Pinterest Scraper – 使用关键字、Python 抓取内容、个人资料
在本章中,我将引导您了解如何使用 Python Pinterest 抓取工具抓取排名靠前的内容和个人资料
在本章中,我将引导您了解如何使用 Python Pinterest 抓取工具抓取排名靠前的内容和个人资料。我们将在本教程中使用几个模块,如下所列
目录:Pinterest Scraper
- Pinterest Scraper 的 4 个硒模块
- Pinterest SERP:
def pinSERP()
- Pinterest pin:
def pinPost()
- 用于获取 Pinterest SERP 的 Pinterest scraper 的完整 Python 脚本
Pinterest Scraper 的 4 个硒模块
Selenium WebDriver 中的预期条件
人们可以使用 Selenium WebDriver 提供的预期条件在特定条件下执行显式等待。 Selenium WebDriver 等待指定条件发生,然后才能继续执行。这提供了必须执行的操作之间所需的等待时间。例如,它定位 WebElement 或对该元素的其他有效操作。
Selenium 中的 WebDriverWait
人们将其应用于具有明确预期条件和时间的某些元素。并且人们只能适用于指定的元素。当未找到元素时,此等待也会引发异常。
-
alertIsPresent()
-
elementSelectionStateToBe()
-
elementToBeClickable()
-
elementToBeSelected()
-
frameToBeAvaliableAndSwitchToIt()
-
invisibilityOfTheElementLocated()
-
invisibilityOfElementWithText()
-
presenceOfAllElementsLocatedBy()
-
presenceOfElementLocated()
-
textToBePresentInElement()
-
textToBePresentInElementLocated()
-
textToBePresentInElementValue()
-
titleIs()
-
titleContains()
-
visibilityOf()
-
visibilityOfAllElements()
-
visibilityOfAllElementsLocatedBy()
-
visibilityOfElementLocated()
关键是硒
人们使用 Selenium 的 Python 模块来使用 Python 执行自动化测试。 Special Keys 是 python 中 Selenium 独有的功能。它允许通过键盘按键,例如 ctrl+f、shift+c+v 等。 class selenium.webdriver.common.keys
.Keys 处理 Selenium Python 中的所有键。它包含大量可以在 Selenium Python 中使用的关键方法。
通过硒
Selenium Find Element 命令接受 By 对象作为参数,并返回 Selenium 中列表 WebElement 类型的对象。按对象依次可与各种定位器策略一起使用,例如通过 ID Selenium、名称、类名、XPATH 等查找元素
Pinterest Scraper – SERP 抓取函数def pinSERP()
首先,人们需要了解 Pinterest 搜索 URL、可访问参数及其结构。下面是我建议您用作基本搜索 URL 的搜索 URL。
-
q
是添加您喜欢在 Pinterest 中搜索的关键字 term_meta[]=keyword + %7Ctyped
是添加关键字短语的每个单词。例如,如果您的关键字是 canon camera,则结构应如下所示term_meta[]=canon%7Ctyped&term_meta[]=camera%7Ctyped
除了 Instagram 机器人之外,人们还需要向下滚动才能显示更多 Pinterest 图钉。因此,在获取发布数据之前,您需要先编写窗口滚动脚本。
关于帖子数据,Pinterest 帖子有多种类型和格式的广告和有机帖子。每种类型可能包含更多或更少的数据集,例如,有些可能提供配置文件 URL,有些可能不提供。
基本上,永久数据集是帖子 URL 和帖子标题。因此,如果您无法从 SERP 获取个人资料 URL,您可以先获取帖子 URL。
Pinterest Scraper – Pin 数据函数def pinPost()
在 Pinterest 帖子中,基本上,人们需要获取两个主要数据集,即个人资料 URL 和外部 Web URL。如果您想抓取关注者等个人资料数据并随后自动发送消息,这将特别有用。有关Pinterest 机器人的更多详细信息,请查看这篇文章
话虽如此,您还可以从帖子中获取其他类型的数据,例如照片、用户评论数据等。但我不会深入探讨本文。
Pinterest Scraper 的完整 Python 脚本,用于使用关键字抓取 SERP 内容和配置文件
如果您对 Pinterest Scraper 使用关键字抓取 SERP 内容和配置文件的完整 Python 脚本感兴趣,请添加消息“第 43 章”来订阅我们的时事通讯。我们会尽快将脚本发送到您的邮箱。
我希望您喜欢阅读第 43 章:使用关键字抓取 SERP 内容和配置文件的 Pinterest Scraper。如果您这样做了,请通过执行下列操作之一来支持我们,因为这总是对我们的频道有所帮助。
- 通过 PayPal ( paypal.me/Easy2digital ) 支持并捐赠我们的频道
- 订阅我的频道并打开通知铃Easy2Digital Youtube 频道。
- 关注并喜欢我的页面Easy2Digital Facebook 页面
- 使用主题标签 #easy2digital 在您的社交网络上分享文章
- 使用 Easy2Digital 10% OFF 折扣代码购买产品 ( Easy2DigitalNewBuyers2021)
- 您订阅我们的每周通讯即可接收 Easy2Digital 最新文章、视频和折扣代码
- 通过 Patreon 订阅我们的月度会员即可享受独家优惠 ( www.patreon.com/louisludigital )