Pinterest Scraper – 使用关键字、Python 抓取内容、个人资料

在本章中,我将引导您了解如何使用 Python Pinterest 抓取工具抓取排名靠前的内容和个人资料

在本章中,我将引导您了解如何使用 Python Pinterest 抓取工具抓取排名靠前的内容和个人资料。我们将在本教程中使用几个模块,如下所列

目录:Pinterest Scraper

Pinterest Scraper 的 4 个硒模块

Selenium WebDriver 中的预期条件

人们可以使用 Selenium WebDriver 提供的预期条件在特定条件下执行显式等待。 Selenium WebDriver 等待指定条件发生,然后才能继续执行。这提供了必须执行的操作之间所需的等待时间。例如,它定位 WebElement 或对该元素的其他有效操作。

Selenium 中的 WebDriverWait

人们将其应用于具有明确预期条件和时间的某些元素。并且人们只能适用于指定的元素。当未找到元素时,此等待也会引发异常。

  • alertIsPresent()
  • elementSelectionStateToBe()
  • elementToBeClickable()
  • elementToBeSelected()
  • frameToBeAvaliableAndSwitchToIt()
  • invisibilityOfTheElementLocated()
  • invisibilityOfElementWithText()
  • presenceOfAllElementsLocatedBy()
  • presenceOfElementLocated()
  • textToBePresentInElement()
  • textToBePresentInElementLocated()
  • textToBePresentInElementValue()
  • titleIs()
  • titleContains()
  • visibilityOf()
  • visibilityOfAllElements()
  • visibilityOfAllElementsLocatedBy()
  • visibilityOfElementLocated()

关键是硒

人们使用 Selenium 的 Python 模块来使用 Python 执行自动化测试。 Special Keys 是 python 中 Selenium 独有的功能。它允许通过键盘按键,例如 ctrl+f、shift+c+v 等。 class selenium.webdriver.common.keys .Keys 处理 Selenium Python 中的所有键。它包含大量可以在 Selenium Python 中使用的关键方法。

通过硒

Selenium Find Element 命令接受 By 对象作为参数,并返回 Selenium 中列表 WebElement 类型的对象。按对象依次可与各种定位器策略一起使用,例如通过 ID Selenium、名称、类名、XPATH 等查找元素

Pinterest Scraper – SERP 抓取函数def pinSERP()

首先,人们需要了解 Pinterest 搜索 URL、可访问参数及其结构。下面是我建议您用作基本搜索 URL 的搜索 URL。

https://www.pinterest.come/search/pins/?q=query&rs=typed&term_meta[]=phrasefirsthalf%7Ctyped&term_meta[]=phrasesecondhalf%7Ctyped

  • q是添加您喜欢在 Pinterest 中搜索的关键字
  • term_meta[]=keyword + %7Ctyped是添加关键字短语的每个单词。例如,如果您的关键字是 canon camera,则结构应如下所示term_meta[]=canon%7Ctyped&term_meta[]=camera%7Ctyped

除了 Instagram 机器人之外,人们还需要向下滚动才能显示更多 Pinterest 图钉。因此,在获取发布数据之前,您需要先编写窗口滚动脚本。

关于帖子数据,Pinterest 帖子有多种类型和格式的广告和有机帖子。每种类型可能包含更多或更少的数据集,例如,有些可能提供配置文件 URL,有些可能不提供。

基本上,永久数据集是帖子 URL 和帖子标题。因此,如果您无法从 SERP 获取个人资料 URL,您可以先获取帖子 URL。

Pinterest Scraper – Pin 数据函数def pinPost()

在 Pinterest 帖子中,基本上,人们需要获取两个主要数据集,即个人资料 URL 和外部 Web URL。如果您想抓取关注者等个人资料数据并随后自动发送消息,这将特别有用。有关Pinterest 机器人的更多详细信息,请查看这篇文章

第 42 章 – 用于抓取 Web URL、电子邮件和自动化消息的 Pinterest Bot

话虽如此,您还可以从帖子中获取其他类型的数据,例如照片、用户评论数据等。但我不会深入探讨本文。

Pinterest Scraper 的完整 Python 脚本,用于使用关键字抓取 SERP 内容和配置文件

如果您对 Pinterest Scraper 使用关键字抓取 SERP 内容和配置文件的完整 Python 脚本感兴趣,请添加消息“第 43 章”来订阅我们的时事通讯。我们会尽快将脚本发送到您的邮箱。

联系我们

我希望您喜欢阅读第 43 章:使用关键字抓取 SERP 内容和配置文件的 Pinterest Scraper。如果您这样做了,请通过执行下列操作之一来支持我们,因为这总是对我们的频道有所帮助。

  • 通过 PayPal ( paypal.me/Easy2digital ) 支持并捐赠我们的频道
  • 订阅我的频道并打开通知铃Easy2Digital Youtube 频道
  • 关注并喜欢我的页面Easy2Digital Facebook 页面
  • 使用主题标签 #easy2digital 在您的社交网络上分享文章
  • 使用 Easy2Digital 10% OFF 折扣代码购买产品 ( Easy2DigitalNewBuyers2021)
  • 您订阅我们的每周通讯即可接收 Easy2Digital 最新文章、视频和折扣代码
  • 通过 Patreon 订阅我们的月度会员即可享受独家优惠 ( www.patreon.com/louisludigital )