EASY2DIGITAL 国际站简体中文版

Pinterest Scraper – 使用关键字、Python 抓取内容、个人资料

在本章中,我将引导您了解如何使用 Python Pinterest 抓取工具抓取排名靠前的内容和个人资料。我们将在本教程中使用几个模块,如下所列

目录:Pinterest Scraper

Pinterest Scraper 的 4 个硒模块

Selenium WebDriver 中的预期条件

人们可以使用 Selenium WebDriver 提供的预期条件在特定条件下执行显式等待。 Selenium WebDriver 等待指定条件发生,然后才能继续执行。这提供了必须执行的操作之间所需的等待时间。例如,它定位 WebElement 或对该元素的其他有效操作。

Selenium 中的 WebDriverWait

人们将其应用于具有明确预期条件和时间的某些元素。并且人们只能适用于指定的元素。当未找到元素时,此等待也会引发异常。

关键是硒

人们使用 Selenium 的 Python 模块来使用 Python 执行自动化测试。 Special Keys 是 python 中 Selenium 独有的功能。它允许通过键盘按键,例如 ctrl+f、shift+c+v 等。 class selenium.webdriver.common.keys .Keys 处理 Selenium Python 中的所有键。它包含大量可以在 Selenium Python 中使用的关键方法。

通过硒

Selenium Find Element 命令接受 By 对象作为参数,并返回 Selenium 中列表 WebElement 类型的对象。按对象依次可与各种定位器策略一起使用,例如通过 ID Selenium、名称、类名、XPATH 等查找元素

Pinterest Scraper – SERP 抓取函数def pinSERP()

首先,人们需要了解 Pinterest 搜索 URL、可访问参数及其结构。下面是我建议您用作基本搜索 URL 的搜索 URL。

https://www.pinterest.come/search/pins/?q=query&rs=typed&term_meta[]=phrasefirsthalf%7Ctyped&term_meta[]=phrasesecondhalf%7Ctyped

除了 Instagram 机器人之外,人们还需要向下滚动才能显示更多 Pinterest 图钉。因此,在获取发布数据之前,您需要先编写窗口滚动脚本。

关于帖子数据,Pinterest 帖子有多种类型和格式的广告和有机帖子。每种类型可能包含更多或更少的数据集,例如,有些可能提供配置文件 URL,有些可能不提供。

基本上,永久数据集是帖子 URL 和帖子标题。因此,如果您无法从 SERP 获取个人资料 URL,您可以先获取帖子 URL。

Pinterest Scraper – Pin 数据函数def pinPost()

在 Pinterest 帖子中,基本上,人们需要获取两个主要数据集,即个人资料 URL 和外部 Web URL。如果您想抓取关注者等个人资料数据并随后自动发送消息,这将特别有用。有关Pinterest 机器人的更多详细信息,请查看这篇文章

第 42 章 – 用于抓取 Web URL、电子邮件和自动化消息的 Pinterest Bot

话虽如此,您还可以从帖子中获取其他类型的数据,例如照片、用户评论数据等。但我不会深入探讨本文。

Pinterest Scraper 的完整 Python 脚本,用于使用关键字抓取 SERP 内容和配置文件

如果您对 Pinterest Scraper 使用关键字抓取 SERP 内容和配置文件的完整 Python 脚本感兴趣,请添加消息“第 43 章”来订阅我们的时事通讯。我们会尽快将脚本发送到您的邮箱。

联系我们

我希望您喜欢阅读第 43 章:使用关键字抓取 SERP 内容和配置文件的 Pinterest Scraper。如果您这样做了,请通过执行下列操作之一来支持我们,因为这总是对我们的频道有所帮助。

退出移动版