Featured Video Play Icon

PythonでAmazonベストセラー商品スクレーパー作成

Amazonのベストセラー商品は毎日毎時更新されています。更新は販売実績や商品の評価に基づいて行われます。ただし、商品を販売している人物について慎重に調べる必要があります。基本的に、ベストセラーの販売者はほぼ毎時刻更新されますが、立場は変わるかもしれません。新しい販売者が、新しい人気のあるニッチなSKUを販売することで目立つ場合があります。

手動ですべてのカテゴリーとSKUを毎時監視することは現実的ではなく、必要ありません。さらに、Amazonのベストセラーのページのインターフェイスは、データ形式でのパフォーマンスの理解にはフレンドリーではありません。そこで、この記事では、Pythonを使用してAmazonのベストセラー商品スクレーパーを作成する方法を説明します。この記事の終わりまでに、競合他社の最新の製品のパフォーマンスと価格、潜在的な顧客の発見、潜在的な製品の識別を取得するためのスクレーパーのコードを学べるようになります。そして、Crontabを設定してプロセスを自動化し、ダッシュボードを更新できます。

目次:Amazonベストセラー商品スクレーパー

Amazonベストセラー商品ランキングページ(カテゴリ別)

Amazonには、ベストセラー商品ページに何百ものカテゴリーとサブカテゴリーがあります。あなたのブランドやビジネスが各カテゴリーや製品に関連していないかもしれませんが、どの情報を確認するページが最も適切かを知る必要があります。情報は、新しいニッチ製品を探索したり、競合他社のSKUを監視したり、潜在的な顧客を見つけたり、潜在的な製品を発見したりするために貴重です。

amazon best selling product scraper

Amazonは、ベストセラー商品を部門別にランク付けしています。各部門にはカテゴリがあり、それぞれのカテゴリには多くのサブカテゴリがあり、その下にはさらにサブサブカテゴリがあります。以下に、 Amazonデバイス&アクセサリーの例を示します。レイヤーごとに分割できるタマネギのように見えます。

https://www.amazon.com/Best-Sellers/zgbs/amazon-devices
https://www.amazon.com/Best-Sellers-Amazon-Device-Accessories/zgbs/amazon-devices/370783011

まず最初に、URLを使用してすべての部門のURLを取得できます。

values_list = https://www.amazon.com/Best-Sellers/zgbs

amazon best selling product scraper

すべてのカテゴリページの左側のメニューのHTMLコーディングは同じ名前付けです。上記のURLを使用して、すべての部門のURLを取得したと仮定します。以下は、すべての部門のURLの完全なリストです。

各部門をスクレイプして理解する場合は、selenium、gspread、beautifulsoupを使用してスクレイプするためのループを作成する必要があります。

まず最初に、シミュレーションドライバーを使用してAmazonのベストセラーページを開く必要があります。Amazonは、BeautifulSoupに直接ページHTMLへのアクセスを許可していないためです。

amazonSERP = []

その後、Googleシートでテーブルを作成し、すべての部門URLを1列に貼り付けることができます。gspreadを使用してURLを読み取ることができます。

最後に、Amazonのベストセラー商品ページのカテゴリURLはid zg_browseRootの下にあります。それは

によってフォーマットされます。したがって、以下はループスクレイパーのコーディングです

カテゴリ別にAmazonベストセラー商品データを取得する

カテゴリURLの完全なリストが手元にあると、特定のカテゴリURLを使用してスクレイパーをセットアップできます。

最初に、各カテゴリのベストセラー商品には50位までのページと、51-100位のページの2つがあります。?pg=をカテゴリURLの後に使用できます。

さらに、各商品のブロックはclass = aok-inline-block zg-itemです。したがって、基本的には、seleniumとbeautifulsoupを使用して、ベストセラー商品のデータセットのすべてのブロックを見つけることができます。

その後、別のループが必要です。それは、タイトル、製品URL、レビュー、評価、価格など、各製品から特定のデータを取得するためです。

最後に、pandasを使用して、スクレーピングコードで作成された変数に接続されたデータを追加できます。その後、自動的にGoogleシートにデータを更新できます。

## append the data and upload to Google Sheets ##

element_info = {
"Market": Market,
"Channel": Channel,
"Tier of Cate": Tier,
"Name of Cate": category,
"Title": title,
"URL": url,
"Review": review,
"Stars": Stars,
# "Min-Price": min_price,
"Max-Price": price
}

amazonSERP.append(element_info)

df = pd.DataFrame(amazonSERP)

Amazonベストセラー商品スクレイパーの完全版スクリプト

Amazon Product Price TrackerのPythonスクリプトの完全版を入手したい場合は、「第21章」というメッセージを追加してニュースレターに登録してください。スクリプトを即座にメールボックスに送信します。

Amazonベストセラー商品スクレイパー – ニッチ商品を見つけ、競合を監視し、潜在的な顧客を特定するための素晴らしいアプローチをお楽しみいただければ幸いです。気に入っていただけた場合は、以下のいずれかのことを行って、チャンネルを支援していただけると幸いです。

  • PayPal (paypal.me/Easy2digital)を通じて弊社チャンネルをサポートおよび寄付を行う
  • Easy2Digital YouTubeチャンネルの登録と通知ベルをオンにする。
  • Easy2Digital Facebookページをフォローしていいね!を押す
  • ハッシュタグ#easy2digitalを使用して、ソーシャルネットワーク上で記事を共有する
  • Easy2Digitalの最新記事、動画、割引コードを受け取るために、週刊ニュースレターに登録する
  • www.patreon.com/louisludigitalを通じて、独占的な特典をお楽しみいただくための月額会員に登録する

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です