Amazonのベストセラー商品は毎日毎時更新されています。更新は販売実績や商品の評価に基づいて行われます。ただし、商品を販売している人物について慎重に調べる必要があります。基本的に、ベストセラーの販売者はほぼ毎時刻更新されますが、立場は変わるかもしれません。新しい販売者が、新しい人気のあるニッチなSKUを販売することで目立つ場合があります。
手動ですべてのカテゴリーとSKUを毎時監視することは現実的ではなく、必要ありません。さらに、Amazonのベストセラーのページのインターフェイスは、データ形式でのパフォーマンスの理解にはフレンドリーではありません。そこで、この記事では、Pythonを使用してAmazonのベストセラー商品スクレーパーを作成する方法を説明します。この記事の終わりまでに、競合他社の最新の製品のパフォーマンスと価格、潜在的な顧客の発見、潜在的な製品の識別を取得するためのスクレーパーのコードを学べるようになります。そして、Crontabを設定してプロセスを自動化し、ダッシュボードを更新できます。
目次:Amazonベストセラー商品スクレーパー
Amazonベストセラー商品ランキングページ(カテゴリ別)
Amazonには、ベストセラー商品ページに何百ものカテゴリーとサブカテゴリーがあります。あなたのブランドやビジネスが各カテゴリーや製品に関連していないかもしれませんが、どの情報を確認するページが最も適切かを知る必要があります。情報は、新しいニッチ製品を探索したり、競合他社のSKUを監視したり、潜在的な顧客を見つけたり、潜在的な製品を発見したりするために貴重です。
Amazonは、ベストセラー商品を部門別にランク付けしています。各部門にはカテゴリがあり、それぞれのカテゴリには多くのサブカテゴリがあり、その下にはさらにサブサブカテゴリがあります。以下に、 Amazonデバイス&アクセサリーの例を示します。レイヤーごとに分割できるタマネギのように見えます。
https://www.amazon.com/Best-Sellers/zgbs/amazon-devices
https://www.amazon.com/Best-Sellers-Amazon-Device-Accessories/zgbs/amazon-devices/370783011
まず最初に、URLを使用してすべての部門のURLを取得できます。
values_list = https://www.amazon.com/Best-Sellers/zgbs

すべてのカテゴリページの左側のメニューのHTMLコーディングは同じ名前付けです。上記のURLを使用して、すべての部門のURLを取得したと仮定します。以下は、すべての部門のURLの完全なリストです。
各部門をスクレイプして理解する場合は、selenium、gspread、beautifulsoupを使用してスクレイプするためのループを作成する必要があります。
まず最初に、シミュレーションドライバーを使用してAmazonのベストセラーページを開く必要があります。Amazonは、BeautifulSoupに直接ページHTMLへのアクセスを許可していないためです。
amazonSERP = []
その後、Googleシートでテーブルを作成し、すべての部門URLを1列に貼り付けることができます。gspreadを使用してURLを読み取ることができます。
最後に、Amazonのベストセラー商品ページのカテゴリURLはid zg_browseRootの下にあります。それは
によってフォーマットされます。したがって、以下はループスクレイパーのコーディングです
カテゴリ別にAmazonベストセラー商品データを取得する
カテゴリURLの完全なリストが手元にあると、特定のカテゴリURLを使用してスクレイパーをセットアップできます。
最初に、各カテゴリのベストセラー商品には50位までのページと、51-100位のページの2つがあります。?pg=
をカテゴリURLの後に使用できます。
さらに、各商品のブロックはclass = aok-inline-block zg-item
です。したがって、基本的には、seleniumとbeautifulsoupを使用して、ベストセラー商品のデータセットのすべてのブロックを見つけることができます。
その後、別のループが必要です。それは、タイトル、製品URL、レビュー、評価、価格など、各製品から特定のデータを取得するためです。
最後に、pandasを使用して、スクレーピングコードで作成された変数に接続されたデータを追加できます。その後、自動的にGoogleシートにデータを更新できます。
## append the data and upload to Google Sheets ##
element_info = {
"Market": Market,
"Channel": Channel,
"Tier of Cate": Tier,
"Name of Cate": category,
"Title": title,
"URL": url,
"Review": review,
"Stars": Stars,
# "Min-Price": min_price,
"Max-Price": price
}
amazonSERP.append(element_info)
df = pd.DataFrame(amazonSERP)
Amazonベストセラー商品スクレイパーの完全版スクリプト
Amazon Product Price TrackerのPythonスクリプトの完全版を入手したい場合は、「第21章」というメッセージを追加してニュースレターに登録してください。スクリプトを即座にメールボックスに送信します。
Amazonベストセラー商品スクレイパー – ニッチ商品を見つけ、競合を監視し、潜在的な顧客を特定するための素晴らしいアプローチをお楽しみいただければ幸いです。気に入っていただけた場合は、以下のいずれかのことを行って、チャンネルを支援していただけると幸いです。
- PayPal (paypal.me/Easy2digital)を通じて弊社チャンネルをサポートおよび寄付を行う
- Easy2Digital YouTubeチャンネルの登録と通知ベルをオンにする。
- Easy2Digital Facebookページをフォローしていいね!を押す
- ハッシュタグ#easy2digitalを使用して、ソーシャルネットワーク上で記事を共有する
- Easy2Digitalの最新記事、動画、割引コードを受け取るために、週刊ニュースレターに登録する
- www.patreon.com/louisludigitalを通じて、独占的な特典をお楽しみいただくための月額会員に登録する