Web サイトの URL を使用してキーワードを抽出すると、すべての情報を読むのではなく、新しいブランドについて最初からすばやく学ぶことができます。世の中には多くのツールがありますが、購読するには費用がかかったり、無料ツールが使いにくく、特にビジネス ダッシュボードと統合するための API が提供されていません。
この記事では、Easy2Digital API (ブランド情報スクレーパーと Google SERP スクレーパー) を使用して、キーワード抽出ツールを構築してみます。
Easy2Digital API を使用してキーワード抽出ツールを構築するための要素
目次
- Easy2Digital API を使用してブランド関連 URL を収集する
- BeautifulSoupを使用してURLからコンテンツをスクレイピングする
- 抽出したキーワードの重複を除去する
- キーワード抽出機能の完全な Python スクリプト
- よくある質問
Easy2Digital API を使用してブランド関連 URL を収集する
最初の質問は、調査しているブランドに関連するキーワードをどこで抽出するかです。答えはブランドの公式サイトとその周辺のポータルサイトです。
API の使用例のコードサンプルは次のとおりです。
BeautifulSoupを使用してURLからコンテンツをスクレイピングする
非反応ベースの Web サイトページのスクレイピングには、Beautifulsoup が間違いなく最良の選択肢です。この段階でできるだけ多くの生のテキストをより効果的にスクレイピングするには、h1、h2、h3、p のコンテンツを個別にスクレイピングし、find_all() を使用して作成することをお勧めします。コードサンプルは次のとおりです。
ストップワードを使用してテキストのキーワードを抽出する
キーワード抽出ツールの先頭引数に数値を追加して、上位 10 . 位や上位 5 位など、最も頻繁に使用されるキーワードのみを抽出できます。さらに、英語のストップワードの取得を避けるために、2 番目の引数 – ストップワードにリストを追加できます。
いくつかのストップワード モジュールがありますが、私の個人的な経験に基づくと、他のものと比較して最も長いストップワード リストを備えている scikit-learn を使用することをお勧めします。このモジュールをスクリプトにインポートする前に、必ず scikit-learn Python パッケージをインストールしてください。
from sklearn . feature_extraction . text import ENGLISH_STOP_WORDS
extract_keywords では、先ほど行った Web サイトからスクレイピングしたテキストをフィードする必要があります。ここでは、スクレイピングされたテキストを含む full_text という名前の変数を作成しました。
keywords = kw_extractor . extract_keywords ( full_text )
抽出されたキーワードの重複排除または Word Cloudify
スクリプトが適切に動作している場合、このように抽出されたキーワードを生成できます。これは JSON 形式であり、スコア値なしでキーワードを抽出するループを作成できます。
全体として、これらのキーワードを賢く活用してインテリジェントな洞察を得るには 2 つの方法があります。 1 つは、数千のキーワードを使用してワード クラウドを生成し、キーワードの人気度をサイズ別に表示することです。もう 1 つは、キーワードの重複を除去し、一意のキーワードのリストのみを残すことです。ここでは、スクリプトの重複を除去する方法を示します。
final_keyword = list ( dict . fromkeys ( keywordResult ))
キーワード抽出機能の完全な Python スクリプト
第 68 章 – Easy2Digital API を使用したキーワード抽出ツールの構築に興味がある場合は、 「第 68 章」というメッセージを追加してニュースレターを購読してください。 。スクリプトはすぐにあなたのメールボックスに送信されます。 (メールスクレイパーも必要な場合は、有料版が必要であることをお知らせください。
第 68 章 – Easy2Digital API を使用したキーワード抽出器の構築を楽しんで読んでいただければ幸いです。もしそうなら、以下にリストされているいずれかの方法で私たちをサポートしてください。それは常に私たちのチャンネルに役立ちます。
- PayPal ( paypal.me/Easy2digital ) を通じて私たちのチャンネルをサポートし、寄付してください。
- 私のチャンネルを購読し、 Easy2Digital Youtube チャンネルの通知ベルをオンにしてください。
- Easy2Digital Facebook ページをフォローして「いいね!」してください
- ハッシュタグ #easy2digital を付けて記事をソーシャル ネットワークで共有してください
- Easy2Digital の最新記事、ビデオ、割引コードを受け取るには、毎週のニュースレターに登録してください。
- Patreon を通じて月額メンバーシップに登録すると、限定特典をお楽しみいただけます ( www.patreon.com/louisludigital )