Erstellen Sie einen Keyword-Extraktor mit Easy2Digital APIs, Yake, Python

0

Erstellen Sie einen Keyword-Extraktor mit Python, Yake, Easy2Digital-APIs – Marken-Footprint-Scraper, Google SERP-Scraper usw

Durch die Schlüsselwortextraktion mithilfe von Website-URLs können Sie schnell von Grund auf etwas über eine neue Marke lernen, anstatt alle Informationen durchzulesen. Es gibt viele Tools, aber das Abonnement ist teuer oder das kostenlose Tool ist nicht benutzerfreundlich, insbesondere weil es keine APIs zur Integration in Ihr Geschäfts-Dashboard bereitstellt.

In diesem Artikel würde ich versuchen, mithilfe der Easy2Digital-APIs – Brand Info Scraper und Google SERP Scraper – einen Keyword-Extraktor zu erstellen.

Zutaten zum Erstellen eines Keyword-Extraktors mithilfe der Easy2Digital-API

Inhaltsverzeichnis

Sammeln markenrelevanter URLs mithilfe von Easy2Digital-APIs

Die erste Frage ist, wo Schlüsselwörter extrahiert werden können, die sich auf die Marke beziehen, die Sie untersuchen. Die Antwort ist die offizielle Website der Marke und die umliegenden Portalseiten.

Hier ist das Codebeispiel der API-Nutzung wie folgt:

Schlüsselwort-Extraktor

Scrapen Sie den Inhalt aus den URLs mit BeautifulSoup

Für das nicht reaktionsbasierte Scraping von Website-Seiten ist Beautifulsoup ohne Zweifel die beste Option. Um zu diesem Zeitpunkt so viele Rohtexte wie möglich besser zu scrappen, schlage ich vor, die Inhalte von h1, h2, h3 und p separat zu scrappen und find_all() zu verwenden, um sie zu erstellen. Hier sind die Codebeispiele wie folgt:

Extrahieren Sie die Schlüsselwörter des Textes mithilfe von Stoppwörtern

Im Top-Argument des Schlüsselwortextraktors können wir eine Zahl hinzufügen, um nur die häufigsten Schlüsselwörter zu extrahieren, z. B. Top 10 und Top 5. Um zu vermeiden, dass die englischen Stoppwörter angezeigt werden, können wir außerdem die Liste im zweiten Argument hinzufügen – Stoppwörter

Es gibt einige Stoppwort-Module. Hier empfehle ich Ihnen die Verwendung von scikit-learn, da es aufgrund meiner persönlichen Erfahrungen im Vergleich zu anderen die längste Stoppwortliste hat. Bitte installieren Sie unbedingt das Scikit-Learn-Python-Paket, bevor Sie dieses Modul in das Skript importieren.

from sklearn . feature_extraction . text import ENGLISH_STOP_WORDS

In „extract_keywords“ müssen wir den geschabten Text von den Websites, die wir gerade erstellt haben, einspeisen. Hier habe ich eine Variable namens full_text erstellt, die den gekratzten Text enthielt.

keywords = kw_extractor . extract_keywords ( full_text )

Deduplizieren oder Word Cloudify der extrahierten Schlüsselwörter

Das Skript kann die extrahierten Schlüsselwörter auf diese Weise generieren, wenn es ordnungsgemäß funktioniert. Es handelt sich um ein JSON-Format und wir können eine Schleife erstellen, um das Schlüsselwort ohne den Bewertungswert zu extrahieren.

Schlüsselwort-Extraktor

Im Großen und Ganzen haben wir zwei Möglichkeiten, diese Schlüsselwörter sinnvoll für intelligente Erkenntnisse zu nutzen. Eine besteht darin, eine Wortwolke zu erstellen, indem Tausende von Schlüsselwörtern verwendet werden, um die Schlüsselwortpopularität nach Größe anzuzeigen. Die andere besteht darin, die Schlüsselwörter zu deduplizieren und nur eine Liste eindeutiger Schlüsselwörter übrig zu lassen. Hier würde ich zeigen, wie man das Skript dedupliziert.

final_keyword = list ( dict . fromkeys ( keywordResult ))

Vollständiges Python-Skript des Keyword Extractor

Wenn Sie sich für Kapitel 68 – Erstellen eines Keyword-Extraktors mit Easy2Digital-APIs interessieren, Bitte abonnieren Sie unseren Newsletter , indem Sie die Nachricht „Kapitel 68“ hinzufügen. . Wir senden Ihnen das Skript umgehend in Ihr Postfach. (Wenn Sie auch den E-Mail-Scraper benötigen, teilen Sie uns bitte mit, dass Sie die kostenpflichtige Version benötigen.

Ich wünsche Ihnen viel Spaß beim Lesen von Kapitel 68 – Erstellen eines Keyword-Extraktors mit Easy2Digital-APIs. Wenn ja, unterstützen Sie uns bitte, indem Sie eine der unten aufgeführten Maßnahmen ergreifen, da dies unserem Kanal immer weiterhilft.

  • Unterstützen Sie unseren Kanal und spenden Sie über PayPal ( paypal.me/Easy2digital )
  • Abonnieren Sie meinen Kanal und aktivieren Sie die Benachrichtigungsglocke des Easy2Digital-Youtube-Kanals .
  • Folgen und liken Sie meine Easy2Digital-Facebook-Seite
  • Teilen Sie den Artikel in Ihrem sozialen Netzwerk mit dem Hashtag #easy2digital
  • Sie melden sich für unseren wöchentlichen Newsletter an, um die neuesten Artikel, Videos und Rabattcodes von Easy2Digital zu erhalten
  • Abonnieren Sie unsere monatliche Mitgliedschaft über Patreon, um exklusive Vorteile zu genießen ( www.patreon.com/louisludigital )

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert