Créer un extracteur de mots clés à l’aide des API Easy2Digital, Yake, Python

Créez un extracteur de mots clés à l’aide des API Python, Yake, Easy2Digital – grattoir d’empreinte de marque, grattoir Google SERP, pour

L'extraction de mots-clés à l'aide d'URL de sites Web vous permet de découvrir rapidement une nouvelle marque à partir de zéro plutôt que de lire toutes les informations. Il existe de nombreux outils, néanmoins, l'abonnement est coûteux ou l'outil gratuit n'est pas convivial, notamment en ne fournissant pas d'API à intégrer au tableau de bord de votre entreprise.

Dans cet article, j'essaierais d'utiliser les API Easy2Digital – le grattoir d'informations sur la marque et le grattoir Google SERP, pour créer un extracteur de mots clés.

Ingrédients pour créer un extracteur de mots clés à l'aide de l'API Easy2Digital

Table des matières

Collecte d'URL pertinentes pour la marque à l'aide des API Easy2Digital

La première question est de savoir où extraire les mots-clés liés à la marque que vous étudiez. La réponse est le site officiel de la marque et les sites portails environnants.

Voici l'exemple de code de l'utilisation de l'API comme suit :

Grattez le contenu des URL à l'aide de BeautifulSoup

Pour le grattage de pages de site Web non basé sur la réaction, Beautifulsoup est sans aucun doute la meilleure option. Pour mieux gratter autant de textes bruts que possible à ce stade, je suggère de gratter le contenu h1, h2, h3 et p séparément et d'utiliser find_all() pour le créer. Voici les exemples de code comme suit :

Extraire les mots-clés du texte à l'aide de mots vides

Dans l'argument supérieur de l'extracteur de mots clés, nous pouvons ajouter un nombre pour extraire uniquement les mots clés les plus fréquents, tels que les 10 premiers et les 5 premiers. De plus, pour éviter d'obtenir les mots vides en anglais, nous pouvons ajouter la liste dans le deuxième argument – mots vides

Il existe un module de mots vides, ici je vous recommande d'utiliser scikit-learn car il a la plus longue liste de mots vides par rapport aux autres en fonction de mes expériences personnelles. Assurez-vous d'installer le package python scikit-learn avant d'importer ce module dans le script.

from sklearn . feature_extraction . text import ENGLISH_STOP_WORDS

Dans extract_keywords, nous devons alimenter le texte extrait des sites Web que nous venons de créer. Ici, j'ai créé une variable nommée full_text, qui comprenait le texte gratté.

keywords = kw_extractor . extract_keywords ( full_text )

Dédupliquer ou Word Cloudifier les mots-clés extraits

Le script peut générer les mots-clés extraits comme celui-ci s'il fonctionne correctement. C'est un format JSON, et nous pouvons créer une boucle pour extraire le mot-clé sans la valeur du score.

Dans l'ensemble, nous avons deux façons de bien utiliser ces mots-clés pour un aperçu intelligent. L'une consiste à générer un nuage de mots en utilisant des milliers de mots clés pour afficher la popularité des mots clés par taille. L'autre consiste à dédupliquer les mots-clés et à ne conserver qu'une liste de mots-clés uniques. Ici, je montrerais pour dédupliquer le script.

final_keyword = list ( dict . fromkeys ( keywordResult ))

Script Python complet de l'extracteur de mots clés

Si vous êtes intéressé par le Chapitre 68 – Créer un extracteur de mots-clés à l'aide des API Easy2Digital, veuillez vous inscrire à notre newsletter en ajoutant le message "Chapitre 68" . Nous vous enverrions le script immédiatement dans votre boîte aux lettres. (Si vous avez également besoin du scraper d'e-mails, veuillez nous indiquer que vous avez besoin de la version payante.

J'espère que vous apprécierez la lecture du Chapitre 68 – Créer un extracteur de mots-clés à l'aide des API Easy2Digital. Si vous l'avez fait, veuillez nous soutenir en faisant l'une des choses énumérées ci-dessous, car cela aide toujours notre chaîne.

  • Soutenez et faites un don à notre chaîne via PayPal ( paypal.me/Easy2digital )
  • Abonnez-vous à ma chaîne et activez la cloche de notification Chaîne Youtube Easy2Digital .
  • Suivez et aimez ma page Page Facebook Easy2Digital
  • Partagez l'article sur votre réseau social avec le hashtag #easy2digital
  • Vous vous inscrivez à notre newsletter hebdomadaire pour recevoir les derniers articles, vidéos et codes de réduction Easy2Digital
  • Abonnez-vous à notre abonnement mensuel via Patreon pour profiter d'avantages exclusifs ( www.patreon.com/louisludigital )