Cree un extractor de palabras clave utilizando las API de Easy2Digital, Yake, Python
Cree un extractor de palabras clave usando Python, Yake, API Easy2Digital: raspador de huella de marca, raspador de SERP de Google, para
La extracción de palabras clave utilizando URL de sitios web le permite aprender rÔpidamente sobre una nueva marca desde cero en lugar de leer toda la información. Existen muchas herramientas, sin embargo, es costoso suscribirse o la herramienta gratuita no es fÔcil de usar, en particular, no proporciona API para que las integre con el panel de control de su empresa.
En este artĆculo, intentarĆa usar las API de Easy2Digital: raspador de información de marca y raspador de SERP de Google, para crear un extractor de palabras clave.
Ingredientes para construir un extractor de palabras clave usando la API Easy2Digital
Tabla de contenido
- Recopilación de URL relevantes para la marca utilizando las API de Easy2Digital
- Extraiga el contenido de las URL con BeautifulSoup
- Desduplicar las palabras clave extraĆdas
- Script Python completo del extractor de palabras clave
Recopilación de URL relevantes para la marca utilizando las API de Easy2Digital
La primera pregunta es dónde extraer palabras clave relacionadas con la marca que estÔ investigando. La respuesta es el sitio oficial de la marca y los sitios del portal circundantes.
Aquà estÔ el ejemplo de código del uso de la API de la siguiente manera:
Extraiga el contenido de las URL con BeautifulSoup
Para el raspado de pĆ”ginas de sitios web no basados āāen reacciones, Beautifulsoup es la mejor opción sin duda. Para raspar mejor tantos textos sin formato como sea posible en esta etapa, sugiero raspar el contenido h1, h2, h3 y p por separado y usar find_all() para hacerlo. AquĆ estĆ”n los ejemplos de código de la siguiente manera:
Extraiga las palabras clave del texto usando palabras vacĆas
En el argumento principal del extractor de palabras clave, podemos agregar un nĆŗmero para extraer solo las palabras clave mĆ”s frecuentes, como las 10 principales y las 5 principales. AdemĆ”s, para evitar obtener las palabras vacĆas en inglĆ©s, podemos agregar la lista en el segundo argumento: palabras vacĆas
Hay algĆŗn módulo de palabras vacĆas, aquĆ te recomiendo que uses scikit-learn porque tiene la lista de palabras vacĆas mĆ”s larga en comparación con otros segĆŗn mis experiencias personales. AsegĆŗrese de instalar el paquete scikit-learn python antes de importar este módulo al script.
from sklearn . feature_extraction . text import ENGLISH_STOP_WORDS
En extract_keywords, necesitamos alimentar el texto raspado de los sitios web que acabamos de hacer. AquĆ creĆ© una variable llamada full_text, que incluĆa el texto raspado.
keywords = kw_extractor . extract_keywords ( full_text )
Deduplicar o Word Cloudify las palabras clave extraĆdas
El script puede generar las palabras clave extraĆdas como esta si funciona correctamente. Es un formato JSON y podemos crear un bucle para extraer la palabra clave sin el valor de puntuación.
En general, tenemos dos formas de usar bien estas palabras clave para obtener información inteligente. Una es generar una nube de palabras utilizando miles de palabras clave para mostrar la popularidad de la palabra clave por tamaƱo. La otra es desduplicar las palabras clave y dejar solo una lista de palabras clave Ćŗnicas. AquĆ mostrarĆa cómo desduplicar el script.
final_keyword = list ( dict . fromkeys ( keywordResult ))
Script Python completo del extractor de palabras clave
Si estĆ” interesado en el CapĆtulo 68: Cree un extractor de palabras clave utilizando las API de Easy2Digital, suscrĆbase a nuestro boletĆn agregando el mensaje "CapĆtulo 68" . Le enviaremos el guión inmediatamente a su buzón. (Si tambiĆ©n necesita el raspador de correo electrónico, dĆganos que necesita la versión paga.
Espero que disfrute leyendo el CapĆtulo 68: Cree un extractor de palabras clave utilizando las API de Easy2Digital. Si lo hiciste, apóyanos haciendo una de las cosas que se enumeran a continuación, porque siempre ayuda a nuestro canal.
- Apoya y dona a nuestro canal a travƩs de PayPal ( paypal.me/Easy2digital )
- SuscrĆbete a mi canal y activa la campanita de notificaciones Easy2Digital Youtube channel .
- Sigue y dale me gusta a mi pƔgina Easy2Digital Facebook page
- Comparte el artĆculo en tu red social con el hashtag #easy2digital
- Te suscribes a nuestro boletĆn semanal para recibir los Ćŗltimos artĆculos, videos y códigos de descuento de Easy2Digital
- SuscrĆbase a nuestra membresĆa mensual a travĆ©s de Patreon para disfrutar de beneficios exclusivos ( www.patreon.com/louisludigital )