blog details
author


blog detail

Извлечение ключевых слов с использованием URL-адресов веб-сайтов поможет вам быстро узнать о новом бренде с нуля, а не читать всю информацию. Существует множество инструментов, тем не менее, подписка обходится дорого, или бесплатный инструмент не удобен для пользователя, в частности, не предоставляет API для интеграции с вашей бизнес-панелью.

В этой статье я попытался бы использовать API Easy2Digital — парсер информации о бренде и парсер Google SERP, чтобы создать экстрактор ключевых слов.

Ингредиенты для создания экстрактора ключевых слов с использованием Easy2Digital API

Оглавление

Сбор релевантных для бренда URL-адресов с использованием API Easy2Digital

Первый вопрос заключается в том, где извлечь ключевые слова, связанные с брендом, который вы исследуете. Ответ — официальный сайт бренда и окружающие его сайты-порталы.

Вот пример кода использования API следующим образом:

blog detail

Очистите содержимое URL-адресов с помощью BeautifulSoup.

Для парсинга страниц веб-сайта, не основанного на реакции, Beautifulsoup, без сомнения, является лучшим вариантом. Чтобы лучше очистить как можно больше необработанных текстов на этом этапе, я предлагаю очистить содержимое h1, h2, h3 и p отдельно и использовать find_all() для его создания. Вот примеры кода следующим образом:

Извлеките ключевые слова текста, используя стоп-слова

В верхнем аргументе экстрактора ключевых слов мы можем добавить число, чтобы извлечь только самые частые ключевые слова, такие как первые 10 и первые 5. Кроме того, чтобы избежать получения английских стоп-слов, мы можем добавить список во второй аргумент — стоп-слова.

Там есть какой-то модуль стоп-слов, здесь я рекомендую вам использовать scikit-learn, потому что у него самый длинный список стоп-слов по сравнению с другими, основанный на моем личном опыте. Обязательно установите пакет scikit-learn python, прежде чем импортировать этот модуль в скрипт.

from sklearn . feature_extraction . text import ENGLISH_STOP_WORDS

В Extract_keywords нам нужно передать очищенный текст с веб-сайтов, которые мы только что сделали. Здесь я создал переменную с именем full_text, которая включала очищенный текст.

keywords = kw_extractor . extract_keywords ( full_text )

Дедупликация или Word Cloudify извлеченных ключевых слов

Сценарий может генерировать извлеченные ключевые слова, как это, если он работает правильно. Это формат JSON, и мы можем создать цикл для извлечения ключевого слова без значения оценки.

blog detail

В целом, у нас есть два способа хорошо использовать эти ключевые слова для интеллектуального понимания. Одним из них является создание облака слов с использованием тысяч ключевых слов для отображения популярности ключевых слов по размеру. Другой — удалить дубликаты ключевых слов и оставить только список уникальных ключевых слов. Здесь я бы показал дедупликацию скрипта.

final_keyword = list ( dict . fromkeys ( keywordResult ))

Полный скрипт Python для извлечения ключевых слов

Если вам интересна Глава 68. Создание экстрактора ключевых слов с помощью API Easy2Digital, пожалуйста , подпишитесь на нашу рассылку , добавив сообщение «Глава 68» . Мы отправим вам сценарий немедленно на ваш почтовый ящик. (Если вам также нужен парсер электронной почты, сообщите нам, что вам нужна платная версия.

Надеюсь, вам понравится читать главу 68. Создание экстрактора ключевых слов с помощью API Easy2Digital. Если вы это сделали, пожалуйста, поддержите нас, выполнив одно из перечисленных ниже действий, потому что это всегда помогает нашему к. аналу.

  • Поддержите и пожертвуйте нашему каналу через PayPal ( paypal.me/Easy2digital )
  • Подпишитесь на мой канал и включите колокольчик уведомлений канала Easy2Digital Youtube .
  • Подписывайтесь и лайкайте мою страницу Страница Easy2Digital в Facebook
  • Поделитесь статьей в своей социальной сети с хэштегом #easy2digital
  • Вы подписываетесь на нашу еженедельную рассылку, чтобы получать последние статьи, видео и коды скидок Easy2Digital.
  • Подпишитесь на наше ежемесячное членство через Patreon, чтобы пользоваться эксклюзивными преимуществами ( www.patreon.com/louisludigital )
Поделиться этим постом

Пока нет комментариев...

shape shape

Подпишитесь на нашу рассылку!

Получайте эксклюзивные обновления и предложения в автомобильном стиле