웹 사이트 URL을 사용한 키워드 추출을 통해 모든 정보를 읽는 대신 처음부터 새로운 브랜드에 대해 빠르게 배울 수 있습니다. 시중에는 많은 도구가 있지만 구독료가 비싸거나 무료 도구는 사용자 친화적이지 않으며 특히 비즈니스 대시보드와 통합할 수 있는 API를 제공하지 않습니다.
이 기사에서는 브랜드 정보 스크레이퍼와 Google SERP 스크레이퍼인 Easy2Digital API를 사용하여 키워드 추출기를 구축하려고 합니다.
Easy2Digital API를 사용하여 키워드 추출기 구축에 대한 구성 요소
목차
- Easy2Digital API를 사용하여 브랜드 관련 URL 수집
- BeautifulSoup을 사용하여 URL에서 콘텐츠 스크랩
- 추출된 키워드 중복 제거
- 키워드 추출기의 전체 Python 스크립트
Easy2Digital API를 사용하여 브랜드 관련 URL 수집
첫 번째 질문은 조사 중인 브랜드와 관련된 키워드를 어디에서 추출할 것인가입니다. 정답은 브랜드 공식 사이트 및 주변 포털 사이트입니다.
다음은 API 사용의 코드 샘플입니다.
BeautifulSoup을 사용하여 URL에서 콘텐츠 스크랩
비 반응 기반 웹 사이트 페이지 스크래핑의 경우 Beautifulsoup이 의심의 여지없이 최선의 선택입니다. 이 단계에서 최대한 많은 원시 텍스트를 더 잘 스크랩하려면 h1, h2, h3 및 p 콘텐츠를 별도로 스크랩하고 find_all()을 사용하여 만드는 것을 제안합니다. 다음은 코드 샘플입니다.
불용어를 사용하여 텍스트의 키워드 추출
키워드 추출기 top 인수에서 숫자를 추가하여 상위 10개, 상위 5개와 같이 . 가장 자주 사용되는 키워드만 추출할 수 있습니다.
일부 불용어 모듈이 있습니다. 내 개인적인 경험을 바탕으로 다른 불용어 목록에 비해 불용어 목록이 가장 길기 때문에 scikit-learn을 사용하는 것이 좋습니다. 이모듈을 스크립트로 가져오기 전에 scikit-learn python 패키지를 설치해야 합니다.
from sklearn . feature_extraction . text import ENGLISH_STOP_WORDS
extract_keywords에서 방금 수행한 웹사이트에서 스크랩한 텍스트를 제공해야 합니다. 여기에서 스크랩한 텍스트를 포함하는 full_text라는 변수를 만들었습니다.
keywords = kw_extractor . extract_keywords ( full_text )
추출된 키워드 중복 제거 또는 Word Cloudify
스크립트가 제대로 작동하는 경우 이와 같이 추출된 키워드를 생성할 수 있습니다. JSON 형식이며 점수 값 없이 키워드를 추출하는 루프를 만들 수 있습니다.
전체적으로 지능적인 통찰력을 위해 이러한 키워드를 잘 사용하는 두 가지 방법이 있습니다. 하나는 키워드 인기도를 크기별로 표시하기 위해 수천 개의 키워드를 사용하여 워드 클라우드를 생성하는 것입니다. 다른 하나는 키워드 중복을 제거하고 고유한 키워드 목록만 남기는 것입니다. 여기에서는 스크립트 중복을 제거하는 방법을 보여 드리겠습니다.
final_keyword = list ( dict . fromkeys ( keywordResult ))
키워드 추출기의 전체 Python 스크립트
68장 – Easy2Digital API를 사용하여 키워드 추출기 구축에 관심이 있는 경우, "Chapter 68"이라는 메시지를 추가하여 뉴스레터를 구독 하십시오. . 귀하의 사서함으로 스크립트를 즉시 보내드립니다. (이메일 스크레이퍼도 필요하시면 유료버전이 필요하다고 말씀해주세요.
68장 – Easy2Digital API를 사용하여 키워드 추출기 구축을 즐겁게 읽으시기 바랍니다. 그렇다면 아래 나열된 항목 중 하나를 수행하여 지원해 주세요. 항상 채널에 도움이 되기 때문입니다.
- PayPal( paypal.me/Easy2digital )을 통해 채널을 지원하고 기부하세요.
- 제 채널 구독하시고 알림벨을 켜주세요 Easy2Digital 유튜브 채널 .
- 내 페이지 팔로우 및 좋아요 Easy2Digital Facebook 페이지
- #easy2digital 해시태그를 사용하여 소셜 네트워크에 기사를 공유하세요.
- Easy2Digital 최신 기사, 비디오 및 할인 코드를 받으려면 주간 뉴스레터에 가입하십시오.
- 독점적인 혜택을 누리려면 Patreon을 통해 월간 멤버십을 구독하세요( www.patreon.com/louisludigital ).