サイトアイコン EASY2DIGITAL

Twitterメールスクレイパーを作成する方法

このPythonチュートリアルでは、TweepyとTwitterを使用してユーザーのメールアドレスを取得するTwitterメールスクレイパーを作成する方法について説明します。このチュートリアルの最後には、正規表現を使用して段落からテキスト情報を抽出する方法も説明します。

Pythonモジュール:Easy2Digital API、Twitter API、正規表現

目次:Twitter Email Scraper

Twitter Email Scraper – Twitterプロファイルのメールアドレスをスクレイプするための方法論

Twitter API自体は、プライバシーやGDPRのコンプライアンスに対応しているため、Twitterユーザープロファイルのメールアドレスは提供していません。ただし、ビジネスコラボレーションを積極的に探しているTwitterプロファイルは、通常、その連絡先をバイオグラフィに記載しています。手動で目を凝らして情報を収集するようにその情報をスクレイピングすることは、データプライバシーに違反していません。なぜなら、ユーザーはあなたに彼女または彼に連絡するように歓迎しているからです。

したがって、このPythonチュートリアルの方法論は、バイオグラフィ情報をスクレイピングして、電子メールを抽出することです。基本的に、ほとんどのユーザーはそこに彼らの連絡先を置きます。

TwitterのニックネームまたはTwitter IDが大丈夫

バイオグラフィ情報をスクレイプする前に、特定のプロファイルIDまたはニックネームが必要です。このスクレイピングアプローチについては、この記事を参照してください。

Chapter 34: Twitter Bot for Scraping Most Popular Topics and Influencer Profiles

Twitterユーザーのバイオグラフィ情報をスクレイプする

Twitterのニックネームを例にとります。名前のリストが準備できたら、Tweepyのget_user()メソッドとパラメーターscreen_nameを使用します。このメソッドは、バイオグラフィ情報を含む特定のTwitterユーザープロファイル情報を呼び出すことができます。

レスポンスデータのフォーマットは、現時点ではJSONとAPIレスポンスID番号が混在しています。JSONを解析するには、ユーザーjsonデータを取得するためのuser._jsonコマンドを追加する必要があります。

次に、JSONデータの一部にはdescriptionというデータセットがあります。これは、ユーザーが自分のプロファイルにアップロードしたバイオグラフィ情報です。これをスクレイプする必要があります。複数のユーザーニックネームを持っている場合は、ループが必要です。

Twitter Email Scraper – 正規表現を使用して電子メールアドレスを抽出する

バイオグラフィ情報には、電子メールアドレス、WebサイトのURL、ソーシャルプロファイルなどが含まれる場合があります。必要に応じて正規表現をカスタマイズできます。ここに電子メールアドレスを抽出するための正規表現があります。

Regexextract式で、第1の位置引数はデータソースを設定するためです。

第2の位置引数は、電子メールを抽出するための式です。

Twitter Email Scraperの完全なPythonスクリプト

Chapter 50 – Twitter Email Scraper Using Twitter、Easy2Digital API、およびRegular Expressionの完全なスクリプトに興味がある場合は、「Chapter 50」というメッセージを追加してニュースレターに登録してください。すぐにスクリプトをあなたのメールボックスに送信します。

お問合せ

Chapter 50 – Twitter Email Scraper Using Twitter、Easy2Digital API、およびRegular Expressionをお楽しみいただけたら幸いです。もしそうであれば、以下のいずれかのことを行って、チャンネルをいつも支援してくれることをお願いします。

  • ターミナルを開く
  • パスに移動する
  • $ chmod 400 .pem
  • $ ssh -i .pem ubuntu@
  • 両方のコマンドは、インスタンス接続ページからコピーできます。行って、探索してください!この記事よりも更新された機能を見つけることができるかもしれません。AWSは、競合他社と比較して、より脂っこく、油っこくなる傾向があります。

    EC2にFlaskアプリを追加する

    ここまで来たら、通常の方法でFlaskを設定してアプリを展開するだけです。以下の手順に従ってください:

    $ sudo apt-get update

    $ sudo apt-get install python3-venv

    // ディレクトリを作成する

    $ mkdir lovely

    $ cd lovely

    // 仮想環境を作成する

    $ python3 -m venv venv

    // 仮想環境をアクティブにする

    よくある質問:

    Q1: Twitterとは何ですか?

    A: Twitterは、140文字以内の短いメッセージを投稿できるオンラインのソーシャルネットワーキングサービスです。

    Q2: Twitterのアカウントを作成するにはどうすればいいですか?

    A: Twitterのウェブサイトまたはモバイルアプリを使用して、アカウントを作成するための手順に従ってください。

    Q3: ツイートとは何ですか?

    A: ツイートは、Twitter上で投稿される140文字以内のメッセージのことです。

    Q4: リツイートとは何ですか?

    A: リツイートは、他のユーザーのツイートを自分のタイムラインに再投稿することです。

    Q5: フォローとは何ですか?

    A: フォローは、他のユーザーの投稿を自分のタイムラインで見るために、そのユーザーを追加することです。

    Q6: ツイートを非公開にする方法はありますか?

    A: はい、ツイートを非公開にするには、アカウントのプライバシー設定を変更し、ツイートを承認制にすることができます。

    Q7: Twitterでハッシュタグを使用する方法はありますか?

    A: はい、ツイートにハッシュタグ(#)を追加することで、特定のトピックやキーワードで検索可能にすることができます。

    Q8: ツイートを削除する方法はありますか?

    A: はい、自分のツイートを削除するには、ツイートを表示し、削除オプションを選択します。

    Q9: ツイートに写真を追加する方法はありますか?

    A: はい、ツイートに写真を追加するには、ツイート作成画面で写真アイコンを選択し、アップロードする画像を選択します。

    Q10: Twitterで他のユーザーをメンションする方法はありますか?

    A: はい、ツイート内で他のユーザーをメンションするには、@の後にユーザー名を入力します。

    モバイルバージョンを終了