この記事では、Pandas GroupBy() の紹介と、共有キーまたは列値を使用して値を 1 つのセットに結合する方法について説明します。たとえば、Google の広告キャンペーン名が日次、週次、月次などのさまざまなデータ セットと共有されている場合、それらを 1 つのセットに統合して簡単に取得、使用、適用できるようにする方法を次に示します。 Web アプリケーションの対話でそれらを使用します。
Pandas Groupby() の目次
- GroupBy()
- 銘柄ニュースデータの操作に使用される Lambda、reset_index、および set_index
- Pandas Groupby、Lambda、reset_index、set_index の完全な Python スクリプト
- よくある質問
パンダの Groupby() & apply(lambda)
groupby
操作には、オブジェクトの分割、関数の適用、結果の結合の組み合わせが含まれます。これを使用して、大量のデータをグループ化し、これらのグループに対して操作を計算できます。
たとえば、ここにある銘柄記号のサンプルは BILL です。基本的には、毎日さまざまなメディアから新しい更新情報が提供されます。 BILL を設定したい場合、このキーワードはニュース関連の BILL を取得するためのキーになります。この場合、シンボル列を 1 つに結合することでgroupby()
を使用できます。
df.groupby('Symbol')
次に、追加したい BILL のデータを選択し、単一のキー BILL の下でこの新しいパックされたデータセットに適用する必要もあります。次に、apply() とラムダ関数を使用できます。
適用する()
関数 func をグループごとに適用し、結果を結合します。 apply に渡される関数は、最初の引数としてデータ フレームを受け取り、DataFrame、Series、またはスカラーを返す必要があります。 apply は結果を結合して単一のデータ フレームまたはシリーズに戻します。したがって、apply は非常に柔軟なグループ化方法です。
ラムダ
pandas.groupby(“Symbol”).apply(lambda x: x[]))
Python ラムダで使用して式を実行できます。 Python のラムダ関数は、任意の数の引数を受け取り、式を実行できる小さな匿名関数です。
この場合、ラムダのリスト値は、キー BILL に追加する選択された列です。コードサンプルは次のとおりです。
Abc = df.groupby('Symbol').apply(lambda x: x[['News Publish Date','News Title','News Link','News Source','E2D Updated Date']]
to_json()、reset_index()、set_index() を使用してキーを設定し、パックされたデータセットの名前を変更します
groupby().apply(lambda)
を使用してエントリ ポイント BILL を統合する主な目的は、このシンボルに関連するすべてのデータを簡単にフェッチするためです。このアプローチは、JSON データ形式に変換する場合に特に人気があります。
この目的のために、これらの関数は必然的にこれらのデータを変換するために使用されます。
Cde = abc.to_json(orient='records')
この変数は、シンボルの下のデータセットを JSON 形式に変換します。
Efg = Cde.reset_index().rename(columns={0:'NewsData'})
このシンボルに関連する株式ニュースの新しい名前を作成するには、インデックスをリセットし、インデックスの名前を新しい名前に変更します。
Xyz = Efg.set_index('Symbol', inplace=True)
最後になりましたが、キーをインデックス要素として設定することで、JSON キーとしても選択します。したがって、ユーザーが JSON で一意の銘柄記号名を呼び出す限り、関連するすべてのニュース データを取得できます。
Pandas Groupby()、Lambda、reset_index、set_index の完全な Python スクリプト
Pandas Groupby、Lambda、reset_index、set_index の完全な Python スクリプトに興味がある場合は、 「 Pandas groupby() 」というメッセージを追加してニュースレターを購読してください。 。スクリプトはすぐにあなたのメールボックスに送信されます。
「Pandas Groupby() – Python を使用してすべての値を同じインデックス キーで共有される 1 つのセットに結合する」をお読みいただければ幸いです。もしそうなら、以下にリストされているいずれかの方法で私たちをサポートしてください。それは常に私たちのチャンネルに役立ちます。
- PayPal ( paypal.me/Easy2digital ) を通じて私たちのチャンネルをサポートし、寄付してください。
- 私のチャンネルを購読し、 Easy2Digital Youtube チャンネルの通知ベルをオンにしてください。
- Easy2Digital Facebook ページをフォローして「いいね!」してください
- ハッシュタグ #easy2digital を付けて記事をソーシャル ネットワークで共有してください
- Easy2Digital の最新記事、ビデオ、割引コードを受け取るには、毎週のニュースレターに登録してください。
- Patreon を通じて月額メンバーシップに登録すると、限定特典をお楽しみいただけます ( www.patreon.com/louisludigital )