EASY2DIGITAL 国际站简体中文版

Pandas Groupby() – 在一个键下组合多组值

在这篇文章中,我将分享介绍 Pandas GroupBy(),并介绍如何使用共享键或列值将值组合成一组。例如,如果您的 Google 广告活动名称与不同的数据集共享,例如每日、每周或每月的数据等,则可以使用以下方法将它们合并为一组,以便于获取、使用和应用它们在 Web 应用程序交互中。

Pandas Groupby() 的目录

Pandas Groupby() 和 Apply(lambda)

groupby操作涉及分割对象、应用函数以及组合结果的某种组合。这可用于对大量数据进行分组并在这些组上进行计算操作。

例如,以下是股票代码的示例,即 BILL。基本上,每天都有来自不同媒体的新更新。如果您想设置 BILL,则此关键字是获取任何与新闻相关的 BILL 的关键。在这种情况下,可以通过将符号列合并为一个来使用groupby()

df.groupby('Symbol')

然后,我们还需要选择您想要添加的 BILL 数据,并将其应用到单键 BILL 下的新打包数据集。然后,我们可以使用 apply() 和 lambda 函数

申请()

逐组应用函数 func 并将结果组合在一起。传递给 apply 的函数必须将数据帧作为其第一个参数并返回 DataFrame、Series 或标量。然后 apply 将负责将结果组合回单个数据帧或系列。因此 apply 是一种高度灵活的分组方法。

在本例中,我们使用apply()来告知哪一列数据将位于同一键 BILL 下

拉姆达

pandas.groupby(“Symbol”).apply(lambda x: x[]))可以与 python lambda 一起使用来执行表达式。 python 中的 lambda 函数是一个小型匿名函数,可以接受任意数量的参数并执行表达式。

在这种情况下,lambda 中的列表值是您要添加到键 BILL 的选定列。代码示例如下:

Abc = df.groupby('Symbol').apply(lambda x: x[['News Publish Date','News Title','News Link','News Source','E2D Updated Date']]

使用 to_json()、reset_index()、set_index() 设置键并重命名打包数据集

使用groupby().apply(lambda)合并入口点 BILL 的主要目的是为了轻松获取与该符号相关的所有数据。如果您想将它们转换为 JSON 数据格式,这种方法尤其受欢迎。

为此,必须使用这些函数来转换这些数据。

Cde = abc.to_json(orient='records')

这个变量是把符号下的数据集转成JSON格式

Efg = Cde.reset_index().rename(columns={0:'NewsData'})

要为与此符号相关的股票新闻创建新名称,我们可以重置索引并将索引重命名为新名称

Xyz = Efg.set_index('Symbol', inplace=True)

最后但并非最不重要的一点是,我们通过将其设置为索引元素来选择该键作为 JSON 键。这样,用户只要调用JSON中唯一的股票代码名称,就可以获取所有相关的新闻数据。

Pandas Groupby()、Lambda、reset_index 和 set_index 的完整 Python 脚本

如果您对Pandas Groupby、Lambda、reset_index 和 set_index 的完整 Python 脚本感兴趣,请添加消息“ Pandas groupby() ”来订阅我们的新闻通讯。我们会立即将脚本发送到您的邮箱。

我希望您喜欢阅读 Pandas Groupby() – 使用 Python 将所有值合并到与相同索引键共享的一组中。如果您这样做了,请通过执行下列操作之一来支持我们,因为这总是对我们的频道有所帮助。

退出移动版