Pandas Groupby(): combine varios conjuntos de valores en una sola clave

Presente Pandas GroupBy() y vea cómo combinar varios conjuntos de valores en uno solo con una clave compartida; obtenga más información.

En este artículo, presentaré Pandas GroupBy() y explicaré cómo combinar el valor en un conjunto con una clave compartida o un valor de columna. Por ejemplo, si el nombre de su campaña publicitaria de Google se comparte con diferentes conjuntos de datos, como datos diarios, semanales o mensuales, etc., aquí encontrará una manera de consolidarlos en un solo conjunto para poder recuperarlos, usarlos y aplicarlos fácilmente. ellos en las interacciones de aplicaciones web.

Tabla de contenidos en Pandas Groupby()

Pandas Groupby() y Aplicar(lambda)

Una operación groupby implica alguna combinación de dividir el objeto, aplicar una función y combinar los resultados. Esto se puede utilizar para agrupar grandes cantidades de datos y calcular operaciones en estos grupos.

Por ejemplo, aquí hay una muestra de un símbolo bursátil, que es BILL. Básicamente, cada día hay nuevas actualizaciones de diferentes medios. Si desea configurar BILL, esta palabra clave es clave para recuperar cualquier BILL relacionado con noticias. groupby() se puede utilizar en este caso combinando la columna de símbolos en una.

df.groupby('Symbol')

Luego, también debemos seleccionar los datos de BILL que desea agregar y aplicar a este nuevo conjunto de datos empaquetado bajo una sola clave: BILL. Luego, podemos usar las funciones apply() y lambda.

Aplicar()

Aplique la función func en grupos y combine los resultados. La función pasada para aplicar debe tomar un marco de datos como primer argumento y devolver un marco de datos, una serie o un escalar. apply luego se encargará de combinar los resultados nuevamente en un único marco de datos o serie. Por lo tanto, apply es un método de agrupación muy flexible.

En este caso, usamos apply() para saber qué columna de datos estaría bajo la misma clave BILL

lambda

pandas.groupby(“Symbol”).apply(lambda x: x[])) se puede utilizar con python lambda para ejecutar expresiones. Una función lambda en Python es una pequeña función anónima que puede tomar cualquier número de argumentos y ejecutar una expresión.

En este caso, el valor de la lista en lambda son las columnas seleccionadas que desea agregar a la clave BILL. Aquí está el ejemplo de código de la siguiente manera:

Abc = df.groupby('Symbol').apply(lambda x: x[['News Publish Date','News Title','News Link','News Source','E2D Updated Date']]

Utilice to_json(), reset_index(), set_index() para establecer una clave y cambiar el nombre del conjunto de datos empaquetado

El objetivo principal de consolidar el punto de entrada BILL utilizando groupby().apply(lambda) es recuperar fácilmente todos los datos relacionados con este símbolo. Este enfoque es especialmente popular si desea convertirlos al formato de datos JSON.

Para ello, necesariamente se utilizan estas funciones para convertir estos datos.

Cde = abc.to_json(orient='records')

Esta variable es para convertir el conjunto de datos bajo el símbolo al formato JSON.

Efg = Cde.reset_index().rename(columns={0:'NewsData'})

Para crear un nuevo nombre para las noticias bursátiles relacionadas con este símbolo, podemos restablecer el índice y cambiarle el nombre a un nuevo nombre.

Xyz = Efg.set_index('Symbol', inplace=True)

Por último, pero no menos importante, también seleccionamos la clave como clave JSON configurándola como elemento de índice. Por lo tanto, siempre que los usuarios llamen al nombre único del símbolo bursátil en JSON, se podrán recuperar todos los datos de noticias relacionados.

Scripts completos de Python de Pandas Groupby(), Lambda, reset_index y set_index

Si está interesado en los scripts Python completos de Pandas Groupby, Lambda, reset_index y set_index, suscríbete a nuestro boletín agregando el mensaje " Pandas groupby() " . Le enviaremos el script inmediatamente a su buzón de correo.

Espero que disfrutes leyendo Pandas Groupby(): combina todos los valores en un conjunto compartido con la misma clave de índice usando Python. Si lo hizo, apóyenos haciendo una de las cosas que se enumeran a continuación, porque siempre ayuda a nuestro canal.