Calcula valores promedio fácilmente con Pandas mean()

Índice

La función DataFrame.mean() de la Biblioteca Python Pandas se utiliza para calcular el valor promedio a lo largo de uno o más ejes de un DataFrame. Pandas mean() es fundamental para el análisis de datos numéricos y puede proporcionar información muy valiosa sobre su distribución.

Web hosting

El hosting web al mejor precio

3 veces más rápido y un 60 % más barato
Máxima disponibilidad con > 99,99
Sólo con IONOS: hasta 500 GB de espacio de almacenamiento incluido

Sintaxis de Pandas `DataFrame.mean()`

La función Pandas-mean() acepta hasta tres parámetros y sigue una sintaxis básica sencilla:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)

python

Parámetros relevantes

Con la ayuda de varios parámetros, puedes ajustar el comportamiento de la función Pandas DataFrame.mean() para que se adapte a tus necesidades.

Parámetro	Descripción	Valor predeterminado
`axis`	Determina si el cálculo se realiza a lo largo de las filas (`axis=0`) o de las columnas (`axis=1`)	`0`
`skipna`	Si es `True`, se ignoran los valores NaN	`True`
`numeric_only`	Si es `True`, solo se incluyen los datos numéricos en el cálculo	`False`

Aplicación de la función `mean()` de Pandas

Pandas DataFrame.mean() tiene diversas aplicaciones.

Calcular los valores promedio de cada columna

En los siguientes ejemplos, se utiliza un DataFrame de Pandas con los siguientes datos:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)

python

El DataFrame resultante sería el siguiente:

Para calcular el valor promedio de cada columna, se puede usar la función Pandas mean() con el parámetro predeterminado axis=0:

column_means = df.mean()
print(column_means)

python

De esta manera, se calculan los valores promedio de cada columna (A, B y C) dividiendo la suma de los elementos por la cantidad de elementos en cada columna. Como resultado, se obtiene la siguiente Series de Pandas:

A    2.5
B    5.5
C    8.5
dtype: float64

Calcular los valores promedio de cada fila

Si en su lugar deseas calcular el valor promedio de cada fila, simplemente debes cambiar el parámetro axis a 1:

row_means = df.mean(axis=1)
print(row_means)

python

Los valores promedio de cada fila se calculan utilizando mean() de Pandas, dividiendo la suma de los elementos por la cantidad de elementos en cada fila. La llamada a la función genera el siguiente resultado:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

Ignorar valores NaN

En el siguiente ejemplo, se utiliza un DataFrame diferente para que contenga algunos valores NaN:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)

python

El código anterior genera el siguiente DataFrame:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Para calcular el promedio teniendo en cuenta los valores NaN, se utiliza el parámetro skipna. El valor predeterminado es True, lo que significa que Pandas mean() ignora automáticamente los valores NaN. En cambio, si cambiáramos el valor predeterminado a skipna=False, el cálculo del promedio de cualquier columna que contenga al menos un valor NaN dará como resultado NaN para esa columna.

mean_with_nan = df.mean()
print(mean_with_nan)

python

La llamada a la función de mean() de Pandas genera:

A    2.333333
B    5.666667
C    8.000000
dtype: float64

Artículos Favoritos

Compraventa de dominios: cómo ganar dinero con las direcciones web

La compraventa de dominios puede convertirse en una actividad lucrativa, siempre que se…

Comparamos 5 alternativas a Nextcloud

¿Buscas alternativas a Nextcloud y quieres saber si están a su nivel? Te ofrecemos un…

Los mejores proveedores de copias de seguridad en la nube

¡Asegura tus datos de manera fiable en la nube! Tus datos estarán en buenas manos con…

Cómo actualizar Debian 13 paso a paso

Aprende cómo actualizar Debian 13 de forma segura y sin errores, desde la preparación del…

Alternativas a InDesign de Adobe gratuitas

¿Te sale muy caro usar InDesign para la maquetación y el diseño editorial? Descubre las…

Artículos similares

UndreyShutterstock

Cómo unir DataFrames con Pandas merge() en Python

La función Pandas DataFrame merge() te ofrece diferentes formas de combinar datos de diversas fuentes. Al ajustar los parámetros, puedes realizar distintos tipos de operaciones de unión, dependiendo de cómo quieras analizar los datos. En este artículo, te explicamos cómo utilizar…

Python Pandas

Mr. Kosalshutterstock

El método Pandas fillna() para reemplazar valores NaN

La función fillna() de Pandas es un método que se utiliza para gestionar valores faltantes. Ofrece una gran flexibilidad a través del uso de varios parámetros que permiten adaptar el reemplazo de los valores NaN según las necesidades del usuario. En este artículo, conocerás los…

Python Pandas

Obtener valores nulos con Pandas isna()

Pandas DataFrame isna() es útil para identificar los datos que faltan en un DataFrame. Gracias a su sintaxis sencilla, te permite obtener rápidamente una visión general de los valores que faltan para que puedas tomar las medidas adecuadas para limpiar los datos. En este artículo,…

Python Pandas

BEST-BACKGROUNDSShutterstock

Buscar en DataFrames con Pandas isin()

Pandas isin() es una función muy útil para el análisis de datos. Con su sintaxis sencilla y múltiples aplicaciones, permite verificar rápida y eficientemente si ciertos valores están presentes en un DataFrame. Ya sea para comprobar columnas específicas, filtrar DataFrames o…

Python Pandas

NDAB Creativityshutterstock

Cómo utilizar el método Pandas groupby()

La función DataFrame.groupby() de Pandas te permite agrupar datos según diferentes criterios y realizar agregaciones complejas de forma eficiente. Si aplicas este método correctamente, podrás realizar análisis de una forma más rápida y sencilla. Descubre todo lo que necesitas…

Python Pandas

UndreyShutterstock

Obtener valores únicos con Pandas unique()

La función Pandas DataFrame unique() se puede utilizar para identificar rápidamente los valores únicos de una columna en un DataFrame, algo muy útil para encontrar duplicados. Esta función facilita el manejo eficiente de grandes conjuntos de datos porque devuelve directamente un…

Python Pandas

Calcula valores promedio fá­ci­l­me­n­te con Pandas mean()

Sintaxis de Pandas DataFrame.mean()

Pa­rá­me­tros re­le­va­n­tes

Apli­ca­ción de la función mean() de Pandas

Calcular los valores promedio de cada columna

Calcular los valores promedio de cada fila

Ignorar valores NaN

Calcula valores promedio fácilmente con Pandas mean()

Sintaxis de Pandas `DataFrame.mean()`

Parámetros relevantes

Aplicación de la función `mean()` de Pandas