Obtener valores únicos con Pandas unique()
Puedes usar la función unique()
de la Biblioteca Python Pandas para obtener los valores únicos en una columna de un DataFrame, lo que te permitirá obtener una visión general de los diferentes valores dentro de un conjunto de datos.
- Rápido, seguro, flexible y escalable
- Seguro con SSL y protección DDoS
- Dominio y asesor personal incluidos
Sintaxis de DataFrame[].unique()
en Pandas
La sintaxis básica para utilizar la función unique()
de Pandas es sencilla, ya que esta función no acepta ningún parámetro adicional:
DataFrame['column_name'].unique()
pythonTen en cuenta que en los DataFrames de Pandas, la función unique()
solo se puede aplicar a una columna específica del DataFrame. Por lo tanto, deberás especificar la columna antes de usarla. La función unique()
genera un array de NumPy con los valores únicos en el orden que aparecen, es decir, no realiza ninguna ordenación de los valores.
Si llevas algún tiempo programando en Python, seguramente ya conoces el equivalente de NumPy a la función unique()
de Pandas. Te recomendamos usar la variante de Pandas, ya que será más eficiente en este caso.
Cómo usar Pandas unique()
Para utilizar unique()
en los DataFrames de Pandas, debes especificar la columna en la que quieres buscar valores únicos.
En el siguiente ejemplo te mostramos un DataFrame con información sobre diferentes personas:
import pandas as pd
# Crear un DataFrame de ejemplo
data = {
'Nombre': ['Alicia', 'Juan', 'Carlos', 'David', 'Eduardo'],
'Edad': [24, 27, 22, 32, 29],
'Ciudad': ['Los Ángeles', 'Nueva York', 'Los Ángeles', 'Chicago', 'Nueva York']
}
df = pd.DataFrame(data)
print(df)
pythonEl DataFrame resultante sería el siguiente:
Nombre Edad Ciudad
0 Alicia 24 Los Ángeles
1 Juan 27 Nueva York
2 Carlos 22 Los Ángeles
3 David 32 Chicago
4 Eduardo 29 Nueva York
Ahora, si quieres identificar las ciudades en las que viven estas personas, asegurándote de que cada ciudad solo se liste una vez, puedes utilizar la función unique()
de Pandas en la columna del DataFrame que contiene las ciudades:
# Encontrar ciudades únicas
unique_cities = df['Ciudad'].unique()
print(unique_cities)
pythonEl resultado es un array de NumPy que contiene cada ciudad una sola vez y que muestra que las personas de la lista provienen de tres ciudades diferentes: Los Ángeles, Nueva York y Chicago.
['Los Ángeles' 'Nueva York' 'Chicago']