Puedes usar la función unique() de la Biblioteca Python Pandas para obtener los valores únicos en una columna de un DataFrame, lo que te permitirá obtener una visión general de los diferentes valores dentro de un conjunto de datos.

Web Hosting
El hosting como nunca lo habías visto
  • Rápido, seguro, flexible y escalable
  • Seguro con SSL y protección DDoS
  • Dominio y asesor personal incluidos

Sintaxis de DataFrame[].unique() en Pandas

La sintaxis básica para utilizar la función unique() de Pandas es sencilla, ya que esta función no acepta ningún parámetro adicional:

DataFrame['column_name'].unique()
python

Ten en cuenta que en los DataFrames de Pandas, la función unique() solo se puede aplicar a una columna específica del DataFrame. Por lo tanto, deberás especificar la columna antes de usarla. La función unique() genera un array de NumPy con los valores únicos en el orden que aparecen, es decir, no realiza ninguna ordenación de los valores.

Nota

Si llevas algún tiempo programando en Python, seguramente ya conoces el equivalente de NumPy a la función unique() de Pandas. Te recomendamos usar la variante de Pandas, ya que será más eficiente en este caso.

Cómo usar Pandas unique()

Para utilizar unique() en los DataFrames de Pandas, debes especificar la columna en la que quieres buscar valores únicos.

En el siguiente ejemplo te mostramos un DataFrame con información sobre diferentes personas:

import pandas as pd
# Crear un DataFrame de ejemplo
data = {
    'Nombre': ['Alicia', 'Juan', 'Carlos', 'David', 'Eduardo'],
    'Edad': [24, 27, 22, 32, 29],
    'Ciudad': ['Los Ángeles', 'Nueva York', 'Los Ángeles', 'Chicago', 'Nueva York']
}
df = pd.DataFrame(data)
print(df)
python

El DataFrame resultante sería el siguiente:

Nombre    Edad       Ciudad
0    Alicia     24   Los Ángeles
1     Juan     27    Nueva York
2    Carlos     22   Los Ángeles
3    David     32      Chicago
4   Eduardo     29    Nueva York

Ahora, si quieres identificar las ciudades en las que viven estas personas, asegurándote de que cada ciudad solo se liste una vez, puedes utilizar la función unique() de Pandas en la columna del DataFrame que contiene las ciudades:

# Encontrar ciudades únicas
unique_cities = df['Ciudad'].unique()
print(unique_cities)
python

El resultado es un array de NumPy que contiene cada ciudad una sola vez y que muestra que las personas de la lista provienen de tres ciudades diferentes: Los Ángeles, Nueva York y Chicago.

['Los Ángeles' 'Nueva York' 'Chicago']
¿Le ha resultado útil este artículo?
Ir al menú principal