Puedes usar la función unique() de la Bi­blio­te­ca Python Pandas para obtener los valores únicos en una columna de un DataFrame, lo que te permitirá obtener una visión general de los di­fe­re­n­tes valores dentro de un conjunto de datos.

Web Hosting
El hosting que crece con tu proyecto
  • Tiempo de actividad de 99.99 % y seguridad ga­ra­n­ti­za­da
  • Aumenta el re­n­di­mie­n­to según el tráfico de tu página web
  • Incluye dominio, SSL, e-mail y soporte 24/7

Sintaxis de DataFrame[].unique() en Pandas

La sintaxis básica para utilizar la función unique() de Pandas es sencilla, ya que esta función no acepta ningún parámetro adicional:

DataFrame['column_name'].unique()
python

Ten en cuenta que en los Da­ta­Fra­mes de Pandas, la función unique() solo se puede aplicar a una columna es­pe­cí­fi­ca del DataFrame. Por lo tanto, deberás es­pe­ci­fi­car la columna antes de usarla. La función unique() genera un array de NumPy con los valores únicos en el orden que aparecen, es decir, no realiza ninguna or­de­na­ción de los valores.

Nota

Si llevas algún tiempo pro­gra­ma­n­do en Python, se­gu­ra­me­n­te ya conoces el equi­va­le­n­te de NumPy a la función unique() de Pandas. Te re­co­me­n­da­mos usar la variante de Pandas, ya que será más eficiente en este caso.

Cómo usar Pandas unique()

Para utilizar unique() en los Da­ta­Fra­mes de Pandas, debes es­pe­ci­fi­car la columna en la que quieres buscar valores únicos.

En el siguiente ejemplo te mostramos un DataFrame con in­fo­r­ma­ción sobre di­fe­re­n­tes personas:

import pandas as pd
# Crear un DataFrame de ejemplo
data = {
    'Nombre': ['Alicia', 'Juan', 'Carlos', 'David', 'Eduardo'],
    'Edad': [24, 27, 22, 32, 29],
    'Ciudad': ['Los Ángeles', 'Nueva York', 'Los Ángeles', 'Chicago', 'Nueva York']
}
df = pd.DataFrame(data)
print(df)
python

El DataFrame re­su­l­ta­n­te sería el siguiente:

Nombre    Edad       Ciudad
0    Alicia     24   Los Ángeles
1     Juan     27    Nueva York
2    Carlos     22   Los Ángeles
3    David     32      Chicago
4   Eduardo     29    Nueva York

Ahora, si quieres ide­n­ti­fi­car las ciudades en las que viven estas personas, ase­gu­rá­n­do­te de que cada ciudad solo se liste una vez, puedes utilizar la función unique() de Pandas en la columna del DataFrame que contiene las ciudades:

# Encontrar ciudades únicas
unique_cities = df['Ciudad'].unique()
print(unique_cities)
python

El resultado es un array de NumPy que contiene cada ciudad una sola vez y que muestra que las personas de la lista provienen de tres ciudades di­fe­re­n­tes: Los Ángeles, Nueva York y Chicago.

['Los Ángeles' 'Nueva York' 'Chicago']
Ir al menú principal