Unsupervised learning: aprendizaje automático sin restricciones
El unsupervised learning o aprendizaje no supervisado sirve para entrenar un modelo de inteligencia artificial (IA) utilizando datos sin etiquetar para descubrir patrones, correlaciones y similitudes ocultos. Sigue leyendo para saber más sobre el aprendizaje no supervisado. [TOC]
¿En qué consiste el unsupervised learning?
El aprendizaje no supervisado (en inglés, unsupervised learning o unsupervised machine learning) es un método de análisis de datos que pertenece al campo de la inteligencia artificial. En este caso, una red neuronal artificial se basa en las similitudes que presentan los diferentes valores de entrada. Con el aprendizaje no supervisado, el ordenador intenta reconocer de forma autónoma los patrones y estructuras que comparten dichos valores.
Por tanto, el aprendizaje no supervisado sería lo contrario del aprendizaje supervisado, un procedimiento en el que los desarrolladores están totalmente al mando y marcan el objetivo de aprendizaje. Sin embargo, con el aprendizaje supervisado, los datos deben etiquetarse o categorizarse manualmente antes de usarlos para entrenar la IA y eso lleva una cantidad de tiempo considerable.
- Crea tu página web en tiempo récord
- Impulsa tu negocio gracias al marketing por IA
- Ahorra tiempo y obtén mejores resultados
¿Cómo funciona el aprendizaje no supervisado?
Explicado de forma sencilla, este método de aprendizaje consiste en una red neuronal artificial que analiza y utiliza una enorme cantidad de información para determinar contextos, patrones y similitudes entre los datos. Este proceso se basa en diferentes procedimientos. Una de las técnicas que se emplean en esta forma de aprendizaje es el análisis de grupos o clustering. En este caso, los algoritmos se encargan de formar grupos de manera autónoma para, finalmente, asignarlos a los datos.
Por ejemplo, si los datos son fotos de perros y gatos, el programa compararía y agruparía estas fotos en función de sus características en el aprendizaje no supervisado. A diferencia del aprendizaje supervisado, no se le indica al algoritmo de antemano si debe diferenciar entre fotos de perros y fotos de gatos, pero es posible que lo haga. Los algoritmos del aprendizaje automático no supervisado toman sus decisiones basándose en similitudes y diferencias entre las fotos, como el color del pelaje del animal, por ejemplo.
Otro método es la asociación: en este caso, para ordenar los datos, el sistema los combina basándose en los atributos que comparten. De esta manera, la tarea de los algoritmos es encontrar las relaciones que hay entre los objetos, sin necesidad de que exista un parecido entre ellos. Una vez más, podemos tomar el ejemplo de las fotos de perros: mediante la asociación, el algoritmo del aprendizaje no supervisado no agruparía todos los perros juntos, sino que, por ejemplo, relacionaría las correas con los perros.

¿Dónde y cuándo se utiliza el aprendizaje no supervisado?
Hay muchos ejemplos de aprendizaje no supervisado. Gracias a este método de aprendizaje, los programas son capaces de aprender las reglas de un juego y diseñar estrategias ganadoras, por lo que pueden utilizarse en el mercado de valores para conseguir beneficios. De este modo, es posible ofrecerle a un programa datos sin procesar sobre las cotizaciones bursátiles para que, por sí mismo, pueda reconocer las actividades de la bolsa y anticipar tendencias.
La inteligencia artificial y, en particular, el aprendizaje no supervisado, ya se utilizan en muchas otras áreas. Por ejemplo, en el marketing es posible determinar los públicos objetivo más relevantes mediante el método del clustering. En este ámbito, la atención se centra en los grupos de personas, que forman la base para desarrollar las estrategias publicitarias. Los algoritmos pueden aprender de forma independiente a agrupar personas con los procedimientos del unsupervised learning.
Un área en la que ya se ha consolidado firmemente el principio del aprendizaje no supervisado es el reconocimiento de voz, imprescindible para el funcionamiento de asistentes de voz como Siri, Alexa o el Asistente de Google. Estos programas aprenden los hábitos de habla del propietario y, con el tiempo, pueden entender expresiones cada vez más precisas, aunque la persona hable un dialecto o tenga un impedimento del habla.
También muchos smartphones incorporan el unsupervised learning y permiten así ordenar la galería de imágenes. El aprendizaje independiente y sin supervisión permite que el dispositivo reconozca a una misma persona en varias fotos o identifique mediante los metadatos que dos instantáneas han sido tomadas en la misma ubicación. Gracias a este sistema, podemos ordenar las fotos según el lugar donde se tomaron o las personas retratadas en ellas.
En los chats también se ha probado la eficacia del aprendizaje no supervisado. La mayoría de los usuarios de Internet ya se ha topado con algún chatbot o bot conversacional, que se encarga de regular la interacción social en las conversaciones virtuales: así, cuando los bots detectan automáticamente insultos, incitación al odio, discriminación o insultos raciales, eliminan a dicho usuario del chat o le llaman la atención. Aquí la inteligencia artificial también desempeña un papel importante. Los chats automatizados que ofrecen servicio al cliente durante los pedidos en línea funcionan de forma similar: ya sea por mensajería o por teléfono, los bots aprenden de forma autónoma y, en parte, sin supervisión.
Un ejemplo negativo: chatbot en redes sociales
En 2016, Microsoft se dio cuenta de que el aprendizaje sin supervisión también podía tener un efecto negativo. La empresa creó una cuenta de Twitter para su bot Tay, con inteligencia artificial, que aprendía comunicándose con otros usuarios de la plataforma. Aunque al principio el programa era bastante sencillo, pronto comenzó a utilizar emoticonos e, incluso, a construir frases complejas. Sin embargo, la inteligencia artificial no calibraba el contenido de sus mensajes y rápidamente comenzó a incitar al antifeminismo y a la xenofobia, difundiendo además teorías conspiratorias. Todo sucedió en menos de 24 horas. El programa en sí mismo no tenía motivaciones racistas o políticas, sino que simplemente aprendió de las publicaciones de las personas. Se desconoce el número de usuarios de Twitter, si es que lo había, que se permitieron alimentar a Tay con este tipo de datos solo por hacer la gracia.
Un ejemplo positivo: investigación genética
Es indudable el efecto positivo del aprendizaje no supervisado en la investigación genética: en este ámbito, el método del clustering sirve de ayuda para analizar el material genético. Los sectores médico y técnico evolucionan con fuerza y al unísono gracias a la inteligencia artificial y a sus métodos de aprendizaje, y la investigación se acelera enormemente, lo que permitirá que enfermedades hereditarias como la anemia falciforme o la ceguera de origen genético puedan ser tratadas y curadas en el futuro.
Ventajas del unsupervised learning en comparación con otros métodos
El aprendizaje automático no solo se aplica al desarrollo tecnológico, sino que también contribuye a aliviar y facilitar muchas áreas de nuestra rutina diaria, enriqueciendo la vida cotidiana, la economía y la investigación. A diferencia de los otros dos métodos de aprendizaje (supervisado y por refuerzo), los desarrolladores no están involucrados en el propio entrenamiento, lo que, además de un posible ahorro de tiempo, supone otra ventaja: el aprendizaje no supervisado permite reconocer patrones que nadie ha sido capaz de percibir previamente. Así, basándose en el aprendizaje automático no supervisado, los algoritmos también tienen la posibilidad de desarrollar ideas creativas.
Diferencias con el aprendizaje supervisado y el semisupervisado
Además del aprendizaje no supervisado, también existe el aprendizaje supervisado, que ya hemos mencionado anteriormente, y el aprendizaje semisupervisado, que se diferencian del aprendizaje no supervisado en varios aspectos. A continuación, analizamos brevemente esas diferencias.
Aprendizaje no supervisado vs. aprendizaje supervisado
A diferencia del aprendizaje no supervisado, con el aprendizaje supervisado tanto los datos de entrada como los resultados correspondientes se saben desde el principio. No obstante, el aprendizaje supervisado tiene objetivos diferentes al aprendizaje no supervisado. Como en el aprendizaje supervisado ya existe una respuesta “correcta” para cada dato, este método de aprendizaje pretende garantizar que la IA pueda responder “correctamente” una vez finalizado el entrenamiento.
Además de sus diferentes objetivos y posibles aplicaciones, estos dos tipos de aprendizaje difieren mucho en cuanto a su eficiencia y claridad. El aprendizaje no supervisado solo necesita datos en bruto para entrenar y reconocer patrones. Por ello, los resultados suelen ser muy abstractos en comparación con el aprendizaje supervisado y, en ocasiones, deben analizarse manualmente. Por otro lado, los costos iniciales del aprendizaje supervisado son bastante altos, ya que el entrenamiento solo puede realizarse con datos completamente etiquetados. La ventaja del aprendizaje supervisado es que los objetivos del entrenamiento se definen claramente al etiquetar los datos y eso se traduce en unos resultados, por lo general, más comprensibles.
Aprendizaje no supervisado vs. aprendizaje semisupervisado
En el aprendizaje semisupervisado se utilizan tanto datos etiquetados como no etiquetados para el entramiento de la IA. Primero, el modelo aprende los datos etiquetados para generar un modelo de clasificación rudimentario. A continuación, se utiliza este modelo para hacer predicciones sobre los datos no etiquetados. Después, se vuelve a entrenar el modelo, esta vez utilizando los datos etiquetados y las predicciones, que se tratan como etiquetas. Este proceso puede repetirse de manera iterativa.
En definitiva, el aprendizaje semisupervisado, al igual que el supervisado, es más adecuado para problemas de clasificación, mientras que el aprendizaje no supervisado se utiliza principalmente para clustering y asociación. Una similitud entre el aprendizaje semisupervisado y el no supervisado sería que ambos tienen unos costos iniciales relativamente bajos.
Otros métodos de aprendizaje de IA: aprendizaje por refuerzo
Entre el aprendizaje supervisado y el no supervisado encontramos el aprendizaje por refuerzo. En este caso, los desarrolladores solo proporcionan impulsos para influir en el entrenamiento de los algoritmos. Con este método, un ordenador aprende a través de ensayo y error qué decisiones son correctas. Por cada decisión, el ordenador recibe una reacción positiva o negativa de su entorno de entrenamiento. De esta manera, la inteligencia artificial puede reconocer patrones y desarrollar estrategias a largo plazo para obtener el mayor número posible de reacciones positivas.
Por ejemplo, se podría entrenar un robot mediante aprendizaje con refuerzo para encontrar un objeto en una habitación y colocarlo cada vez en un lugar diferente. El robot recibiría feedback negativo por cada colisión y tiempo perdido. Con el tiempo, el robot desarrollaría estrategias para optimizar su método de búsqueda.