Para cumplir con su tarea, RankBrain recurre a la experiencia que ha acumulado con consultas anteriores, crea conexiones y se basa en ellas para predecir lo que busca cada usuario y escoger la mejor manera de responder a su consulta. Para ello intenta resolver cualquier ambigüedad y deducir el sentido de términos desconocidos hasta el momento como neologismos, por ejemplo. Obviamente, Google no revela cómo se enfrenta a este desafío, aunque los expertos en SEO sospechan que RankBrain traduce las consultas con ayuda de representaciones vectoriales de palabras en una forma que permite a los ordenadores deducir relaciones semánticas.
Ya en 2013, Google lanza Word2Vec, un software de aprendizaje automático de código abierto con el que transformar, medir y comparar las relaciones semánticas entre palabras en una representación matemática. Para poder llevar a cabo este análisis es necesario contar con un corpus lingüístico de base.
Para “aprender” las relaciones semánticas entre las palabras, Word2Vec genera en un primer momento un espacio vectorial multidimensional (n-dimensional) en el que cada palabra del corpus subyacente es representada por un vector en tantas dimensiones como defina el valor n. Cuantas más dimensiones se seleccionen, más relaciones con otras palabras es capaz de reconocer el programa.
En un siguiente paso, este espacio vectorial se introduce en una red neuronal que permite, con ayuda de un algoritmo de aprendizaje, ajustar el espacio vectorial de tal manera que las palabras que se utilizan en el mismo contexto generen un vector parecido. La semejanza entre vectores se calcula a partir de la denominada distancia de coseno como un valor entre -1 y +1.
En definitiva, si se proporciona un corpus lingüístico cualquiera a Word2Vec como input, el programa entrega los correspondientes vectores como output, los cuales permiten evaluar la cercanía o la distancia semántica de las palabras contenidas en el corpus. Si el programa se enfrenta a un input nuevo, el algoritmo de aprendizaje le capacita para reajustar el espacio vectorial y crear nuevas conexiones semánticas o rechazar conclusiones anteriores. Es así como la red neuronal “aprende”.