Predecir el futuro con ayuda de métodos ma­te­má­ti­cos: esta parece ser la intrépida ambición del modelo pre­di­c­ti­vo en un futuro próximo. Este método de análisis de datos forma parte del análisis de big data y tiene como objetivo la pre­di­c­ción de te­n­de­n­cias futuras en di­s­ci­pli­nas como la ciencia, el marketing o en los sectores fi­na­n­cie­ro o de los seguros.

El elemento más im­po­r­ta­n­te de lo que también se podría denominar como pre­di­c­tion analytics es el llamado indicador pre­di­c­ti­vo, término acuñado, por ejemplo, para designar a una persona o unidad a las que se les hace un se­gui­mie­n­to para poder pro­no­s­ti­car un co­m­po­r­ta­mie­n­to futuro. Un ejemplo concreto de ello sería un seguro que se anticipa a los posibles factores para el cálculo de riesgos del pro­pie­ta­rio de un vehículo, donde se tendrían en cuenta aspectos como la ex­pe­rie­n­cia al volante, la edad o la salud de la persona en cuestión. De la suma de estos factores y, gracias al análisis pre­di­c­ti­vo, se pueden calcular los posibles riesgos de accidente, así como la cuantía de la prima del seguro.

Data mining, la base de los sondeos ana­lí­ti­cos

En la práctica, el término pre­di­c­ti­ve analytics se usa a menudo como sinónimo de minería de datos o data mining. En muchos casos, los métodos de data mining de­sem­pe­ñan un papel fu­n­da­me­n­tal en el proceso de ide­n­ti­fi­ca­ción de los enfoques de pre­di­c­ti­ve analytics, me­to­do­lo­gía que precisa la fu­n­cio­na­li­dad de la minería de datos y tiene en cuenta otras técnicas. Hay otros elementos como, por ejemplo, la teoría de juegos y el apre­n­di­za­je de las máquinas, que también de­sem­pe­ñan un papel esencial. Asimismo, a la hora de aplicar el método del análisis pre­di­c­ti­vo también se utilizan pro­ce­di­mie­n­tos de análisis es­pe­cia­les basados en al­go­ri­t­mos complejos para obtener un patrón claro a partir de fra­g­me­n­tos de textos inconexos pro­ce­de­n­tes de entradas en las redes sociales o de artículos de blogs.

Hecho

El data mining (ex­tra­c­ción de datos) intenta ide­n­ti­fi­car patrones inhe­re­n­tes en grandes ca­n­ti­da­des de datos con ayuda de métodos ma­te­má­ti­cos y es­to­cá­s­ti­cos y de al­go­ri­t­mos. Con los co­no­ci­mie­n­tos extraídos con esta práctica se pueden leer y anticipar te­n­de­n­cias y posibles de­sa­rro­llos.

Para poder co­m­pre­n­der mejor la fu­n­cio­na­li­dad de las pre­di­c­ti­ve analytics, cabe conocer los términos co­n­ve­n­cio­na­les del análisis del big data o del data mining:  

  • Análisis de la regresión: se ide­n­ti­fi­can las in­ter­ac­cio­nes entre diversas variables de­pe­n­die­n­tes e in­de­pe­n­die­n­tes. En este caso, las es­ti­ma­cio­nes dependen del precio de los productos y de la solvencia de los clientes.
  • Clu­s­te­ri­ng (agru­pa­mie­n­to): mediante la se­g­me­n­ta­ción de los datos se puede agrupar a los clientes po­te­n­cia­les en función de sus ingresos o de factores similares.  
  • Análisis aso­cia­ti­vo: el objetivo es  mostrar las es­tru­c­tu­ras con aquellas variables que conduzcan a re­su­l­ta­dos idénticos. Como co­n­se­cue­n­cia, se pueden extraer co­n­clu­sio­nes del co­m­po­r­ta­mie­n­to de los clientes así como prever compras futuras. Por ejemplo, si un cliente está in­te­re­sa­do en zapatos, también podría comprar un zapatero.

La di­fe­re­n­cia­ción de las pre­di­c­ti­ve analytics

El re­co­no­ci­mie­n­to de patrones en bases de datos recuerda en cierto modo al proceso de in­te­r­pre­ta­ción propio del cerebro humano, aunque por su co­m­ple­ji­dad los análisis del big data superan de largo su capacidad. A decir verdad, hay cierto pa­ra­le­li­s­mo entre las es­tru­c­tu­ras de data mining aplicadas y las co­ne­xio­nes neu­ro­na­les del cerebro humano, ya que la red ar­ti­fi­cial también tiene la capacidad de ide­n­ti­fi­car y almacenar patrones. En co­n­se­cue­n­cia, se puede de­te­r­mi­nar que el data mining es, a nivel es­tru­c­tu­ral, similar a la in­te­li­ge­n­cia ar­ti­fi­cial (AI) o al apre­n­di­za­je de las máquinas. En este sentido, los programas in­fo­r­má­ti­cos aprenden prá­c­ti­ca­me­n­te de manera autónoma a partir de la base al­ma­ce­na­da y adquieren nuevos datos de los patrones apre­n­di­dos y de­sa­rro­lla­dos.

Se puede poner de relieve, sin embargo, una di­fe­re­n­cia im­po­r­ta­n­te entre el data mining y el análisis pre­di­c­ti­vo, y es que, en general, el objetivo de la minería de datos co­n­ve­n­cio­nal es mostrar patrones es­tru­c­tu­ra­les en los datos y los clústeres exi­s­te­n­tes. Centrar la atención en el de­sa­rro­llo prá­c­ti­ca­me­n­te au­to­di­da­c­ta de los cálculos que se llevan a cabo de forma pro­gre­si­va en la base de datos es una ca­ra­c­te­rí­s­ti­ca del apre­n­di­za­je au­to­má­ti­co y desempeña un papel esencial para el modelo de análisis pre­di­c­ti­ve. Los al­go­ri­t­mos ya exi­s­te­n­tes deben co­m­bi­nar­se de manera autónoma a partir de las bases de datos y, además, extraer nuevas co­n­clu­sio­nes para, de un modo in­de­pe­n­die­n­te y por medio de pre­di­c­cio­nes poder prever, por ejemplo, el co­m­po­r­ta­mie­n­to de los clientes. El co­n­de­n­sa­do de estas encuestas es lo que se conoce como Smart Customer Data.

Ámbitos de apli­ca­ción de las pre­di­c­ti­ve analytics

La in­te­gra­ción del modelo pre­di­c­ti­vo ya ha de­mo­s­tra­do su validez en los sectores más diversos. Además de las empresas de te­c­no­lo­gía, el sector de la sanidad también utiliza este método para prever pa­to­lo­gías. El sector de la energía, por su parte, es otro de los más populares y en él, la red eléctrica in­te­li­ge­n­te del futuro ha sido de­no­mi­na­da como “smart grid”. En este sentido, se puede prever el consumo de ele­c­tri­ci­dad con ayuda de los patrones de conducta al­ma­ce­na­dos de los clientes (Smart Customer Data) para regular el su­mi­ni­s­tro de energía eólica e hi­dráu­li­ca con exactitud.

Otro ejemplo son las técnicas de ma­n­te­ni­mie­n­to pre­di­c­ti­vo (pre­di­c­ti­ve mai­n­te­na­n­ce), con respecto a las que se in­tro­du­cen los datos actuales de una máquina en fu­n­cio­na­mie­n­to con el objetivo de prever su uti­li­za­ción futura y el desgaste re­su­l­ta­n­te. Así, las vu­l­ne­ra­bi­li­da­des de­te­c­ta­das en la cadena de pro­du­c­ción pueden ide­n­ti­fi­car­se y repararse rá­pi­da­me­n­te para, por ejemplo, evitar pérdidas en la misma.

Aplicar pre­di­c­ti­ve analytics tiene sentido sobre todo cuando se dispone de muchos paquetes extensos y limpios de datos. Todos ellos se integran en el análisis, la precisión de cuyo resultado

depende de la amplitud de datos de que se dispone. La mayoría de empresas se valen de los efectos si­né­r­gi­cos para in­cre­me­n­tar su es­tru­c­tu­ra de in­te­li­ge­n­cia em­pre­sa­rial ya existente para las funciones del pre­di­c­tion analytics. Entre las he­rra­mie­n­tas más populares para la uti­li­za­ción de pre­di­c­ti­ve analytics se en­cue­n­tran: 

  • Alpine Data Labs
  • Alteryx
  • Angoss Kno­w­le­d­ge­S­TU­DIO
  • BIRT Analytics
  • IBM SPSS Sta­ti­s­ti­cs and IBM SPSS Modeler
  • KXEN Modeler
  • Ma­the­ma­ti­ca
  • MATLAB

El siguiente paso en el análisis de datos se define como Pre­s­cri­p­ti­ve Analytics, un método empleado cuando el análisis pre­di­c­ti­vo topa con sus límites. Con este sistema se intenta leer las di­s­po­si­cio­nes con respecto al modo de actuar para encauzar la tra­ye­c­to­ria de las te­n­de­n­cias. Los supuestos previstos son, de­pe­n­die­n­do del caso, más sencillos de ejecutar y también se tiene en cuenta la re­di­re­c­ción del de­sa­rro­llo que ha tenido lugar hasta ahora. Este pro­ce­di­mie­n­to es posible gracias a es­tru­c­tu­ras ana­lí­ti­cas sobre la base de complejos modelos y de los es­to­cá­s­ti­cos métodos Mo­n­te­car­lo. Al igual que en el análisis pre­di­c­ti­vo, la precisión de los re­su­l­ta­dos también depende de la cantidad de variables conocidas y seguras que se conocen.

En resumen

Existen numerosos ejemplos para la apli­ca­ción y fu­n­cio­na­mie­n­to de pre­di­c­ti­ve analytics, método que está asociado con la cantidad y calidad de los datos in­tro­du­ci­dos. No obstante, los al­go­ri­t­mos empleados son cada vez más re­s­tri­c­ti­vos, de modo que las pre­di­c­cio­nes de­sa­rro­lla­das son cada vez más precisas. Los análisis pre­s­cri­p­ti­vos también se be­ne­fi­cian de este de­sa­rro­llo como paso posterior al análisis de datos.

Ir al menú principal