Twitter

Data Mining aplicado al marketing

Data Mining, acercando cerveza a los pañales

Los cazadores de la información perdida

La
minería es una actividad que acompaña a la humanidad desde los confines
de su historia. Separar metales y otros elementos de la corteza
terrestre ha requerido de paciencia y de una trabajosa acumulación de
conocimientos a lo largo de los siglos para mejorar las técnicas de
purificación y aislamiento de sustancias. Desde la extracción de materia
prima para la elaboración de pigmentos hasta los sueños de rápido
enriquecimiento por el hallazgo de metales preciosos, la actividad
minera ha tenido relación con la búsqueda de lo difícilmente accesible.

En la actualidad el tiempo de los intrépidos buscadores de metales
parece extinguido, de la mano de los nuevos métodos extractivos que la
tecnología provee, sin privarse de aristas controversiales. Y en una era
marcada por la informática, el término minería adquiere un nuevo
significado en el desarrollo de sistemas de data mining, o minería de
datos.

 

Simplificando al extremo, podemos decir que estos sistemas permiten
leer entre líneas las bases de datos, obteniendo a partir de ellas
información no explicitada que puede ser relevante con distintos fines.
Los sistemas de data mining operan como verdaderos exploradores que
bucean en las profundidades de las bases de datos por medio de
herramientas estadísticas y de inteligencia artificial. Y lo hacen de
manera casi automática, detectando supuestas anomalías, repeticiones u
otros factores que llaman la atención a programas informáticos
especialmente dotados para ver datos llamativos donde aparentemente no
los hay.

 

CON EL DIARIO DEL LUNES

 

Si bien la minería de datos tomó impulso a partir del avance de la
informática, buena parte de sus fundamentos provienen de postulados
conocidos desde casi tres siglos atrás. Por entonces, un ministro
presbiteriano llamado Thomas Bayes se destacó como un autor
multifacético que produjo escritos que iban desde lo religioso hasta lo
matemático. En su obra postuló el bautizado como Teorema de Bayes, un
hallazgo de inalterable vigencia en el ámbito de las ciencias que
permite explorar la probabilidad de que una causa sea responsable de un
fenómeno efectivamente observado y analizar probabilidades previamente
calculadas cuando se posee nueva información. Algo parecido –salvando
las indudables distancias– a analizar el posible desarrollo de un
partido de fútbol antes de jugarse y revisar el análisis después, con el
resultado puesto. O como dice una frase popular, con el diario del
lunes.

 

Los aportes de Bayes sobre la probabilidad inversa, sumados a los
avances en el campo de la inteligencia artificial y la portentosa
capacidad de procesamiento que adquirieron las computadoras en las
últimas décadas son los ingredientes que –condimentados con una dosis de
intereses económicos y políticos– nutren el desarrollo de sistemas de
data mining. Es que la minería de datos es una herramienta muy versátil
que permite –además de la para nada despreciable capacidad de explorar
los vericuetos de las campañas deportivas– escudriñar información
valiosa para una amplísima galería de actividades.

 

CERVEZAS Y PAÑALES

 

TEOREMA DE BAYES.

 

Leer entre líneas –una práctica casi tan vieja y humana como la
minería– requiere cierto refinamiento tecnológico cuando se trata de
información aparentemente inconexa, guardada en el inmenso océano de
bits que representan los sistemas informáticos. Pero el esfuerzo vale la
pena porque rastrear y organizar toda esa información, en principio
oculta, permite descubrir jugosa información en terrenos tan disímiles
como la medicina, el marketing comercial o la estrategia militar, sobre
todo cuando se trata de la predicción de comportamientos o tendencias.

 

Parece ser que el primer estudio hecho y derecho relacionado con la
minería de datos no involucró a cuestiones de trascendencia médica,
científica o geopolítica, sino a un asunto más prosaico, pero de
importancia comercial. Una cita clásica de la literatura vinculada al
marketing trae el caso de la utilización de herramientas de data mining
para resolver el enigma de por qué un grupo de clientes compraba en los
súper simultáneamente cerveza y pañales los viernes a la tarde.

 

Las técnicas de data mining sirvieron para detectar que los clientes
en cuestión eran padres jóvenes que dedicaban los fines de semana a
cuidar a sus hijos y a consumir su bebida predilecta. Los datos fueron
utilizados comercialmente para obtener un incremento de ventas acercando
la sección de “cervezas” a la de “pañales”, simplificando el asunto a
los sacrificados portadores de los paquetes de pañales, casi siempre
voluminosos y no tan gratificantes como los de su cerveza preferida.

 

Con el tiempo, la minería de datos comenzó a ser aplicada para
entender en qué circunstancias los clientes cambian sus preferencias,
abandonando a un proveedor de productos o servicios, apuntando a
explicar tanto las fugas de clientes más imperceptibles como las más
masivas y rimbombantes. Y en el terreno de los servicios bancarios su
uso se extendió al análisis de los fraudes, falsificaciones y corridas
de diverso tenor.

 

PARTE DE LA HISTORIA (CLINICA)

 

La medicina se vale de la minería de datos para estudiar la
efectividad de los tratamientos. En tiempos de historias clínicas
digitalizadas, los datos escondidos en las gigantescas bases de datos
acumuladas en hospitales y consultorios pueden facilitar el seguimiento
de los tratamientos medicamentosos, las recuperaciones posquirúrgicas o
el control de epidemias.

 

Por citar algunos casos, los estudios sobre diabetes que se realizan
desde hace más de 10 años permitieron modificar los parámetros con que
se evalúan los análisis clínicos a partir de enormes volúmenes de
información obtenidos de pacientes estadounidenses. Y los análisis
relacionados con el Parkinson condujeron a refinar los métodos de su
diagnóstico temprano.

 

También en el terreno de la ingeniería genética y la biotecnología,
las técnicas de data mining abren las puertas para el conocimiento más
profundo de la relación entre las variaciones genéticas individuales y
la predisposición a sufrir enfermedades que se consideran de origen
genético.

 

No todas son rosas para el uso de la minería de datos en medicina.
Aunque generalmente la información analizada mantiene en el anonimato,
no está claro cómo obtener los consentimientos de enormes cantidades de
pacientes para el uso de su información médica personal sin afectar su
privacidad.

 

DAME PAZ Y DAME GUERRA

 

En muchos países los sistemas de defensa están implementando
técnicas de data mining cada vez más sofisticadas y, paradójicamente,
guardando en secreto buena parte de sus prácticas de implementación. El
asunto adquiere entonces importancia estratégica y hace a la autonomía
nacional. En nuestro país un desarrollo en este sensible terreno corre
por cuenta del Departamento de Informática del Instituto de
Investigaciones Científicas y Técnicas para la Defensa (Citedef). Allí
está en marcha un proyecto que se orienta a desarrollar sistemas propios
de data mining basados en software libre, y adaptados a las necesidades
locales.

 

La minería de datos asimismo adquiere protagonismo en actividades de
espionaje que opacarían las mejores historias de ficción. Cada vez más
usadas en el control de las fronteras y el movimiento de personas y
mercaderías, a estas técnicas se les atribuye la resonante detección de
algunos responsables de los atentados del 11 de septiembre de 2001 en
Nueva York, y la capacidad de haber desactivado a tiempo otros hechos
potencialmente similares.

 

La cuestión del uso de datos supuestamente privados por estas
herramientas informáticas plantea un dilema ético, acerca de hasta dónde
estos sistemas automatizados podrían hurgar en el monumental acopio de
información que existe en las bases de datos, sin afectar los derechos
de personas al resguardo de esa información. Quizá sea tiempo de pensar
también en esta otra cara de la minería de datos, y no dejarnos cautivar
sólo por las formidables capacidades tecnológicas que representa.



Por Jorge Forno

Febrero 2013.

Fuente Futuro. P12

© 2015 RedRRPP - Todos los derechos reservados.

Erézcano 3360 PB 2 CABA - Tel: +54 (11) 1555959511
adigenova@redrrpp.com.ar

Diseño web
Grupo Deboss
Grupo Deboss