Conferencia de Directores y Decanos de Ingeniería Informática

Un sistema de la UPM analiza flujos de datos aprendiendo en tiempo real

El sistema. Fuente: UPM.

Investigadores de la Escuela de Ingenieros Informáticos de la Universidad Politécnica de Madrid (UPM) han desarrollado un sistema de análisis de flujos de datos capaz de aprender del contexto y de detectar, generar, almacenar y reutilizar los patrones recogidos en los datos que ya se han analizado. De este modo, se puede predecir el momento en el que estos patrones volverán a aparecer e identificar cambios en el contexto que ayuden a detectar fraudes o spam.

“Nuestro trabajo se centra en un ámbito que es punta de lanza en materia de minería de datos, en data streams”, explica Ernestina Menasalvas, del Departamento de Lenguajes y Sistemas Informáticos e Ingeniería del Software de la UPM, en la nota de prensa de ésta. “El sistema permite optimizar el desarrollo de modelos de clasificación de minería de datos reutilizando modelos similares en contextos parecidos. Todo ello mejora las capacidades de aplicar la inteligencia artificial a entornos como ciudades inteligentes, Internet de las cosas, o dispositivos móviles”.

Los cambios de contexto pueden estar originados por hechos conocidos, como aquellos asociados a la climatología o a la estación del año, o provenir de aspectos desconocidos a priori. Para predecirlos, los investigadores desarrollaron una función de similitud basada en técnicas de lógica difusa que extiende el comportamiento básico de decisión sí/no. “Una vez que la función determina si existen modelos de clasificación equivalentes para tratar el nuevo contexto, el sistema puede aplicar los mismos de forma directa gracias a su almacenamiento previo en un repositorio”, explica Miguel Ángel Abad, autor de la tesis en la que se exponen los resultados de este trabajo.

El mecanismo tiene aplicaciones en materia de ciberseguridad, donde la herramienta permitirá detectar patrones similares y prever ataques cibernéticos, mejorando los sistemas de detección y respuesta. También podría aplicarse a la detección de intrusiones y fraudes por vías informáticas y al desarrollo de filtros antispam. El ahorro de recursos es otra de las ventajas que supone este sistema.