Investigadores de la Universidad de Burgos desarrollan una evolución de su algoritmo más internacional que logra la misma precisión con solo un 30% de aportación humana
Un equipo de científicos del Departamento de Ingeniería Informática de la Universidad de Burgos ha desarrollado SSRotF (Semi-Supervised Rotation Forest), un método de inteligencia artificial que pone el criterio humano en el centro del aprendizaje de las máquinas. Este avance es la actualización del algoritmo de clasificación más citado del mundo, nacido en la UBU: el ‘Rotation Forest’ original, o ‘rotación de árboles de decisión’ publicado hace 20 años.
La puesta al día de este algoritmo ha surgido gracias a los avances en el aprendizaje semisupervisado, en el que un algoritmo puede aprender tanto de datos etiquetados (como hace el aprendizaje supervisado), como de los datos no etiquetados, que suelen ser mucho más abundantes. Este aprendizaje de los datos no etiquetados es esencial, ya que el etiquetado manual es una tarea muy costosa, tanto temporal como económicamente. Así, etiquetando “del 20 al 30% de los datos” se consigue una fiabilidad casi perfecta, aunque ya desde el 15% se mejora el rendimiento respecto a otros algoritmos.
De esta forma, el coste económico y el tiempo que se debe emplear para enseñar al sistema se reducen enormemente comparado con los sistemas supervisados, adquiriendo información de los datos no etiquetados. Por ejemplo, en un proceso industrial que mide el fallo de una máquina, obtener datos es sencillo gracias a los sensores. Sin embargo, etiquetar esos datos (es decir, si existe fallo o no) es un proceso humano muy costoso, por lo que se suelen etiquetar pocos datos. Un algoritmo de aprendizaje supervisado solo podrá aprender de los pocos datos que ha etiquetado el humano, mientras que un algoritmo semisupervisado puede aprender de todos los datos, haciendo que aprenda mejor de ellos y pueda predecir los fallos con mayor precisión.
Un legado de 20 años
Este nuevo sistema de ‘rotación de árboles semisupervisado’ supone la evolución del modelo Rotation Forest, uno de los algoritmos de clasificación más exitosos y citados en computación. Nacido en el seno de la Universidad de Burgos, el método original cumple ahora 20 años como un sistema fundamental en el análisis de datos y se mantiene como un modelo fiable y ampliamente citado. Es reconocido internacionalmente como uno de los métodos de «conjuntos» (ensembles) más exitosos.
Mientras el algoritmo original es un método de aprendizaje supervisado, es decir, que solo puede extraer conocimiento de datos previamente etiquetados o clasificados por una persona, el nuevo método permite que el propio sistema aprenda de datos no etiquetados, que son mucho más abundantes, y pueda identificar nuevos casos sin revisión humana constante.
Este artículo surge del grupo ADMIRABLE, un grupo de investigación de la Universidad de Burgos especializado en el diseño de algoritmos, minería y tratamiento de datos y diseño de modelos 3D. La investigación parte de la tesis doctoral de José Miguel Ramírez Sanz, dirigida por Andrés Bustillo Iglesias y Álvar Arnaiz González, que se centra en resolución de problemas industriales.
Referencias
Fuente: Universidad de Burgos




