Máquinas que aprenden solas: la nueva revolución de la industria
Una investigación demuestra cómo el aprendizaje semisupervisado optimiza la detección de fallos en procesos industriales, permitiendo prever averías y reducir gastos no previstos

José Miguel Ramírez Sanz desarrolla su labor investigadora dentro del grupo ADMIRABLE de la Universidad de Burgos.
La inteligencia artificial está aportando cambios fundamentales a la industria, entre los cuales se destaca no solamente la puesta a punto del proceso, sino también la reducción de los costes de producción. El trabajo del Dr. José Miguel Ramírez Sanz, investigador de la Universidad de Burgos con la tesis calificada con sobresaliente Cum Laude ‘Optimización de Procesos Industriales Mediante Técnicas de Aprendizaje Semisupervisado’ es un claro ejemplo de la evolución de la temática.
El Dr. Ramírez-Sanz comenzó su actividad en la Universidad de Burgos en 2015 como matriculado del grado en Ingeniería Informática, y lo finalizó en 2020 con el máster interuniversitario en Inteligencia de Negocio y Big Data en Entornos Seguros. Fue durante este periodo cuando asistió a las charlas organizadas por el departamento de Ingeniería Informática en un entorno cercano y accesible en el que se explicaba qué era ser doctor y qué posibilidades ofrecía. Desde entonces, su interés por este camino lo llevó a unirse a varios proyectos de investigación.
Su trabajo investigador se desarrolla dentro del grupo ADMIRABLE, cuyo enfoque es el aprendizaje automático para problemas aplicados en medicina, bioinformática e industria. En su caso, el foco se ha centrado en el aprendizaje semisupervisado, una de las áreas de inteligencia artificial que incorpora elementos tanto del aprendizaje supervisado como no supervisado para incrementar la eficiencia en los modelos de predicción, y que permite obtener información útil incluso de datos no manualmente etiquetados.
El objetivo principal de su trabajo ha sido la detección y diagnosis de fallos en procesos industriales, utilizando datos extraídos de máquinas en funcionamiento para predecir cuándo un componente crítico está a punto de fallar o, en caso de que el fallo ya se haya producido, identificar su tipo y gravedad. Esto permite una intervención proactiva para reemplazar componentes antes de que fallen, reduciendo tiempos de inactividad y costos de mantenimiento. Además, en sistemas complejos como la maquinaria industrial o los aerogeneradores, la identificación temprana de un fallo es vital, porque puede evitar daños mayores y prolongar la vida útil de los equipos.
Pero, ¿Qué es el aprendizaje semisupervisado? Para comprenderlo, el Dr. Ramírez-Sanz explica que debemos entender en primera instancia que en el Aprendizaje Automático existen dos paradigmas predominantes; éstos son el aprendizaje supervisado y el aprendizaje no supervisado. Ambos necesitan grandes cantidades de datos para crear modelos que serán utilizados para distintos fines (por ejemplo: predicción de fallos en aerogeneradores). El aprendizaje no supervisado permite realizar tareas de agrupación de datos o detección de anomalías, entre otros (por ejemplo: caracterización de grupos de pacientes por medicamentos).
El aprendizaje supervisado permite a los modelos «aprender» sobre el conjunto de datos con el que se ha entrenado para extraer información de las características que lo conforman con el fin de poder encontrar relaciones entre esas características y la clase que se quiere predecir (habitualmente el tipo de fallo y su severidad cuando se habla de diagnóstico de fallos). Un ejemplo de aprendizaje supervisado podría ser un modelo creado para predecir si va a llover o no, donde las características podrían ser datos sobre la humedad, la temperatura y la presión. Con un gran número de datos, que serían ejemplos de estas tres características y su clase, es decir si llovía o no en el momento en el que se han grabado esas medidas, se puede entrenar un modelo de aprendizaje supervisado que permita, con una nueva instancia de datos formada por las tres medidas, hacer una predicción sin saber la clase real.
Según el Dr. Ramírez-Sanz, el aprendizaje semisupervisado es un paradigma que ha ganado mucha popularidad en los últimos años. Este paradigma se encuentra a medio camino entre el aprendizaje supervisado y el no supervisado, ya que permite resolver los mismos problemas que el aprendizaje supervisado, pero además de utilizar para entrenar los datos compuestos por las características y la clase final (datos o instancias etiquetadas donde existirían las medidas de humedad, temperatura y presión, y además estaría la clase correspondiente de si llueve en ese momento o no), permite obtener información de aquellas instancias de datos de las cuales solo se tienen las características pero no se tiene la clase (datos o instancias no etiquetadas, donde solo se tienen las medidas de humedad, temperatura y presión, pero no se sabe si llovía en ese momento o no). Si, por ejemplo, hay una fresadora mecanizando piezas, no sería necesario medir la calidad geométrica y superficial de todas las piezas mecanizadas, sino sólo de parte de ellas; esos serían los datos etiquetados de los que conocemos su precisión y calidad superficial, las otras piezas, que no se han medido y por tanto no sabemos su calidad, serían las instancias no etiquetadas, pues bien: los modelos semisupervisados pueden aprender también de estos datos no etiquetados.
Durante su investigación, el Dr. Ramírez-Sanz ha aplicado estos modelos a distintos ámbitos, con un enfoque especial en la detección de fallos en rodamientos, un componente crítico presente en la mayoría de maquinarias industriales. También ha trabajado en un proyecto internacional en colaboración con la Universidad Politécnica de Varsovia, donde aplicó modelos de aprendizaje semisupervisado al problema de ‘Travel Mode Choice’, con el objetivo de predecir qué medio de transporte utilizará un usuario en la ciudad y así mejorar la eficiencia del transporte urbano.
Más allá de estas aplicaciones, las posibilidades del aprendizaje semisupervisado son amplias, asevera el Dr. Ramírez-Sanz. En la industria de fabricación de componentes mecánicos o automotrices, estos modelos pueden predecir la calidad de las piezas sin necesidad de inspeccionar cada una de ellas, reduciendo costos y garantizando estándares de producción más altos. También pueden aplicarse en bioinformática y medicina, facilitando el diagnóstico temprano de enfermedades o la clasificación de pacientes en función de su respuesta a determinados tratamientos.
Innovadores
El sistema inteligente que revoluciona la gestión del tráfico en emergencias
María Merino
El siguiente paso en su investigación es mejorar el modelo semisupervisado desarrollado en su tesis, haciéndolo más seguro y capaz de ignorar datos ruidosos que podrían afectar su rendimiento. Además, uno de sus principales objetivos es transferir este conocimiento a la industria, implementando estos modelos en entornos productivos reales para que puedan ser utilizados en la detección y prevención de fallos en equipos industriales.