Análisis de fiabilidad mediante la integración de sistemas CMMS y Machine Learning
David López Maganto
Director de ofician de proyectos
Sisteplant
1. INTRODUCCIÓN
Los sistemas CMMS (Computerized Maintenance Management System) son ampliamente utilizados por las empresas para la realización de cualquier actividad de gestión del mantenimiento de los activos a lo largo de su ciclo de vida:
- Gestión del correctivo
- Organización de recursos (carga y capacidad)
- Planificación y programación del mantenimiento planificado (preventivo, predictivo)
- Gestión de repuestos, almacenes y compras
- Imputación y control de costes
- Generación de informes
- Monitorización del desempeño mediante indicadores y cuadro de mando
- Gestión de proyectos
Asimismo, los sistemas CMMS, adecuadamente modelizados y explotados, permiten recoger de manera estructurada una gran cantidad de datos relevantes sobre las intervenciones, en particular aquéllos que informan sobre:
- la naturaleza del fenómeno a resolver (defecto)
- sus causas últimas
- y las soluciones adoptadas para corregirlo o eliminarlo de raíz.
Es lo que denominamos análisis DCA (Defecto –Causa –Acción).
Sin embargo, pese a disponer de esta valiosa información, raras veces se explota de manera ágil para realizar estudios profundos de fiabilidad, por ejemplo mediante RCM (Reliability Centered Maintenance), y cuando se hace, se utilizan medios externos (típicamente Excel).
En este artículo explicaremos cómo acometer un análisis de fiabilidad de manera integral con un sistema CMMS (en este caso Prisma4 ®), así como el salto de profundidad en el análisis que se puede conseguir mediante la integración del sistema CMMS con un software de Machine Learning (Promind ®), al relacionar defectos y causas con variables que definen el contexto operacional del activo.
2. LA FORMA TRADICIONAL DE REALIZAR RCM
Probablemente, le técnica RCM sea una de las más utilizadas dentro de los diferentes métodos y herramientas de análisis de fiabilidad de los activos. La secuencia de análisis profundo que desencadena, partiendo de una rigurosa definición de las funciones de los elementos del árbol de activos, permite definir con claridad, concisión y precisión sus potenciales fallos funcionales, así como sus causas, sus efectos y las consecuencias de éstos sobre la seguridad de las personas, el medio ambiente, las operaciones y la calidad. El resultado del análisis es una clasificación de los activos por índice de criticidad (índice de riesgo: NPR) y un potente plan de acción para la optimización de la fiabilidad de los activos, el cual contempla, entre otras:
- Eliminación de causas de fallos crónicos
- Modificaciones/transformaciones de diseño de los activos para robustecer su operación y mantenibilidad
- Definición de políticas adecuadas de mantenimiento acorde al nivel de criticidad del activo
- Optimización de gamas y normas de mantenimiento
Sin embargo, a pesar del valor real y objetivo que aporta el análisis RCM, es frecuente encontrar dificultades en su puesta en práctica en las empresas, por los siguientes motivos:
- Creencia de que realizar RCM consume muchos recursos
- Creencia de que RCM es un proyecto de larga duración
- Disponibilidad de datos buenos, fiables
- Creencia de que los resultados no son tangibles a corto plazo
Aún así, siempre hay empresas “valientes” que se atreven a abordar proyectos RCM, para lo cual forman un equipo multidisciplinar, nombran a un líder y lo echan a rodar.
En el mejor de los casos, se dispone de un sistema CMMS del cual se extrae el histórico de averías, intervenciones de correctivo, preventivos, modificaciones, etc. Incluso se podría disponer además de un sistema MES (Manufacturing Execution System) que ofreciera un histórico preciso de paros por máquina e incluso equipo.¡Mejor aún!: se podrían tener integrados los sistemas MES y CMMS, de manera que, cuando se declarase un paro por avería en el MES, éste generase la solicitud de orden de trabajo en el CMMS y todo quedara cronológicamente trazado.
Con esto ya tendría una base de información valiosa para comenzar los análisis. Ahora bien, ¿cómo se llevarían a cabo éstos? En la mayor parte de los casos, en una herramienta ajena al CMMS, como por ejemplo Excel, el paradigma de software versátil.Se exportarán los datos del CMMS y del MESa Excel, se construirán diagramas de Pareto para realizar un ranking de frecuencia y coste de fallo por activo, se describirán las funciones, los fallos funcionales, modos de fallo, efectos y consecuencias en una tabla AMFE, se calculará el índice de riesgo por activo y se escribirán acciones concretas para minimizar éste. Todo un proceso en el cual la compilación, depuración, cálculo y representación de la información de partida supondrá aproximadamente entre un 25% y un 35% del tiempo total de análisis RCM.Reducir este tiempo es fundamental para hacer eficaz y eficiente un proyecto RCM, por lo que disponer de un módulo ad hocen el propio sistema CMMS, que proporcione directamente toda la información de partida necesaria para los diferentes análisis a realizar, es una ventaja notable.
En el siguiente apartado se resumirá cómo en Prisma®, el sistema CMMS de Sisteplant, se puede abordar un proyecto RCM mediante la explotación de su módulo de Gestión del Conocimiento.
3. REALIZACIÓN DE RCM MEDIANTE EL SISTEMA CMMSPrisma®
Prisma® permite desarrollar las siguientes acciones básicas para el análisis RCM:
- Descomposición del activo en componentes, funciones y fallos funcionales.
- Determinación del factor de criticidad de los fallos funcionales en función de su probabilidad, detectabilidad y consecuencias (índice de riesgo:NPR).
- Asociación de diferentes modos de fallo al fallo funcional. Análisis causal de fallos.
- Definición de acciones asociadas a fallos funcionales y sus causas.
3.1. Definición de funciones y fallos funcionales
Los fallos funcionales se pueden crear fácilmente en Prisma® desde el módulo de Análisis RCM de Activos o directamente en su maestro.
Para determinar los fallos más importantes susceptibles de ser analizados, existen varias herramientas internas:
- Árbol de fallos
- Consulta de DCAs
- Análisis de Defectos por Activo
- Análisis de Repetitividad del defecto por Activo
- Análisis MTBF, MTTR y MKBF
El uso de dichos análisis permitirá priorizar dónde enfocar los esfuerzos de análisis.
3.2. Determinación del índice de riesgo o factor de criticidad
Los efectos y consecuencias de cada fallo funcional definido anteriormente se podrán modelizar en Prisma®:
- Detectabilidad y probabilidad.
- Tabla de Consecuencias.
Asimismo, en función de los valores de Detectabilidad y Consecuencias seleccionado, muestra el factor de riesgo que se compone del producto de:
Riesgo = PesoProbabilidad * (100-PesoDetectabilidad)* PesoConsecuencia
donde:
- PesoProbabilidad es el peso de la probabilidad seleccionada.
- PesoDetectabilidad es el peso de la detectabilidad seleccionada.
- PesoConsecuencia es la suma ponderada de los valores de la consecuencia, multiplicada por el peso de cada consecuencia.
3.3. Análisis de modos de fallo y construcción de plan de acción
A partir del índice NPR calculado para cada activo, podremos determinar centrarnos en aquellos con mayor riesgo, sobre los cuales acometer un profundo análisis de causa y raíz para determinar las acciones oportunas que eliminen o minimicen el riesgo de fallo.
Para ello, se puede acceder al árbol DCA (Defecto-Causa-Acción) de cada activo y sus respectivas órdenes de trabajo, con el objetivo de hacer un análisis de detalle de los posibles fallos funcionales, sus causas y potenciales acciones asociadas a dichos fallos.
Asimismo, las consultas de las órdenes de trabajo permitirán especificar las OTs asociadas a un funcional concreto para recabar información útil para su análisis.
Finalmente, mediante los árboles funcionales, se realizará el análisis desde el fallo funcional hasta las causas raíz(utilizando herramientas como 5 porqués, Ishikawa...), en función a la información disponible en las consultas de DCAs y de las OTs vistas anteriormente.
Identificadas las causas últimas, se procede a la definición del plan de acción que las mitigue. En Prisma® se asocia la acción a la causa, así como a una fecha de lanzamiento y una fecha prevista de finalización, además de un Responsable de Ejecución y Responsable de Seguimiento. También es factible la vinculación de la acción con una Orden de Trabajo.
3.4. Análisis avanzado
Además del análisis RCM convencional que hemos resumido en los puntos anteriores, Prisma/R) habilita la realización de análisis específicos de una causa y su aparición en un activo o en una familia de activos, teniendo como objetivos:
- Determinar la función de probabilidad de aparición de una causa.
- Determinar la mejor política de preventivo mediante una simulación que minimiza los costes de mantenimiento.
Para realizar este análisis, deberemos definir la causa, fecha de realización del análisis y los costes que genera el fallo, así como el coste que ocasiona el realizar intervenciones de correctivo para solucionarlo.
La función de probabilidad de fallo se calculará de manera automática en función de:
- Histórico de aparición de la causa del fallo (tasa de fallos)
- Tareas correctivas y preventivas donde se ha realizado o no sustitución del elemento: observaciones
El sistema calcula la función de probabilidad que mejor se ajusta a la aparición del fallo según las observaciones introducidas. La función de Probabilidad de Fallo que nos propone puede ser alguna de las siguientes:
- Exponencial
- Weibull de dos parámetros
- Curva de bañera (formada por dos Weibulls)
Prisma® calcula automáticamente los parámetros de dichas funciones, así como la bondad del ajuste (en porcentaje).
Mediante esta función estadística, podremos determinar la probabilidad de aparición de una causa concreta en un intervalo de tiempo dado, lo cual permitirá anticipar y planificar intervenciones, suministros de repuestos, etc. minimizando el riesgo de no operación del activo.
Complementario a lo anterior, Prisma® asiste también al proceso de optimización de la política de preventivo bajo criterios de minimización de costes. Para ello, el sistema propone tres políticas posibles preventivas:
- Política de Sustitución: se sustituye el elemento cada intervalo fijo (en días o unidades de medidor) independientemente del estado.
- Política de Revisión: intervalos regulares de inspección en los cuales se revisa el estado del modo de fallo (causa). Si en la revisión se determina que es necesita ser cambiado, se sustituye. Si está bien, se deja como está.
- Política de Monitorización: se monitoriza permanentemente el sistema, y el mecanismo de monitorización determina cuándo el sistema debe ser sustituido antes de que falle.
El usuario podrá incluir diferentes políticas con diferentes costes y probabilidades. Además, para cada una de ellas, deberá incluir un intervalo mínimo y máximo (excepto para la monitorización).
Gráficamente, los costes asociados a cada política seleccionada se mostrarán en un diagrama:
Pulsando sobre la opción “Mejor Política Preventiva” se obtiene la política que obtiene el mejor coste, y para ella la frecuencia óptima.
4. ANÁLISIS DE FIABILIDAD COMBINANDO CMMS CON MACHINE LEARNING
La determinación del estado de salud de los activos para la realización de pronósticos acertados sobre sus fallos potenciales se ha convertido en un campo de estudio fundamental para la mejora de la fiabilidad de los activos. En este terreno, la integración de los sistemas CMMS con herramientas de inteligencia artificial (machine learning, o aprendizaje automático, en particular) cobran especial relevancia.
El cálculo del estado de salud se ha de basaren dos fuentes principales de información:
- La monitorización en tiempo real de las variables críticas del contexto operacional:el comportamiento de dichas variables es procesado en tiempo real por un sistema de Machine Learning (Promind®, de Sisteplant), el cual es capaz de pronosticar su evolución futura mediante modelos matemáticos embebidos, de manera que predice comportamientos anómalos.
- El cálculo en tiempo real de la probabilidad de fallo por la estimación del punto de ubicación de cada activo/equipo en la curva de la bañera, utilizando el histórico de fallos y modelos estadísticos (función de probabilidad de fallos), realizado mediante Prisma ® (sistema CMMS), como se ha explicado en el apartado anterior.
Por tanto, la integración de sistemas CMMS (Prisma®) y Machine Learning (Promind®) acelera y enriquece el proceso de pronóstico de fallos, combinando un análisis en tiempo real(de variables críticas asociadas a fallos) con un análisis probabilístico a futuro, determinado por la historia del activo contada por su histórico de fallos.
5. CONCLUSIONES
La realización de análisis profundos de fiabilidad cuesta tiempo y dinero, razón por la cual la capacidad de realizarlos íntegramente en el sistema informático de gestión del mantenimiento (CMMS) resulta una gran ventaja, al maximizar la eficacia y la eficiencia del proceso.
En particular, Prisma® de Sisteplant, permite desarrollar integralmente un proyecto RCM en su propio entorno, sin necesidad de recurrir a hojas Excel u otras herramientas informáticas externas. Asimismo, dispone de funcionalidades avanzadas para:
- el cálculo de la función estadística de distribución de probabilidad de fallo, la cual habilita el cálculo de la probabilidad de aparición de un fallo determinado en un intervalo de tiempo dado
- la selección de las políticas de mantenimiento preventivo más adecuadas para la minimización del coste de mantenimiento
Por último, la integración de sistemas CMMS (Prisma®) con sistemas de Machine Learning (Promind®) hace realidad la determinación del estado de salud de los activos y el pronóstico de fallos, por medio de la combinación de métodos estadísticos (embebidos en CMMS: función de probabilidad de fallo en función de histórico de fallos) y la aplicación de modelos matemáticos avanzados sobre variables críticas que, monitorizadas en tiempo real y estando asociadas a modos de fallos, son proyectadas en el tiempo por el sistema Machine Learning para simular su comportamiento y predecir anomalías que deriven en potenciales fallos funcionales.