Industria química y de proceso | Mantenimiento

Aplicando inteligencia de datos para mejorar la gestión de activos

1071
9
0
0
12 min. de lectura
Imagen del artículo Aplicando inteligencia de datos para mejorar la gestión de activos

John Alexander Ardila Evan
Asistente de Gerencia de Proyectos
Phoenix AMC, Calgary, Canadá

Isaac Ortiz Ruiz
Profesional en Gestión de Activos
Phoenix AMC, Calgary, Canadá

Orlando Morean
Consultor Senior en Gerencia de Activos de Infraestructura
Phoenix AMC, Calgary, Canadá

1. INTRODUCCIÓN

La gestión de activos de infraestructura juega un papel fundamental en la optimización del rendimiento operativo y la eficiencia energética, la reducción de emisiones, riesgos y costos, y la prolongación de la vida útil de los activos. La inteligencia de datos ofrece una valiosa oportunidad para mejorar la eficiencia y efectividad en la toma de decisiones para optimizar optimizando el rendimiento de procesos e infraestructura.

El presente documento presenta los avances de la investigación realizada por Phoenix AMC en la integración de técnicas de inteligencia de datos en la gestión de activos de infraestructura, integrados en una metodología referida como INDAGA (Inteligencia de Datos en Gestión de Activos).

2. SUMARIO EJECUTIVO

INDAGA se fundamenta en herramientas de analítica avanzada para transformar datos en información, identificar anomalías y tendencias, y supervisar el desempeño y la salud de los activos operativos. En este trabajo se presenta la aplicación de tres herramientas específicas: el análisis de Weibull para identificar patrones de falla y anticipar problemas potenciales, el análisis de Mahalanobis para la detección de anomalías (patrones inusuales y comportamientos atípicos) y Blanqueamiento o “Whitening” con ZCA y PCA (“Zero-phase Component Analysis y Principal Component Analysis”) para reducir la correlación y la dimensionalidad, facilitando el análisis, la visualización e interpretación de conjuntos de datos complejos.

En la figura 1 se presenta el diagrama simplificado que describe la metodología INDAGA.

Figura 1. Diagrama simplificado de la metodología INDAGA.

INDAGA mejora la efectividad de las técnicas de gestión de activos en prevención de fallas y optimización del rendimiento de activos de infraestructura. INDAGA facilita la identificación de patrones inusuales o anómalos en la curva P-F en una etapa temprana, indicativos de potenciales modos de falla en desarrollo. Implica la detección de señales o indicadores que sugieren que un componente o sistema está sufriendo una degradación que podría ocasionar eventualmente una falla funcional. Estas señales permiten la implementación de medidas proactivas para prevenir que la falla progrese a una etapa en la que cause un impacto significativo en la operación o en la integridad del equipo.

3. FUNDAMENTACIÓN

El proceso de trabajo de la metodología INDAGA comienza con la comprensión del proceso y la selección de la(s) variable(s) de interés. Bajo la perspectiva de componentes principales, variables de interés representan una síntesis clara de la variabilidad presente en los datos. Adicionalmente, tomando en cuenta el conocimiento de expertos en el tema y validando con los responsables del proceso, se lleva a cabo una depuración de datos utilizando programación en Python potenciada con el uso de herramientas y librerías como Pandas, NumPy, Matplotlib, Datacleaner y Seaborn.

Tras la selección de la variable de interés y la depuración de los datos, se realiza el análisis Weibull. La distribución de Weibull es frecuentemente empleada en el análisis de procesos y determinación de anomalías de funcionamiento. El análisis Weibull permite estimar parámetros estadísticos: β (forma) y η (escala) que caracterizan una distribución. La función de distribución acumulada se indica en la formula [1].

Donde: “F(x)” representa la función de distribución acumulada de Weibull, “x” la variable independiente (de interés en nuestro caso), “β” y “η”, parámetros de forma y escala de la distribución.
El comportamiento temporal de la variable de interés se transforma en frecuencia de ocurrencia durante el intervalo de análisis y se elabora un “Gráfico de Probabilidad de Weibull” con el fin de determinar los parámetros estadísticos de la distribución Weibull que mejor aproxima el comportamiento de la variable de interés. Este análisis de Weibull permite establecer la probabilidad de obtener un determinado rendimiento del proceso, o de manera alternativa, la probabilidad de falla. Para ilustrar este tipo de gráficos, se presentan algunos ejemplos en la figura 2.

Figura 2. Ejemplos de análisis Weibull
(https://www.weibull.nl/weibull-plot/)

Es importante destacar que el comportamiento de un proceso cambia en el tiempo en virtud de alteraciones en la condición de sistemas o equipos, el marco operativo o cambios del proceso. Estos cambios se reflejan en variaciones de los parámetros estadísticos de las aproximaciones Weibull. La parametrización se realiza mediante análisis de regresión lineal usando “splines” como base. Dicho análisis genera una segmentación o “clustering” que optimiza la minimización del error cuadrático medio. Cada segmento tiene asociados parámetros β y η de la distribución Weibull que mejor aproxima el segmento. Esta caracterización permite evaluar la estabilidad del proceso.

Las figuras 3 y 4 contienen ejemplos de aproximaciones generadas por el análisis Weibull. La imagen de la figura 3 ilustra como una distribución de la variable de interés puede presentar una marcada afinidad con una única distribución de Weibull. La imagen de la figura 4 describe una situación donde se requiere más de una distribución Weibull para modelar el comportamiento de la variable de interés. En ambas figuras, β es menor que 1, lo cual significa que existe una alta probabilidad de que el proceso no cumpla con las expectativas debido a su elevada tasa de fallas. En la figura 3 se esperaría que el comportamiento mejorase en el tiempo, pero en la figura 4 la situación es más comprometida.

Figura 3. Ejemplo de representación gráfica con una sola función Weibull

Figura 4. Ejemplo de representación gráfica con requiriendo tres funciones Weibull parametrizada con splines

Para determinar los parámetros estadísticos en casos donde la parametrización requiere más de una función de probabilidad de Weibull se recurre a la segmentación o clustering utilizando splines. En la figura 3, los parámetros estadísticos de los segmentos son:

  • Segmento 1: β = 0.023, η = 300*106
  • Segmento 2: β = 0.217, η = 60.3
  • Segmento 3: β = 0.656, η = 177.0

Esto implica tres diferentes regímenes de operación durante el periodo de análisis. Asimismo, una β menor de 1 implica una alta variación estadística en el proceso.

En condiciones ideales, se debería mejorar en el proceso, previo a utilizar mecanismos de control. En la gran mayoría de las situaciones, hay variables relevantes al proceso que son independientes y por ende no están sujetas a control. En estos casos, es necesaria la evaluación simultanea de variables independientes y dependientes y un mecanismo estadístico que permita la detección de anomalías y puesta en práctica de estrategias para prevenir o corregir el comportamiento del proceso. Tras un exhaustivo análisis y considerando las contribuciones de Nassif (2021), se decidió basar la detección de anomalías utilizando un modelo de “Machine Learning (ML)”, apoyado en técnicas de Mahalanobis e implementado en Python. Este análisis utiliza las técnicas de ZCA y PCA Whitening para decorrelacionar las variables de interés, y actuar basándose en los componentes principales Con datos asociados al régimen operacional del proceso actuando de modo normal o esperado, se determina el centroide estadístico y las distancias de Mahalanobis respectivas, a ser utilizados a título comparativo para evaluar el comportamiento del proceso en el tiempo y detectar anomalías que denotan situaciones atípicas o irregulares. La interpretación de las anomalías requiere del conocimiento de expertos y de la historia del proceso. La figura 5 muestra casos simples de graficas representativas de este tipo de análisis, indicando valores atípicos (outliers) y anomalías.

Figura 5. Representación gráfica de valores atípicos y anomalías.
https://www.moviri.com/executive-guide-anomaly-detection-with-machine-learning

4. EJEMPLO DE APLICACIÓN

Para efectuar las pruebas de la metodología en activos específicos se utilizaron los datos de un simulador de calderas desarrollado por Lawrence Berkeley National Laboratory, US Department of Energy, el cual es referido como BOLDSim (“Berkeley Lab Boiler Simulation”).

Las calderas son un componente vital de los sistemas de calefacción tanto en entornos industriales, como comerciales y residenciales, con un uso ampliamente extendido debido al rol esencial que desempeñan suministrando vapor sobrecalentado a presión elevada. Un aspecto secundario relevante es el impacto significativo que las calderas pueden tener en emisiones de gases de efecto invernadero (GEI), en particular si utilizan la energía proveniente de combustibles fósiles.

Las calderas simuladas en BOLDSim están diseñadas para suministrar vapor de alta presión utilizado en ámbitos industriales, comerciales y residenciales. Investigadores e ingenieros utilizan BOLDSim para optimizar diseños de calderas, mejorar la eficiencia de combustión, reducir emisiones y explorar nuevas tecnologías para una producción de energía más limpia y eficiente.

El esquema y diagrama en bloques de las calderas en BOLDSim se ilustra en las figuras 6 y 7 respectivamente.

Figura 6. Esquema del sistema de vapor

Figura 7. Modelo de bloques del sistema de vapor

Las variables consideradas en esta investigación son: el consumo energético, la carga calórica y la temperatura exterior. Respecto a las condiciones del sistema, se consideraron 3 situaciones: sin fallas, incrustaciones (fouling en inglés) al 35% y fouling 5%. Cabe destacar que la segunda caldera se activa solamente cuando la capacidad de la primera caldera es insuficiente para responder a la carga calórica, integrando una dinámica no lineal en el proceso.

5. PROCEDIMIENTO DE EVALUACIÓN

El estudio implicó un análisis riguroso para extraer conclusiones significativas sobre el comportamiento del sistema. El análisis llevo a caracterizar el comportamiento y presencia de anomalías del consumo enérgico de las calderas (variable dependiente) que es afectado por dos variables independientes; la carga calórica y la temperatura ambiente. Matemáticamente se representa como

y = f (x1, x2)

donde, 𝑦 representa el consumo energético, el cual es una función de 𝑥1 (la carga calórica) y 𝑥2 (la temperatura ambiente). Los resultados del análisis Weibull y la identificación de splines se presentaron en las figuras 3 y 4 de la sección 3. En la figura 8 se presentan los resultados del análisis de Mahalanobis y el modelo de Machine Learning del consumo energético (kwh), tomando en cuenta 8759 datos correspondientes a las horas de un año de información histórica, y 12 nuevos datos de operación bajo fouling del 35%. Es importante mencionar que, los primeros datos corresponden a comienzos de enero en donde la temperatura ambiente es baja, alrededor de 30 °F, lo cual exige mayor operación de la planta de vapor.

Si el análisis de los datos se realizará solo teniendo en cuenta los métodos tradicionales y se analizarán las tres variables de manera independiente, fácilmente se concluiría erróneamente que todos los puntos (azules y naranjas) representan condiciones normales de proceso. Sin embargo, con el análisis de Mahalanobis y ML, se logra identificar que los puntos color naranja a la derecha de la gráfica corresponden a anomalías detectadas en el consumo energético de una caldera.

Figura 8. Gráfica para la identificación de anomalías con fouling del 35% para una muestra de 12 datos de consumo energético

El objetivo del análisis resumido en la figura 9 es probar con una muestra más grande, la eficiencia de la metodología INDAGA para identificar anomalías del proceso con una muestra más grande. La imagen de la izquierda de la figura 9 contiene 8859 datos del consumo energético (kwh), los primeros 8759 con la información de consumo de las calderas durante un año de información histórica y los últimos 100 nuevos datos con la información de consumo con fouling del 35%.

Con el propósito de mejorar la visualización de los datos, en la imagen de la derecha de la figura 9 se presentan los mismos datos de la imagen izquierda, quitando los primeros 8039 datos, es decir, esta gráfica presenta únicamente los últimos 3 meses de información (desde la hora 8040 hasta la 8759) unidos con los 100 nuevos datos analizados con fouling del 35%, desde la hora 8760 hasta la 8859. Considerando una menor cantidad de datos en la gráfica derecha, es más fácil ver el comportamiento de consumo energético de las calderas.

Figura 9. Gráficas para la identificación de anomalías con fouling del 35%

Si hacemos una revisión detallada de los datos, se puede inferir que, de los 100 nuevos datos de información, 81 son detectados como anomalías y los 19 restantes aparentemente correspondes a valores normales del proceso. Sin embargo, al realizar un análisis teniendo en cuenta la lógica de control del proceso se determina que, de los 19 datos indicados, 18 corresponden a momentos en los que la activación de la caldera estaba iniciándose o apagándose. En conclusión, solo un (1) registro corresponde a una anomalía que no fue detectada por el modelo.

Lo anterior permite concluir que, para los 100 datos con fouling de 35%, el modelo presentó un porcentaje de error en la detección de anomalías de solo el 1.2% (1 de cada 82 anomalías no detectada por el modelo). En la figura 10 se presentan los 19 datos representando fouling del 35% no detectados como outliers. Solo el dato obtenido en la hora 8828 con un consumo de 1567.43 kwh corresponde a una anomalía, los otros 18 datos corresponden a momentos en los que la caldera tenía un consumo energético muy bajo.

Figura 10. Registro de datos con fouling al 35% que no fueron detectados como una anomalía

Con el objetivo de evaluar la eficiencia del modelo para detectar anomalías con fallas latentes o marginales, casi imperceptibles incluso para un experto del proceso, en la figura 11 se presentan los resultados del análisis de Mahalanobis y el modelo de Machine Learning del consumo energético (kwh) de 8759 datos de BOLDSim en un (1) ano de operación de la caldera y cien 100 datos adicionales de consumo con fouling del 5% que corresponderían a un consumo en los primeros 3 meses del año, es decir en un total de 15 meses. Las imágenes de la izquierda de la figura 11 representa el comportamiento durante los 15 meses. La imagen de la derecha de la misma figura representa el comportamiento de los 3 últimos meses; desde la hora 8040 a la 8759 sin fouling y desde la hora 8760 has la hora 8859 con fouling del 5%.

Figura 11. Gráficas para la identificación de anomalías con fouling del 5%

En los cálculos numéricos de la figura 10, se evidencia que la metodología INDAGA y los modelos de ML detectaron 31 anomalías de los 100 nuevos analizados. Este es un muy buen resultado porque con las herramientas tradicionales de análisis de datos (curva P-F, tendencias, análisis de variación, etc.) es muy difícil detectar anomalías con una falla tan pequeña (fouling 5%) en un activo donde generalmente se tienen n variables correlacionadas.

Adicionalmente, similar a lo realizado con un fouling de 35%, se analizó minuciosamente el comportamiento de los 69 datos restantes que aparentemente corresponden a valores normales del proceso. Sin embargo, luego de analizar los datos y validar con los SMEs, se llegó a la conclusión que con un fouling de solo el 5%, únicamente se podría identificar comportamientos atípicos del boiler si estos eran sometidos a un esfuerzo de combustión representativo, para el caso de estudio, mayor a 900 kwh. De esta manera se logró concluir que, de los 69 datos no identificados como anomalías, 68 corresponden a momentos en los que el boiler estaba con un consumo energético inferior a 900 kwh bien sea por un shutdown, o por estar el proceso de arranque o apagando, y solo un (1) registro corresponde a una anomalía que no fue detectada por el modelo. En la figura 12 de presenta una muestra de 10 de los 69 datos que no fueron identificados como anomalías y en color pastel se destaca el único registro que puede ser determinado como un error del modelo (ver dato de la muestra 8850 en la figura 12).

Figure 12. Registro datos con fouling al 5% que no fueron detectados como una anomalía

En la figura 13 se presenta un resumen de los resultados obtenidos de la detección de anomalías con los 100 datos provenientes del consumo energético con fouling al 5% y con los 100 datos provenientes del consumo energético con fouling al 35%. En ambos escenarios se puede concluir que a pesar de haber seleccionado un nivel de confianza del 95% en la realización de las pruebas de hipótesis para la detección de anomalías con el análisis de Mahalanobis, la eficiencia del modelo es del 98.8% (81/82) y 96.9% (31/32) en la detección de anomalías, para los fouling al 35% y 5%, respectivamente.

Deja tu comentario

Consulta nuestra para evitar que se elimine

Principios y normas de participación en AEM Daily News

En AEM queremos fomentar la participación de los lectores a través de los comentarios en los artículos que publicamos en nuestra web y aplicación móvil. Así mismo, queremos promover una conversación de calidad con los usuarios, que enriquezca el debate y el pluralismo en temas de interés del sector del mantenimiento, en la que quedan excluidos los insultos, las descalificaciones y opiniones no relacionadas con el tema. El objetivo es ofrecer a los usuarios la revista un debate y discusión en la que se respeten los siguientes principios:

Son bienvenidos todos los comentarios de todos los usuarios que contribuyan a enriquecer el contenido y la calidad de la página web y app de AEM Daily News.

La discrepancia y el contraste de opiniones son elementos básicos del debate. Los insultos, ataques personales, descalificaciones o cualquier expresión o contenido que se aleje de los cauces correctos de discusión no tienen cabida en AEM Daily News.

La política de moderación garantiza la calidad del debate, acorde con los principios de pluralidad y respeto recogidos en el aviso legal de esta web y app. En AEM Daily News seremos muy estrictos a la hora de rechazar opiniones insultantes, xenófobas, racistas, homófobas, difamatorias o de cualquier otra índole que consideremos inaceptables.

El usuario publicará sus comentarios con su nombre y apellidos, y se compromete a no enviar mensajes que difamen, insulten, contengan información falsa, inapropiada, abusiva, pornográfica, amenazadora, que dañe la imagen de terceras personas o que por alguna causa infrinjan alguna ley.

La dirección editorial de AEM Daily News decidirá a diario qué contenidos se abren a comentarios. Esta selección se hará con criterios de valor informativo y siempre que resulte posible gestionar una moderación de calidad. La lista de contenidos abierta a comentarios aspira a ser lo más amplia posible y a estar en permanente actualización.

Los comentarios realizados en la página web y app de AEM Daily News pueden publicarse simultáneamente en las principales redes sociales dentro de la aspiración a ampliar la conversación a otros espacios.

Los mensajes escritos en mayúsculas, publicitarios o sobre cuestiones no relacionadas con el tema del artículo serán rechazados.

AEM Daily News se reserva el derecho de eliminar los comentarios que considere inadecuados y de expulsar a aquellas personas que incumplan estas normas.

Hazte socio de la AEM

Regístrate como socio y pasa a formar parte de la red de profesionales de Mantenimiento más importante de España.

Más información

Formación AEM

Consulta nuestra agenda de eventos y encuentra la formación que buscas en el área del mantenimiento.

Ver oferta formativa

Síguenos en las redes

No te pierdas ningún evento

Suscríbete a nuestro newsletter para recibir en tu correo o en nuestra app Android / iOS toda la información sobre formación, jornadas, webinars, etc.

Suscríbete al newsletter

Patrocinadores

Conviértete en patrocinador de la AEM

Infórmate de los beneficios y ventajas de asociarse a la AEM. Contacta con nosotros.

El sitio web utiliza cookies propias y de terceros con fines analíticos y técnicos para mejorar la experiencia de navegación. Puede aceptarlas todas o cambiar las preferencias de sus cookies en el botón de Configuración. Mas información en Política de cookies.