Reliabilityweb Mantenimiento: El Nuevo Paradigma

Mantenimiento: El Nuevo Paradigma

El patrón A es la bien conocida “curva de bañera” y el patrón B es el mismo de la Figura 2. El patrón C muestra una probabilidad lentamente creciente de fallo, sin una edad específica de desgaste. El patrón D muestra una baja probabilidad inicial y luego un rápido incremento a un nivel constante, mientras el patrón E muestra una probabilidad constante a cualquier edad. El patrón F comienza con una alta probabilidad de mortandad infantil para decaer a una probabilidad baja y constante o ligeramente creciente de fallo.

Hace ya tiempo que casi todo lo que se publica sobre temas de la Gestión está dominado por el argumento de cambio. Se exhorta a todas las disciplinas a adaptarse a cambios en organización, diseño, tecnología, capacidad de liderazgo, comunicaciones; es decir virtualmente en todos los aspectos de la actividad laboral. Tal vez donde esto se percibe con mayor extensión y profundidad es en el campo de la administración de los activos físicos.na característica impactante de este fenómeno es la cantidad de cambios que han ocurrido simultáneamente. Algunos han ocurrido a nivel estratégico, casi filosófico, mientras otros son más tácticos o técnicos en su naturaleza. La extensión de los cambios resulta aun más sorprendente. No solo implican cambios radicales de dirección (a veces diametralmente opuestos a como se hacían las cosas en el pasado): algunos pretenden enfrentarnos con conceptos totalmente novedosos.

El presente trabajo identifica quince áreas clave de cambio. Cada uno por sí mismo ya tiene suficiente alcance como para merecer mucha atención en la mayoría de las organizaciones. En su conjunto, constituyen un paradigma íntegramente nuevo. El acomodarnos a esta migración de paradigmas significa que para la mayoría de nosotros, la administración de los activos físicos se va a transformar en un monumental ejercicio de cambio a lo largo de los próximos años.

Cada uno de los cambios por sí solo es suficiente argumento para un libro, o varios (piense en todos los libros disponibles tan solo sobre el tema de mantenimiento preventivo). Entonces un breve trabajo como el presente no puede lograr la exploración de todos los cambios en detalle. En efecto, va al extremo opuesto: limita cada área de cambio a dos máximas, seguidas por una breve explicación. En cada caso, una máxima pretende sintetizar el modo en que se hacían las cosas, mientras la otra sintetiza cómo se hace - o debiera hacerse - ahora.

Cualquier intento de resumir un tema cualquiera en una o dos oraciones, corre el riesgo de introducir una sobre-simplificación. Más aún quince temas. Sin embargo una síntesis como ésta satisface dos propósitos:

Provee una rápida visión de cuáles son los cambios
Provee una base de comparación para las diferentes herramientas de apoyo para la toma de decisión y filosofías de gestión que pretenden establecer bases de acción (RCM, FMEA, MSG3, HAZOP, TPM, análisis por árbol de fallos, RCM 2 y otros).

Este artículo solamente resume las quince áreas de cambio. La utilización de ésta síntesis para comparar distintas herramientas estratégicas de mantenimiento, será motivo de otro trabajo.

Máxima 1

ANTIGUA

El mantenimiento se ocupa de la preservación de los activos físicos

MODERNA

El mantenimiento se ocupa de la preservación de las funciones de los activos

La mayoría de los ingenieros sienten alguna afinidad con los objetos, sean mecánicos, eléctricos o estructurales. Esto conlleva a darnos satisfacción cuando los activos están en buenas condiciones y cierto disgusto por activos en mal estado.

Estos reflejos fueron siempre los rectores del mantenimiento preventivo. Han originado conceptos de “cuidado de activos”, que tal como su nombre indica, persigue cuidar de los activos por ser activos. Esto también ha inducido a los estrategas de Mantenimiento a creer que el mantenimiento persigue preservar la confiabilidad inherente o la capacidad de diseño de cualquier activo. De hecho esto no es así.

A medida que adquirimos mejor comprensión del papel que juegan los activos en un negocio, comenzamos a apreciar que todo activo físico es puesto en servicio porque alguien desea que haga algo. De esto surge que cuando mantenemos un activo, el estado en el cual deseamos conservarlo debe ser aquél en el cual continúe haciendo lo que quienes lo utilizan desean que haga. Esto a su vez implica que debemos prestar atención en mantener lo que el activo hace, más que en lo que el activo es.

Es evidente que antes de poder hacer esto, debemos obtener una comprensión totalmente clara respecto de las funciones de cada activo, junto con sus parámetros de funcionamiento.

Por ejemplo: la Fig. 1 muestra una bomba de agua con una capacidad nominal de 400 litros/minuto, bombeando agua a un tanque del cual se consumen 300 litros/minuto. En este caso la función primaria de la bomba es “suministrar agua al tanque a no menos de 300 litros/minuto”. Cualquier programa de mantenimiento para esta bomba, debe asegurar que no baje de los 300 litros/minuto. (Note que para asegurar que el tanque no se vacíe, el programa de mantenimiento NO persigue que la bomba continúe siendo “capaz de suministrar 400 litros/minuto”.

mantenimiento_1

Sin embargo, si la misma bomba es mudada a otro tanque en el cual el consumo es de 350 litros/minuto, la función primaria cambia en concordancia y por lo tanto el programa de mantenimiento tiene que responder para satisfacer la mayor expectativa.

Las funciones y las expectativas de desempeño no solamente cubren el volumen de producción. También se relacionan con cuestiones como la calidad del producto, el servicio al cliente, economía y eficiencia de operación, control, contención, confort, protección, cumplimiento de normas del medio ambiente, integridad estructural e inclusive el aspecto físico del activo.

Máxima 2

ANTIGUA

El mantenimiento de rutina es para prevenir fallos

MODERNA

El mantenimiento de rutina es para evitar, reducir o eliminar las consecuencias de los fallos

Un análisis detallado de una planta industrial promedio, puede arrojar de cinco a diez mil modos de fallo posibles. Cada uno de estos fallos afecta a la organización de alguna manera. Pero en cada caso los efectos son diferentes. Pueden afectar a las operaciones. También pueden afectar a la calidad de los productos, servicio al cliente, seguridad o medio ambiente. Todos costarán tiempo y dinero para su reparación.

Estas consecuencias ejercen fuerte influencia sobre el énfasis con que trataremos de prevenir cada fallo. Si un modo de fallo tiene consecuencias severas, estaremos dispuestos a arbitrar cualquier medida para tratar de prevenirlo. Si tiene poco o ningún efecto, tal vez decidiremos no tomar ninguna acción preventiva.

En otras palabras: las consecuencias de los fallos son mucho más importantes que sus características técnicas.

Por ejemplo, un fallo que pudiese afectar a la bomba de la Fig. 1 es “el rodamiento se agarrota debido al deterioro por el uso normal”. Si el reemplazo de un rodamiento fallado lleva cuatro horas y el fallo no anticipado del rodamiento solo se hace evidente a los operarios cuando el nivel del tanque desciende al interruptor de bajo nivel, el tanque solo contendría 2,5 horas de suministro de agua. Por consiguiente se vaciará y permanecerá vacío por 1,5 horas mientras el rodamiento es reemplazado.

Una tarea “a condición” aplicable a esta circunstancia sería el monitoreo de los niveles de vibración utilizando un analizador de vibraciones. Si es detectado el fallo incipiente, la primera prioridad de los operarios será llenar el tanque antes de que el rodamiento se agarrote. Con esto, obtendrán cinco horas para hacer una reparación de cuatro. Esto a su vez les permite evitar las consecuencias de un tanque vacío (y también evitar posibles daños secundarios a la bomba). La tarea no “salva” al rodamiento - éste está condenado pase lo que pase.

Este ejemplo demuestra que el principal motivo para realizar una tarea de mantenimiento proactiva es para evitar, reducir o eliminar las consecuencias de un fallo. Una revisión formal de consecuencias de fallos concentra la atención en tareas de mantenimiento que tienen el mayor impacto en el funcionamiento de la organización y reduce la atención sobre aquellas que tienen baja o ninguna incidencia. Esto contribuye a asegurar que cualquiera sea el costo de mantenimiento, éste sea aplicado allí donde traerá los mayores beneficios.

Máxima 3

ANTIGUA

El principal objetivo de la función mantenimiento es el de optimizar la disponibilidad de planta al mínimo costo.

MODERNA

El mantenimiento afecta todos los aspectos de efectividad del negocio, riesgo, seguridad, integridad del medio ambiente, uso eficiente de la energía, calidad de producto y servicio al cliente. No solamente disponibilidad de planta y costo.

Los tiempos de parada de máquinas siempre han afectado la capacidad productiva de los activos físicos limitando los volúmenes de producción, aumentando los costos operativos e interfiriendo con el servicio a clientes. En las décadas de 1960 y 1970 esto ya preocupaba en los sectores de minería, manufactura y transportes. En manufactura, los efectos de tiempos de paro se agravan con el advenimiento mundial de los sistemas “just-in-time”, implicando que los reducidos stocks de material en proceso hagan altamente probable que hoy, aún fallos menores, ya conlleven la posibilidad de parar toda una planta. En tiempos recientes, la mayor mecanización y automatización ha traído consigo que la confiabilidad y disponibilidad se han transformado en cuestiones clave en sectores tan diversos como la atención de salud, procesamiento de datos, telecomunicaciones y administración de edificios.

El costo de mantenimiento también está creciendo a paso constante a lo largo de varias décadas, tanto en términos absolutos como en su incidencia en el total de gastos. En algunas industrias es hoy el segundo elemento de costo cuando no a veces el primero en incidencia. De tal suerte, en cuarenta años el costo de mantenimiento ha pasado de insignificante, a la cabeza de las prioridades de control de costos.

La importancia de estos dos aspectos de la administración de los activos físicos (tiempos de paradas y costos de mantenimiento), hace que muchos gerentes y jefes de mantenimiento sigan considerándolos como los únicos objetivos significativos de mantenimiento.

Sin embargo esto ha dejado de ser cierto. La función de mantenimiento hoy tiene un espectro amplio de objetivos adicionales. Los resumiremos en los párrafos siguientes.

El mayor nivel de automación implica que más y más fallos afecten nuestra habilidad de alcanzar y mantener niveles de calidad satisfactorios. Esto se relaciona tanto con estándares de servicio como con la calidad de los productos. Así, por ejemplo, los fallos de los equipos que afectan el control de temperatura en un edificio o una red de transporte, interfieren tanto como la consecución permanente de la especificación de tolerancias de producción.

Otro resultado del incremento de automación es el aumento de la cantidad de fallos que tienen serias consecuencias sobre la seguridad o el medio ambiente, cuando simultáneamente las exigencias respecto de estas variables están creciendo rápidamente. En muchos lugares del mundo se ha llegado al punto en que las organizaciones, o bien se adaptan a las expectativas de la sociedad respecto de seguridad y medio ambiente, o son clausuradas. Esta realidad agrega una nueva dimensión a nuestra dependencia de la integridad de los activos físicos: va más allá de los costos para transformarse en una cuestión de sobre vivencia de ciertas empresas.

Al mismo tiempo que crece nuestra dependencia de los activos físicos, también crece su costo. Costo de operarlos y costo de tenerlos. Para asegurar el máximo retorno sobre la inversión que significan, deben ser mantenidos en condiciones de operación eficiente durante todo el tiempo que sus usuarios así lo deseen.

Estos desarrollos significan que el mantenimiento actual desempeña un rol que se desplaza crecientemente hacia los objetivos de preservar todos los aspectos de la salud física, financiera y competitiva de la empresa. Esto a su vez implica que los profesionales del mantenimiento se deben a sí mismos y a sus empleadores el equiparse con las herramientas necesarias para resolver estas cuestiones en forma continua, proactiva y directa y no manejarlas “ad-hoc” cuando el tiempo lo permite.

Máxima 4

ANTIGUA

La mayoría de los equipos son más propensos a fallar cuando envejecen.

MODERNA

La mayoría de los fallos no son más probables cuando el equipo envejece.

Durante décadas, la sabiduría convencional sugería que la mejor forma de optimizar el desempeño de activos físicos era restaurarlos o reponerlos a intervalos fijos. Esto se basaba en la premisa de que hay una correlación directa entre la cantidad de tiempo (número de ciclos) que el equipo está en servicio, y la probabilidad de que falle, como muestra la Figura 2. Esto sugiere que la expectativa es que la mayoría de los ítems operarán confiablemente por un período “X”, y luego se desgastan.

El pensamiento clásico sostenía que “X” podía ser obtenido a partir de registros históricos sobre fallos de equipos, permitiendo a los usuarios la toma de acciones preventivas poco antes de que el ítem estuviese por fallar en el futuro. En efecto, esta correlación predicable “edad” y “fallo” es válida para algunos modos de fallo. Tiende a encontrarse en casos en que el equipo está en contacto directo con el producto. Ejemplos: impulsores de bombas, refractarios de hornos, asientos de válvulas, recubrimiento de trituradoras, transportadores a tornillo y así siguiendo. Los fallos relacionados con la edad muchas veces también se asocian con fatiga y corrosión.

mantenimiento_2

Sin embargo, en general los equipos son mucho más complejos aún de lo que eran hace quince años. Esto ha llevado a cambios asombrosos en los patrones de fallo de los equipos, como muestra la Figura 3. Los gráficos muestran la probabilidad condicional de fallo en función de la edad de operación para una gran variedad de ítems eléctricos y mecánicos.

Los estudios realizados en la aviación civil mostraron que 4% de los ítems se comportan de acuerdo con el patrón A, 2% con el B, 5% con el C, 7% con el D, 14% con el E y nada menos que 68 % con el F. (La distribución de estos patrones en la aviación, no necesariamente es la misma que en la industria. Pero a medida que los equipos se tornan más complejos, más y más ítems se comportan de acuerdo con los patrones de fallo E y F).

Estas conclusiones contradicen la creencia de que siempre hay una correlación entre confiabilidad y edad de operación; creencia que llevó a la idea de que cuanto más frecuentemente se restaura un ítem, menor es la probabilidad de que falle. En la práctica esto raramente es cierto. Salvo que exista un modo de fallo dominante que está correlacionado con la edad, las restauraciones o reemplazos a intervalos fijos hacen poco o nada a favor de la confiabilidad de ítems complejos.

La mayoría de los profesionales del mantenimiento son conscientes de estas situaciones y comienzan a preocuparse por la realidad de la aleatoriedad, después de décadas en la bañera. Sin embargo, el hecho de que la curva de la bañera todavía aparece en tantos textos de mantenimiento, es testimonio de la fe casi mística que algunas personas mantienen respecto de la correlación entre edad y fallo. En la práctica, esta fe tiene dos serios inconvenientes:

* conduce a creer que aunque no tengamos ninguna evidencia cierta de que existe un modo de fallo relacionado con la edad, de todos modos es prudente restaurar el ítem de tanto en tanto, “por si acaso” como si tal modo de fallo existiese. Esto prescinde del hecho de que las restauraciones son acciones extraordinariamente disruptivas, que interfieren masivamente en sistemas estables. En consecuencia, propenden a inducir mortandad infantil produciendo justamente los fallos que pretenden prevenir.

mantenimiento_3

* a nivel más filosófico, los creyentes en la bañera se auto convencen de que es más conservador (es decir más seguro) suponer que todo tiene una vida útil y en consecuencia restaurar los equipos en base a una vida útil supuesta que aceptar que pueda fallar aleatoriamente. Luego de implantar mantenimiento restaurativo basado en ese supuesto, sostienen que ningún fallo debiera ocurrir entre restauraciones y que cualquiera que ocurriese no obstante, no puede ser atribuido a falta de mantenimiento “porque lo hemos restaurado la semana pasada/el año pasado/ o lo que sea”. La posibilidad de que el mantenimiento restaurativo por sí mismo pueda ser el causante del fallo, ni se les ocurre a esas personas. Más grave aún: se niegan a aceptar la conclusión más importante asociada a la MÁXIMA 4, que se resume como sigue:

Ante la ausencia de cualquier evidencia en contra, es más conservador desarrollar estrategias de mantenimiento que suponen que cualquier fallo puede ocurrir en cualquier momento (es decir aleatoriamente) y no suponer que solamente ocurrirá después de un cierto período de tiempo en servicio.

Máxima 5

ANTIGUA

Para desarrollar un programa de mantenimiento exitoso es necesario disponer de buenos datos estadísticos sobre ratios de fallos (historial).

MODERNA

Las decisiones sobre el control de fallos de los equipos casi siempre tendrán que ser tomadas con datos inadecuados sobre ratios de fallo.

Es sorprendente cuánta gente cree que solamente se pueden formular políticas eficaces de mantenimiento si se dispone de extenso historial de información sobre fallos. Alrededor del mundo se han instalado millares de sistemas manuales y computarizados para registrar historial técnico basado en esa creencia. También ha inducido a poner mucho énfasis en los patrones de fallo discutidos en la Máxima 4 anterior. Sin embargo desde el punto de vista del mantenimiento, estos patrones están cargados de dificultades prácticas y contradicciones. En lo que sigue resumimos algunos:

Dimensión de la muestra y evolución:

Los procesos industriales de envergadura normalmente poseen solamente uno o dos activos de cada tipo. Tienden a ser puestos en funcionamiento secuencialmente y no simultáneamente. Esto significa que el tamaño de la muestra estadística suele no ser representativo. Para activos nuevos con alto contenido de tecnología de avanzada, siempre son muestras estadísticas demasiado pequeñas.

Tales activos además están en constante estado de evolución y modificación, en parte como respuesta a nuevos requisitos operacionales y en parte para intentar de eliminar fallos que o bien tienen serias consecuencias o son demasiado costosos para prevenir. Quiere decir que el período de tiempo durante el cual cualquier activo permanece en una misma configuración, es relativamente breve.

En tales circunstancias, los registros históricos no tienen mucha validez, ya que la base de datos es muy pequeña y constantemente cambiante. (La excepción importante son empresas de gran dimensión que utilizan cantidades grandes de equipos idénticos en contextos también idénticos).

Complejidad:

La cantidad de activos y diversidad de los mismos en la mayoría de los emprendimientos industriales significa que es simplemente imposible desarrollar una descripción analítica completa de las características de confiabilidad de toda una empresa, o siquiera de algún activo importante dentro de la misma.

Esto se complica aún más por el hecho de que muchos fallos funcionales no se originan en dos o tres, sino tal vez en dos o tres docenas de modos de fallo. En consecuencia, mientras puede ser relativamente fácil registrar estadísticamente los fallos funcionales, sería un enorme emprendimiento estadístico aislar y describir los patrones de fallo que se aplican a cada modo de fallo. Esto solo, ya hace que un análisis estadístico histórico realmente válido sea casi imposible.

Información sobre fallos:

Cuando la política de información no es coherente, aparecen más problemas. Por ejemplo en un sector un ítem puede ser sacado de servicio porque está fallando, mientras que en otro sector solo se lo retira cuando ha fallado.

También surgen diferencias de este tipo cuando difieren las expectativas de desempeño. Se define como fallo funcional a la incapacidad de un ítem en satisfacer un parámetro de desempeño deseado. Estos parámetros naturalmente pueden diferir para un mismo activo si el contexto operacional es diferente, de modo que cuando decimos “falló” también podemos estar implicando estados diferentes. Por ejemplo la bomba mostrada en la Figura 1 ha fallado si es incapaz de suministrar 300 litros por minuto en un contexto, pero 350 litros por minuto en otro.

Estos ejemplos muestran que lo que es un fallo en una organización - o a veces hasta en un sector de la organización - puede no ser un fallo en otra organización. Esto puede resultar en dos series de datos bastante diferentes para dos ítems aparentemente idénticos.

La contradicción total:

Lo que más distorsiona toda la cuestión del historial técnico es el hecho de que si estamos registrando datos de fallos, debe ser porque no los estamos previniendo. Las implicancias de esto están resumidas por Resnikoff (1978) en la siguiente aseveración:

“La obtención de información que los diseñadores de políticas de mantenimiento consideran más necesaria - información referida a fallos críticos - en principio es inaceptable y pone en evidencia las deficiencias del programa de mantenimiento. Se sabe que hay fallos críticos que pueden ocasionar (y en algunos casos necesariamente ocasionan) la muerte. Ningún porcentaje de muertes es aceptable en una organización, como precio para la obtención de información sobre fallos dirigida a establecer políticas de mantenimiento. Por lo tanto, el diseñador de políticas de mantenimiento enfrenta el problema de fijar una política de mantenimiento para la cual la expectativa de pérdida de vida será menor que la de la vida esperada del activo. Esto significa que tanto en la práctica como por principio, la política tendrá que ser diseñada sin utilizar información experimental que surgiría de los fallos que la política intenta evitar.”

Para aquellos casos en que ocurre un fallo crítico a pesar del mejor esfuerzo de los diseñadores de políticas de mantenimiento, Nowlan y Heap (1978) hacen el siguiente comentario referido a la obtención y el análisis de datos históricos:

“El desarrollo de una correlación entre edad y confiabilidad, como lo es la curva de ‘probabilidad condicional de fallo’ en función de la ‘edad’ requiere una cantidad respetable de datos. Cuando el fallo tiene consecuencias graves, tal cantidad de datos no existe, ya que será imperioso que se tomen medidas preventivas después de la primera falla. Por consiguiente, el análisis de estadísticas históricas de fallos no sirve para establecer límites de ‘edad’ (“vida”) precisamente en aquellos casos de máxima preocupación: aquellos donde es necesario asegurar la seguridad.”

Esto nos coloca frente a la contradicción más flagrante con respecto a la prevención de fallos con consecuencias graves y la información histórica respecto de dichos fallos: un mantenimiento preventivo eficaz nos impide obtener los datos históricos que creemos necesitar para decidir qué mantenimiento preventivo debemos realizar para que sea eficaz.

La contradicción recíproca se cumple en el otro extremo de la escala de consecuencias. Aquellos fallos con consecuencias poco importantes suelen ser tolerados, precisamente porque no importan mucho. Como resultado, es fácil obtener muchos datos estadísticos históricos sobre estos fallos. Esto significa que tendremos suficiente material para un análisis estadístico representativo. En ciertos casos hasta pueden surgir límites de ‘edad’. Sin embargo, justamente porque estos fallos importan poco, es muy improbable que las intervenciones de mantenimiento a intervalos fijos resulten costo-eficaces. Es decir que si bien para estos casos la obtención y el análisis de estadísticas históricas serían válidos por su precisión, también será probable que constituya una pérdida de tiempo.

Conclusión:

Tal vez la conclusión más importante que estriba de los comentarios anteriores, es que los profesionales del mantenimiento deben dejar de contar fallos (con la esperanza de que un lindo gráfico les diga cómo ganar la partida en el futuro) para en cambio abocarse a anticipar o prevenir fallos, que es lo que importa.

Entonces, para ser realmente eficaces, debemos aceptar la idea de la incertidumbre y desarrollar estrategias que nos permitan manejarla con confianza. También debemos admitir que si las consecuencias de demasiada incertidumbre no pueden ser toleradas, tendremos que cambiar las consecuencias. En casos extremos de incertidumbre, puede ser que la única solución sea abandonar el proceso en cuestión.

Máxima 6

ANTIGUA

Hay tres tipos básicos de mantenimiento:

Predictivo - Preventivo - Correctivo

MODERNA

Hay cuatro tipos básicos de mantenimiento:

Predictivo - Preventivo - Correctivo - Detectivo

La mayor parte de lo que ha sido escrito hasta ahora sobre estrategias de mantenimiento en general, hace referencia a tres - y solamente tres - tipos de mantenimiento: predictivo, preventivo y correctivo.

Las tareas predictivas (o basadas en la condición), implican constatar si algo está fallando. Las tareas de mantenimiento preventivo normalmente implican restaurar ítems o reemplazar componentes a intervalos fijos. El mantenimiento correctivo significa reparar ítems cuando se descubre que están fallando o cuando han fallado.

Sin embargo, hay toda una familia de tareas de mantenimiento que no está incluida en ninguna de las tres categorías mencionadas.

Por ejemplo, cuando accionamos una alarma de incendio de tanto en tanto, no estamos verificando si está fallando. Tampoco la estamos restaurando ni reemplazando y tampoco la estamos reparando. Simplemente estamos verificando si aún funciona.

Las tareas diseñadas para verificar si algo aun funciona, se conocen como “verificación funcional” o “tareas de búsqueda de fallas”. (Por coherencia - y para que rimen con las otras tres familias de tareas - el autor y sus colegas también las llaman “detectivas” porque se utilizan para detectar si algo ha fallado).

El mantenimiento detectivo o búsqueda de fallos, solamente se aplica para fallos ocultos o no-evidentes. Los fallos ocultos a su vez sólo afectan a dispositivos de protección.

Si aplicamos técnicas de formulación de estrategias de mantenimiento científicas a casi cualquier sistema industrial moderno y complejo, nos encontramos que hasta el 40% de los modos de fallo caen en la categoría de fallos ocultos. Más aún, hasta el 80% de estos modos de fallo requieren “búsquedas de fallo”. Esto indica que típicamente un tercio de las tareas generadas por un programa de diseño de estrategias de mantenimiento completo y correctamente aplicado, serán tareas detectivas.

Por otra parte, las mismas técnicas analíticas demuestran que normalmente el “monitoreo a condición” solamente es técnicamente viable para no más del 20% de los modos de fallo, y que solamente “vale la pena” la inversión en la mitad de estos casos. (Esto de ninguna manera quiere decir que el “monitoreo a condición” no deba ser utilizado: donde es bueno, es muy, MUY bueno, pero también debemos recordar de desarrollar estrategias adecuadas para manejar el restante 90% de los modos de fallo).

Un hecho más alarmante es que la mayoría de los planes de mantenimiento tradicionales solamente proveen alguna atención a la tercera parte (un tercio) de los dispositivos de protección (y generalmente a intervalos inadecuados).

Las personas que operan y mantienen una planta cubierta por estos planes de mantenimiento tradicionales, tienen conciencia de que existe otro tercio de estos dispositivos a los cuales no le prestan ninguna atención, mientras es normal que nadie tan siquiera sabe que el tercer tercio existe. Esta falta de atención y de conocimiento significa que la mayoría de los elementos de protección en las industrias - nuestro último recurso de protección cuando todo lo demás falla - reciben pobre mantenimiento o ningún mantenimiento.

Esta situación es totalmente insostenible.

Si la industria toma en serio los temas de seguridad e integridad ambiental, entonces toda la cuestión del mantenimiento detectivo (búsqueda de fallos) debe recibir primer prioridad en términos de urgencia. A medida que más y más profesionales del mantenimiento toman conciencia de la importancia de esta área descuidada del mantenimiento, tiende a convertirse en un argumento estratégico de envergadura que en la próxima década superará a lo que el mantenimiento predictivo fue en los últimos diez años.

mantenimiento_4

Máxima 7

ANTIGUA

La frecuencia con que se realizan las tareas “a-condición-de” debe basarse en la frecuencia de la falla y/o la criticidad del ítem.

MODERNA

La frecuencia con que se realizan las tareas “a-condición-de” debe basarse en la duración del período de desarrollo de la falla (también conocido como “tiempo de demora hasta la falla” ó “intervalo P-F”).

Cuando se discute la frecuencia con que deben ser realizadas las tareas predictivas (ó “a-condición-de”) frecuentemente se oyen una (a veces ambas) aseveraciones siguientes:

No falla con frecuencia, por lo tanto no es necesario chequearlo con frecuencia.

Debemos chequear elementos críticos con frecuencia mayor que los elementos menos críticos de la planta.

Ambas aseveraciones están equivocadas.

La frecuencia de las tareas de Mantenimiento Predictivo no tiene nada que ver con la frecuencia de la falla y no tiene nada que ver con la criticidad del ítem. La frecuencia de cualquier forma de mantenimiento “a-condición-de” se basa en el hecho de que la mayoría de las fallas no ocurren repentinamente. Más bien ocurre que en muchos casos es posible detectar que la falla ha comenzado a ocurrir, durante los estadios finales del deterioro.

La Fig. 5 muestra este proceso. Se la denomina curva P-F porque muestra cómo una falla comienza y prosigue el deterioro hasta un punto en el cual puede ser detectado (el punto de falla potencial “P”). A partir de allí, si no se detecta y no se toman las acciones adecuadas, continúa el deterioro -a veces a un ritmo acelerado - hasta alcanzar el punto “F” de falla funcional.

La cantidad de tiempo (o el número de ciclos de esfuerzo) que transcurren entre el punto en que aparece una falla potencial y el punto en el cual se transforma en un fallo funcional, se conoce como intervalo P-F, mostrado en la Fig. 6.

El intervalo P-F rige la frecuencia con que debe ser realizada la tarea predictiva. El intervalo de chequeo, debe ser sensiblemente menor que el intervalo P-F si deseamos detectar el fallo potencial antes de que se convierta en un fallo funcional.

mantenimiento_5

El intervalo P-F puede ser medido en cualquier unidad asociada con la exposición al uso (tiempo de uso, unidades producidas, número de paradas y arranques, etc.). La medición más frecuente es por tiempo transcurrido. Para diferentes modos de fallo, el intervalo P-F puede variar desde fracciones de segundos a varias décadas.

mantenimiento_6

El tiempo necesario para responder a cualquier fallo potencial que se descubra también influye sobre los intervalos de tareas “a condición”. En general, estas respuestas implican cualquiera o todas las siguientes acciones:

· actuar para evitar las consecuencias de la falla

· Planificar una acción correctiva tal que pueda ser ejecutada sin disrupción de la producción o de otras tareas de mantenimiento.

· planificar los recursos necesarios para corregir la falla.

El tiempo necesario para tales respuestas también es variable. Pueden ser horas (por ejemplo hasta el fin de un ciclo de trabajo o el final de un turno), minutos (para evacuar personas de un edificio que se está derrumbando) o aún segundos (para detener una máquina o un proceso que está saliendo de control) hasta semanas o meses (por ejemplo hasta una parada general).

Salvo que aparezca una buena razón en contra, generalmente es suficiente definir un intervalo de chequeo igual a la mitad del intervalo P-F. Esto asegura que la tarea de chequeo encontrará la falla antes de que ocurra el fallo funcional, dando a la vez la mitad del tiempo del intervalo P-F para tomar alguna acción al respecto.

Sin embargo, algunas veces es necesario elegir un intervalo de chequeo que es una fracción diferente del P-F. Por ejemplo la figura 7 muestra cómo un intervalo P-F de nueve meses y un intervalo de chequeo de un mes, deja un intervalo neto de P-F de ocho meses.

Si el intervalo P-F es demasiado corto para que el chequeo resulte práctico en ese intervalo, o si el intervalo P-F es demasiado corto para permitir cualquier medida una vez encontrada la falla potencial, la tarea “a condición” no es apta para el modo de falla en cuestión.

mantenimiento_7

Máxima 8

ANTIGUA

En caso de ser técnicamente factible tanto una tarea de restauración o reemplazo a intervalos fijos (preventiva), como una tarea “a condición de” (predictiva), generalmente la primera es más económica y efectiva que la basada en la condición.

MODERNA

En caso de ser técnicamente factible tanto una tarea de restauración o reemplazo a intervalos fijos (preventiva), como una tarea “a condición de” (predictiva), ésta última es generalmente más económica y efectiva a lo largo de la vida del activo.

Hoy en día la nueva máxima 8 es bien entendida por la mayoría de los profesionales del mantenimiento por lo cual registramos aquí éste cambio tan solo para completar el panorama. Sin embargo queda un pequeño número de personas que siguen creyendo en la máxima antigua. Por consiguiente vale la pena resumir brevemente por qué la máxima nueva es válida. Posiblemente la mejor forma de hacerlo es mediante un ejemplo.

En la mayoría de los países hoy se especifica una profundidad mínima legalmente aceptable para el dibujo de un neumático (generalmente 2 mm). Los neumáticos que llegan a, o superan tal desgaste, deben ser recauchutados o reemplazados. En la práctica, neumáticos de camiones - especialmente en vehículos similares de una misma flotilla que opera recorriendo rutas similares - muestran una correlación buena entre edad y aparición de falla por desgaste normal. La recubierta restituye casi completamente la resistencia original al desgaste. Por consiguiente los neumáticos admitirían una programación para su restauración después de haber recorrido una distancia preestablecida. O sea que todos los neumáticos de la flota serían recauchutados una vez cubierto un kilometraje de recorrido prefijado, lo requieran o no.

mantenimiento_8

La figura anterior muestra los datos de falla hipotéticos de tal flotilla. Se observa que la mayoría de los neumáticos duran entre 45.000 y 75.000 Km. Si se adoptase una política de recubrir todos los neumáticos a intervalos prefijados en base a estos datos estadísticos, todos los neumáticos serían recubiertos a los 45.000 Km. Esta política significaría que muchos neumáticos son recubiertos mucho antes de que fuese realmente necesario. En algunos casos, neumáticos que hubiesen durado 75.000 Km., ya serían recubiertas a los 45.000 con lo que perderían hasta 30.000 Km. de vida útil.

Por otra parte, es posible definir una condición de fallo potencial de neumáticos, en función de la profundidad del dibujo. Verificar la profundidad del dibujo es rápido y fácil. Luego es sencillo chequear los neumáticos, digamos, cada 3.000 Km. y programar su recubierto solamente cuando lo requieran. Esto permitiría obtener un promedio de uso de 60.000 Km. de los neumáticos, sin correr riesgos, en vez de los 45.000 Km. que lograría si efectúa la restauración programada descripta primero. Esto es un aumento en la vida útil de 33%. Este ejemplo demuestra que una tarea predictiva es mucho más costo-eficaz que una restauración programada (preventiva).

El ejemplo demuestra que el mantenimiento predictivo debe ser considerado primero, por los siguientes motivos:

Casi siempre puede ser ejecutado sin mover el activo y generalmente manteniéndolo en operación. Es decir que raramente interfiere con la producción. Además suele ser fácil de organizar.
Identifica condiciones de fallos potenciales específicos lo cual permite definir claramente las acciones correctivas antes de iniciarlas. Esto reduce la cantidad de trabajo de reparación a efectuar y posibilita que sea ejecutado con mayor rapidez.
Al identificar la falla de equipos en el punto de fallo potencial, se permite el aprovechamiento máximo de su vida útil. La cantidad de reemplazos que se realizan por fallos potenciales es muy poco superior a la que ocurriría por fallos funcionales de modo que el costo total de reparación y de repuestos resulta minimizado.

Máxima 9

ANTIGUA

Los incidentes serios, accidentes catastróficos que implican fallos múltiples de equipos, generalmente son el resultado de “mala suerte” ó “actos de Dios”, y por lo tanto son inmanejables.

MODERNA

La probabilidad de un fallo múltiple es, en buena medida, una variable manejable, especialmente en sistemas protegidos

En el pasado, los grandes accidentes industriales solían ser contemplados como un riesgo adicional del negocio. Se pensaba que era demasiado costoso, si no imposible, analizar los sistemas industriales con suficiente detalle como para controlar los riesgos con alguna credibilidad.

Más recientemente, los especialistas en confiabilidad han desarrollado poderosas herramientas para determinar probabilidades acumuladas de falla y niveles globales de riesgos que afectan sistemas complejos. (Tales como determinación probabilística o cuantitativa de riesgos).

Sin embargo, la tendencia a considerar la probabilidad de fallo de la función protegida y del dispositivo de protección como fijos ha impuesto cierta limitación a la aplicación de estas técnicas, especialmente cuando se tratan sistemas protegidos. Esto conlleva la creencia de que la única forma de modificar la probabilidad de fallos múltiples asociados con tales fallos, es modificar el hardware (en otras palabras modificar el sistema) tal vez agregando más protección o reemplazando componentes existentes por otros considerados más confiables.

De hecho ahora se ha puesto en evidencia de que es factible modificar tanto la probabilidad de falla de la función protegida y (especialmente) el tiempo de indisponibilidad del dispositivo de protección adoptando políticas adecuadas de mantenimiento y de operación. En consecuencia, adoptando tales políticas, también resulta posible reducir la probabilidad de fallos múltiples a casi cualquier nivel razonable deseado. (Está claro que “cero” es un ideal inalcanzable).

La probabilidad aceptable para cualquier fallo múltiple depende de sus consecuencias. En algunos casos, los niveles de aceptabilidad están dados por normas o disposiciones legales emanadas de autoridad competente. Pero en la gran mayoría de los casos la determinación debe ser efectuada por quienes utilizan los activos. Dado que las consecuencias varían ampliamente entre sistema y sistema, la adopción de la aceptabilidad también varía ampliamente. Es decir que - al menos por ahora - no existen normas de riesgo universales que puedan ser aplicadas a cualquier sistema de un tipo dado.

Sin embargo alguien debe tomar la decisión respecto del nivel de riesgo aceptable, antes de decidir cómo debe diseñarse, operar y mantener sistemas protegidos. De hecho, convencer a las gerencias de que se trata de una variable manejable y que por lo tanto ellos deben manejarla, es uno de los mayores desafíos que hoy deben encarar los profesionales del mantenimiento.

Máxima 10

ANTIGUA

La forma más rápida y segura de mejorar el comportamiento de un activo existente que “no es confiable” es mejorar su diseño.

MODERNA

Casi siempre es más costo-eficaz tratar de mejorar el comportamiento de un activo no confiable mejorando la forma en que es operado y mantenido, revisando el diseño sólo si tal solución no logra el comportamiento deseado.

A medida que aprendemos más y más sobre qué debemos hacer para mantener exitosamente nuestros activos, descubrimos cuántos problemas de mantenimiento pudieron haberse evitado o eliminado ya en el tablero de dibujo durante el diseño. Esto está alertando al reconocimiento - ya muy demorado - de que los diseñadores de equipos deben considerar no solamente qué debe hacerse para crear nuevos equipos que funcionen, sino cómo deben diseñarse para que continúen funcionando.

Sin embargo, aparece una tendencia a veces alarmante al aplicar inoportunamente esta visión a la administración de activos ya existentes. Un reducido pero audible grupo de personas parecen creer que la mejor forma de lidiar con problemas de confiabilidad es volver al tablero de dibujo sin detenerse a preguntar si la mejor solución al problema no será, eventualmente, aplicar mejores prácticas de mantenimiento.

En la práctica, el mantenimiento debe ser contemplado antes que el rediseño por tres motivos:

· la mayoría de las modificaciones llevan de seis meses a tres años desde la iniciación hasta la entrega funcionando, dependiendo del costo y complejidad del nuevo diseño. Por otra parte, la persona de mantenimiento que hoy está de guardia, tiene que mantener el equipo tal como existe hoy y no aquél que debiera estar allí o estará allí en algún futuro. De tal suerte, hoy debe ser tratada la realidad de hoy, antes que los rediseños de mañana.

· la mayoría de las organizaciones encuentran más oportunidades de mejoras de diseño aparentemente deseables que la factible física o económicamente.

Al intentar ante todo obtener el funcionamiento deseado de los activos tal como están configurados actualmente, contribuye a determinar prioridades racionales para tales proyectos. Esto es así porque separa los rediseños que son indispensables, de aquéllos meramente deseables.

· no hay garantía automática de que el nuevo diseño de hecho resolverá el problema. Los patios de chatarra están repletos de modificaciones “que no funcionaron”: testimonio mudo de que reinventar el diseño original muchas veces pasa a ser un costoso y fútil ejercicio.

Esto no quiere decir que nunca debemos rediseñar activos existentes. Frecuentemente se presentan casos en que las prestaciones deseadas del activo exceden su confiabilidad inherente. En tales casos ningún mantenimiento podrá lograr la prestación deseada. “Mejor” mantenimiento no podrá resolver el problema. Entonces deberemos mirar más allá del mantenimiento para encontrar soluciones. Las opciones incluyen la modificación del activo, el cambio de procesos operativos o simplemente limitar las expectativas y decidir vivir con el problema.

Máxima 11

ANTIGUA

Para la mayoría de los activos pueden desarrollarse políticas genéricas de mantenimiento.

MODERNA

Las políticas genéricas solamente deben aplicarse en activos idénticos cuyo contexto operacional, funciones y parámetros de prestación deseados también sean idénticos.

La mayoría de los planes de mantenimiento tradicionales se apoyan en la creencia que para la mayor parte de los activos pueden y deben aplicarse políticas genéricas de mantenimiento. Frecuentemente se escucha decir, por ejemplo: “la política de mantenimiento que aplicamos para todas nuestras bombas es X” ó “calibramos todos nuestros instrumentos con la política Y”.

En cambio la formulación científica de técnicas de mantenimiento demuestra que la aplicación de enfoques genéricos de mantenimiento inadecuados es uno de los motivos principales por los cuales tantos programas tradicionales de mantenimiento dejan de lograr su pleno potencial. Los párrafos siguientes explican por qué los planes de mantenimiento genéricos deben ser tratados con gran cautela:

funciones: la descripción de la Fig. 1 (en PG. 2) muestra cómo una bomba puede tener una expectativa de prestación en una ubicación y una expectativa diferente en otra ubicación. Parámetros de prestación diferentes necesariamente requieren políticas de mantenimiento también diferentes. (Esto es especialmente cierto donde se utilizan máquinas idénticas para producir productos con requisitos de calidad muy diferentes).

modos de falla: cuando se utilizan máquinas idénticas en localizaciones diferentes (por ejemplo un sector de alta humedad o un entorno con mucho polvo en el ambiente) o bien para ejecutar tareas ligeramente diferentes (cortar un metal algo más duro que el habitual, funcionamiento a mayor temperatura, bombeando un líquido más abrasivo o más ácido) los modos de fallo variarán drásticamente. Esto implica que las estrategias de mantenimiento también tendrán que variar acorde con aquéllas diferencias en los modos de fallo.

consecuencias de fallos: cuando las consecuencias de fallos son diferentes, las estrategias de mantenimiento también serán diferentes. Esto queda demostrado por las tres bombas idénticas mostradas en la Fig. 9. La bomba A es “stand alone” o sea bomba de servicio única. En tal contexto, si falla, tarde o temprano las operaciones se verán afectadas. Por eso los usuarios ó mantenedores de la bomba “A” estarán inclinados a realizar esfuerzos por anticipar ó prevenir su fallo. (La medida del esfuerzo dependerá de la medida en que serán afectadas las operaciones y de la seriedad y frecuencia de las fallas de la bomba).

En cambio si falla la bomba “B”, los operadores simplemente cambiarán por la bomba “C”. Entonces la única consecuencia para la bomba “B” es que tendrá que ser reparada. En vista de lo dicho, los operadores de la bomba “B” probablemente optarán por dejar trabajar esa bomba “B” “hasta que falle” (especialmente si la falla de la bomba “B” no causa ningún daño secundario).

Por otra parte, si la bomba C falla mientras la bomba B aún está funcionando (por ejemplo si alguien “canibalizó” una pieza de C quitándola para colocarla en alguna otra máquina que la requiere), lo más probable es que los operarios ni siquiera sepan que la bomba C ha fallado hasta que falle la bomba B también. Para protegerse contra ésta situación posible, una estrategia sensata de mantenimiento puede ser hacer marchar la bomba C de tanto en tanto para detectar si ha fallado.

Este ejemplo muestra cómo tres activos idénticos pueden conllevar tres estrategias de mantenimiento totalmente diferentes, ya que las consecuencias de los fallos son diferentes en cada caso.

* Tareas de mantenimiento: diferentes organizaciones - o diferentes áreas de una misma organización - raramente emplean personas con habilidades idénticas. Esto implica que las personas que trabajan en un activo pueden preferir la utilización de una tecnología pro-activa para anticipar fallos (por ejemplo alta tecnología), mientras otro grupo trabajando con un activo idéntico puede sentirse más cómodo utilizando otra (por ejemplo una combinación de monitoreo de desempeño y los sentidos humanos). Es sorprendente que frecuentemente esto no importa, mientras la(s) técnica(s) elegidas sean costo-eficaces. De hecho, muchas organizaciones de mantenimiento comienzan a comprender que generalmente conviene más que la gente que tiene que realizar la tarea se sienta cómoda en ejecutarla, que imponer a todos la utilización de una misma metodología. (La validez de diferentes tareas también depende del contexto operacional del activo. Por ejemplo, pensemos cómo el ruido de fondo puede alterar la verificación de “ruido anormal” en un equipo).

Todo esto significa que debe tomarse especial cuidado en asegurar que el contexto operacional, las funciones y los parámetros de desempeño deseados, sean virtualmente idénticos, antes de aplicar a un activo una política de mantenimiento diseñada para otro.