Las bases Teóricas de este análisis se basan en Metodologías de Confiabilidad Operacional, como Análisis de Criticidad (AC), Análisis Causa Raíz (ACR) y Mantenimiento Centrado en Confiabilidad (MCC).
El análisis se realizó en las estaciones de Telecomunicaciones que pertenecen al Sistema de Microondas de PDVSA Oriente, específicamente en la estación Sabana Larga, la cual sirvió como piloto para estudiar el resto de las estaciones, ya que es la más crítica de todas. Cada una de estas estaciones consta de tres sub-sistemas: Energía, Infraestructura y Radio.
El trabajo mostrado define las metodologías que permitieron diagnosticar y controlar el sistema, y para la misma se definen dos etapas: Una de diagnostico, en la cual se identifican los sistemas críticos objetos de estudio y las fallas recurrentes que deseamos mitigar; y una etapa de Control, en la cual se diseñan políticas de mantenimiento y de rediseño de los sistemas en estudio.
El resultado de este análisis nos permitió obtener una mayor confiabilidad de los activos y se logro alargar el ciclo vida de los mismos generando un incremento en la confiabilidad general de los procesos productivos.
1.- Introducción
Actualmente en PDVSA (Petróleos de Venezuela S.A.) dentro de la Gerencia de AIT Oriente la cual es actualmente custodia de todos los sistemas de Automatización, Informática y Telecomunicaciones, existen sistemas de alta criticidad debido al factor riesgo asociado. Un ejemplo de esos sistemas críticos es el sistema de Microondas el cual pertenece al área de Telecomunicaciones. La red de Transporte de Información (también llamada Red de transmisión) del Sistema de Microondas de PDVSA está diseñada con base en una jerarquía de dos niveles, un nivel corporativo (Red Corporativa) conformado por enlaces Interregionales de 140 Mbps que interconectan las diferentes regiones donde opera PDVSA (Centros Regionales de Transmisión) a lo largo del territorio nacional: Occidente, Paraguaná, Sur, Centro-Occidente, Area Metropolitana y Oriente. Por otra parte, el nivel operativo de la red (Red Operacional) lo constituyen todos los enlaces intrarregionales a través del cual se conectan las diferentes localidades de una región con el punto más cercano de la Red Corporativa. Con esta topología de Red se trata de garantizar el transporte de Información de todos servicios de Telecomunicaciones de PDVSA (Voz, Datos, Video, Telemetría, Comunicaciones Móviles, aplicaciones especiales, etc.), entre las diversas localidades, tanto operativas como administrativas, distribuidas a nivel Nacional. Esta red de transmisión está conformada por cerca de 264 enlaces bajo estándar PDH. Adicionalmente, el Sistema de Administración/ Supervisión (DAS 64) es propietario, y en la actualidad se está adquiriendo su reemplazo por el (STAER).
La Red Troncal de Transmisión abarca toda la faja norte del país desde Zulia hasta Monagas; además, se extiende desde Anzoátegui y Monagas hasta Bolívar y desde Lara hasta Barinas y Apure. Está conformada principalmente, por enlaces de radios digitales de microondas de velocidad 4x34 Mb/s en los troncales principales y de 2x34 Mb/s en los troncales secundarios, para un total de 264 enlaces. En algunos tramos la Red Corporativa esta constituida por anillos de contingencia, desarrollados con el propósito de contar con una infraestructura de telecomunicaciones que garantice la continuidad y disponibilidad de los servicios cursados. El sistema de transmisión es alimentado de la red publica con 115V AC O 220V AC y transformado por un banco de transformadores a 110V AC, los mismos llegan a un rectificador de 110V AC a 48 V DC del cual se alimenta el radio de microondas.
A principios del año 2003, dentro de PDVSA en la Gerencia AIT específicamente en Oriente-Distrito Puerto La Cruz, se presentaron fallas recurrentes en las estaciones de Telecomunicaciones de los Sub-Sistemas de Energía e Infraestructura del Sistema de Microondas, afectando la confiabilidad operacional del mismo y generando un alto impacto en las operaciones y en los presupuestos de gastos.
Como ejemplo, cincuenta Estaciones de Telecomunicaciones del Sistema Microondas pierden su función durante 8 horas al año por fallas del sistema de energía, totalizando la pérdida del servicio durante 400 horas al año; esto causa un impacto en: producción que oscila en pérdida de 1,6 MMB/Año a razón de 4.000 barriles por hora producidos; y en las ganancias de 32 MMUS$/Año, tomando en cuenta que por cada barril producido se obtiene una ganancia US$20.
2.- Marco Conceptual
Para el Análisis de Confiabilidad Operacional del Sistema de Microondas se utilizaron las metodologías siguientes:
- Análisis de Criticidad (AC).
- Análisis Causa Raíz (ACR).
- Mantenimiento Centrado en Confiabilidad (MCC)
2.1 Análisis de Criticidad (AC)
Es una metodología que permite jerarquizar sistemas, instalaciones y equipos, en función de su impacto global, con el fin de optimizar el proceso de asignación de recursos (económicos, humanos y técnicos). El término “crítico” y la definición de criticidad pueden tener diferentes interpretaciones y van a depender del objetivo que se está tratando de jerarquizar.
Para aplicar AC se deben: definir los alcances y propósitos del análisis; establecer criterios de importancia y seleccionar un método de evaluación para jerarquizar la selección del sistema objeto del análisis.
El análisis se realiza vía tormenta de ideas en una reunión de trabajo con un grupo multi-disciplinario entre los que se encuentran la línea supervisora y trabajadores de operaciones y mantenimiento, ingeniería de procesos o infraestructura, analista de mantenimiento (preventivo/predictivo), con la finalidad de unificar criterios y validar la información.
Generalmente los criterios establecidos para AC son: Seguridad, Ambiente, Producción, Costos de Operación, Costos de Mantenimiento, Frecuencia de Fallas y Tiempo Promedio para Reparar.
Con estos criterios, se genera un modelo de criticidad definido por:
Criticidad = Frecuencia x Consecuencia
En la matriz de criticidad se ubican los sistemas o equipos según su nivel, bien sea, crítico ( C ), medianamente crítico (MC) y no crítico (NC). Como se muestra en la figura 2.1.1
Un Análisis de Criticidad debe aplicarse cuando se requiera de fijar prioridades en sistemas complejos, administrar recursos escasos, crear valor, determinar impacto en el negocio, aplicar metodologías de confiabilidad operacional, etc.
El Análisis de Criticidad puede ser aplicado en cualquier conjunto de procesos, plantas, sistemas, equipos y/o componentes que requieran ser jerarquizados en función de su impacto dentro del ámbito en estudio.
2.2.- Análisis de Causa Raiz (ACR): Es una metodología utilizada para identificar las causas que originan las fallas o problemas, las cuales al ser corregidas evitarán la ocurrencia de los mismos. ACR permite buscar la razón por la cual un sistema, instalación, equipo, componente o elemento no funciona satisfactoriamente.
Su identificación y análisis, requieren un profundo conocimiento del sistema, las operaciones, el personal y los métodos de trabajo; es por ello que es el resultado de un trabajo en equipo.
Generalmente se ejecuta ACR, cuando se presenta la pérdida de la función de un activo (ESCP) Y suele aplicarse para fallas recurrentes. El objetivo es definir el problema identificando las soluciones efectivas e implementando las mismas.
El análisis del problema (véase Fig. 2.2.1) es seguir el problema por la presencia de un efecto. Con lo cual se identifica y se describe al mismo, buscando la causa más cercana. Al llegar a este punto se aplican herramientas de investigación (Línea de tiempo y árboles de causa raíz, entre otros) con la finalidad de identificar realmente las causas del problema. En la siguiente fase se verifican las causas y el efecto. En una fase final se verifican las mejoras una vez aplicadas las soluciones efectivas planteadas.
ACR resiste cualquier análisis cuantitativo o lógico porque se basa en hechos mensurables y cuantificables, no suposiciones o conjeturas y las causas reales han sido identificadas mediante razonamientos ordenados y racionales. Además es expresado en formas y lenguajes simples.
ACR es normalmente aplicado cuando se requiere de análisis de fallas repetitivas en equipos o procesos críticos; cuando se requiere de análisis de errores humanos, en el proceso de diseño y aplicación de procedimientos y su supervisión; cuando se requiere de análisis de diferencias organizacionales y programáticas, etc.
2.3.- Mantenimiento Centrado en Confiabilidad (MCC) es una metodología utilizada para determinar sistemáticamente que debe hacerse para asegurar que los activos físicos continúen haciendo lo requerido por el usuario en el contexto operacional presente.
Las principales premisas del MCC son:
- Análisis enfocados en las funciones que el proceso o sistema requiere.
- Análisis realizados por equipos naturales de trabajo (operador, mantenedor, programador, especialistas) dirigidos por un facilitador, especialista en la metodología del MCC.
- El resultado o producto que se obtiene con un análisis de MCC, son planes óptimos de mantenimiento, basados en las consecuencias que produce cada modo de falla.
La metodología de MCC se basa en siete preguntas claves:
- ¿Cuáles son las funciones y los estándares de ejecución?
- ¿En qué forma se pierde la función o no se cumplen los estándares de ejecución?
- ¿Qué causa cada falla funcional?
- ¿Qué ocurre cuando sucede una falla?
- ¿Cómo impacta cada falla?
- ¿Qué puede hacerse para prevenir cada falla funcional?
- ¿Qué puede hacerse sino se conoce tarea de prevención?
Para garantizar el éxito en una aplicación o análisis de MCC, es importante responder cada una de las siete preguntas en orden de aparición y de forma correcta, sin omitir detalles, con hechos y no suposiciones. La mejor manera de dar respuesta verdadera a cada una de las siete preguntas es a través del diagrama mostrado en la figura 2.3.1.
Cada bloque tiene una razón de ser y una función específica dentro del proceso de análisis del Mantenimiento Centrado en Confiabilidad.
El Contexto Operacional: Define en forma precisa todos los elementos que serán considerados en el análisis, desde la definición de las fronteras hasta los distintos activos y/o elementos que forman parte del sistema a evaluar, así como también, el régimen de operaciones al cual estará sujeto el activo. Para definir un buen contexto operacional, que facilite las etapas siguientes del flujo grama de proceso que debe seguir el análisis de MCC, es de suma importancia incorporar El Diagrama Entrada - Proceso - Salida (EPS) y El diagrama funcional.
Para definir los bloques restantes, es conveniente definir el término de “Análisis de Modos y Efectos de Falla (AMEF)”, el cual es un proceso estructurado para el análisis de: funciones, fallas funcionales, modos de falla y efectos de falla. Los efectos o consecuencias de las fallas son posteriormente evaluados para determinar acciones de prevención. El proceso es conceptualmente simple y sistemático en su aplicación. La ventaja de este proceso es la capacidad que aporta para considerar las posibilidades de fallas que no se han presentado en la práctica, para así poder establecer medidas preventivas y gerenciar políticas efectivas que eviten o mitiguen las consecuencias de las fallas.
La mejor manera de ejecutar un proceso AMEF es a través de un equipo natural de trabajo (ENT), el cual debe estar integrado por personal familiarizado y conocedor de la planta, proceso o activo objeto de análisis, y por el facilitador, especialista en MCC y quien conducirá el análisis para garantizar que se cumplan con éxito cada una de las etapas.
El AMEF permite identificar sistemáticamente para un sistema y/o activo, los siguientes elementos:
- Función
- Falla de función o falla funcional
- Modo de falla
- Efecto de falla
Las funciones: deben estar enfocadas a lo que se desee que realicen los sistemas o activos. Se dividen en primarias o secundarias. Su descripción está constituida por un verbo, un objeto y el estándar de desempeño deseado.
Las fallas funcionales: se presentan cuando una función no se cumple incluso cuando se pierde cualquiera de los estándares de desempeño. Para definir una falla funcional sólo se requiere escribir la función en sentido negativo, es decir, negar la función.
Los Modos de falla: son las razones que dan origen a las fallas funcionales. Son las condiciones que se presentan, como desgaste, fractura, pérdida de calibración, suciedad, atascamiento, etc., es decir, lo que hace que la planta, sistema o activo no realice la función deseada. Adicionalmente, se describen las causas de falla ocasionadas por error humano, error de diseño o error en el proceso. Cada falla funcional puede ser originada por mas de un modo de falla y cada modo de falla tendrá asociado ciertos efectos, que son básicamente las consecuencias de que dicha falla ocurra.
Los Efectos de fallas son simplemente los que pueden observarse si se presenta un modo de falla en particular. La descripción de un efecto de falla debe cumplir con:
- Tener la información necesaria para determinar consecuencias y tareas de mantenimiento.
- Debe describirse como si no estuviera haciéndose algo para prevenirlos.
- Debe considerarse que el resto de los dispositivos y procedimiento operacionales funcionan o se llevan a cabo.
El MCC categoriza los efectos de acuerdo a sus consecuencias en: fallas ocultas, seguridad y/o ambiente, operacionales y no operacionales.
Acciones de Mantenimiento
Luego de analizar las funciones, fallas funcionales, modos de falla y sus consecuencias, el siguiente paso consiste en seleccionar la actividad de mantenimiento.
Para establecer las acciones de mantenimiento requeridas, se utiliza el árbol de decisiones, donde dependiendo del tipo de consecuencia que ocasiona cada falla (oculta, seguridad, ambiente, operacional y no operacional), se deberá ejecutar una acción: predictiva, preventiva, detective, un rediseño, o simplemente dejar fallar.
La aplicación adecuada de las nuevas técnicas de mantenimiento, bajo el enfoque del MCC, permiten de forma eficiente optimizar los procesos de producción, y disminuir al máximo los posibles riesgos sobre la seguridad personal y el ambiente que traen consigo las fallas de los activos en un contexto operacional específico.
3.- Caso de Aplicación
Como parte del Análisis de Confiabilidad Operacional de los Sistemas de la Gerencia de AIT Oriente se lleva a cabo como proyecto piloto la Confiabilidad Operacional del Sistema de Microondas. Este estudio comienza realizando un análisis de criticidad en las estaciones de telecomunicaciones de PDVSA Oriente, específicamente en el Distrito Puerto La Cruz. Para este análisis se definieron Las Frecuencias de Fallas y los Criterios de Consecuencias mostrados a continuación: se muestra en base a que se definieron estos parámetros:
A.- Frecuencias de Fallas: Esta fue obtenida del Centro de Control de la Red (CCR). El CCR es un centro de monitoreo que se encarga de visualizar las alarmas de todos los sistemas de telecomunicaciones (Sistema de Microondas, Sistema de Energía, Sistema de ATM, y Sistema de Centrales Telefónicas, entre otros).
Estas alarmas se visualizan a través del software PEM (Patrol Enterprise Manager) el cual tiene una interfaz con el SIFTEL que permite grabar la base de datos de todas las alarmas. Con esta data ubicada en el SIFTEL se pudo obtener la información de las fallas en cada una de las estaciones de Telecomunicaciones para el año 2002.
B.- Consecuencias: Para el análisis de consecuencias se definieron criterios que permitieron evaluar el impacto en el sistema de microondas; a continuación se muestran con sus respectivas ponderaciones:
Número de Enlaces (N.E): Cantidad de enlaces asociados a una estación.
Capacidad del Radio (C.R): Cantidad de bits que pueden transferir los radios en cada estación por unidad de tiempo.
Impacto en el Servicio (I.S): Cantidad de servicios de datos y centrales telefónicas asociados a cada estación.
Acceso (A): Es el tiempo que se tarda en llegar a la estación al perderse el servicio de la misma
Flexibilidad (F): Capacidad de “re-enrutar” los servicios críticos.
Desconexión de la Central Regional (D.R): Pérdida de conexión entre la central zonal y la central regional al perderse la conexión con la estación asociada.
Ponderación de Criterios
Numero de Enlaces (NE): En una estación de transmisión, el tope de la cantidad de enlaces son 10. A las estaciones con mayor cantidad de enlaces se les asignó una ponderación mayor, ya que las consecuencias son más altas.
Capacidad del Radio (CR): Las estaciones con diferentes capacidades de radio deben tener mas alto impacto, por lo tanto la ponderación tiene mayor valor.
Impacto en el Sistema (IS): Se toman como referencia las estaciones con mayor cantidad de centrales zonales como las que tienen mayor alto impacto. Las centrales zonales son llamadas centrales telefónicas en la red de conmutación de PDVSA. Para este criterio se consideró, a través de un consenso, que en épocas de contingencia el dato más importante es la voz.
Acceso (A): El acceso con mayor de 3 horas tiene mayor ponderación ya que el impacto es mayor.
Flexibilidad (F): Las estaciones que tienen la flexibilidad de re-enrutar los servicios son de menor impacto que las que no tienen flexibilidad.
Desconexión de la Central Regional (DR): Las estaciones que tienen desconexión de la central regional (Centrales TANDEM en la red de conmutación de PDVSA) tienen mas alto impacto que las que no.
Una vez definida la Frecuencia de Fallas y los Criterios de Consecuencias se procedió a expresar la criticidad de la siguiente manera:
C = FF x (NE+CR+IS+A+DR+F)
Donde C indica el valor relativo de un subsistema en función de la frecuencia de falla (FF) y de las consecuencias (NE+CR+IS+A+DR+F). Esto permite, adicionalmente, representar los valores dentro de la matriz de criticidad mostrada en la Fig. 3.1.
La matriz de criticidad mostrada en la Fig. 3.1 fue construida con base a los criterios de consecuencias definidos y las fallas obtenidas en un año; así se pudo determinar que la estación de telecomunicaciones SABANA LARGA posee los mayores niveles de criticidad. En tal sentido, se decidió seleccionarla como estación piloto. Una vez seleccionada la estación se procedió a la paretización de las fallas más recurrentes (AC, Motogenerador, Aire Acondicionado y Radio) como se muestra en la Fig. 3.2. Las fallas del AC, Motogenerador y Radio son obtenidas de la base de datos del SIFTEL; en el caso de los Aires Acondicionados la data se consideró con respecto a la experiencia de los expertos obtenidas en un año. De este análisis se puede concluir que para el periodo 2002 se observa que el Radio falla aproximadamente en un 6% y que los sistemas externos son para este caso en particular los que mas fallan.
Obtenidos estos resultados, se tomó una de estas fallas de la estación Sabana Larga para realizar un Análisis Causa Raíz y obtener las causas Raíz: Física, Latente o Humana. “Mal funcionamiento del Motogenerador del Sub-Sistema de Energía”.
Es importante resaltar que con este estudio causa – raíz, además de identificar las fallas de los equipos, se presentan las posibles soluciones para disminuir las mismas. Las alternativas de solución planteadas para este estudio están orientadas a optimizar la confiabilidad operacional en todas las estaciones de Telemetría del
Resultados del Análisis Causa Raíz (ACR).
- No hay conocimiento sobre las causas probables de recurrencia de fallas.
- Esquema global de costos de mantenimiento para toda la instalación, sin discretización por sistemas y/o equipos.
- Existencia de planes de mantenimiento preventivo aislados, con cumplimiento parcial.
- Actividad de mantenimiento realizada por frecuencia no por condición.
- Inexistencia de un sistema de control de gestión.
- Inexistencia de planes de mantenimiento, sistemáticos y coherentes que permitan evaluar, mejorar y controlar la gestión mantenimiento.
- Inexistencia de bases de datos de instrumentación en sap pm.
- No existe diferenciación ni responsabilidad concreta entre los distintos niveles de mantenimiento.
Aplicación del MCC
Hasta este punto se ha desarrollado la fase de diagnóstico de la Metodología planteada. Para entrar en la de control, se deben desarrollar proyectos de MCC para cada sub-sistema. En vista del alto impacto en las operaciones causado por el subsistema energía, se seleccionó para mostrar su AMEF como ejemplo práctico. El Sub-Sistema Energía esta compuesto por Equipos como: Motogeneradores, Rectificadores, Banco de Baterías, Sistema Puesta a tierra, entre otros. Su función principal es “Suministrar en forma continua tensiones de -48 y -24 vdc +/- 10% a los equipos de radio” y de ella se derivan cuatro fallas funcionales: “No suministra nada”, “Suministrar en forma intermitente”, “No suministrar tensiones de -24 +/- 10% vdc a los equipos de radio”; de cada una de éstas se obtienen varios modos y efectos de falla. En la Figura 3.4 se observa el resumen de esto en la hoja RCM2.
El paso siguiente es identificar el tipo de tareas que deben ejecutarse para mitigar los efectos de estas fallas. En la figura 3.5 se muestra el diagrama de decisión con las tareas propuestas.
Resultados
A continuación se muestran gráficamente la distribución de tareas de mantenimiento de los subsistemas de energía, infraestructura y radio. Dichas tareas redundarán en la creación de los planes de mantenimiento de las instalaciones involucradas, lo cual minimizará la ocurrencia de las fallas.
Nota: El sistema estudiado aparte, es un subsistema que forma parte del Sistema de Energía, pero que requiere tratamiento especial.
Nota: El sistema se analiza por separado, es un subsistema que forma parte de los Sub-Sistemas de Radio e Infraestructura, pero que requiere tratamiento especial.
Recomendasiones de Re Diseño
Sub-Sistema de Energía
- Se recomienda la colocación de parabichos para evitar que entren alimañas por las puertas de las casetas.
- Elaborar procedimiento que asegure la reconexión de los sistemas de aterramiento una vez concluido el mantenimiento.
Sub-Sistema Infraestructura
1. Rediseñar la caseta de manera que evite el acceso de intrusos.
4.- Lecciones Aprendidas
Durante el proceso de aplicación de Confiabilidad Operacional del Sistema de Microondas, se pueden identificar las siguientes lecciones aprendidas:
- El esquema de trabajo en equipo de las metodologías aplicadas, brinda una excelente oportunidad para aprender de otras disciplinas y/o fortalecer nuestros conocimientos sobre la instalación.
- El proceso de comunicación de resultados es un factor habilitador, que facilita la búsqueda de recursos adicionales, rompe paradigmas y promueve el cambio de Gerencia Reactiva en Gerencia Proactiva.
- El MCC es una excelente metodología para captar el conocimiento y estadística no documentada de la organización.
5.- Conclusiones
- La metodología de MCC permite generar planes óptimos de mantenimiento, siempre y cuando se aplique de forma estructurada y sistemática cada una de las etapas que la conforman.
Un estudio de MCC no se concluye hasta que las tareas de mantenimiento producto del análisis, no hayan sido implantadas, lo que significa que formen parte del sistema Sap-pm o en cualquier otro sistema de información.
Implementar los Índices de Gestión de Mantenimiento, Confiabilidad, Mantenibilidad y Disponibilidad para justificar y orientar a la toma de decisiones de un activo.
6.- Referencias
1. PDVSA CIED, Introducción a la Confiabilidad Operacional, 1999.
2. PDVSA CIED, Mantenimiento Centrado en la Confiabilidad, 1999.
3. Strategic Tecnologies Inc., Reliability –Centred Maintenance for facilitators., 1999
4. The Woodhouse Partnership Ltd, Mantenimiento Centrado en la Confiabilidad Plus, 1988.
5. Resultados Confiabilidad Operacional E & P Occidente, Agosto 2000.
6. Desarrollo de un Modelo de Gestion de Confiabilidad