La importancia del mantenimiento preventivo (PM)
Jason Spivey
Piense en esto: si vive en los EE. UU., usted –al igual que muchos otros residentes– tiene un vehículo motorizado de algún tipo. Ese vehículo lo lleva desde el punto A hasta el punto B diariamente. Sin embargo, si usted es como la mayoría de los propietarios de vehículos entonces, tal vez, usted no considera el mantenimiento de rutina básico necesario, incluso para ese “algo” en el que usted depende más. Esta es más una relación de “si se rompe, se repara”. Desafortunadamente, este mismo tipo de relación es común en la industria de centros de datos actual. Varios tipos de máquinas funcionan las 24 horas del día, los 365 días del año, lo que equi‑vale a 8760 horas al año. Los centros de datos no pueden permitir que falle alguna de sus máquinas. Por lo tanto, el mantenimiento preventivo (PM) es imprescindible.
El mantenimiento preventivo (PM) es un mantenimiento de rutina, realizado para garantizar la confiabilidad de los activos y eliminar cualquier falla o tiempo de inactividad que los activos presenten. El PM debe verse como un enfoque proactivo que establece inspecciones programadas de los activos para verificar la confiabilidad y también prolongar su vida útil.
Los centros de datos no pueden permitir que falle alguna de sus máquinas
Actualmente, los operadores de centros de datos gastan una cantidad de dinero abrumadora para tener la nueva sala de datos terminada para un arrendatario entrante, pero es posible que no reflexionen mucho para tener un plan de PM cuando vence la garantía del fabricante de equipo original (OEM). Es cierto, la mayoría de los problemas de la maquinaria nueva se presentan durante el arranque y el licenciamiento, pero ¿qué pasará dentro de tres a cinco años cuando ocurra un incidente?
El mantenimiento reactivo es una práctica común en algunas instalaciones. Al ser lo opuesto al mantenimiento preventivo, el mantenimiento reactivo esencialmente está esperando que ocurra un incidente. Esta práctica puede parecer ser una estrategia de ahorro de costos, pero cuando se produce tiempo de inactividad no planificado usted pasa más tiempo solucionando el problema que si tuviera un plan de mantenimiento preventivo instaurado. Este mantenimiento demorado podría generar publicidad negativa para su instalación y, a su vez, afectar la confianza de sus clientes. El programa de PM está diseñado para aliviar las interrupciones imprevistas y que las instalaciones ahorren tiempo y dinero.
La maquinaria que no se revisa regularmente puede crear un ambiente de trabajo peligroso e inseguro. Tener un programa de PM ayuda a garantizar la seguridad de los empleados en las instalaciones, evitando lesiones y accidentes.
Más importante aún, los técnicos capacitados en fábrica, en colaboración con los gerentes del centro de datos, deben realizar el mantenimiento preventivo (PM) para garantizar que no se violen los acuerdos de nivel de servicio (SLA). Por ejemplo, si un SLA requiere que el proveedor de alojamiento realice un mantenimiento de rutina anual para cumplir con el acuerdo y garantizar que los datos del cliente no se vean comprometidos; este requisito debe cumplirse.
Otro aspecto para considerar como parte de cualquier buen programa de PM es el plan de ciclo de vida de la maquinaria, en el que los gerentes de informática (TI) deben:
- retirar la máquina para revisiones de rutina;
- reemplazar los dispositivos antes de que fallen;
- modificar o actualizar los dispositivos;
- establecer las fechas del ciclo de vida y reemplazar cuando sea necesario.
Junto con un buen plan de PM, también es importante tener un plan de protección de energía (PPP) para eliminar o minimizar el tiempo de inactividad en el centro de datos. Cada PPP debe incluir el siguiente proceso:
- visita integral de PM anual realizada por un ingeniero de servicio al cliente capacitado en fábrica;
- ejecución frente a una inspección visual minuciosa de todas las piezas (p. ej., bombillas, pantallas, hardware faltante, limpieza), con las correcciones necesarias;
- verificación y calibración de todos los componentes de monitoreo;
- verificación del estado y el funcionamiento apropiado del sistema;
- comprobación del sistema para un equilibrio de carga, uso de kVA y estado de la alarma de la instalación adecuados;
- informes completos de todos los servicios prestados;
- escaneo infrarrojo de conexiones internas para buscar puntos calientes que causan el deterioro de los componentes y un desastre para evitar que ocurran;
- tiempo de respuesta de cuatro horas durante el tiempo de inactividad;
- acceso las 24 horas, los 7 días a la semana a asistencia técnica telefónica de los OEM;
- costos de piezas y mano de obra necesarias para corregir cualquier problema o mantener el sistema en buenas condiciones de funcionamiento;
- disponibilidad de piezas garantizada;
- kit de repuestos dentro de las instalaciones.
Figura 1: El técnico de servicio de campo verifica los voltajes del interruptor de transferencia estática y realiza una inspección visual durante una visita de rutina como parte del mantenimiento preventivo (PM).
Figura 2: El técnico de servicio de campo confirma la calibración y funcionalidad en un interruptor de transferencia estática durante una visita de rutina como parte del mantenimiento preventivo (PM).
Sobra decir que, durante el tiempo de inactividad, las piezas de repuesto originales de fábrica que se tienen a mano son esenciales para reducir el promedio de tiempo para reparar (MTTR). Si bien los técnicos de la fábrica pueden responder rápidamente, no tener las piezas significa un período de espera más largo para que el OEM las envíe.
Otro enfoque para garantizar el tiempo de actividad máximo es asegurarse de que el equipo de trabajo de su instalación reciba capacitación en la fábrica por parte del OEM. Esto elimina las molestas llamadas de servicio al OEM, lo que a menudo causa ansiedad al cliente.
Con la gran expansión del Internet de las Cosas (IoT) y autos semiautónomos, la confiabilidad de los centros de datos y el almacenamiento en la nube se ha vuelto una necesidad, no solo una función agradable. El mantenimiento preventivo (PM) siempre debe desempeñar un papel importante en las operaciones de los centros de datos. No obstante, sin una previsión adecuada y un plan de mantenimiento bien pensado, los gerentes del centro de datos están dirigiendo inadvertidamente el negocio hacia más problemas de los que debería tener.
Es posible mitigar el riesgo trazando un curso de mantenimiento preventivo (PM) y preparándose para los posibles factores de riesgo. De esta forma, si ocurre un corte de energía, el impacto se reduce y la organización no se convierte en el próximo encabezado de falla del centro de datos.