El Uptime Institute afirma que aproximadamente el 70% de las interrupciones de los centros de datos son causadas por errores humanos; lo que lleva a la mayor causa de tiempo de inactividad en nuestra industria y la más evitable. Podemos rastrear los errores humanos hasta tres aspectos interrelacionados: el trabajo, el individuo y la organización. El trabajo puede ser de naturaleza compleja; En ocasiones, las demandas pueden ser abrumadoras y los procedimientos pueden no ser tan claros como deberían ser. Para los individuos, consideramos la confianza y la competencia en su actitud, personalidad y nivel de habilidad. Desde el punto de vista organizacional, los recursos, las comunicaciones y la cultura pueden afectar el comportamiento y provocar errores en el desempeño del trabajo.
Estos pueden afectar la capacidad de una persona (y crear limitaciones) para concentrarse de manera eficaz en la gestión de riesgos y la reducción de errores humanos. Los siguientes consejos y trucos se utilizan en un modelo operativo de centro de datos exitoso para estimular mentalmente el enfoque de los técnicos y reducir la probabilidad de una interrupción.
Ubicación de ubicaciones precisas con un sistema de cuadrícula de centro de datos
Un sistema de cuadrícula para ubicaciones de piso y gabinete ayudará a los técnicos a navegar por el espacio en blanco y localizar la ubicación precisa de la instalación o el equipo de infraestructura de TI. Comience con letras en secuencia en una pared, alineadas con las baldosas del piso o espaciadas a dos pies de distancia para ambientes de piso sólido.
Utilice letras dobles una vez que se haya agotado AZ (es decir, AA, AB, AC, etc.). Las paredes adyacentes se etiquetarán con números en secuencia utilizando el mismo espacio. Esto creará ubicaciones específicas para mudanzas, adiciones, cambios o actividades de mantenimiento y reparación. Por ejemplo, habrá una ubicación en la habitación llamada F10 que permitirá a los técnicos ver visualmente las etiquetas F y 10 cerca del techo en dos paredes adyacentes. Continúe con el sistema de cuadrícula para etiquetar activos en gabinetes que normalmente no se reubican, como regletas de enchufes, paneles de conexiones y cables.
Una guía de referencia para verificar las condiciones operativas normales del centro de datos
La colocación de pequeños imanes circulares en el equipo de infraestructura de la instalación puede ser una guía de referencia rápida para verificar las condiciones normales de funcionamiento. Es una ayuda más para ayudar a los técnicos que realizan rondas y lecturas a confirmar lo que se espera e identificar fácilmente problemas potenciales. Coloque los imanes cerca de una posición de interruptor o palanca y, cuando corresponda, los imanes de colores pueden corresponder aún más a las condiciones esperadas. Por ejemplo, un imán verde junto a un interruptor abierto y uno rojo junto a un interruptor cerrado es una manera fácil para que un técnico coincida con lo que espera ver visualmente.
Advertencia: equipos o materiales peligrosos
Una advertencia táctil en las manijas de las puertas, como cinta moleteada o abrasiva aplicada a la superficie de contacto, proporciona un recordatorio adicional de que un técnico está a punto de ingresar a una habitación que contiene equipos o materiales potencialmente peligrosos. Algunas jurisdicciones pueden requerir advertencias táctiles para puertas a áreas peligrosas. Ya sea durante el mantenimiento programado o una evacuación, el sentido del tacto puede desencadenar un recordatorio de que lo que hay detrás de la puerta es un área para tener más precaución.
Orientación: mejora de la experiencia de la instalación
La mayoría de los operadores de centros de datos utilizan códigos de colores para reducir los errores humanos; por ejemplo, la ruta de distribución A es azul y la ruta B es verde. Algunos centros de datos han ido un paso más allá y han aplicado los colores a los paneles frontales y laterales de los equipos de infraestructura de las instalaciones. Las etiquetas de colores en este equipo deben usarse como mínimo; Tener cubiertas de paneles pintadas a juego lleva la mitigación de riesgos al siguiente nivel más allá del negro, blanco y gris estándar.
Encubrimiento: mitigar el riesgo de activación de EPO
La activación del apagado de emergencia (EPO) es casi siempre accidental y los botones de EPO deben protegerse con una cubierta de plástico con bisagras para mitigar el riesgo de activación accidental. La cubierta agrega un paso más a la activación, ya que la cubierta debe levantarse antes de poder acceder al botón. Para mitigar aún más el riesgo de un evento de EPO involuntario, conecte la cubierta con un interruptor de contacto sensible a la presión que hará sonar una alarma en el momento en que se levante la cubierta.
El error humano es inevitable, pero considerar e implementar estos consejos y trucos puede ayudar a los técnicos a concentrarse en el trabajo que están a punto de realizar y minimizar los errores humanos en su centro de datos. Para obtener más información sobre las mejores prácticas y programas que utilizamos para gestionar el riesgo en las operaciones del centro de datos en Salute Mission Critical, póngase en contacto con nosotros.