Ahorre dinero, tiempo y frustraciones con la intervención temprana en operaciones
El ritmo de crecimiento y cambio en nuestra industria ha creado carreras emocionantes para todos. Los que han prosperado han sido los que aprendieron y se adaptaron más rápido. Quienes adoptan la idea de llevar las operaciones a las primeras etapas del diseño de un centro de datos se benefician del ahorro de costos y la velocidad de comercialización porque elimina el retrabajo y aumenta la confiabilidad desde el primer día. Hace unos diez años, Lee Kirby escribió un artículo para el Uptime Institute Journal titulado "Comenzar con el fin en mente." Fue un documento de posición que culminó sus lecciones aprendidas, habiendo trabajado con los principales actores a medida que proliferaba la industria. Con líderes clave compartiendo el mensaje, este artículo generó una discusión saludable dentro de la industria.
Sin embargo, se mantiene el dicho de que si sigues haciendo lo mismo, obtendrás el mismo resultado. Dado que la misma mentalidad heredada aún obstaculiza muchos proyectos de construcción de centros de datos, quería compartir las oportunidades más comunes para traer operaciones durante el diseño de un proyecto de construcción o modernización. Las dos categorías importantes en las que hay que centrarse son Mantenimiento y Servicio y Riesgo Operacional.
Mantenimiento y capacidad de servicio
Capacitación para el personal de operaciones
Cursos de proveedores de equipos y software en todos los sistemas internos, incluidos, entre otros, el Sistema de gestión de edificios (BMS), Control de acceso, Circuito cerrado de televisión (CCTV), Calefacción, ventilación y aire acondicionado (HVAC), Fuente de alimentación ininterrumpida ( UPS), generadores y cualquier otro equipo y/o sistema, que sean requeridos por el Operador para administrar las operaciones del sitio de manera efectiva.
La planificación del espacio
La planificación del espacio del centro de datos implica la consideración y la gestión cuidadosas de los recursos físicos, como el espacio físico, la energía, la refrigeración y la infraestructura de redes para garantizar una utilización y disponibilidad óptimas de los equipos de TI. El espacio para trabajar con seguridad y permitir el reemplazo de componentes significativos dentro de un activo es esencial. A menudo se requiere acceso posterior al equipo para mantenimiento y reparaciones.
ubicación de activos
Determinar qué equipo se puede instalar sobre el piso o en los techos a menudo se determina a través de una lente de planificación del espacio. Las operaciones necesitarán equipos de acceso seguro para mantener, recopilar datos o reparar equipos. Requerir ascensores requiere mucho tiempo, es costoso y crea riesgos de seguridad adicionales.
Estrategias del ciclo de vida de los activos
Esto implica la planificación, gestión y optimización de los activos de TI durante toda su vida útil, desde la adquisición hasta la eliminación. La instalación de activos más grandes como transformadores, generadores, enfriadores y unidades de condensación remotas (RCU) durante la construcción de edificios es fácil antes de que se coloquen las puertas y las paredes. Pero avance rápido 10-15 años después, cuando sea el momento de reemplazar físicamente esos activos en un centro de datos en vivo; puede crear desafíos significativos, especialmente cuando el trabajo puede requerir el cierre de cargas críticas y la eliminación de paredes.
Riesgo operacional
Suelo de rejilla abierta
Un sistema de suelo elevado que permite un mejor flujo de aire y refrigeración en los centros de datos, así como un acceso más fácil a la infraestructura y el cableado bajo el suelo. Esto es común para el enfoque de pórtico de varios pisos, pero crea problemas de seguridad ya que cualquier herramienta o tuerca/perno que se caiga puede perderse o tiene el potencial de impactar la infraestructura ubicada en el piso de abajo. También es muy desafiante maniobrar equipo/material pesado a través y alrededor de pisos de rejilla abierta. Además, el rechazo de calor de un activo puede afectar directamente a otro (p. ej., el calor de los generadores terrestres que ascienden a los enfriadores superiores).
Servicios de agua domésticos por encima de la planta crítica o salas de datos
La instalación de sistemas de plomería que suministran agua potable a la infraestructura crítica de un edificio, como salas de máquinas o centros de datos, desde arriba en lugar de desde abajo. Esto es simple de prevenir, pero todavía lo ves hoy. Por lo general, se soluciona instalando terraplenes, bandejas de goteo y detección de fugas, pero el agua siempre parece encontrar una forma de evitar las medidas de protección. El agua enfriada se considera una excepción, ya que las medidas automáticas pueden detectar y aislar fugas.
El Centro de operaciones de seguridad (SOC) y el Centro de operaciones de las instalaciones (FOC) deben estar alimentados por un UPS
Todos los tomacorrientes en todo el SOC y FOC de seguridad deben estar en un UPS para que permanezca encendido durante un tiempo en caso de una pérdida de energía en el sitio, o partes del sitio, por cualquier motivo, hasta que la energía principal. se restaura, o los sistemas de energía de emergencia están disponibles para proporcionar energía de emergencia al sitio, lo que ocurra primero. Cuando un incidente afecta la carga crítica, es valioso contar con capacidades segregadas de monitoreo, solución de problemas y control de acceso.
Etiquetado
Identificar y etiquetar claramente los activos, el equipo y la infraestructura de TI dentro de un entorno de centro de datos para facilitar la gestión, la resolución de problemas y el mantenimiento. El etiquetado debe ser totalmente completo, único, correcto y actualizado. Los operadores dependen de ello. Todos los equipos deberán estar etiquetados de manera única y visible. El etiquetado debe ser coherente y preciso en todo el diseño y la documentación conforme a obra para ayudar al personal de operaciones y seguridad en la ejecución de sus funciones con confianza y precisión.
Sincroniza automáticamente los relojes del sistema
Los propietarios y operadores deben acordar que todos los sistemas internos tendrán sincronización automática de relojes, administrada por el propietario e implementada durante la instalación del equipo y del sistema para garantizar que todas las marcas de tiempo sean idénticas. Crear una línea de tiempo de eventos históricos mientras se resuelve un incidente es mucho más fácil cuando todos los relojes del sistema están sincronizados.
Estas son las lecciones que hemos aprendido y son oportunidades para llevar las operaciones a la fase de diseño de un proyecto de construcción o modernización. Un proyecto de construcción o modernización que considere estas lecciones aprendidas desde el principio brindará efectividad operativa a largo plazo y menos riesgo para los inquilinos, al tiempo que evitará la repetición del trabajo y los retrasos que estos pueden causar porque el retorno de estas inversiones es la rapidez con la que puede llenar el centro de datos con los negocios generadores de ingresos que impulsaron la demanda en primer lugar. Ahora es el momento de cambiar la forma en que pensamos acerca de las operaciones.