¿Qué es la gestión de la infraestructura del centro de datos (DCIM)?

¿Qué es la gestión de la infraestructura del centro de datos (DCIM)?

La gestión de la infraestructura del centro de datos (DCIM) abarca los procesos y las tecnologías utilizados para supervisar, medir y gestionar la infraestructura física y virtual de un centro de datos. La DCIM utiliza herramientas, software y aplicaciones para supervisar diversas áreas clave dentro de los centros de datos, como:

  • Infraestructura física: este tipo de monitoreo emplea métodos que incluyen sensores, cámaras y software de gestión de instalaciones para verificar el estado de los equipos y el estado de las amenazas a la seguridad, fallas de los equipos y otras anomalías potenciales.
  • Gestión de la Capacidad: Un suministro de energía confiable y siempre disponible es un requisito crucial en un centro de datos. El software DCIM monitoriza la capacidad de energía, el ancho de banda de la red, el espacio en rack y la capacidad de refrigeración. Esto ayuda a los operadores del centro de datos a comprender cuándo los racks de servidores se están quedando sin espacio e implementar nuevos equipos cuando sea necesario. También puede ayudar a investigar las causas del alto consumo de energía y a mejorar la eficiencia de la refrigeración.
  • Seguridad: DCIM supervisa varios aspectos de la seguridad del centro de datos, como:
      1. Seguridad física: esto incluye prevenir acceso no autorizado y actividad maliciosa, evitar el uso de cámaras, monitorear cerraduras de puertas y otros sensores para detectar intrusiones y proporcionar alertas.
      2. Seguridad ambiental: Condiciones ambientales como el polvo, la humedad y la temperatura pueden ser peligrosas y comprometer el buen funcionamiento de los centros de datos. Los sistemas DCIM ayudan a reducir el riesgo de exposición de los equipos a estos peligros. Los equipos de los centros de datos consumen una cantidad significativa de energía, por lo que es crucial garantizar que el flujo de aire en un centro de datos esté refrigerado y controlado para evitar el sobrecalentamiento. La humedad en un centro de datos debe mantenerse dentro de un rango específico para prevenir la corrosión.
      3. Seguridad de activos: DCIM monitorea los activos del centro de datos, como dispositivos de almacenamiento, equipos de red y servidores, para identificar actividad no autorizada en activos críticos.
      4. Seguridad lógica: DCIM monitorea los registros del sistema, el tráfico de la red y otros datos para alertar al personal sobre actividades sospechosas, violaciones de datos y violaciones de la red.

¿Qué puede monitorizar un DCIM?

La gestión de la infraestructura del centro de datos (DCIM) utiliza herramientas de monitorización para recopilar datos de activos y así mejorar la eficiencia operativa en toda la organización. La DCIM se puede dividir en diferentes niveles, entre ellos:

1. Equipos de TI (Tecnología de la Información):

  • Servidores: supervisa el estado operativo, la temperatura, la CPU, la memoria y el uso del almacenamiento.
  • Dispositivos de almacenamiento: controlan el espacio disponible, el rendimiento y la integridad de los datos.
  • Conmutadores de red: supervisa la conectividad, el ancho de banda, el tráfico de datos y el rendimiento de la red.
  • Enrutadores y firewalls: administra la conectividad de red, la configuración de seguridad y la supervisión del tráfico.

2. Seguridad y control de acceso:

  • Sistemas de Control de Acceso: Monitorea la entrada y salida de personal autorizado, registra eventos de acceso y controla el acceso a áreas restringidas.
  • Cámaras de seguridad: Monitorea actividades y eventos de seguridad en tiempo real, graba videos y captura imágenes para su posterior análisis.

3. Entorno físico:

  • Sensores de temperatura y humedad: monitorean las condiciones ambientales para garantizar que estén dentro de límites aceptables.
  • Sensores de detección de agua: detecta fugas o inundaciones para evitar daños al equipo.
  • Sensores de humo y fuego: Monitorea la presencia de humo y activa alarmas en caso de incendio.

4. Gestión de activos:

  • Inventario de equipos: mantiene un registro detallado de todos los activos de TI y la infraestructura del centro de datos, incluida la ubicación, el estado y la información del historial de mantenimiento.

Si bien los sistemas DCIM (Gestión de Infraestructura del Centro de Datos) desempeñan un papel crucial en la gestión eficiente de los recursos físicos y lógicos de un centro de datos, aún existe la necesidad de un enfoque innovador y complementario que sea más detallado en algunos niveles de la infraestructura que lleve la inteligencia operativa a un nuevo nivel, como:

Infraestructura eléctrica:

  • PDUs (Unidades de Distribución de Energía): Monitoreo y predicción de problemas de distribución de energía, carga, consumo y estado de la energía.
  • SAIs (Sistemas de Alimentación Ininterrumpida): Monitorización de capacidad de batería, estado de energía, tiempo de autonomía, identificación temprana de anomalías.
  • Generadores: Controla el estado operacional, nivel de combustible y disponibilidad para operación en caso de corte de energía, así como el control de mantenimiento en función de las condiciones del equipo.

Infraestructura de refrigeración:

  • Unidades de aire acondicionado: monitorean la temperatura ambiente, la humedad, el flujo de aire, la temperatura del compresor, el voltaje y la corriente para predecir problemas de manera temprana.
  • Ventiladores: Controla el estado operativo, la velocidad de rotación y el flujo de aire.
  • Torres de enfriamiento: Monitoreo y control de bombas, compresores, incluyendo temperatura del agua de entrada y salida, voltaje, corriente, humedad, temperatura y vibración.

¿Cuáles son las principales diferencias entre un DCIM y un Bridgemeter?

  1. Enfoque en la anticipación y la prevención: Bridgemeter va más allá de la simple monitorización y gestión de la infraestructura física. Mediante algoritmos de inteligencia avanzados, anticipa posibles fallos y anomalías, lo que permite intervenciones proactivas para prevenir interrupciones y maximizar la disponibilidad operativa.
  2. Inteligencia adicional: Además de monitorear parámetros físicos como la temperatura y la humedad, Bridgemeter ofrece inteligencia adicional mediante análisis predictivo. Identifica patrones y tendencias, proporcionando información valiosa para optimizar la eficiencia energética, planificar la capacidad futura y mejorar la utilización de los recursos del centro de datos.
  3. Interacción con el Equipo de Mantenimiento: Bridgemeter agiliza y reduce el tiempo de corrección del problema identificado directamente con el equipo de campo generando tareas de corrección con la documentación pertinente del equipo en cuestión.
  4. Adaptabilidad: Gracias a su capacidad de adaptarse a nuevas condiciones y entornos en tiempo real, Bridgemeter permite una respuesta rápida a los cambios operativos. Esto garantiza que los operadores de centros de datos puedan tomar decisiones informadas y ágiles, ya sea en relación con el servicio al cliente o con cambios en la inteligencia/configuración de monitorización.
  5. Integración fluida con DCIM: Bridgemeter no reemplaza los sistemas DCIM existentes, sino que los mejora y destaca en conectividad e integración de datos al ser compatible con más de 150 protocolos de comunicación diferentes. Esto significa que puede conectarse a cualquier sensor, PLC (controlador lógico programable) o equipo existente en el centro de datos, añadiendo conectividad DICM y permitiendo la recopilación de información más densa y variada. Esta capacidad facilita la rápida implementación del sistema, proporcionando una visión global más inteligente de las operaciones del centro de datos. Además, Bridgemeter actúa como middleware para la conectividad intersectorial, lo que permite la integración fluida de datos de diferentes sistemas y equipos en todo el entorno del centro de datos.
  6. Elevando el nivel de eficiencia: Al ofrecer una solución completa e integrada para la gestión de centros de datos, Bridgemeter eleva el nivel de eficiencia operativa y fiabilidad. Su capacidad para proporcionar información en tiempo real y respaldar la toma de decisiones estratégicas lo convierte en un componente esencial de cualquier entorno de centro de datos moderno.

En resumen, Bridgemeter de Above-Net no solo se diferencia de los sistemas DCIM tradicionales, sino que también mejora su eficacia y usabilidad al incorporar inteligencia y capacidades de análisis avanzado a los entornos de centros de datos. Al adoptar Bridgemeter, las organizaciones pueden alcanzar un nuevo nivel de excelencia operativa y garantizar la máxima disponibilidad de sus servicios críticos.

Monitoreo térmico como herramienta de monitoreo de centros de datos

La monitorización térmica es el proceso de recopilar y analizar datos sobre la temperatura de los activos eléctricos críticos en un centro de datos.

La monitorización térmica se utiliza en los centros de datos para supervisar la temperatura de los equipos y la infraestructura eléctrica, con el fin de evitar el sobrecalentamiento y, por consiguiente, fallos en los equipos. Este es un elemento importante que contribuye a la disponibilidad energética y al tiempo de actividad del sistema.

El aumento de temperatura, especialmente en las uniones eléctricas y las barras colectoras, es una señal de alerta de posibles problemas, como una conexión suelta o dañada. Si no se controla, aumenta el riesgo de fallos en los equipos eléctricos, lo que puede poner en mayor riesgo al personal que trabaja cerca de estos activos eléctricos críticos. Monitorear la temperatura de las uniones eléctricas y las barras colectoras no solo ayuda a prevenir tiempos de inactividad y daños a la infraestructura crítica que, de otro modo, podrían reducir la eficiencia, corromper datos o fallar los equipos, sino que también ayuda a mantener la seguridad del personal cerca de los activos.

Los operadores de centros de datos se enfrentan a numerosos desafíos, pero el sobrecalentamiento de los equipos es uno de los más críticos. Este sobrecalentamiento puede provocar tiempos de inactividad imprevistos, lo que perjudica la fiabilidad del servicio para los clientes y genera importantes costes financieros y de reputación. A medida que aumenta la dependencia de los datos, aumenta la necesidad de tecnologías como la monitorización térmica continua para ayudar a prevenir interrupciones y tiempos de inactividad imprevistos.

La adopción de monitoreo térmico en centros de datos se está acelerando porque ayuda a los equipos de ingeniería a minimizar el daño a los equipos y reducir la probabilidad de cortes que pueden resultar de fallas no detectadas.

Métodos de monitorización térmica en centros de datos

La monitorización térmica se puede implementar en los centros de datos de varias maneras, entre ellas:

  1. Monitoreo Térmico Continuo (MCC): El MCC es un enfoque de monitoreo basado en la condición que puede reemplazar las inspecciones periódicas con cámaras termográficas (IR). Es una forma proactiva de monitorear la temperatura de la infraestructura eléctrica en centros de datos y otras industrias que utilizan infraestructura crítica. Implica el uso de sensores para medir y monitorear continuamente la temperatura de múltiples activos eléctricos en todo el centro de datos, proporcionando datos en tiempo real sobre el estado de los activos monitoreados. Los sensores proporcionan datos de temperatura en tiempo real, alertando al personal sobre aumentos de temperatura antes de que excedan los límites de seguridad. Los datos de estos sensores se pueden recopilar y analizar para tomar decisiones inteligentes e identificar posibles fallas. Estos sensores se pueden integrar con sistemas inteligentes de monitoreo de IoT, proporcionando alarmas, notificaciones, tendencias y análisis, lo que facilita el mantenimiento predictivo.
  2. Cámaras termográficas: El uso de cámaras termográficas, o termografía infrarroja, es otro método de monitorización térmica. Estas cámaras capturan imágenes del calor emitido por los equipos eléctricos. Con ellas, se pueden detectar puntos calientes y otros problemas que pueden pasar desapercibidos a simple vista. Este enfoque fue popular históricamente, pero está siendo rápidamente reemplazado por métodos más predictivos, como la medición de temperatura corporal (CTM), descrita anteriormente.
  3. Auditorías y mantenimiento: este es un enfoque de mantenimiento preventivo que se realiza a intervalos regulares para garantizar que los sistemas de refrigeración, HVAC (calefacción, ventilación y aire acondicionado) y otra infraestructura crítica funcionen de manera óptima.

Beneficios de la monitorización térmica para los centros de datos

  • Prevenir el sobrecalentamiento: Los puntos calientes y el sobrecalentamiento son las principales causas de fallos en los equipos de los centros de datos. Sensores estratégicamente ubicados toman lecturas de temperatura continuamente en diversas ubicaciones, como racks de servidores y sistemas de distribución de barras. El sistema indica cuándo las temperaturas superan los límites establecidos. El monitoreo térmico ayuda a prevenir el sobrecalentamiento de los equipos de los centros de datos.
  • Aumente la vida útil de los equipos: Los equipos críticos del centro de datos, como racks de servidores, tableros de distribución y dispositivos de almacenamiento, pueden beneficiarse de una vida útil más larga cuando se monitorean y controlan la temperatura de los activos y la humedad de las instalaciones. Con el tiempo, esto se traduce en una reducción de los costos de mantenimiento de los equipos críticos.
  • Prevenir cortes de energía inesperados: Los cortes de energía suelen ser imprevistos, y el tiempo de inactividad es perjudicial y costoso para los centros de datos. Implementar la monitorización térmica continua de los activos críticos alerta al personal sobre posibles riesgos antes de que se produzcan fallos.
  • Mejore la productividad: La detección temprana de uniones y conexiones dañadas en activos eléctricos reduce los cortes de energía. Los centros de datos dependen en gran medida de la disponibilidad de energía. Monitorear la temperatura de las conexiones eléctricas críticas mejora la confiabilidad de los equipos, lo que contribuye a optimizar el rendimiento y la productividad.

Desarrollar una mayor resiliencia en los centros de datos es crucial para que los propietarios y operadores gestionen instalaciones fiables y sostenibles que satisfagan las demandas futuras. Mantener la eficiencia y la seguridad eléctrica es esencial; por lo tanto, la monitorización de la temperatura de los activos críticos ayuda a comprender dónde es probable que se produzcan fallos en los equipos críticos antes de una interrupción del servicio. Las alertas de la monitorización de la temperatura proporcionan información que puede utilizarse para programar el mantenimiento predictivo y un enfoque más proactivo para el personal operativo.

 

Lea también:

Revolucionando el mantenimiento de cámaras frigoríficas, refrigeradores y congeladores 

Above-Net avanza con más instalaciones Smart IIoT para saneamiento

¿Te gusto este artículo?

Compartir en LinkedIn
Compartir en Facebook
Compartir en Twitter
Compartir por correo electrónico
Compartir en WhatsApp
Compartir en Telegram

Suscríbete a nuestro boletín