¿Qué es la gestión de la infraestructura del centro de datos (DCIM)?

¿Qué es la gestión de la infraestructura del centro de datos (DCIM)?

La gestión de la infraestructura del centro de datos (DCIM) abarca los procesos y las tecnologías utilizados para supervisar, medir y gestionar la infraestructura física y virtual de un centro de datos. DCIM utiliza herramientas, software y aplicaciones para supervisar diversas áreas clave dentro de los centros de datos, como:

  • Infraestructura física: Este tipo de monitorización emplea métodos que incluyen sensores, cámaras y software de gestión de instalaciones para verificar el estado de los equipos y la situación de las amenazas a la seguridad, los fallos de los equipos y otras posibles anomalías.
  • Gestión de capacidad: Un suministro eléctrico fiable y siempre disponible es fundamental en un centro de datos. El software DCIM monitoriza la capacidad eléctrica, el ancho de banda de la red, el espacio en rack y la capacidad de refrigeración. Esto ayuda a los operadores del centro de datos a saber cuándo se están quedando sin espacio en los racks de servidores y a implementar nuevos equipos cuando sea necesario. También puede ayudar a investigar las causas del alto consumo energético y a mejorar la eficiencia de la refrigeración.
  • Seguridad: DCIM supervisa varios aspectos de la seguridad en los centros de datos, tales como:
      1. Seguridad física: Esto incluye prevenir el acceso no autorizado y la actividad maliciosa, bloquear el uso de cámaras, monitorear las cerraduras de las puertas y otros sensores para detectar intrusiones y proporcionar alertas.
      2. Seguridad ambiental: Las condiciones ambientales como el polvo, la humedad y la temperatura pueden ser peligrosas y afectar el buen funcionamiento de los centros de datos. Los sistemas DCIM ayudan a reducir el riesgo de que los equipos se expongan a estos peligros. Los equipos en los centros de datos consumen una cantidad significativa de energía, por lo que es fundamental garantizar que el flujo de aire se enfríe y se supervise para evitar el sobrecalentamiento de los equipos. La humedad en un centro de datos debe mantenerse dentro de un rango específico para prevenir la corrosión.
      3. Seguridad de los activos: DCIM supervisa los activos del centro de datos, como dispositivos de almacenamiento, equipos de red y servidores, para identificar actividades no autorizadas en activos críticos.
      4. Seguridad lógica: DCIM supervisa los registros del sistema, el tráfico de red y otros datos para alertar al personal sobre actividades sospechosas, filtraciones de datos y fallos en la red.

¿Qué puede monitorizar un DCIM?

La gestión de la infraestructura del centro de datos, o DCIM, utiliza herramientas de monitorización para recopilar datos de activos y así mejorar la eficiencia operativa en toda la organización. Estas herramientas se pueden dividir en diferentes niveles, entre ellos:

1. Equipos de TI (Tecnología de la Información):

  • Servidores: Supervisa el estado operativo, la temperatura, la utilización de la CPU, la memoria y el almacenamiento.
  • Dispositivos de almacenamiento: Controlan el espacio disponible, el rendimiento y la integridad de los datos.
  • Conmutadores de red: Supervisan la conectividad, el ancho de banda, el tráfico de datos y el rendimiento de la red.
  • Routers y cortafuegos: Gestionan la conectividad de red, la configuración de seguridad y la monitorización del tráfico.

2. Seguridad y control de acceso:

  • Sistemas de control de acceso: Supervisan la entrada y salida del personal autorizado, registran los eventos de acceso y controlan el acceso a áreas restringidas.
  • Cámaras de seguridad: Monitorean las actividades y eventos de seguridad en tiempo real, graban videos y capturan imágenes para su posterior análisis.

3. Entorno físico:

  • Sensores de temperatura y humedad: Monitorizan las condiciones ambientales para garantizar que se encuentren dentro de los límites aceptables.
  • Sensores de detección de agua: Detectan fugas o inundaciones para evitar daños en los equipos.
  • Sensores de humo y fuego: Monitorean la presencia de humo y activan las alarmas en caso de incendio.

4. Gestión de activos:

  • Inventario de equipos: Mantiene un registro detallado de todos los activos de TI y la infraestructura del centro de datos, incluyendo información sobre su ubicación, estado e historial de mantenimiento.

Si bien los sistemas DCIM (Gestión de Infraestructura del Centro de Datos) desempeñan un papel crucial en la gestión eficiente de los recursos físicos y lógicos de un centro de datos, aún existe la necesidad de un enfoque más detallado, innovador y complementario para ciertos niveles de infraestructura que eleve la inteligencia operativa a un nuevo nivel, como:

Infraestructura eléctrica:

  • Unidades de Distribución de Energía (PDU): Monitorización y predicción de problemas en la distribución de energía, carga, consumo y estado del suministro eléctrico.
  • Sistemas de alimentación ininterrumpida (UPS): Monitorización de la capacidad de la batería, el estado de la alimentación, el tiempo de funcionamiento y la detección temprana de anomalías.
  • Generadores: Controla el estado operativo, el nivel de combustible y la disponibilidad para el funcionamiento en caso de fallo eléctrico, así como el control del mantenimiento predictivo del equipo.

Infraestructura de refrigeración:

  • Unidades de aire acondicionado: Monitorean la temperatura ambiente, la humedad, el flujo de aire, la temperatura del compresor, el voltaje y la corriente para la predicción temprana de problemas.
  • Ventiladores: Controlan el estado de funcionamiento, la velocidad de rotación y el flujo de aire.
  • Torres de refrigeración: Monitorización y control de bombas y compresores, incluyendo la temperatura del agua de entrada y salida, voltaje, corriente, humedad, temperatura y vibración.

¿Cuáles son las principales diferencias entre un DCIM y un Bridgemeter?

  1. Enfoque en la anticipación y la prevención: Bridgemeter va más allá de la simple monitorización y gestión de la infraestructura física. Mediante algoritmos de inteligencia artificial avanzados, anticipa posibles fallos y anomalías, lo que permite intervenciones proactivas para prevenir interrupciones y maximizar la disponibilidad operativa.
  2. Funcionalidades de inteligencia adicionales: Además de monitorizar parámetros físicos como la temperatura y la humedad, Bridgemeter ofrece inteligencia adicional mediante análisis predictivos. Identifica patrones y tendencias, proporcionando información valiosa para optimizar la eficiencia energética, planificar la capacidad futura y mejorar la utilización de los recursos del centro de datos.
  3. Interacción con el equipo de mantenimiento: Bridgemeter agiliza y reduce el tiempo necesario para corregir los problemas detectados mediante la comunicación directa con el equipo de campo, generando tareas correctivas con la documentación pertinente para el equipo en cuestión.
  4. Adaptabilidad: Gracias a su capacidad para adaptarse a nuevas condiciones y entornos en tiempo real, Bridgemeter permite una respuesta rápida a los cambios operativos. Esto garantiza que los operadores de centros de datos puedan tomar decisiones informadas y ágiles, ya sea en lo que respecta al servicio o a los cambios en la configuración o la inteligencia de monitorización.
  5. Integración perfecta con DCIM: Bridgemeter no reemplaza los sistemas DCIM existentes, sino que los optimiza y destaca en conectividad e integración de datos al ser compatible con más de 150 protocolos de comunicación diferentes. Esto significa que puede conectarse a cualquier sensor, PLC (Controlador Lógico Programable) o equipo existente en el centro de datos, añadiendo conectividad DCIM y permitiendo la recopilación de información más densa y variada. Esta capacidad facilita la rápida implementación del sistema, proporcionando una visión más inteligente y completa de las operaciones del centro de datos. Además, Bridgemeter actúa como middleware para la conectividad multisectorial, permitiendo una integración de datos fluida desde diferentes sistemas y equipos en todo el entorno del centro de datos.
  6. Elevando el estándar de eficiencia: Al ofrecer una solución completa e integrada para la gestión de centros de datos, Bridgemeter eleva el estándar de eficiencia operativa y confiabilidad. Su capacidad para proporcionar información en tiempo real y respaldar la toma de decisiones estratégicas lo convierte en un componente esencial para cualquier entorno de centro de datos moderno.

En resumen, Bridgemeter de Above-Net no solo se diferencia de los sistemas DCIM tradicionales, sino que también aumenta su eficacia y utilidad al incorporar inteligencia y capacidades analíticas avanzadas a los entornos de centros de datos. Al adoptar Bridgemeter, las organizaciones pueden alcanzar un nuevo nivel de excelencia operativa y garantizar la máxima disponibilidad de sus servicios críticos.

Monitoreo térmico como herramienta de monitoreo de centros de datos

La monitorización térmica es el proceso de recopilar y analizar datos sobre la temperatura de los activos eléctricos críticos en un centro de datos.

La monitorización térmica se utiliza en los centros de datos para supervisar la temperatura de los equipos y la infraestructura eléctrica, con el fin de evitar el sobrecalentamiento y, por consiguiente, fallos en los equipos. Este es un elemento importante que contribuye a la disponibilidad energética y al tiempo de actividad del sistema.

El aumento de temperatura, especialmente en las uniones eléctricas y las barras colectoras, es una señal de alerta de posibles problemas, como una conexión suelta o dañada. Si no se controla, aumenta el riesgo de fallos en los equipos eléctricos, lo que puede poner en mayor riesgo al personal que trabaja cerca de estos activos eléctricos críticos. Monitorear la temperatura de las uniones eléctricas y las barras colectoras no solo ayuda a evitar tiempos de inactividad y daños a la infraestructura crítica que, de otro modo, podrían reducir la eficiencia, corromper datos o fallar los equipos, sino que también contribuye a la seguridad del personal cerca de los activos.

Los operadores de centros de datos se enfrentan a diversos desafíos, pero el sobrecalentamiento de los equipos es uno de los más críticos. Este sobrecalentamiento puede provocar tiempos de inactividad imprevistos, lo que perjudica la fiabilidad del servicio para los clientes y genera importantes costes financieros y de reputación. A medida que aumenta la dependencia de los datos, aumenta la necesidad de tecnologías como la monitorización térmica continua para ayudar a prevenir interrupciones y tiempos de inactividad imprevistos.

La adopción de monitoreo térmico en centros de datos se está acelerando porque ayuda a los equipos de ingeniería a minimizar los daños a los equipos y reducir la probabilidad de cortes que pueden resultar de fallas no detectadas.

Métodos de monitorización térmica en centros de datos

La monitorización térmica se puede implementar en los centros de datos de varias maneras, entre ellas:

  1. Monitoreo Térmico Continuo (CTM): El CTM es un método de monitoreo basado en condiciones que puede reemplazar la inspección periódica mediante cámaras termográficas (IR). Es una forma proactiva de monitorear la temperatura de la infraestructura eléctrica en centros de datos y otras industrias que utilizan infraestructura crítica. Consiste en usar sensores para medir y monitorear continuamente la temperatura de diversos activos eléctricos en todo el centro de datos, proporcionando datos en tiempo real sobre el estado de los activos monitoreados. Los sensores proporcionan datos de temperatura en tiempo real, alertando al personal sobre aumentos de temperatura antes de que superen los límites de seguridad. Los datos de estos sensores se pueden recopilar y analizar para tomar decisiones informadas e identificar posibles fallas. Estos sensores se pueden integrar en sistemas de monitoreo IoT inteligentes que proporcionan alarmas, notificaciones, tendencias y análisis, lo que ayuda en el mantenimiento predictivo.
  2. Cámaras termográficas: El uso de cámaras termográficas, o termografía infrarroja, es otro método de monitorización térmica. Estas cámaras capturan imágenes del calor emitido por los equipos eléctricos. Mediante cámaras termográficas se pueden detectar puntos calientes y otros problemas que no son evidentes a simple vista. Este método fue popular en el pasado, pero está siendo rápidamente reemplazado por enfoques más predictivos, como el CTM, descrito anteriormente.
  3. Auditorías y mantenimiento: Se trata de un enfoque de mantenimiento preventivo que se lleva a cabo a intervalos regulares para garantizar que los sistemas de refrigeración, climatización (calefacción, ventilación y aire acondicionado) y demás infraestructura crítica funcionen de forma óptima.

Beneficios de la monitorización térmica para los centros de datos

  • Prevención del sobrecalentamiento: Los puntos calientes y el sobrecalentamiento son causas importantes de fallos en los equipos de los centros de datos. Sensores estratégicamente ubicados registran continuamente la temperatura en diversos puntos, como los racks de servidores y los sistemas de distribución de bus. El sistema indica cuándo las temperaturas superan los límites establecidos. La monitorización térmica ayuda a prevenir el sobrecalentamiento de los equipos del centro de datos.
  • Mayor vida útil de los equipos: Los equipos críticos de los centros de datos, como los racks de servidores, los bastidores de distribución y los dispositivos de almacenamiento, pueden beneficiarse de una vida útil prolongada cuando se supervisa y controla la temperatura de los activos y la humedad de las instalaciones. Con el tiempo, esto se traduce en una reducción de los costes de mantenimiento de los equipos críticos.
  • Prevención de cortes de energía inesperados: Los cortes de energía suelen ser imprevistos, y el tiempo de inactividad resulta perjudicial y costoso para los centros de datos. La implementación de un monitoreo térmico continuo de los activos críticos alerta al personal sobre posibles riesgos antes de que se produzca una falla.
  • Mejora de la productividad: La detección temprana de conexiones y empalmes defectuosos en los equipos eléctricos reduce los cortes de energía. Los centros de datos dependen en gran medida de la disponibilidad de energía. Monitorear la temperatura de las conexiones eléctricas críticas mejora la confiabilidad de los equipos, lo que contribuye a optimizar el rendimiento y la productividad.

Aumentar la resiliencia en los centros de datos es fundamental para que los propietarios y operadores gestionen instalaciones fiables y sostenibles que satisfagan las demandas futuras. Mantener la eficiencia y la seguridad eléctricas es esencial; por lo tanto, la monitorización de la temperatura de los activos críticos ayuda a comprender dónde es probable que se produzcan fallos en los equipos críticos antes de una interrupción del servicio. Las alertas de la monitorización de la temperatura proporcionan información que puede utilizarse para programar el mantenimiento predictivo y un enfoque más proactivo para el personal operativo.

 

Lea también:

Revolucionando el mantenimiento de cámaras frigoríficas, refrigeradores y congeladores 

Above-Net avanza con más instalaciones Smart IIoT para saneamiento

¿Te gusto este artículo?

Compartir en LinkedIn
Compartir en Facebook
Compartir en Twitter
Compartir por correo electrónico
Compartir vía WhatsApp
Compartir vía Telegram

Suscríbete a nuestro boletín