La gestion de l'infrastructure des centres de données (DCIM) englobe les processus et les technologies utilisés pour surveiller, mesurer et gérer l'infrastructure physique et virtuelle d'un centre de données. La DCIM utilise des outils, des logiciels et des applications pour suivre divers aspects clés des centres de données, tels que :
- Infrastructure physique : Ce type de surveillance utilise des méthodes telles que des capteurs, des caméras et des logiciels de gestion des installations pour vérifier l'état des équipements et l'état des menaces à la sécurité, des pannes d'équipement et autres anomalies potentielles.
- Gestion des capacités : Une alimentation électrique fiable et toujours disponible est essentielle dans un centre de données. Le logiciel DCIM assure le suivi de la capacité électrique, de la bande passante réseau, de l’espace occupé dans les baies et de la capacité de refroidissement. Cela permet aux opérateurs de centres de données d’anticiper la saturation des baies de serveurs et de déployer de nouveaux équipements si nécessaire. Il contribue également à identifier les causes d’une consommation électrique excessive et à optimiser l’efficacité du refroidissement.
- Sécurité : DCIM surveille différents aspects de la sécurité dans les centres de données, tels que :
-
-
- Sécurité physique : Cela comprend la prévention des accès non autorisés et des activités malveillantes, le blocage de l’utilisation des caméras, la surveillance des serrures de porte et autres capteurs pour détecter les intrusions et émettre des alertes.
- Sécurité environnementale : Les conditions environnementales telles que la poussière, l’humidité et la température peuvent être dangereuses et menacer le bon fonctionnement des centres de données. Les systèmes DCIM contribuent à réduire les risques d’exposition des équipements à ces dangers. Les équipements des centres de données consomment une quantité importante d’énergie ; il est donc crucial de veiller à ce que la circulation de l’air soit refroidie et surveillée afin d’éviter toute surchauffe. L’humidité dans un centre de données doit être maintenue dans une plage spécifique pour prévenir la corrosion.
- Sécurité des actifs : Le DCIM surveille les actifs du centre de données, tels que les périphériques de stockage, les équipements réseau et les serveurs, afin d'identifier toute activité non autorisée sur les actifs critiques.
- Sécurité logique : Les journaux système, le trafic réseau et d'autres données sont surveillés par le DCIM afin d'alerter le personnel en cas d'activité suspecte, de fuite de données et de violation du réseau.
-
Que peut surveiller un DCIM ?
La gestion de l'infrastructure des centres de données (DCIM) utilise des outils de surveillance pour collecter des données sur les actifs afin d'améliorer l'efficacité opérationnelle de l'ensemble de l'organisation. Ces outils peuvent être classés en différents niveaux, notamment :
1. Équipement informatique (TI) :
- Serveurs : Surveille l'état de fonctionnement, la température, l'utilisation du processeur, la mémoire et le stockage.
- Périphériques de stockage : Contrôlent l’espace disponible, les performances et l’intégrité des données.
- Commutateurs réseau : Surveillez la connectivité, la bande passante, le trafic de données et les performances du réseau.
- Routeurs et pare-feu : gérez la connectivité réseau, les paramètres de sécurité et la surveillance du trafic.
2. Sécurité et contrôle d'accès :
- Systèmes de contrôle d'accès : Surveillent les entrées et sorties du personnel autorisé, enregistrent les événements d'accès et contrôlent l'accès aux zones restreintes.
- Caméras de sécurité : Surveillent les activités et les événements de sécurité en temps réel, enregistrent des vidéos et capturent des images pour une analyse ultérieure.
3. Environnement physique :
- Capteurs de température et d'humidité : Surveillent les conditions environnementales pour s'assurer qu'elles restent dans les limites acceptables.
- Capteurs de détection d'eau : détectent les fuites ou les inondations afin de prévenir les dommages aux équipements.
- Détecteurs de fumée et d'incendie : Surveillent la présence de fumée et déclenchent les alarmes en cas d'incendie.
4. Gestion des actifs :
- Inventaire des équipements : tient un registre détaillé de tous les actifs informatiques et de l’infrastructure du centre de données, y compris les informations de localisation, l’état et l’historique de maintenance.
Bien que les systèmes DCIM (Data Center Infrastructure Management) jouent un rôle crucial dans la gestion efficace des ressources physiques et logiques d'un centre de données, il est toujours nécessaire d'adopter une approche plus détaillée, innovante et complémentaire à certains niveaux d'infrastructure afin d'élever l'intelligence opérationnelle à un niveau supérieur, par exemple :
Infrastructure électrique :
- Unités de distribution d'énergie (PDU) : surveillance et prédiction des problèmes de distribution d'énergie, de charge, de consommation et d'état de l'alimentation électrique.
- Systèmes d'alimentation sans interruption (UPS) : surveillance de la capacité de la batterie, de l'état de l'alimentation, de l'autonomie, identification précoce des anomalies.
- Générateurs : Contrôle l’état de fonctionnement, le niveau de carburant et la disponibilité en cas de panne de courant, ainsi que le contrôle de la maintenance conditionnelle de l’équipement.
Infrastructure frigorifique :
- Unités de climatisation : Surveillent la température ambiante, l'humidité, le débit d'air, la température du compresseur, la tension et le courant pour une détection précoce des problèmes.
- Ventilateurs : Contrôle l'état de fonctionnement, la vitesse de rotation et le débit d'air.
- Tours de refroidissement : Surveillance et contrôle des pompes et des compresseurs, y compris la température de l'eau d'entrée et de sortie, la tension, le courant, l'humidité, la température et les vibrations.
Quelles sont les principales différences entre un DCIM et un pontmètre ?
- Priorité à l'anticipation et à la prévention : Bridgemeter va au-delà de la simple surveillance et gestion des infrastructures physiques. Grâce à des algorithmes d'intelligence artificielle avancés, il anticipe les pannes et anomalies potentielles, permettant ainsi des interventions proactives pour prévenir les interruptions et optimiser la disponibilité opérationnelle.
- Offre de fonctionnalités supplémentaires : Outre la surveillance des paramètres physiques tels que la température et l’humidité, Bridgemeter propose des fonctionnalités supplémentaires grâce à l’analyse prédictive. Ce système identifie les tendances et les schémas, fournissant ainsi des informations précieuses pour optimiser l’efficacité énergétique, planifier les capacités futures et améliorer l’utilisation des ressources des centres de données.
- Interaction avec l'équipe de maintenance : Bridgemeter rationalise et réduit le temps de correction des problèmes identifiés en communiquant directement avec l'équipe sur le terrain, en générant des tâches correctives accompagnées de la documentation pertinente pour l'équipement concerné.
- Adaptabilité : Grâce à sa capacité d’adaptation en temps réel aux nouvelles conditions et environnements, Bridgemeter permet une réaction rapide aux changements opérationnels. Les opérateurs de centres de données peuvent ainsi prendre des décisions éclairées et agiles, qu’il s’agisse de services ou de modifications de la configuration et des outils de surveillance.
- Intégration transparente avec les systèmes DCIM : Bridgemeter ne remplace pas les systèmes DCIM existants ; il les améliore et excelle en matière de connectivité et d’intégration des données grâce à la prise en charge de plus de 150 protocoles de communication différents. Il peut ainsi se connecter à n’importe quel capteur, automate programmable (PLC) ou équipement existant du centre de données, ajoutant la connectivité DCIM et permettant la collecte d’informations plus denses et plus variées. Cette capacité facilite le déploiement rapide du système et offre une vision plus intelligente et plus complète des opérations du centre de données. De plus, Bridgemeter agit comme un middleware pour la connectivité multisectorielle, permettant une intégration transparente des données provenant de différents systèmes et équipements au sein de l’environnement du centre de données.
- Amélioration de l'efficacité : En proposant une solution complète et intégrée de gestion des centres de données, Bridgemeter améliore l'efficacité opérationnelle et la fiabilité. Sa capacité à fournir des informations en temps réel et à faciliter la prise de décisions stratégiques en fait un élément essentiel de tout environnement de centre de données moderne.
En résumé, Bridgemeter d' Above-Net se distingue des systèmes DCIM traditionnels et en améliore l'efficacité et l'utilité en intégrant intelligence et capacités d'analyse avancées aux environnements de centres de données. L'adoption de Bridgemeter permet aux entreprises d'atteindre un niveau d'excellence opérationnelle inédit et de garantir une disponibilité maximale de leurs services critiques.
La surveillance thermique en tant qu'outil de surveillance des centres de données
La surveillance thermique est le processus de collecte et d'analyse des données relatives à la température des équipements électriques critiques d'un centre de données.
La surveillance thermique est utilisée dans les centres de données pour contrôler la température des équipements et de l'infrastructure électrique afin de prévenir la surchauffe et, par conséquent, les pannes. Il s'agit d'un élément important qui contribue à la disponibilité de l'alimentation électrique et au bon fonctionnement du système.
Une température élevée, notamment au niveau des jonctions électriques et des barres omnibus, est un signal d'alarme indiquant des problèmes potentiels, tels qu'une connexion desserrée ou endommagée. Si elle n'est pas contrôlée, le risque de panne des équipements électriques augmente, exposant ainsi le personnel travaillant à proximité de ces installations critiques à un risque accru. La surveillance de la température des jonctions électriques et des barres omnibus permet non seulement d'éviter les interruptions de service et les dommages aux infrastructures critiques, qui pourraient entraîner une baisse d'efficacité, une corruption de données ou une panne d'équipement, mais aussi de garantir la sécurité du personnel travaillant à proximité de ces installations.
Les opérateurs de centres de données sont confrontés à de nombreux défis, mais la surchauffe des équipements est l'un des plus critiques. Celle-ci peut entraîner des interruptions de service imprévues, ce qui nuit à la fiabilité du service pour les clients et engendre des coûts financiers et une atteinte à la réputation considérables. Face à la dépendance croissante aux données, le besoin de technologies telles que la surveillance thermique continue se fait de plus en plus sentir afin de prévenir les interruptions et d'éviter les temps d'arrêt non planifiés.
L'adoption de la surveillance thermique dans les centres de données s'accélère car elle aide les équipes d'ingénierie à minimiser les dommages causés aux équipements et à réduire la probabilité de pannes pouvant résulter de défaillances non détectées.
Méthodes de surveillance thermique dans les centres de données
La surveillance thermique peut être mise en œuvre dans les centres de données de plusieurs manières, notamment :
- Surveillance thermique continue (CTM) : La CTM est une approche de surveillance conditionnelle qui peut remplacer les inspections périodiques par caméras thermiques (IR). C’est une méthode proactive pour surveiller la température des infrastructures électriques dans les centres de données et autres industries utilisant des infrastructures critiques. Elle repose sur l’utilisation de capteurs pour mesurer et surveiller en continu la température de divers équipements électriques dans l’ensemble du centre de données, fournissant ainsi des données en temps réel sur l’état des équipements surveillés. Les capteurs fournissent des données de température en temps réel, alertant le personnel en cas d’augmentation de température avant que celle-ci ne dépasse les seuils de sécurité. Les données issues de ces capteurs peuvent ensuite être collectées et analysées afin de prendre des décisions éclairées et d’identifier les pannes potentielles. Ces capteurs peuvent être intégrés à des systèmes de surveillance IoT intelligents fournissant des alarmes, des notifications, des tendances et des analyses, facilitant ainsi la maintenance prédictive.
- Caméras thermiques : L’utilisation de caméras thermiques, ou thermographie infrarouge, est une autre méthode de surveillance thermique. Ces caméras capturent des images de la chaleur émise par les équipements électriques. Les points chauds et autres problèmes invisibles à l’œil nu peuvent être détectés grâce aux caméras thermiques. Cette approche, autrefois très répandue, est rapidement remplacée par des méthodes plus prédictives, telles que la thermographie conventionnelle (CTM), décrite précédemment.
- Audits et maintenance : Il s'agit d'une approche de maintenance préventive réalisée à intervalles réguliers afin de garantir le fonctionnement optimal des systèmes de réfrigération, de CVC (chauffage, ventilation et climatisation) et autres infrastructures critiques.
Avantages de la surveillance thermique pour les centres de données
- Prévention de la surchauffe : Les points chauds et la surchauffe sont des causes majeures de pannes des équipements de centres de données. Des capteurs positionnés stratégiquement effectuent des relevés de température en continu à différents endroits, notamment dans les baies de serveurs et sur les bus ou les systèmes de distribution de bus. Le système signale tout dépassement des seuils de température prédéfinis. La surveillance thermique contribue à prévenir la surchauffe des équipements de centres de données.
- Prolonger la durée de vie des équipements : Les équipements critiques des centres de données, tels que les baies de serveurs, les répartiteurs et les dispositifs de stockage, bénéficient d’une durée de vie prolongée grâce à la surveillance et au contrôle de la température et de l’humidité ambiantes. À terme, cela permet de réduire les coûts de maintenance de ces équipements.
- Prévenir les coupures de courant inattendues : les coupures de courant sont souvent imprévues et les temps d’arrêt sont préjudiciables et coûteux pour les centres de données. La mise en place d’une surveillance thermique continue des équipements critiques permet d’alerter le personnel des risques potentiels avant qu’une panne ne survienne.
- Amélioration de la productivité : La détection précoce des joints et connexions défectueux des équipements électriques permet de réduire les coupures de courant. Les centres de données dépendent fortement de la disponibilité de l’alimentation électrique. La surveillance de la température des connexions électriques critiques améliore la fiabilité des équipements, contribuant ainsi à optimiser leurs performances et leur productivité.
Renforcer la résilience des centres de données est fondamental pour permettre aux propriétaires et aux exploitants de gérer des installations fiables et durables, capables de répondre aux besoins futurs. Le maintien de l'efficacité et de la sécurité électriques est essentiel ; par conséquent, la surveillance de la température des équipements critiques permet d'anticiper les défaillances potentielles et d'éviter les interruptions de service. Les alertes issues de cette surveillance fournissent des informations précieuses pour planifier la maintenance prédictive et permettre une approche plus proactive de la part du personnel d'exploitation.
Lire aussi :
Révolutionner la maintenance des chambres froides, des réfrigérateurs et des congélateurs

