La gestion de l'infrastructure des centres de données (DCIM) englobe les processus et technologies utilisés pour surveiller, mesurer et gérer l'infrastructure physique et virtuelle d'un centre de données. DCIM utilise des outils, des logiciels et des applications pour suivre divers aspects clés des centres de données, tels que :
- Infrastructure physique : ce type de surveillance utilise des méthodes comprenant des capteurs, des caméras et des logiciels de gestion des installations pour vérifier l'état de l'équipement et l'état des menaces de sécurité, des pannes d'équipement et d'autres anomalies potentielles.
- Gestion de la capacité : Une alimentation électrique fiable et toujours disponible est essentielle dans un centre de données. Le logiciel DCIM surveille la capacité électrique, la bande passante réseau, l'espace rack et la capacité de refroidissement. Cela permet aux opérateurs de centres de données d'identifier les cas où les racks de serveurs sont à court d'espace et de déployer de nouveaux équipements si nécessaire. Il peut également aider à identifier les causes d'une consommation électrique élevée et à améliorer l'efficacité du refroidissement.
- Sécurité : DCIM surveille divers aspects de la sécurité du centre de données, tels que :
- Sécurité physique : Cela comprend la prévention des accès non autorisés et des activités malveillantes, la prévention de l’utilisation de caméras, la surveillance des serrures de porte et d’autres capteurs pour détecter les intrusions et fournir des alertes.
- Sécurité environnementale : Les conditions environnementales telles que la poussière, l’humidité et la température peuvent être dangereuses et compromettre le bon fonctionnement des centres de données. Les systèmes DCIM contribuent à réduire le risque d’exposition des équipements à ces dangers. Les équipements des centres de données consomment une quantité importante d’énergie ; il est donc crucial de garantir un refroidissement et une surveillance de la circulation d’air afin d’éviter toute surchauffe. L’humidité dans un centre de données doit se situer dans une plage spécifique pour éviter la corrosion.
- Sécurité des actifs : DCIM surveille les actifs du centre de données tels que les périphériques de stockage, les équipements réseau et les serveurs pour identifier les activités non autorisées sur les actifs critiques.
- Sécurité logique : les journaux système, le trafic réseau et d’autres données sont surveillés par DCIM pour alerter le personnel des activités suspectes, des violations de données et des violations du réseau.
Que peut surveiller un DCIM ?
La gestion de l'infrastructure des centres de données (DCIM) utilise des outils de surveillance pour collecter des données sur les actifs et ainsi améliorer l'efficacité opérationnelle de l'organisation. DCIM se divise en différents niveaux, notamment :
1. Équipement informatique (technologies de l'information) :
- Serveurs : surveille l’état opérationnel, la température, le processeur, la mémoire et l’utilisation du stockage.
- Périphériques de stockage : contrôle l’espace disponible, les performances et l’intégrité des données.
- Commutateurs réseau : surveille la connectivité, la bande passante, le trafic de données et les performances du réseau.
- Routeurs et pare-feu : gère la connectivité réseau, les paramètres de sécurité et la surveillance du trafic.
2. Sécurité et contrôle d’accès :
- Systèmes de contrôle d'accès : surveille l'entrée et la sortie du personnel autorisé, enregistre les événements d'accès et contrôle l'accès aux zones restreintes.
- Caméras de sécurité : surveillez les activités et les événements de sécurité en temps réel, enregistrez des vidéos et capturez des images pour une analyse ultérieure.
3. Environnement physique :
- Capteurs de température et d'humidité : surveillent les conditions environnementales pour garantir qu'elles se situent dans des limites acceptables.
- Capteurs de détection d'eau : détectent les fuites ou les inondations pour éviter d'endommager l'équipement.
- Capteurs de fumée et d'incendie : surveillent la présence de fumée et déclenchent des alarmes en cas d'incendie.
4. Gestion des actifs :
- Inventaire des équipements : conserve un enregistrement détaillé de tous les actifs informatiques et de l'infrastructure du centre de données, y compris les informations sur l'emplacement, l'état et l'historique de maintenance.
Bien que les systèmes DCIM (Data Center Infrastructure Management) jouent un rôle crucial dans la gestion efficace des ressources physiques et logiques d'un centre de données, il existe toujours un besoin d'une approche innovante et complémentaire, plus détaillée à certains niveaux de l'infrastructure, qui amène l'intelligence opérationnelle à un nouveau niveau, comme par exemple :
Infrastructure électrique :
- PDU (Power Distribution Units) : Surveillance et prévision des problèmes de distribution d'énergie, de charge, de consommation et d'état de l'alimentation.
- Onduleurs (Systèmes d'Alimentation Sans Interruption) : Surveillance de la capacité des batteries, de l'état de l'alimentation, du temps d'autonomie, identification précoce des anomalies.
- Générateurs : Contrôle l'état opérationnel, le niveau de carburant et la disponibilité pour le fonctionnement en cas de panne de courant, ainsi que le contrôle de la maintenance en fonction des conditions de l'équipement.
Infrastructures de réfrigération :
- Unités de climatisation : Surveille la température ambiante, l'humidité, le débit d'air, la température du compresseur, la tension et le courant pour prédire les problèmes à un stade précoce.
- Ventilateurs : Contrôle l'état de fonctionnement, la vitesse de rotation et le débit d'air.
- Tours de refroidissement : Surveillance et contrôle des pompes, compresseurs, y compris la température de l'eau d'entrée et de sortie, la tension, le courant, l'humidité, la température et les vibrations.
Quelles sont les principales différences entre un DCIM et un Bridgemeter :
- Priorité à l'anticipation et à la prévention : Bridgemeter va au-delà de la simple surveillance et de la gestion des infrastructures physiques. Grâce à des algorithmes d'intelligence avancés, il anticipe les pannes et anomalies potentielles, permettant ainsi des interventions proactives pour prévenir les pannes et optimiser la disponibilité opérationnelle.
- Intelligence supplémentaire : Outre la surveillance des paramètres physiques tels que la température et l'humidité, Bridgemeter offre une intelligence supplémentaire grâce à l'analyse prédictive. Il identifie les schémas et les tendances, fournissant ainsi des informations précieuses pour optimiser l'efficacité énergétique, planifier la capacité future et améliorer l'utilisation des ressources du centre de données.
- Interaction avec l'équipe de maintenance : Bridgemeter accélère et réduit le temps de correction du problème identifié directement avec l'équipe de terrain en générant des tâches de correction avec une documentation pertinente de l'équipement en question.
- Adaptabilité : Grâce à sa capacité à s'adapter en temps réel aux nouvelles conditions et environnements, Bridgemeter permet une réponse rapide aux changements opérationnels. Les opérateurs de centres de données peuvent ainsi prendre des décisions éclairées et agiles, qu'il s'agisse du service client ou des modifications de la surveillance ou de la configuration.
- Intégration transparente avec DCIM : Bridgemeter ne remplace pas les systèmes DCIM existants ; il les améliore et excelle en matière de connectivité et d'intégration de données grâce à la prise en charge de plus de 150 protocoles de communication différents. Il peut ainsi se connecter à n'importe quel capteur, automate programmable industriel (API) ou équipement existant du datacenter, ajoutant ainsi la connectivité DICM et permettant la collecte d'informations plus denses et plus variées. Cette fonctionnalité facilite le déploiement rapide du système et offre une vision globale plus intelligente des opérations du datacenter. De plus, Bridgemeter agit comme intergiciel pour la connectivité intersectorielle, permettant l'intégration transparente des données provenant de différents systèmes et équipements de l'environnement du datacenter.
- Améliorer l'efficacité : En proposant une solution complète et intégrée pour la gestion des centres de données, Bridgemeter améliore l'efficacité et la fiabilité opérationnelles. Sa capacité à fournir des informations en temps réel et à soutenir la prise de décisions stratégiques en fait un élément essentiel de tout environnement de centre de données moderne.
En résumé, Bridgemeter d' Above-Net se distingue non seulement des systèmes DCIM traditionnels, mais améliore également leur efficacité et leur ergonomie en ajoutant des capacités d'intelligence et d'analyse avancées aux environnements de centres de données. En adoptant Bridgemeter, les entreprises peuvent atteindre un niveau d'excellence opérationnelle inédit et garantir une disponibilité maximale de leurs services critiques.
La surveillance thermique comme outil de surveillance du centre de données
La surveillance thermique est le processus de collecte et d’analyse des données sur la température des actifs électriques critiques dans un centre de données.
La surveillance thermique est utilisée dans les centres de données pour surveiller la température des équipements et des infrastructures électriques afin d'éviter toute surchauffe et, par conséquent, toute panne. Il s'agit d'un élément important qui contribue à la disponibilité de l'énergie et à la disponibilité des systèmes.
L'augmentation de la température, notamment au niveau des jonctions électriques et des jeux de barres, est un signe avant-coureur de problèmes potentiels, tels qu'une connexion desserrée ou endommagée. Sans intervention, le risque de défaillance des équipements électriques augmente, ce qui peut exposer le personnel travaillant à proximité de ces équipements critiques à des risques accrus. La surveillance de la température des jonctions électriques et des jeux de barres permet non seulement d'éviter les interruptions de service et les dommages aux infrastructures critiques, susceptibles d'entraîner une baisse d'efficacité, une corruption des données ou une panne des équipements, mais aussi de garantir la sécurité du personnel travaillant à proximité de ces équipements.
Les opérateurs de centres de données sont confrontés à de nombreux défis, mais la surchauffe des équipements est l'un des plus critiques. Elle peut entraîner des interruptions de service imprévues, ce qui nuit à la fiabilité du service pour les clients et engendre des coûts financiers et une atteinte à la réputation considérables. Face à la dépendance croissante aux données, le besoin de technologies telles que la surveillance thermique continue se fait de plus en plus pressant pour prévenir les pannes et éviter les interruptions de service imprévues.
L’adoption de la surveillance thermique dans les centres de données s’accélère car elle aide les équipes d’ingénierie à minimiser les dommages aux équipements et à réduire la probabilité de pannes pouvant résulter de défaillances non détectées.
Méthodes de surveillance thermique dans les centres de données
La surveillance thermique peut être mise en œuvre dans les centres de données de plusieurs manières, notamment :
- Surveillance thermique continue (CTM) : La CTM est une approche de surveillance conditionnelle qui peut remplacer les inspections périodiques par caméras thermiques (IR). C'est une méthode proactive de surveillance de la température des infrastructures électriques des centres de données et autres secteurs utilisant des infrastructures critiques. Elle utilise des capteurs pour mesurer et surveiller en continu la température de plusieurs équipements électriques du centre de données, fournissant des données en temps réel sur l'état des équipements surveillés. Ces capteurs fournissent des données de température en temps réel, alertant le personnel des augmentations de température avant qu'elles ne dépassent les limites de sécurité. Les données de ces capteurs peuvent ensuite être collectées et analysées pour prendre des décisions éclairées et identifier les pannes potentielles. Ces capteurs peuvent être intégrés à des systèmes de surveillance IoT intelligents, fournissant des alarmes, des notifications, des tendances et des analyses, facilitant ainsi la maintenance prédictive.
- Caméras thermiques : L’utilisation de caméras thermiques, ou thermographie infrarouge, est une autre méthode de surveillance thermique. Ces caméras capturent des images de la chaleur émise par les équipements électriques. Les points chauds et autres problèmes non visibles à l’œil nu peuvent être détectés grâce aux caméras thermiques. Cette approche, traditionnellement populaire, est rapidement remplacée par des approches plus prédictives, comme la CTM, décrite précédemment.
- Audits et maintenance : Il s’agit d’une approche de maintenance préventive qui est effectuée à intervalles réguliers pour garantir que les systèmes de réfrigération, de CVC (chauffage, ventilation et climatisation) et d’autres infrastructures critiques fonctionnent de manière optimale.
Avantages de la surveillance thermique pour les centres de données
- Prévention de la surchauffe : Les points chauds et la surchauffe sont les principales causes de panne des équipements des centres de données. Des capteurs placés stratégiquement mesurent en continu la température à différents endroits, notamment dans les racks de serveurs et les systèmes de distribution par jeux de barres. Le système signale tout dépassement des limites établies. La surveillance thermique permet d'éviter la surchauffe des équipements des centres de données.
- Augmenter la longévité des équipements : Les équipements critiques des centres de données, tels que les racks de serveurs, les tableaux de distribution et les périphériques de stockage, peuvent bénéficier d'une durée de vie prolongée grâce à la surveillance et au contrôle de la température et de l'humidité des installations. À terme, cela se traduit par une réduction des coûts de maintenance des équipements critiques.
- Prévenir les pannes de courant imprévues : Les pannes de courant sont souvent imprévues, et les temps d'arrêt sont dommageables et coûteux pour les centres de données. La mise en œuvre d'une surveillance thermique continue des actifs critiques alerte le personnel des risques potentiels avant toute panne.
- Améliorez votre productivité : la détection précoce des joints et connexions défectueux dans les équipements électriques réduit les pannes de courant. Les centres de données dépendent fortement de la disponibilité de l'électricité. La surveillance de la température des connexions électriques critiques améliore la fiabilité des équipements, contribuant ainsi à optimiser les performances et la productivité.
Renforcer la résilience des centres de données est crucial pour les propriétaires et les exploitants afin de gérer des installations fiables et durables, capables de répondre aux besoins futurs. Le maintien de l'efficacité et de la sécurité électrique est essentiel ; par conséquent, la surveillance de la température des actifs critiques permet d'identifier les points de défaillance potentiels des équipements critiques avant une panne. Les alertes issues de la surveillance de la température fournissent des informations permettant de planifier une maintenance prédictive et une approche plus proactive pour le personnel opérationnel.
Lire aussi :
Révolutionner la maintenance des chambres froides, des réfrigérateurs et des congélateurs
Above-Net progresse avec davantage d'installations IIoT intelligentes pour l'assainissement