La gestion de l'infrastructure du centre de données (DCIM) comprend les processus et les technologies utilisés pour surveiller, mesurer et gérer l'infrastructure physique et virtuelle d'un centre de données. DCIM utilise des outils, des logiciels et des applications pour suivre divers domaines clés des centres de données, tels que :
- Infrastructure physique : ce type de surveillance utilise des méthodes comprenant des capteurs, des caméras et des logiciels de gestion des installations pour vérifier l'état des équipements et l'état des menaces de sécurité, des pannes d'équipement et d'autres anomalies potentielles.
- Gestion de la capacité : une alimentation électrique fiable et toujours disponible est une exigence cruciale dans un centre de données. Le logiciel DCIM suit la capacité électrique, la bande passante du réseau, l'espace rack et la capacité de refroidissement. Cela aide les opérateurs de centres de données à comprendre quand les racks de serveurs manquent d'espace et à déployer de nouveaux équipements si nécessaire. Cela peut également aider à rechercher les causes d’une consommation d’énergie élevée et à améliorer l’efficacité du refroidissement.
- Sécurité : DCIM surveille divers aspects de la sécurité dans les centres de données, tels que :
-
-
- Sécurité physique : cela inclut les accès non autorisés et les activités malveillantes, empêchant l'utilisation de caméras, surveillant les serrures de porte et autres capteurs pour détecter les intrusions et fournir des alertes.
- Sécurité environnementale : Les conditions environnementales telles que la poussière, l’humidité et la température peuvent être dangereuses et menacer le bon fonctionnement des centres de données. Les systèmes DCIM aident à réduire les risques liés à ces dangers pour les équipements. Les équipements des centres de données consomment une quantité importante d'énergie. Il est donc crucial de garantir que le flux d'air dans un centre de données est refroidi et surveillé pour éviter la surchauffe des équipements. L'humidité dans un centre de données doit se situer dans une plage spécifique pour éviter la corrosion.
- Sécurité des actifs : DCIM surveille les actifs du centre de données tels que les périphériques de stockage, les équipements réseau et les serveurs pour identifier les activités non autorisées sur les actifs critiques.
- Sécurité logique : les journaux système, le trafic réseau et d'autres données sont surveillés par DCIM pour alerter le personnel des activités suspectes, des violations de données et du réseau.
-
Que peut surveiller un DCIM ?
La gestion de l'infrastructure du centre de données, ou DCIM, utilise des outils de surveillance pour collecter des données sur les actifs afin d'améliorer l'efficacité opérationnelle dans l'ensemble de l'organisation. Ils peuvent être divisés en différents niveaux, notamment :
1. Équipement informatique (technologie de l'information) :
- Serveurs : surveille l'état de fonctionnement, la température, l'utilisation du processeur, la mémoire et le stockage.
- Périphériques de stockage : contrôle l'espace disponible, les performances et l'intégrité des données.
- Commutateurs réseau : surveillent la connectivité, la bande passante, le trafic de données et les performances du réseau.
- Routeurs et pare-feu : gère la connectivité réseau, les paramètres de sécurité et la surveillance du trafic.
2. Sécurité et contrôle d'accès :
- Systèmes de contrôle d'accès : surveille l'entrée et la sortie du personnel autorisé, enregistre les événements d'accès et contrôle l'accès aux zones restreintes.
- Caméras de sécurité : surveillez les activités et les événements de sécurité en temps réel, enregistrez des vidéos et capturez des images pour une analyse ultérieure.
3. Environnement physique :
- Capteurs de température et d'humidité : surveille les conditions environnementales pour s'assurer qu'elles se situent dans des limites acceptables.
- Capteurs de détection d'eau : Détecte les fuites ou les inondations pour éviter d'endommager l'équipement.
- Capteurs de fumée et d'incendie : surveille la présence de fumée et déclenche des alarmes en cas d'incendie.
4. Gestion des actifs :
- Inventaire des équipements : conserve un enregistrement détaillé de tous les actifs informatiques et de l'infrastructure du centre de données, y compris les informations de localisation, l'état et l'historique de maintenance.
Bien que les systèmes DCIM (Data Center Infrastructure Management) jouent un rôle crucial dans la gestion efficace des ressources physiques et logiques d'un centre de données, il existe toujours un besoin pour une approche innovante et complémentaire plus détaillée de certains niveaux de l'infrastructure qui élève l'intelligence opérationnelle au niveau supérieur. un nouveau niveau, tel que :
Infrastructure électrique :
- PDU (Power Distribution Units) : surveillance et prévision des problèmes de distribution d'énergie, de la charge, de la consommation et de l'état de l'alimentation.
- UPS (Uninterruptible Power Systems) : Surveillance de la capacité de la batterie, de l'état de l'alimentation, du temps d'autonomie, identification précoce des anomalies.
- Générateurs : contrôle l'état de fonctionnement, le niveau de carburant et la disponibilité pour le fonctionnement en cas de panne de courant, ainsi que le contrôle de la maintenance en fonction des conditions de l'équipement.
Infrastructures de réfrigération :
- Unités de climatisation : surveille la température ambiante, l'humidité, le débit d'air, la température, la tension et le courant du compresseur pour une prévision précoce des problèmes.
- Ventilateurs : contrôle l’état de fonctionnement, la vitesse de rotation et le débit d’air.
- Tours de refroidissement : Surveillance et contrôle des pompes, des compresseurs, y compris la température d'entrée et de sortie d'eau, la tension, le courant, l'humidité, la température et les vibrations.
Quelles sont les principales différences entre un DCIM et Bridgemeter :
- Focus sur l'anticipation et la prévention : Bridgemeter va au-delà de la simple surveillance et gestion de l'infrastructure physique Bridgemeter En utilisant des algorithmes de renseignement avancés, il anticipe les pannes et anomalies potentielles, permettant des interventions proactives pour éviter les perturbations et maximiser la disponibilité opérationnelle.
- Offrant une intelligence supplémentaire : en plus de surveiller les paramètres physiques tels que la température et l'humidité, Bridgemeter offre une intelligence supplémentaire grâce à l'analyse prédictive. Il identifie les modèles et les tendances, fournissant des informations précieuses pour optimiser l'efficacité énergétique, planifier les capacités futures et améliorer l'utilisation des ressources du centre de données.
- Interaction avec l'équipe de maintenance : Bridgemeter Bridgemeter identifié directement avec l'équipe de terrain en générant des tâches de correction avec la documentation pertinente pour l'équipement en question.
- Adaptabilité : Grâce à sa capacité à s'adapter à de nouvelles conditions et environnements en temps réel, Bridgemeter permet une réponse rapide aux changements opérationnels. Cela garantit que les opérateurs de centres de données peuvent prendre des décisions éclairées et agiles, qu'il s'agisse du service ou des changements dans l'intelligence/la configuration de la surveillance.
- Intégration transparente avec DCIM : Bridgemeter Bridgemeter remplace pas les systèmes DCIM existants ; au contraire, il les améliore et se distingue également par sa connectivité et son intégration de données en prenant en charge plus de 150 types de protocoles de communication différents. Cela signifie qu'il est capable de se connecter à n'importe quel capteur, PLC (Programmable Logic Controller) ou équipement existant dans le centre de données, en ajoutant une connectivité DICM, permettant la collecte d'informations plus denses et plus variées. Cette fonctionnalité facilite le déploiement rapide du système, offrant une vue globale plus intelligente des opérations du centre de données. De plus, Bridgemeter agit comme un middleware pour la connexion multisectorielle, permettant une intégration transparente des données provenant de différents systèmes et équipements dans l'environnement du centre de données.
- Élever le niveau d'efficacité : en proposant une solution complète et intégrée pour la gestion des centres de données, Bridgemeter élève le niveau d'efficacité opérationnelle et de fiabilité. Sa capacité à fournir des informations en temps réel et à soutenir la prise de décision stratégique en fait un composant essentiel de tout environnement de centre de données moderne.
En bref, Bridgemeter d' Above-Net se différencie non seulement des systèmes DCIM traditionnels, mais élève également leur efficacité et leur utilité en ajoutant des capacités d'intelligence et d'analyse avancées aux environnements de centres de données. En adoptant Bridgemeter , les organisations peuvent atteindre un nouveau niveau d'excellence opérationnelle et garantir une disponibilité maximale de leurs services critiques.
Surveillance thermique comme outil de surveillance du centre de données
La surveillance thermique est le processus de collecte et d'analyse de données sur la température des actifs électriques critiques dans un centre de données.
La surveillance thermique est utilisée dans les centres de données pour surveiller la température des équipements et des infrastructures électriques afin d'éviter toute surchauffe et donc toute panne d'équipement. Il s’agit d’un élément important qui contribue à la disponibilité de l’énergie et à la disponibilité du système.
L'augmentation des températures, en particulier au niveau des joints électriques et des jeux de barres, est un signe avant-coureur de problèmes potentiels, tels qu'une connexion desserrée ou compromise. Si rien n’est fait, il existe un risque accru de panne d’équipement électrique, ce qui peut exposer davantage le personnel travaillant à proximité de ces actifs électriques critiques. La surveillance de la température des joints électriques et des jeux de barres permet non seulement d'éviter les temps d'arrêt et les dommages aux infrastructures critiques qui pourraient autrement entraîner une efficacité réduite, des données corrompues ou une panne d'équipement, mais peut également contribuer à maintenir l'assurance du personnel autour des actifs.
Les opérateurs de centres de données sont confrontés à plusieurs défis, mais la surchauffe des équipements est l'un des plus critiques. La surchauffe des équipements peut entraîner des temps d'arrêt imprévus, ce qui a un effet néfaste sur la fiabilité du service pour les clients et entraîne des coûts financiers et de réputation importants. À mesure que la dépendance à l’égard des données augmente, il devient de plus en plus nécessaire de recourir à des technologies telles que la surveillance thermique continue pour aider à prévenir les pannes et éviter les temps d’arrêt imprévus.
L'adoption de la surveillance thermique dans les centres de données s'accélère car elle aide les équipes d'ingénierie à minimiser les dommages aux équipements et à réduire la probabilité de pannes pouvant résulter de pannes non détectées.
Méthodes de surveillance thermique dans les centres de données
La surveillance thermique peut être mise en œuvre dans les centres de données de plusieurs manières, notamment :
- Surveillance thermique continue (CTM) : CTM est une approche de surveillance basée sur l'état qui peut remplacer l'inspection périodique à l'aide de caméras à imagerie thermique (IR). Il s'agit d'un moyen proactif de surveiller la température de l'infrastructure électrique dans les centres de données et autres industries utilisant des infrastructures critiques. Cela implique l'utilisation de capteurs pour mesurer et surveiller en continu la température de divers actifs électriques dans tout le centre de données, fournissant ainsi des données en temps réel sur l'état des actifs surveillés. Les capteurs fournissent des données de température en temps réel, alertant le personnel des augmentations de température avant qu'elles ne dépassent les limites de sécurité. Les données de ces capteurs peuvent ensuite être collectées et analysées pour prendre des décisions intelligentes et identifier les pannes potentielles. Ces capteurs peuvent être intégrés à des systèmes de surveillance IoT intelligents fournissant des alarmes, des notifications, des tendances et des analyses, contribuant ainsi à la maintenance prédictive.
- Caméras thermiques : L’utilisation de caméras thermiques, ou thermographie IR, est une autre méthode de surveillance thermique. Ces caméras capturent des photos de la chaleur émise par les équipements électriques. Les points chauds et autres problèmes qui peuvent ne pas être évidents à l’œil nu peuvent être détectés à l’aide de caméras thermiques. Cette approche était historiquement populaire, mais elle est rapidement remplacée par des approches plus prédictives, telles que la CTM décrite ci-dessus.
- Audits et maintenance : Il s'agit d'une approche de maintenance préventive effectuée à intervalles réguliers pour garantir que les systèmes de réfrigération, de CVC (chauffage, ventilation et climatisation) et autres infrastructures critiques fonctionnent de manière optimale.
Avantages de la surveillance thermique pour les centres de données
- Prévenir la surchauffe : les points chauds et la surchauffe sont les principales causes de pannes des équipements des centres de données. Des capteurs stratégiquement placés mesurent en permanence la température à plusieurs endroits, y compris les racks de serveurs et les systèmes de bus ou de distribution de bus. Le système indique lorsque les températures dépassent les limites établies. La surveillance thermique aide à empêcher la surchauffe des équipements du centre de données.
- Augmenter la longévité des équipements : les équipements critiques du centre de données, tels que les racks de serveurs, les tableaux de distribution et les périphériques de stockage, peuvent bénéficier d'une durée de vie prolongée lorsque la température des actifs et l'humidité des installations sont surveillées et contrôlées. Au fil du temps, cela se traduit par une réduction des coûts de maintenance des équipements critiques.
- Prévenez les pannes de courant inattendues : les pannes de courant sont souvent imprévues et les temps d'arrêt sont perturbateurs et coûteux pour les centres de données. La mise en œuvre d’une surveillance thermique continue des actifs critiques alerte le personnel des risques potentiels avant une panne.
- Améliorez la productivité : grâce à la détection précoce des joints et connexions compromis dans les actifs électriques, les pannes de courant sont réduites. Les centres de données dépendent fortement de la disponibilité électrique. La surveillance de la température des connexions électriques critiques améliore la fiabilité des équipements, contribuant ainsi à améliorer les performances et la productivité.
Il est essentiel de renforcer la résilience des centres de données afin que les propriétaires et les opérateurs puissent exploiter des installations fiables et durables qui répondent aux demandes futures. Le maintien de l’efficacité et de la sécurité électriques est essentiel ; Par conséquent, la surveillance de la température des actifs critiques vous aide à comprendre où les pannes potentielles des équipements critiques sont susceptibles de se produire avant une panne. Les alertes de surveillance de la température fournissent des informations qui peuvent être utilisées pour planifier une maintenance prédictive et une approche plus proactive pour le personnel opérationnel.
A lire aussi :
Révolutionner la maintenance des chambres froides, des réfrigérateurs et des réfrigérateurs
Above-Net progresse avec davantage d'installations Smart IIoT pour l'assainissement