La gestione dell'infrastruttura del data center (DCIM) comprende i processi e le tecnologie utilizzati per monitorare, misurare e gestire l'infrastruttura fisica e virtuale di un data center. Il DCIM utilizza strumenti, software e applicazioni per monitorare una varietà di aree chiave all'interno dei data center, come:
- Infrastruttura fisica: questo tipo di monitoraggio impiega metodi che includono sensori, telecamere e software di gestione delle strutture per verificare lo stato delle apparecchiature e lo stato delle minacce alla sicurezza, dei guasti delle apparecchiature e di altre potenziali anomalie.
- Gestione della capacità: un'alimentazione affidabile e sempre disponibile è un requisito fondamentale in un data center. Il software DCIM monitora la capacità di alimentazione, la larghezza di banda di rete, lo spazio sui rack e la capacità di raffreddamento. Questo aiuta gli operatori dei data center a capire quando i rack dei server stanno esaurendo lo spazio e a installare nuove apparecchiature quando necessario. Può anche aiutare a individuare le cause di un elevato consumo energetico e a migliorare l'efficienza del raffreddamento.
- Sicurezza: DCIM monitora vari aspetti della sicurezza del data center, quali:
- Sicurezza fisica: include la prevenzione di accessi non autorizzati e attività dannose, la prevenzione dell'uso di telecamere, il monitoraggio delle serrature delle porte e di altri sensori per rilevare intrusioni e inviare avvisi.
- Sicurezza ambientale: condizioni ambientali come polvere, umidità e temperatura possono essere pericolose e compromettere il corretto funzionamento dei data center. I sistemi DCIM contribuiscono a ridurre il rischio di esposizione delle apparecchiature a questi pericoli. Le apparecchiature dei data center consumano una quantità significativa di energia, quindi è fondamentale garantire che il flusso d'aria al loro interno sia raffreddato e monitorato per evitarne il surriscaldamento. L'umidità in un data center deve rientrare in un intervallo specifico per prevenire la corrosione.
- Sicurezza delle risorse: DCIM monitora le risorse del data center, quali dispositivi di archiviazione, apparecchiature di rete e server, per identificare attività non autorizzate su risorse critiche.
- Sicurezza logica: i registri di sistema, il traffico di rete e altri dati vengono monitorati dal DCIM per avvisare il personale di attività sospette, violazioni dei dati e violazioni della rete.
Cosa può monitorare un DCIM?
La gestione dell'infrastruttura del data center, o DCIM, utilizza strumenti di monitoraggio per raccogliere dati sulle risorse e contribuire a migliorare l'efficienza operativa dell'intera organizzazione. Il DCIM può essere suddiviso in diversi livelli, tra cui:
1. Apparecchiature IT (Information Technology):
- Server: monitora lo stato operativo, la temperatura, la CPU, la memoria e l'utilizzo dello storage.
- Dispositivi di archiviazione: controllano lo spazio disponibile, le prestazioni e l'integrità dei dati.
- Switch di rete: monitorano la connettività, la larghezza di banda, il traffico dati e le prestazioni della rete.
- Router e firewall: gestiscono la connettività di rete, le impostazioni di sicurezza e il monitoraggio del traffico.
2. Sicurezza e controllo degli accessi:
- Sistemi di controllo degli accessi: monitorano l'ingresso e l'uscita del personale autorizzato, registrano gli eventi di accesso e controllano l'accesso alle aree riservate.
- Telecamere di sicurezza: monitorano le attività e gli eventi di sicurezza in tempo reale, registrano video e catturano immagini per un'analisi successiva.
3. Ambiente fisico:
- Sensori di temperatura e umidità: monitorano le condizioni ambientali per garantire che siano entro limiti accettabili.
- Sensori di rilevamento dell'acqua: rilevano perdite o allagamenti per prevenire danni alle apparecchiature.
- Sensori di fumo e incendio: monitorano la presenza di fumo e attivano gli allarmi in caso di incendio.
4. Gestione patrimoniale:
- Inventario delle apparecchiature: mantiene un registro dettagliato di tutte le risorse IT e dell'infrastruttura del data center, comprese informazioni su posizione, stato e cronologia della manutenzione.
Sebbene i sistemi DCIM (Data Center Infrastructure Management) svolgano un ruolo cruciale nella gestione efficiente delle risorse fisiche e logiche di un data center, c'è ancora bisogno di un approccio innovativo e complementare, più dettagliato ad alcuni livelli dell'infrastruttura, che porti l'intelligence operativa a un nuovo livello, come ad esempio:
Infrastruttura elettrica:
- PDU (Power Distribution Unit): monitoraggio e previsione di problemi di distribuzione dell'energia, carico, consumo e stato dell'alimentazione.
- UPS (Uninterruptible Power Supply Systems): monitoraggio della capacità delle batterie, dello stato di alimentazione, del tempo di autonomia, identificazione precoce delle anomalie.
- Generatori: controllano lo stato operativo, il livello del carburante e la disponibilità al funzionamento in caso di interruzione di corrente, nonché il controllo della manutenzione in base alle condizioni delle apparecchiature.
Infrastruttura di refrigerazione:
- Unità di condizionamento: monitorano la temperatura ambiente, l'umidità, il flusso d'aria, la temperatura del compressore, la tensione e la corrente per prevedere tempestivamente i problemi.
- Ventole: controllano lo stato operativo, la velocità di rotazione e il flusso d'aria.
- Torri di raffreddamento: monitoraggio e controllo di pompe e compressori, compresi temperatura dell'acqua in ingresso e in uscita, tensione, corrente, umidità, temperatura e vibrazioni.
Quali sono le principali differenze tra DCIM e Bridgemeter:
- Focus su anticipazione e prevenzione: Bridgemeter va oltre il semplice monitoraggio e gestione dell'infrastruttura fisica. Utilizzando algoritmi di intelligence avanzati, anticipa potenziali guasti e anomalie, consentendo interventi proattivi per prevenire interruzioni e massimizzare la disponibilità operativa.
- Informazioni aggiuntive: oltre al monitoraggio di parametri fisici come temperatura e umidità, Bridgemeter offre informazioni aggiuntive attraverso l'analisi predittiva. Identifica modelli e tendenze, fornendo informazioni preziose per ottimizzare l'efficienza energetica, pianificare la capacità futura e migliorare l'utilizzo delle risorse del data center.
- Interazione con il team di manutenzione: Bridgemeter velocizza e riduce i tempi di correzione del problema identificato direttamente con il team sul campo, generando attività di correzione con la documentazione pertinente dell'apparecchiatura in questione.
- Adattabilità: grazie alla sua capacità di adattarsi a nuove condizioni e ambienti in tempo reale, Bridgemeter consente una risposta rapida ai cambiamenti operativi. Ciò garantisce agli operatori dei data center di prendere decisioni informate e agili, sia per quanto riguarda il servizio clienti che per modifiche all'intelligenza e alla configurazione del monitoraggio.
- Integrazione perfetta con DCIM: Bridgemeter non sostituisce i sistemi DCIM esistenti, ma li migliora e si distingue anche per la connettività e l'integrazione dei dati, supportando oltre 150 diversi protocolli di comunicazione. Ciò significa che può connettersi a qualsiasi sensore, PLC (Programmable Logic Controller) o apparecchiatura esistente nel data center, aggiungendo connettività DICM e consentendo la raccolta di informazioni più dense e variegate. Questa capacità facilita la rapida implementazione del sistema, fornendo una visione globale più intelligente delle operazioni del data center. Inoltre, Bridgemeter funge da middleware per la connettività intersettoriale, consentendo la perfetta integrazione dei dati provenienti da diversi sistemi e apparecchiature nell'ambiente del data center.
- Alzare l'asticella dell'efficienza: offrendo una soluzione completa e integrata per la gestione dei data center, Bridgemeter alza l'asticella dell'efficienza operativa e dell'affidabilità. La sua capacità di fornire informazioni in tempo reale e supportare il processo decisionale strategico lo rende un componente essenziale di qualsiasi ambiente di data center moderno.
In breve, Bridgemeter di Above-Net non solo si differenzia dai tradizionali sistemi DCIM, ma ne migliora anche l'efficacia e la fruibilità, aggiungendo funzionalità di intelligence e analisi avanzate agli ambienti dei data center. Adottando Bridgemeter, le organizzazioni possono raggiungere un nuovo livello di eccellenza operativa e garantire la massima disponibilità dei loro servizi critici.
Il monitoraggio termico come strumento di monitoraggio del data center
Il monitoraggio termico è il processo di raccolta e analisi dei dati sulla temperatura delle risorse elettriche critiche in un data center.
Il monitoraggio termico viene utilizzato nei data center per monitorare la temperatura delle apparecchiature e dell'infrastruttura elettrica, prevenendone il surriscaldamento e, di conseguenza, i guasti. Si tratta di un elemento importante che contribuisce alla disponibilità di energia e al tempo di attività del sistema.
L'aumento delle temperature, soprattutto in corrispondenza di giunti elettrici e sbarre collettrici, è un segnale di allarme di potenziali problemi, come una connessione allentata o compromessa. Se non controllata, aumenta il rischio di guasti alle apparecchiature elettriche, che può mettere a rischio il personale che lavora in prossimità di queste risorse elettriche critiche. Il monitoraggio della temperatura di giunti elettrici e sbarre collettrici non solo aiuta a prevenire tempi di inattività e danni alle infrastrutture critiche che potrebbero altrimenti portare a una riduzione dell'efficienza, alla corruzione dei dati o a guasti alle apparecchiature, ma può anche contribuire a garantire la sicurezza del personale in prossimità delle risorse.
Gli operatori di data center devono affrontare numerose sfide, ma il surriscaldamento delle apparecchiature è una delle più critiche. Il surriscaldamento delle apparecchiature può causare tempi di inattività non pianificati, con un impatto negativo sull'affidabilità del servizio per i clienti e costi finanziari e di reputazione significativi. Con l'aumento dell'affidabilità dei dati, aumenta la necessità di tecnologie come il monitoraggio termico continuo per prevenire interruzioni ed evitare tempi di inattività non pianificati.
L'adozione del monitoraggio termico nei data center sta accelerando perché aiuta i team di ingegneria a ridurre al minimo i danni alle apparecchiature e a diminuire la probabilità di interruzioni che possono derivare da guasti non rilevati.
Metodi di monitoraggio termico nei data center
Il monitoraggio termico può essere implementato nei data center in diversi modi, tra cui:
- Monitoraggio Termico Continuo (CTM): il CTM è un approccio di monitoraggio basato sulle condizioni che può sostituire le ispezioni periodiche mediante termocamere (IR). È un modo proattivo per monitorare la temperatura delle infrastrutture elettriche nei data center e in altri settori che utilizzano infrastrutture critiche. Prevede l'utilizzo di sensori per misurare e monitorare costantemente la temperatura di più risorse elettriche in tutto il data center, fornendo dati in tempo reale sullo stato di salute delle risorse monitorate. I sensori forniscono dati sulla temperatura in tempo reale, avvisando il personale in caso di aumenti di temperatura prima che superino i limiti di sicurezza. I dati provenienti da questi sensori possono quindi essere raccolti e analizzati per prendere decisioni intelligenti e identificare potenziali guasti. Questi sensori possono essere integrati con sistemi di monitoraggio IoT intelligenti, fornendo allarmi, notifiche, trend e analisi, a supporto della manutenzione predittiva.
- Termocamere: l'uso di termocamere, o termografia IR, è un altro metodo di monitoraggio termico. Queste telecamere catturano immagini del calore emesso dalle apparecchiature elettriche. Punti caldi e altri problemi che potrebbero non essere evidenti a occhio nudo possono essere individuati utilizzando le termocamere. Questo approccio è stato storicamente popolare, ma sta rapidamente venendo sostituito da approcci più predittivi, come il CTM, descritto sopra.
- Audit e manutenzione: si tratta di un approccio di manutenzione preventiva eseguito a intervalli regolari per garantire che i sistemi di refrigerazione, HVAC (riscaldamento, ventilazione e condizionamento dell'aria) e altre infrastrutture critiche funzionino in modo ottimale.
Vantaggi del monitoraggio termico per i data center
- Prevenire il surriscaldamento: i punti caldi e il surriscaldamento sono le principali cause di guasti alle apparecchiature dei data center. Sensori posizionati strategicamente rilevano costantemente la temperatura in diverse posizioni, inclusi rack di server e sistemi di distribuzione a barre collettrici. Il sistema segnala quando le temperature superano i limiti stabiliti. Il monitoraggio termico aiuta a prevenire il surriscaldamento delle apparecchiature dei data center.
- Aumento della longevità delle apparecchiature: le apparecchiature critiche dei data center, come rack per server, quadri di distribuzione e dispositivi di storage, possono beneficiare di una maggiore durata di vita grazie al monitoraggio e al controllo della temperatura e dell'umidità dell'impianto. Nel tempo, ciò si traduce in una riduzione dei costi di manutenzione per le apparecchiature critiche.
- Prevenire interruzioni di corrente impreviste: le interruzioni di corrente sono spesso impreviste e i tempi di inattività sono dannosi e costosi per i data center. L'implementazione di un monitoraggio termico continuo delle risorse critiche avvisa il personale dei potenziali rischi prima che si verifichino guasti.
- Migliora la produttività: il rilevamento tempestivo di giunti e connessioni compromessi nelle risorse elettriche riduce le interruzioni di corrente. I data center dipendono fortemente dalla disponibilità di energia. Il monitoraggio della temperatura delle connessioni elettriche critiche migliora l'affidabilità delle apparecchiature, contribuendo a migliorare prestazioni e produttività.
Garantire una maggiore resilienza nei data center è fondamentale per proprietari e gestori, al fine di gestire strutture affidabili e sostenibili in grado di soddisfare le esigenze future. Mantenere l'efficienza e la sicurezza elettrica è essenziale; pertanto, il monitoraggio della temperatura degli asset critici aiuta a comprendere dove è probabile che si verifichino potenziali guasti nelle apparecchiature critiche prima di un'interruzione. Gli avvisi derivanti dal monitoraggio della temperatura forniscono informazioni che possono essere utilizzate per pianificare la manutenzione predittiva e un approccio più proattivo per il personale operativo.
Leggi anche:
Rivoluzionare la manutenzione di celle frigorifere, frigoriferi e congelatori
Above-Net avanza con più installazioni Smart IIoT per i servizi igienico-sanitari