La gestione dell'infrastruttura del data center (DCIM) comprende i processi e le tecnologie utilizzati per monitorare, misurare e gestire l'infrastruttura fisica e virtuale di un data center. Il DCIM utilizza strumenti, software e applicazioni per monitorare una varietà di aree chiave all'interno dei data center, tra cui:
- Infrastruttura fisica: questo tipo di monitoraggio impiega metodi che includono sensori, telecamere e software di gestione delle strutture per verificare lo stato delle apparecchiature e lo stato delle minacce alla sicurezza, dei guasti delle apparecchiature e di altre potenziali anomalie.
- Gestione della capacità: un'alimentazione affidabile e sempre disponibile è un requisito fondamentale in un data center. Il software DCIM monitora la capacità di alimentazione, la larghezza di banda di rete, lo spazio sui rack e la capacità di raffreddamento. Questo aiuta gli operatori dei data center a capire quando i rack dei server stanno esaurendo lo spazio e a installare nuove apparecchiature quando necessario. Può anche aiutare a individuare le cause di un elevato consumo energetico e a migliorare l'efficienza del raffreddamento.
- Sicurezza: DCIM monitora vari aspetti della sicurezza nei data center, quali:
-
-
- Sicurezza fisica: include la prevenzione di accessi non autorizzati e attività dannose, il blocco dell'uso di telecamere, il monitoraggio delle serrature delle porte e di altri sensori per rilevare intrusioni e inviare avvisi.
- Sicurezza ambientale: condizioni ambientali come polvere, umidità e temperatura possono essere pericolose e compromettere il corretto funzionamento dei data center. I sistemi DCIM contribuiscono a ridurre il rischio che le apparecchiature siano esposte a questi pericoli. Le apparecchiature nei data center consumano una quantità significativa di energia, pertanto è fondamentale garantire che il flusso d'aria all'interno del data center sia raffreddato e monitorato per prevenirne il surriscaldamento. L'umidità in un data center deve rientrare in un intervallo specifico per prevenire la corrosione.
- Sicurezza delle risorse: DCIM monitora le risorse del data center, come dispositivi di archiviazione, apparecchiature di rete e server, per identificare attività non autorizzate su risorse critiche.
- Sicurezza logica: i registri di sistema, il traffico di rete e altri dati vengono monitorati dal DCIM per avvisare il personale di attività sospette, violazioni dei dati e violazioni della rete.
-
Cosa può monitorare un DCIM?
La gestione dell'infrastruttura del data center, o DCIM, utilizza strumenti di monitoraggio per raccogliere dati sulle risorse e contribuire a migliorare l'efficienza operativa dell'intera organizzazione. Questi possono essere suddivisi in diversi livelli, tra cui:
1. Apparecchiature IT (Information Technology):
- Server: monitora lo stato operativo, la temperatura, l'utilizzo della CPU, la memoria e l'archiviazione.
- Dispositivi di archiviazione: controllano lo spazio disponibile, le prestazioni e l'integrità dei dati.
- Switch di rete: monitorano la connettività, la larghezza di banda, il traffico dati e le prestazioni della rete.
- Router e firewall: gestiscono la connettività di rete, le impostazioni di sicurezza e il monitoraggio del traffico.
2. Sicurezza e controllo degli accessi:
- Sistemi di controllo degli accessi: monitorano l'ingresso e l'uscita del personale autorizzato, registrano gli eventi di accesso e controllano l'accesso alle aree riservate.
- Telecamere di sicurezza: monitorano le attività e gli eventi di sicurezza in tempo reale, registrano video e catturano immagini per un'analisi successiva.
3. Ambiente fisico:
- Sensori di temperatura e umidità: monitorano le condizioni ambientali per garantire che siano entro limiti accettabili.
- Sensori di rilevamento dell'acqua: rilevano perdite o allagamenti per prevenire danni alle apparecchiature.
- Sensori di fumo e incendio: monitorano la presenza di fumo e attivano gli allarmi in caso di incendio.
4. Gestione patrimoniale:
- Inventario delle apparecchiature: mantiene un registro dettagliato di tutte le risorse IT e dell'infrastruttura del data center, comprese le informazioni sulla posizione, lo stato e la cronologia della manutenzione.
Sebbene i sistemi DCIM (Data Center Infrastructure Management) svolgano un ruolo cruciale nella gestione efficiente delle risorse fisiche e logiche di un data center, è ancora necessario un approccio più dettagliato, innovativo e complementare a determinati livelli infrastrutturali che elevi l'intelligence operativa a un nuovo livello, come ad esempio:
Infrastruttura elettrica:
- PDU (Power Distribution Unit): monitoraggio e previsione di problemi nella distribuzione dell'energia, nel carico, nel consumo e nello stato dell'alimentazione.
- UPS (sistemi di alimentazione ininterrotta): monitoraggio della capacità della batteria, dello stato di alimentazione, dell'autonomia, identificazione precoce delle anomalie.
- Generatori: controllano lo stato operativo, il livello del carburante e la disponibilità al funzionamento in caso di interruzione di corrente, nonché il controllo della manutenzione dell'apparecchiatura in base alle condizioni.
Infrastruttura di refrigerazione:
- Unità di condizionamento dell'aria: monitorano la temperatura ambiente, l'umidità, il flusso d'aria, la temperatura del compressore, la tensione e la corrente per prevedere tempestivamente i problemi.
- Ventole: controllano lo stato operativo, la velocità di rotazione e il flusso d'aria.
- Torri di raffreddamento: monitoraggio e controllo di pompe e compressori, inclusi temperatura dell'acqua in ingresso e in uscita, tensione, corrente, umidità, temperatura e vibrazioni.
Quali sono le principali differenze tra un DCIM e un Bridgemeter?
- Focus su anticipazione e prevenzione: Bridgemeter va oltre il semplice monitoraggio e gestione dell'infrastruttura fisica. Utilizzando algoritmi di intelligence avanzati, anticipa potenziali guasti e anomalie, consentendo interventi proattivi per prevenire interruzioni e massimizzare la disponibilità operativa.
- Offerta di intelligence aggiuntiva: oltre al monitoraggio di parametri fisici come temperatura e umidità, Bridgemeter offre un'analisi predittiva aggiuntiva. Identifica modelli e tendenze, fornendo preziose informazioni per ottimizzare l'efficienza energetica, pianificare le capacità future e migliorare l'utilizzo delle risorse del data center.
- Interazione con il team di manutenzione: Bridgemeter semplifica e riduce i tempi di correzione dei problemi identificati comunicando direttamente con il team sul campo, generando attività correttive con la documentazione pertinente per l'apparecchiatura in questione.
- Adattabilità: grazie alla sua capacità di adattarsi a nuove condizioni e ambienti in tempo reale, Bridgemeter consente una risposta rapida ai cambiamenti operativi. Ciò garantisce che gli operatori dei data center possano prendere decisioni informate e agili, sia in termini di servizi che di modifiche all'intelligenza/configurazione del monitoraggio.
- Integrazione perfetta con DCIM: Bridgemeter non sostituisce i sistemi DCIM esistenti, ma li migliora e si distingue per la connettività e l'integrazione dei dati, supportando oltre 150 diversi protocolli di comunicazione. Ciò significa che può connettersi a qualsiasi sensore, PLC (Programmable Logic Controller) o apparecchiatura esistente nel data center, aggiungendo connettività DCIM e consentendo la raccolta di informazioni più dense e variegate. Questa capacità facilita la rapida implementazione del sistema, fornendo una visione più intelligente e completa delle operazioni del data center. Inoltre, Bridgemeter funge da middleware per la connettività multisettoriale, consentendo un'integrazione perfetta dei dati da diversi sistemi e apparecchiature in tutto l'ambiente del data center.
- Elevare gli standard di efficienza: offrendo una soluzione completa e integrata per la gestione dei data center, Bridgemeter innalza gli standard di efficienza operativa e affidabilità. La sua capacità di fornire informazioni in tempo reale e supportare il processo decisionale strategico lo rende un componente essenziale per qualsiasi ambiente di data center moderno.
In breve, Bridgemeter di Above-Net non solo si differenzia dai tradizionali sistemi DCIM, ma ne aumenta anche l'efficacia e l'utilità, aggiungendo intelligenza e capacità analitiche avanzate agli ambienti dei data center. Adottando Bridgemeter, le organizzazioni possono raggiungere un nuovo livello di eccellenza operativa e garantire la massima disponibilità dei loro servizi critici.
Il monitoraggio termico come strumento di monitoraggio del data center
Il monitoraggio termico è il processo di raccolta e analisi dei dati sulla temperatura delle risorse elettriche critiche in un data center.
Il monitoraggio termico viene utilizzato nei data center per monitorare la temperatura delle apparecchiature e dell'infrastruttura elettrica, prevenendone il surriscaldamento e, di conseguenza, i guasti. Si tratta di un elemento importante che contribuisce alla disponibilità di energia e al tempo di attività del sistema.
L'aumento della temperatura, soprattutto in corrispondenza di giunti elettrici e sbarre collettrici, è un segnale di allarme che potrebbe indicare la presenza di potenziali problemi, come una connessione allentata o compromessa. Se non si interviene, aumenta il rischio di guasti alle apparecchiature elettriche, che può mettere a rischio il personale che lavora in prossimità di queste risorse elettriche critiche. Il monitoraggio della temperatura di giunti elettrici e sbarre collettrici aiuta non solo a evitare tempi di inattività e danni alle infrastrutture critiche che potrebbero altrimenti causare una riduzione dell'efficienza, la corruzione dei dati o guasti alle apparecchiature, ma contribuisce anche a garantire la sicurezza del personale in prossimità delle risorse.
Gli operatori di data center devono affrontare diverse sfide, ma il surriscaldamento delle apparecchiature è una delle più critiche. Il surriscaldamento delle apparecchiature può causare tempi di inattività non pianificati, con un impatto negativo sull'affidabilità del servizio per i clienti e costi finanziari e di reputazione significativi. Con l'aumento dell'affidabilità dei dati, aumenta la necessità di tecnologie come il monitoraggio termico continuo per prevenire interruzioni ed evitare tempi di inattività non pianificati.
L'adozione del monitoraggio termico nei data center sta accelerando perché aiuta i team di ingegneria a ridurre al minimo i danni alle apparecchiature e a diminuire la probabilità di interruzioni che possono derivare da guasti non rilevati.
Metodi di monitoraggio termico nei data center
Il monitoraggio termico può essere implementato nei data center in diversi modi, tra cui:
- Monitoraggio Termico Continuo (CTM): il CTM è un approccio di monitoraggio basato sulle condizioni che può sostituire l'ispezione periodica mediante termocamere (IR). È un modo proattivo per monitorare la temperatura delle infrastrutture elettriche nei data center e in altri settori che utilizzano infrastrutture critiche. Prevede l'utilizzo di sensori per misurare e monitorare costantemente la temperatura di vari asset elettrici in tutto il data center, fornendo dati in tempo reale sullo stato di salute degli asset monitorati. I sensori forniscono dati sulla temperatura in tempo reale, avvisando il personale di eventuali aumenti di temperatura prima che superino i limiti di sicurezza. I dati provenienti da questi sensori possono quindi essere raccolti e analizzati per prendere decisioni informate e identificare potenziali guasti. Questi sensori possono essere integrati in sistemi di monitoraggio IoT intelligenti che forniscono allarmi, notifiche, trend e analisi, facilitando la manutenzione predittiva.
- Termocamere: l'uso di termocamere, o termografia IR, è un altro metodo di monitoraggio termico. Queste telecamere catturano immagini del calore emesso dalle apparecchiature elettriche. Punti caldi e altri problemi che potrebbero non essere evidenti a occhio nudo possono essere individuati utilizzando le termocamere. Questo approccio è stato storicamente popolare, ma sta rapidamente venendo sostituito da approcci più predittivi, come il CTM, descritto sopra.
- Audit e manutenzione: si tratta di un approccio di manutenzione preventiva che viene eseguito a intervalli regolari per garantire che i sistemi di refrigerazione, HVAC (riscaldamento, ventilazione e condizionamento dell'aria) e altre infrastrutture critiche funzionino in modo ottimale.
Vantaggi del monitoraggio termico per i data center
- Prevenzione del surriscaldamento: i punti caldi e il surriscaldamento sono le principali cause di guasti alle apparecchiature dei data center. Sensori posizionati strategicamente rilevano costantemente la temperatura in diverse posizioni, inclusi rack di server e sistemi di distribuzione bus o bus. Il sistema segnala quando le temperature superano i limiti impostati. Il monitoraggio termico aiuta a prevenire il surriscaldamento delle apparecchiature dei data center.
- Aumento della longevità delle apparecchiature: le apparecchiature critiche dei data center, come rack per server, quadri di distribuzione e dispositivi di storage, possono beneficiare di una maggiore durata grazie al monitoraggio e al controllo della temperatura e dell'umidità delle risorse. Nel tempo, ciò si traduce in una riduzione dei costi di manutenzione per le apparecchiature critiche.
- Prevenire interruzioni di corrente impreviste: le interruzioni di corrente sono spesso impreviste e i tempi di inattività sono dannosi e costosi per i data center. L'implementazione di un monitoraggio termico continuo delle risorse critiche avvisa il personale dei potenziali rischi prima che si verifichi un guasto.
- Miglioramento della produttività: grazie al rilevamento tempestivo di giunti e connessioni compromessi nelle risorse elettriche, si riducono le interruzioni di corrente. I data center dipendono in modo significativo dalla disponibilità di energia. Il monitoraggio della temperatura delle connessioni elettriche critiche migliora l'affidabilità delle apparecchiature, contribuendo a migliorare prestazioni e produttività.
Garantire una maggiore resilienza nei data center è fondamentale affinché proprietari e gestori possano gestire strutture affidabili e sostenibili in grado di soddisfare le esigenze future. Mantenere l'efficienza elettrica e la sicurezza è essenziale; pertanto, il monitoraggio della temperatura degli asset critici aiuta a comprendere dove è probabile che si verifichino potenziali guasti nelle apparecchiature critiche prima di un'interruzione. Gli avvisi derivanti dal monitoraggio della temperatura forniscono informazioni che possono essere utilizzate per pianificare la manutenzione predittiva e un approccio più proattivo per il personale operativo.
Leggi anche:
Rivoluzionare la manutenzione di celle frigorifere, frigoriferi e congelatori
Above-Net prosegue con altre installazioni Smart IIoT per i servizi igienico-sanitari

