Che cos'è la gestione dell'infrastruttura del data center (DCIM)?

Che cos'è la gestione dell'infrastruttura del data center (DCIM)?

La gestione dell'infrastruttura del data center (DCIM) comprende i processi e le tecnologie utilizzati per monitorare, misurare e gestire l'infrastruttura fisica e virtuale di un data center. Il DCIM utilizza strumenti, software e applicazioni per monitorare una varietà di aree chiave all'interno dei data center, tra cui:

  • Infrastruttura fisica: questo tipo di monitoraggio utilizza metodi che includono sensori, telecamere e software di gestione degli impianti per verificare lo stato di salute delle apparecchiature e la presenza di minacce alla sicurezza, guasti alle apparecchiature e altre potenziali anomalie.
  • Gestione della capacità: un'alimentazione elettrica affidabile e sempre disponibile è un requisito fondamentale in un data center. Il software DCIM tiene traccia della capacità di alimentazione, della larghezza di banda di rete, dello spazio rack e della capacità di raffreddamento. Questo aiuta gli operatori del data center a capire quando lo spazio nei rack dei server si sta esaurendo e a installare nuove apparecchiature quando necessario. Può anche aiutare a indagare le cause di un elevato consumo energetico e a migliorare l'efficienza del raffreddamento.
  • Sicurezza: DCIM monitora vari aspetti della sicurezza nei data center, come ad esempio:
      1. Sicurezza fisica: include la prevenzione di accessi non autorizzati e attività dannose, il blocco dell'uso di telecamere, il monitoraggio delle serrature e di altri sensori per rilevare intrusioni e fornire avvisi.
      2. Sicurezza ambientale: condizioni ambientali come polvere, umidità e temperatura possono essere pericolose e compromettere il corretto funzionamento dei data center. I sistemi DCIM contribuiscono a ridurre il rischio che le apparecchiature siano esposte a tali pericoli. Le apparecchiature nei data center consumano una quantità significativa di energia, pertanto è fondamentale garantire che il flusso d'aria all'interno di un data center sia raffreddato e monitorato per prevenire il surriscaldamento delle apparecchiature. L'umidità in un data center deve rientrare in un intervallo specifico per prevenire la corrosione.
      3. Sicurezza delle risorse: DCIM monitora le risorse del data center, come dispositivi di archiviazione, apparecchiature di rete e server, per identificare attività non autorizzate su risorse critiche.
      4. Sicurezza logica: i registri di sistema, il traffico di rete e altri dati vengono monitorati da DCIM per avvisare il personale di attività sospette, violazioni dei dati e violazioni della rete.

Cosa può monitorare un DCIM?

La gestione dell'infrastruttura del data center, o DCIM, utilizza strumenti di monitoraggio per raccogliere dati sulle risorse e contribuire a migliorare l'efficienza operativa dell'intera organizzazione. Questi possono essere suddivisi in diversi livelli, tra cui:

1. Apparecchiature IT (Information Technology):

  • Server: Monitora lo stato operativo, la temperatura, l'utilizzo della CPU, la memoria e lo spazio di archiviazione.
  • Dispositivi di archiviazione: controllano lo spazio disponibile, le prestazioni e l'integrità dei dati.
  • Switch di rete: Monitorano la connettività, la larghezza di banda, il traffico dati e le prestazioni della rete.
  • Router e firewall: Gestisci la connettività di rete, le impostazioni di sicurezza e il monitoraggio del traffico.

2. Sicurezza e controllo degli accessi:

  • Sistemi di controllo accessi: monitorano l'ingresso e l'uscita del personale autorizzato, registrano gli eventi di accesso e controllano l'accesso alle aree riservate.
  • Telecamere di sicurezza: monitorano le attività e gli eventi di sicurezza in tempo reale, registrano video e acquisiscono immagini per successive analisi.

3. Ambiente fisico:

  • Sensori di temperatura e umidità: monitorano le condizioni ambientali per garantire che rientrino nei limiti accettabili.
  • Sensori di rilevamento dell'acqua: rilevano perdite o allagamenti per prevenire danni alle apparecchiature.
  • Sensori di fumo e incendio: monitorano la presenza di fumo e attivano gli allarmi in caso di incendio.

4. Gestione patrimoniale:

  • Inventario delle apparecchiature: Mantiene un registro dettagliato di tutte le risorse IT e dell'infrastruttura del data center, comprese le informazioni sulla posizione, lo stato e la cronologia della manutenzione.

Sebbene i sistemi DCIM (Data Center Infrastructure Management) svolgano un ruolo cruciale nella gestione efficiente delle risorse fisiche e logiche di un data center, è ancora necessario un approccio più dettagliato, innovativo e complementare a determinati livelli infrastrutturali che elevi l'intelligence operativa a un nuovo livello, come ad esempio:

Infrastruttura elettrica:

  • Unità di distribuzione dell'energia (PDU): monitoraggio e previsione di problemi nella distribuzione dell'energia, nel carico, nel consumo e nello stato dell'alimentazione elettrica.
  • Sistemi UPS (Uninterruptible Power Supply): monitoraggio della capacità della batteria, dello stato di alimentazione, del tempo di funzionamento e individuazione precoce delle anomalie.
  • Generatori: Controlla lo stato operativo, il livello del carburante e la disponibilità al funzionamento in caso di interruzione di corrente, nonché il controllo della manutenzione predittiva delle apparecchiature.

Infrastruttura di refrigerazione:

  • Unità di condizionamento dell'aria: monitora la temperatura ambiente, l'umidità, il flusso d'aria, la temperatura del compressore, la tensione e la corrente per prevedere tempestivamente eventuali problemi.
  • Ventole: Controlla lo stato di funzionamento, la velocità di rotazione e il flusso d'aria.
  • Torri di raffreddamento: Monitoraggio e controllo di pompe e compressori, inclusi temperatura dell'acqua in ingresso e in uscita, tensione, corrente, umidità, temperatura e vibrazioni.

Quali sono le principali differenze tra un DCIM e un Bridgemeter?

  1. Attenzione alla previsione e alla prevenzione: Bridgemeter va oltre il semplice monitoraggio e la gestione delle infrastrutture fisiche. Grazie all'utilizzo di algoritmi di intelligenza artificiale avanzati, anticipa potenziali guasti e anomalie, consentendo interventi proattivi per prevenire interruzioni e massimizzare la disponibilità operativa.
  2. Funzionalità aggiuntive: Oltre al monitoraggio di parametri fisici come temperatura e umidità, Bridgemeter offre funzionalità aggiuntive tramite analisi predittiva. Identifica modelli e tendenze, fornendo informazioni preziose per ottimizzare l'efficienza energetica, pianificare le capacità future e migliorare l'utilizzo delle risorse del data center.
  3. Interazione con il team di manutenzione: Bridgemeter semplifica e riduce i tempi di risoluzione dei problemi identificati comunicando direttamente con il team sul campo e generando attività correttive con la relativa documentazione per l'apparecchiatura in questione.
  4. Adattabilità: grazie alla sua capacità di adattarsi a nuove condizioni e ambienti in tempo reale, Bridgemeter consente una risposta rapida ai cambiamenti operativi. Ciò garantisce che gli operatori dei data center possano prendere decisioni informate e agili, sia in merito ai servizi che alle modifiche all'intelligenza/configurazione del monitoraggio.
  5. Integrazione perfetta con DCIM: Bridgemeter non sostituisce i sistemi DCIM esistenti, bensì li potenzia, eccellendo in connettività e integrazione dei dati grazie al supporto di oltre 150 protocolli di comunicazione diversi. Ciò significa che può connettersi a qualsiasi sensore, PLC (Controllore Logico Programmabile) o apparecchiatura presente nel data center, aggiungendo connettività DCIM e consentendo la raccolta di informazioni più dense e diversificate. Questa funzionalità facilita la rapida implementazione del sistema, fornendo una visione più intelligente e completa delle operazioni del data center. Inoltre, Bridgemeter funge da middleware per la connettività multisettoriale, consentendo una perfetta integrazione dei dati provenienti da diversi sistemi e apparecchiature in tutto l'ambiente del data center.
  6. Innalzare gli standard di efficienza: offrendo una soluzione completa e integrata per la gestione dei data center, Bridgemeter innalza gli standard di efficienza operativa e affidabilità. La sua capacità di fornire informazioni in tempo reale e supportare le decisioni strategiche lo rende un componente essenziale per qualsiasi ambiente data center moderno.

In breve, Bridgemeter di Above-Net non solo si differenzia dai tradizionali sistemi DCIM, ma ne aumenta anche l'efficacia e l'utilità, aggiungendo intelligenza e capacità analitiche avanzate agli ambienti dei data center. Adottando Bridgemeter, le organizzazioni possono raggiungere un nuovo livello di eccellenza operativa e garantire la massima disponibilità dei loro servizi critici.

Il monitoraggio termico come strumento di monitoraggio del data center

Il monitoraggio termico è il processo di raccolta e analisi dei dati sulla temperatura delle risorse elettriche critiche in un data center.

Il monitoraggio termico viene utilizzato nei data center per monitorare la temperatura delle apparecchiature e dell'infrastruttura elettrica, prevenendone il surriscaldamento e, di conseguenza, i guasti. Si tratta di un elemento importante che contribuisce alla disponibilità di energia e al tempo di attività del sistema.

L'aumento della temperatura, soprattutto in corrispondenza di giunti elettrici e sbarre collettrici, è un segnale di allarme che potrebbe indicare la presenza di potenziali problemi, come una connessione allentata o compromessa. Se non si interviene, aumenta il rischio di guasti alle apparecchiature elettriche, che può mettere a rischio il personale che lavora in prossimità di queste risorse elettriche critiche. Il monitoraggio della temperatura di giunti elettrici e sbarre collettrici aiuta non solo a evitare tempi di inattività e danni alle infrastrutture critiche che potrebbero altrimenti causare una riduzione dell'efficienza, la corruzione dei dati o guasti alle apparecchiature, ma contribuisce anche a garantire la sicurezza del personale in prossimità delle risorse.

Gli operatori di data center devono affrontare diverse sfide, ma il surriscaldamento delle apparecchiature è una delle più critiche. Il surriscaldamento delle apparecchiature può causare tempi di inattività non pianificati, con un impatto negativo sull'affidabilità del servizio per i clienti e costi finanziari e di reputazione significativi. Con l'aumento dell'affidabilità dei dati, aumenta la necessità di tecnologie come il monitoraggio termico continuo per prevenire interruzioni ed evitare tempi di inattività non pianificati.

L'adozione del monitoraggio termico nei data center sta accelerando perché aiuta i team di ingegneria a ridurre al minimo i danni alle apparecchiature e a diminuire la probabilità di interruzioni che possono derivare da guasti non rilevati.

Metodi di monitoraggio termico nei data center

Il monitoraggio termico può essere implementato nei data center in diversi modi, tra cui:

  1. Monitoraggio termico continuo (CTM): il CTM è un approccio di monitoraggio basato sulle condizioni che può sostituire le ispezioni periodiche tramite termocamere (IR). Si tratta di un metodo proattivo per monitorare la temperatura delle infrastrutture elettriche nei data center e in altri settori che utilizzano infrastrutture critiche. Prevede l'utilizzo di sensori per misurare e monitorare continuamente la temperatura di diverse apparecchiature elettriche all'interno del data center, fornendo dati in tempo reale sullo stato di salute delle apparecchiature monitorate. I sensori forniscono dati di temperatura in tempo reale, avvisando il personale di eventuali aumenti di temperatura prima che superino i limiti di sicurezza. I dati provenienti da questi sensori possono quindi essere raccolti e analizzati per prendere decisioni informate e identificare potenziali guasti. Questi sensori possono essere integrati in sistemi di monitoraggio IoT intelligenti che forniscono allarmi, notifiche, trend e analisi, contribuendo alla manutenzione predittiva.
  2. Termocamere: L'utilizzo di termocamere, o termografia a infrarossi, è un altro metodo di monitoraggio termico. Queste telecamere catturano immagini del calore emesso dalle apparecchiature elettriche. Punti caldi e altri problemi che potrebbero non essere evidenti a occhio nudo possono essere individuati tramite termocamere. Questo approccio è stato storicamente diffuso, ma sta venendo rapidamente sostituito da metodi più predittivi, come il CTM, descritto in precedenza.
  3. Audit e manutenzione: si tratta di un approccio di manutenzione preventiva che viene effettuato a intervalli regolari per garantire che i sistemi di refrigerazione, HVAC (riscaldamento, ventilazione e condizionamento dell'aria) e altre infrastrutture critiche funzionino in modo ottimale.

Vantaggi del monitoraggio termico per i data center

  • Prevenzione del surriscaldamento: i punti caldi e il surriscaldamento sono tra le principali cause di guasto delle apparecchiature nei data center. Sensori posizionati strategicamente rilevano continuamente la temperatura in diverse aree, tra cui rack di server e sistemi bus o di distribuzione del bus. Il sistema segnala quando le temperature superano i limiti impostati. Il monitoraggio termico contribuisce a prevenire il surriscaldamento delle apparecchiature del data center.
  • Aumento della durata delle apparecchiature: le apparecchiature critiche dei data center, come rack per server, quadri di distribuzione e dispositivi di archiviazione, possono beneficiare di una maggiore durata se la temperatura e l'umidità degli ambienti vengono monitorate e controllate. Nel tempo, ciò si traduce in una riduzione dei costi di manutenzione delle apparecchiature critiche.
  • Prevenire interruzioni di corrente impreviste: le interruzioni di corrente sono spesso impreviste e i tempi di inattività sono dannosi e costosi per i data center. L'implementazione di un monitoraggio termico continuo delle risorse critiche avvisa il personale dei potenziali rischi prima che si verifichi un guasto.
  • Miglioramento della produttività: grazie all'individuazione precoce di giunzioni e connessioni danneggiate negli impianti elettrici, si riducono le interruzioni di corrente. I data center dipendono in modo significativo dalla disponibilità di energia elettrica. Il monitoraggio della temperatura delle connessioni elettriche critiche migliora l'affidabilità delle apparecchiature, contribuendo a ottimizzare prestazioni e produttività.

Garantire una maggiore resilienza nei data center è fondamentale affinché proprietari e gestori possano gestire strutture affidabili e sostenibili in grado di soddisfare le esigenze future. Mantenere l'efficienza elettrica e la sicurezza è essenziale; pertanto, il monitoraggio della temperatura degli asset critici aiuta a comprendere dove è probabile che si verifichino potenziali guasti nelle apparecchiature critiche prima di un'interruzione. Gli avvisi derivanti dal monitoraggio della temperatura forniscono informazioni che possono essere utilizzate per pianificare la manutenzione predittiva e un approccio più proattivo per il personale operativo.

 

Leggi anche:

Rivoluzionare la manutenzione di celle frigorifere, frigoriferi e congelatori 

Above-Net prosegue con altre installazioni Smart IIoT per i servizi igienico-sanitari

Ti è piaciuto questo articolo?

Condividi su LinkedIn
Condividi su Facebook
Condividi su Twitter
Condividi via e-mail
Condividi tramite WhatsApp
Condividi tramite Telegram

Iscriviti alla nostra newsletter