Czym jest zarządzanie infrastrukturą centrum danych (DCIM)?

Czym jest zarządzanie infrastrukturą centrum danych (DCIM)?

Zarządzanie infrastrukturą centrum danych (DCIM) obejmuje procesy i technologie wykorzystywane do monitorowania, pomiaru i zarządzania infrastrukturą fizyczną i wirtualną centrum danych. DCIM wykorzystuje narzędzia, oprogramowanie i aplikacje do śledzenia szeregu kluczowych obszarów w centrach danych, takich jak:

  • Infrastruktura fizyczna: Ten typ monitorowania wykorzystuje metody obejmujące czujniki, kamery i oprogramowanie do zarządzania obiektem w celu weryfikacji stanu sprzętu oraz statusu zagrożeń bezpieczeństwa, awarii sprzętu i innych potencjalnych anomalii.
  • Zarządzanie mocą: Niezawodne i zawsze dostępne źródło zasilania jest kluczowym wymogiem w centrum danych. Oprogramowanie DCIM monitoruje moc zasilania, przepustowość sieci, miejsce w szafach rack oraz wydajność chłodzenia. Pomaga to operatorom centrów danych zrozumieć, kiedy w szafach serwerowych zaczyna brakować miejsca i w razie potrzeby wdrożyć nowy sprzęt. Może również pomóc w zbadaniu przyczyn wysokiego zużycia energii i poprawie wydajności chłodzenia.
  • Bezpieczeństwo: DCIM monitoruje różne aspekty bezpieczeństwa w centrach danych, takie jak:
      1. Bezpieczeństwo fizyczne: obejmuje ono zapobieganie nieautoryzowanemu dostępowi i złośliwym działaniom, blokowanie korzystania z kamer, monitorowanie zamków drzwi i innych czujników w celu wykrywania włamań i wysyłania alertów.
      2. Bezpieczeństwo środowiskowe: Warunki środowiskowe, takie jak kurz, wilgotność i temperatura, mogą być niebezpieczne i zagrażać płynnemu funkcjonowaniu centrów danych. Systemy DCIM pomagają zmniejszyć ryzyko narażenia sprzętu na te zagrożenia. Sprzęt w centrach danych zużywa znaczną ilość energii, dlatego kluczowe jest zapewnienie chłodzenia i monitorowania przepływu powietrza w centrum danych, aby zapobiec przegrzaniu sprzętu. Wilgotność w centrum danych musi mieścić się w określonym zakresie, aby zapobiec korozji.
      3. Bezpieczeństwo zasobów: DCIM monitoruje zasoby centrum danych, takie jak urządzenia pamięci masowej, sprzęt sieciowy i serwery, aby identyfikować nieautoryzowane działania na najważniejszych zasobach.
      4. Bezpieczeństwo logiczne: DCIM monitoruje logi systemowe, ruch sieciowy i inne dane, aby ostrzegać personel o podejrzanej aktywności, naruszeniach danych i naruszeniach sieci.

Co może monitorować DCIM?

Zarządzanie infrastrukturą centrum danych (DCIM) wykorzystuje narzędzia monitorujące do gromadzenia danych o zasobach, co pomaga poprawić wydajność operacyjną w całej organizacji. Można je podzielić na różne poziomy, w tym:

1. Sprzęt IT (technologia informacyjna):

  • Serwery: monitorują stan operacyjny, temperaturę, wykorzystanie procesora, pamięć i magazynowanie.
  • Urządzenia pamięci masowej: Kontrolują dostępną przestrzeń, wydajność i integralność danych.
  • Przełączniki sieciowe: monitorują łączność, przepustowość, ruch danych i wydajność sieci.
  • Routery i zapory sieciowe: zarządzanie łącznością sieciową, ustawieniami zabezpieczeń i monitorowaniem ruchu.

2. Bezpieczeństwo i kontrola dostępu:

  • Systemy kontroli dostępu: monitorują wejścia i wyjścia upoważnionego personelu, rejestrują zdarzenia związane z dostępem i kontrolują dostęp do stref o ograniczonym dostępie.
  • Kamery bezpieczeństwa: monitorują działania i zdarzenia związane z bezpieczeństwem w czasie rzeczywistym, nagrywają filmy i przechwytują obrazy do późniejszej analizy.

3. Środowisko fizyczne:

  • Czujniki temperatury i wilgotności: monitorują warunki środowiskowe, aby zapewnić, że mieszczą się one w dopuszczalnych granicach.
  • Czujniki wykrywania wody: wykrywają przecieki lub zalania, zapobiegając uszkodzeniom sprzętu.
  • Czujniki dymu i ognia: monitorują obecność dymu i uruchamiają alarm w przypadku pożaru.

4. Zarządzanie aktywami:

  • Inwentaryzacja sprzętu: prowadzi szczegółowy rejestr wszystkich zasobów IT i infrastruktury centrum danych, obejmujący informacje o lokalizacji, statusie i historii konserwacji.

Chociaż systemy DCIM (Data Center Infrastructure Management) odgrywają kluczową rolę w efektywnym zarządzaniu zasobami fizycznymi i logicznymi centrum danych, nadal istnieje potrzeba bardziej szczegółowego, innowacyjnego i uzupełniającego podejścia do niektórych poziomów infrastruktury, które przeniesie inteligencję operacyjną na nowy poziom, takiego jak:

Infrastruktura elektryczna:

  • PDU (jednostki dystrybucji zasilania): monitorowanie i przewidywanie problemów w dystrybucji zasilania, obciążeniu, zużyciu i stanie zasilania.
  • UPS-y (systemy zasilania bezprzerwowego): monitorowanie pojemności baterii, stanu zasilania, czasu pracy, wczesne wykrywanie nieprawidłowości.
  • Generatory: Kontrolują stan operacyjny, poziom paliwa i gotowość do pracy w przypadku awarii zasilania, a także kontrolę konserwacji sprzętu na podstawie jego stanu.

Infrastruktura chłodnicza:

  • Jednostki klimatyzacyjne: monitorują temperaturę otoczenia, wilgotność, przepływ powietrza, temperaturę sprężarki, napięcie i prąd w celu wczesnego przewidywania problemów.
  • Wentylatory: Kontrolują stan pracy, prędkość obrotową i przepływ powietrza.
  • Wieże chłodnicze: monitorowanie i sterowanie pompami i sprężarkami, obejmujące temperaturę wody na wlocie i wylocie, napięcie, prąd, wilgotność, temperaturę i wibracje.

Jakie są główne różnice pomiędzy DCIM i Bridgemeterem?

  1. Nacisk na przewidywanie i zapobieganie: Bridgemeter wykracza poza samo monitorowanie i zarządzanie infrastrukturą fizyczną. Wykorzystując zaawansowane algorytmy inteligencji, przewiduje potencjalne awarie i anomalie, umożliwiając proaktywne interwencje w celu zapobiegania zakłóceniom i maksymalizacji dostępności operacyjnej.
  2. Dodatkowa oferta rozwiązań inteligentnych: Oprócz monitorowania parametrów fizycznych, takich jak temperatura i wilgotność, Bridgemeter oferuje dodatkowe rozwiązania inteligentne poprzez analitykę predykcyjną. Identyfikuje wzorce i trendy, dostarczając cennych informacji pozwalających na optymalizację efektywności energetycznej, planowanie przyszłych mocy obliczeniowych i poprawę wykorzystania zasobów centrum danych.
  3. Współpraca z zespołem ds. konserwacji: Bridgemeter usprawnia i skraca czas usuwania zidentyfikowanych problemów dzięki bezpośredniej komunikacji z zespołem terenowym i generowaniu zadań naprawczych wraz z odpowiednią dokumentacją dotyczącą danego sprzętu.
  4. Adaptowalność: Dzięki możliwości adaptacji do nowych warunków i środowisk w czasie rzeczywistym, Bridgemeter umożliwia szybką reakcję na zmiany operacyjne. Dzięki temu operatorzy centrów danych mogą podejmować świadome i elastyczne decyzje, zarówno dotyczące usług, jak i zmian w inteligencji/konfiguracji monitorowania.
  5. Bezproblemowa integracja z DCIM: Bridgemeter nie zastępuje istniejących systemów DCIM, lecz je ulepsza i zapewnia doskonałą łączność oraz integrację danych, obsługując ponad 150 różnych protokołów komunikacyjnych. Oznacza to, że może połączyć się z dowolnym czujnikiem, sterownikiem PLC (Programmable Logic Controller) lub istniejącym sprzętem w centrum danych, dodając łączność DCIM i umożliwiając gromadzenie gęstszych i bardziej zróżnicowanych informacji. Ta możliwość ułatwia szybkie wdrożenie systemu, zapewniając inteligentniejszy i bardziej kompleksowy obraz działania centrum danych. Ponadto Bridgemeter działa jako oprogramowanie pośredniczące dla łączności wielosektorowej, umożliwiając bezproblemową integrację danych z różnych systemów i sprzętu w całym środowisku centrum danych.
  6. Podnoszenie standardów wydajności: Oferując kompletne i zintegrowane rozwiązanie do zarządzania centrum danych, Bridgemeter podnosi standard wydajności operacyjnej i niezawodności. Jego zdolność do dostarczania analiz w czasie rzeczywistym i wspierania strategicznego podejmowania decyzji czyni go niezbędnym elementem każdego nowoczesnego środowiska centrum danych.

Krótko mówiąc, Bridgemeter firmy Above-Net nie tylko wyróżnia się na tle tradycyjnych systemów DCIM, ale także podnosi ich efektywność i użyteczność, dodając inteligencję i zaawansowane możliwości analityczne do środowisk centrów danych. Wdrażając Bridgemeter, organizacje mogą osiągnąć nowy poziom doskonałości operacyjnej i zapewnić maksymalną dostępność kluczowych usług.

Monitorowanie temperatury jako narzędzie do monitorowania centrum danych

Monitorowanie temperatury to proces zbierania i analizowania danych na temat temperatury najważniejszych urządzeń elektrycznych w centrum danych.

Monitoring termiczny jest stosowany w centrach danych do monitorowania temperatury urządzeń i infrastruktury elektrycznej, aby zapobiegać przegrzaniu, a tym samym awariom. Jest to ważny element wpływający na dostępność zasilania i bezawaryjną pracę systemu.

Podwyższona temperatura, zwłaszcza w złączach elektrycznych i szynach zbiorczych, jest sygnałem ostrzegawczym o potencjalnych problemach, takich jak luźne lub uszkodzone połączenie. Brak kontroli zwiększa ryzyko awarii urządzeń elektrycznych, co może narazić personel pracujący w pobliżu tych krytycznych urządzeń elektrycznych na większe ryzyko. Monitorowanie temperatury złączy elektrycznych i szyn zbiorczych pomaga nie tylko uniknąć przestojów i uszkodzeń infrastruktury krytycznej, które mogłyby prowadzić do spadku wydajności, utraty danych lub awarii urządzeń, ale także zapewnia bezpieczeństwo personelu w pobliżu urządzeń.

Operatorzy centrów danych stają przed wieloma wyzwaniami, ale przegrzewanie się sprzętu jest jednym z najpoważniejszych. Przegrzanie sprzętu może prowadzić do nieplanowanych przestojów, co negatywnie wpływa na niezawodność usług dla klientów i generuje znaczne koszty finansowe oraz utratę reputacji. Wraz ze wzrostem zależności od danych rośnie zapotrzebowanie na technologie, takie jak ciągły monitoring temperatury, aby pomóc zapobiegać zakłóceniom i unikać nieplanowanych przestojów.

Coraz popularniejsze staje się wdrażanie monitoringu termicznego w centrach danych, ponieważ pomaga on zespołom inżynieryjnym minimalizować uszkodzenia sprzętu i zmniejszać prawdopodobieństwo przerw w działaniu, które mogą wynikać z niewykrytych usterek.

Metody monitorowania termicznego w centrach danych

Monitoring termiczny w centrach danych można wdrożyć na kilka sposobów, w tym:

  1. Ciągły monitoring termiczny (CTM): CTM to metoda monitorowania oparta na stanie technicznym, która może zastąpić okresowe inspekcje za pomocą kamer termowizyjnych (IR). To proaktywny sposób monitorowania temperatury infrastruktury elektrycznej w centrach danych i innych branżach wykorzystujących infrastrukturę krytyczną. Polega ona na wykorzystaniu czujników do ciągłego pomiaru i monitorowania temperatury różnych zasobów elektrycznych w całym centrum danych, dostarczając w czasie rzeczywistym dane o stanie monitorowanych zasobów. Czujniki dostarczają dane o temperaturze w czasie rzeczywistym, ostrzegając personel o wzroście temperatury, zanim przekroczy ona bezpieczne granice. Dane z tych czujników mogą być następnie gromadzone i analizowane w celu podejmowania świadomych decyzji i identyfikacji potencjalnych awarii. Czujniki te można zintegrować z inteligentnymi systemami monitorowania IoT, generując alarmy, powiadomienia, obserwując trendy i analizując je, co wspomaga konserwację predykcyjną.
  2. Kamery termowizyjne: Wykorzystanie kamer termowizyjnych, czyli termografii IR, to kolejna metoda monitoringu termicznego. Kamery te rejestrują obrazy ciepła emitowanego przez urządzenia elektryczne. Gorące punkty i inne problemy, które mogą nie być widoczne gołym okiem, można wykryć za pomocą kamer termowizyjnych. To podejście było historycznie popularne, ale szybko jest zastępowane przez bardziej predykcyjne metody, takie jak CTM, opisane powyżej.
  3. Audyty i konserwacja: Jest to podejście polegające na zapobiegawczej konserwacji, przeprowadzane w regularnych odstępach czasu w celu zapewnienia optymalnego działania systemów chłodniczych, HVAC (ogrzewanie, wentylacja i klimatyzacja) oraz innej krytycznej infrastruktury.

Korzyści z monitorowania termicznego w centrach danych

  • Zapobieganie przegrzaniu: Gorące punkty i przegrzanie to główne przyczyny awarii sprzętu w centrach danych. Strategicznie rozmieszczone czujniki stale mierzą temperaturę w różnych miejscach, w tym w szafach serwerowych oraz magistralach i systemach dystrybucji magistrali. System sygnalizuje przekroczenie ustalonych limitów temperatury. Monitorowanie temperatury pomaga zapobiegać przegrzaniu sprzętu w centrach danych.
  • Wydłużenie żywotności sprzętu: Krytyczny sprzęt centrum danych, taki jak szafy serwerowe, stelaże dystrybucyjne i urządzenia pamięci masowej, może zyskać na dłuższej żywotności, gdy temperatura zasobów i wilgotność obiektu są monitorowane i kontrolowane. Z czasem przekłada się to na niższe koszty konserwacji krytycznego sprzętu.
  • Zapobieganie nieoczekiwanym przerwom w dostawie prądu: Przerwy w dostawie prądu są często nieplanowane, a przestoje są szkodliwe i kosztowne dla centrów danych. Wdrożenie ciągłego monitoringu termicznego krytycznych zasobów ostrzega personel o potencjalnych zagrożeniach, zanim dojdzie do awarii.
  • Poprawa produktywności: Dzięki wczesnemu wykrywaniu uszkodzonych połączeń i złączy w urządzeniach elektrycznych, liczba przerw w dostawie prądu ulega zmniejszeniu. Centra danych są w znacznym stopniu uzależnione od dostępności zasilania. Monitorowanie temperatury krytycznych połączeń elektrycznych poprawia niezawodność sprzętu, przyczyniając się do poprawy wydajności i produktywności.

Budowanie większej odporności centrów danych ma fundamentalne znaczenie dla właścicieli i operatorów, którzy chcą prowadzić niezawodne i zrównoważone obiekty, spełniające przyszłe wymagania. Utrzymanie sprawności i bezpieczeństwa elektrycznego jest kluczowe; dlatego monitorowanie temperatury zasobów krytycznych pomaga zrozumieć, gdzie najprawdopodobniej wystąpią potencjalne awarie sprzętu krytycznego, zanim nastąpi awaria. Alerty z monitoringu temperatury dostarczają informacji, które można wykorzystać do planowania konserwacji predykcyjnej i bardziej proaktywnego podejścia personelu operacyjnego.

 

Przeczytaj także:

Rewolucja w konserwacji komór chłodniczych, lodówek i zamrażarek 

Above-Net wdraża kolejne inteligentne rozwiązania IIoT na potrzeby systemów sanitarnych

Czy podobał Ci się ten artykuł?

Udostępnij na LinkedIn
Udostępnij na Facebooku
Udostępnij na Twitterze
Udostępnij przez e-mail
Udostępnij przez WhatsApp
Udostępnij przez Telegram

Zapisz się do naszego newslettera