HPE Nimble Storage: Sześć dziewiątek dostępności
Aktualności

HPE Nimble Storage: Sześć dziewiątek dostępności

Napisany przez 18 marca 2023 25 maja, 2023 No Comments

Sześć dziewiątek, czyli 99,9999% to parametr określający czas dostępności systemu pamięci masowej w stosunku do całego czasu pracy. Oznacza, że w ciągu roku pracy system może być niedostępny przez nie więcej niż 31 sekund (dokładnie: 31 536 mikrosekund/rok).

Sześć dziewiątek występujących w charakterystyce rozwiązań HPE Nimble Storage to nie jest „parametr marketingowy”, nierealna obietnica, czy własność dotycząca wąskiej grupy konkretnej wersji rozwiązania. Sześć dziewiątek dotyczy wszystkich rozwiązań HPE Nimble Storage zainstalowanych dotychczas i wdrażanych do użytkowania i jest obliczane na podstawie funkcjonowania wszystkich systemów, w całym czasie ich działania. Nie jest przy tym obarczone dodatkowymi wymaganiami (na przykład wykupienia specjalnego pakietu serwisowego czy utrzymaniowego) i dodatkowymi opła- tami. Działa dla wszystkich systemów jako ich podstawowa własność.

Źródła niezawodności

Niezawodność zaczyna się od fizycznej architektury systemu zaprojektowanej i budowanej z założeniem braku pojedynczych punktów awarii. Wszystkie elementy systemu są dublowane lub pracują w innych nadmiarowych konfiguracjach tworząc rozwiązanie odporne na uszkodzenia (fault-tolerant). Drugim zasadniczym sposobem zwiększania niezawodności jest korzystanie ze sztucznej inteligencji, która analizuje funkcjonowanie pracujących rozwiązań i pozwala przewidywać ewentualne problemy aby w porę im zapobiegać. Wśród całego szeregu rozwiązań technicznych (sprzętowych i programowych) i organizacyjnych (zbieranie i analiza danych) stosowanych w rozwiązaniach HPE Nimble Storage szczególne miejsce zajmują dwa, które opiszemy bardziej szczegółowo:

  • Triple+ Parity RAID, jako mechanizm działający na poziomie sprzętu a zapewniający, że nawet w przypadku awarii trzech dysków w macierzy cała macierz działa poprawnie a uszkodzenie nie jest odczuwalne dla użytkownika,
  • InfoSight Predictive Analytics, jako rozwiązanie klasy AI (sztucznej inteligencji) zapewniające możliwość przewidywania awarii i uszkodzeń zanim one wystąpią (dokładniej mówiąc – szacowania prawdopodobieństwa wystąpienia takiej sytuacji na podstawie dostępnych danych i zauważonych symptomów i możliwości jej zapobieżenia przez podjęcie działań wyprzedzających).

Triple+ Parity RAID

Triple+ Parity RAID to opracowany przez HPE i doskonalony w trakcie eksploatacji kolejnych generacji rozwiązań mechanizm z dziedziny fault tolerance (rozwiązań odpornych na uszkodzenia), który zgodnie z regułami tego podejścia zakłada, że nie ma urządzeń, które nie ulegają uszkodzeniom, ale da się budować systemy, które są na takie uszkodzenia odporne. Można to osiągać na przykład dzięki zastosowaniu podwójnych elementów, które w razie potrzeby zastępują się nawzajem lub budowaniu rozwiązań z nadmiarem funkcjonalnym, w których pracujące moduły mogą przejmować funkcje tych, które ulegną uszkodzeniu do czasu wymiany tych ostatnich. Zgodnie z nazwą rozwiązania Triple+ Parity RAID stoso- wanego w macierzach dyskowych HPE Nimble Storage nawet w przypadku uszkodzenia trzech dysków w macierzy całe rozwiązanie pracuje nadal poprawnie – bez utraty funkcjonalności i wydajności i bez żadnych skutków odczuwanych przez użytkownika. A niejako „w zapasie” ma jeszcze kontrolę parzystości na poziomie pojedynczych dysków i wbudowane mechanizmy ochrony przed błędami zapisu/odczytu – stąd plus w nazwie. W porównaniu z typowo stosowanymi w branży rozwiązaniami RAID 5 i RAID 6, Triple+ RAID daje o rzędy wielkości lepsze parametry niezawodnościowe.

InfoSight Predictive Analytics

InfoSight Predictive Analytics to rozwiązanie analizujące dostępne dane i przewidujące możliwe zacho- wania monitorowanych systemów – ten typ analizy predykcyjnej pozwala na znaczne podniesienie niezawodności już nie za pomocą rozbudowy sprzętu o dodatkowe, nadmiarowe elementy i moduły, ale za pomocą wnikliwej analizy jego funkcjonowania i podejmowania działań wyprzedzających ewentualne problemy. Szerzej patrząc na to zagadnienie, można powiedzieć, że Predictive Maintenance to zupełnie nowe podejście do eksploatacji różnego rodzaju urządzeń i systemów technicznych – od zastosowań na poziomie pojedynczych elementów, układów elektronicznych i systemów informatycznych, aż po całe maszyny i linie produkcyjne w przemyśle. Zamiast tradycyjnego określania przewidywanej żywotności urządzeń i planowania na tej podstawie okresowych aktualizacji (typowych dla rozwiązań IT) czy przeglądów i remontów (w przypadku zastosowań przemysłowych) bazujemy na rzeczywistych danych o sprawności i kondycji poszczególnych monitorowanych elementów i całych systemów. Dzięki rozmieszczeniu w sprzęcie i w kodzie oprogramowani sensorów, czujników i mechanizmów samotestowania, mamy na bieżąco informacje o tym jakie są parametry pracy elementów i urządzeń, a zbieranie tych danych równolegle do oceny sprawności całego rozwiązania i detekcji awarii pozwala na tworzenie zaawansowanych modeli predykcyjnych, które przewidują jakie mogą nastąpić zdarzenia jeżeli w systemie zanotujemy specyficzne odczyty parametrów, w charaktery- styczny sposób zmieniające się w czasie. Gromadzenie, agregacja, analiza i korelowanie takich danych to rola systemów uczenia maszynowego będących podstawą sztucznej inteligencji. Jak można się domyślać, im więcej mamy takich danych, im bardziej są one szczegółowe i im dłużej je zbieramy i analizujemy i odnosimy do rzeczywistych zdarzeń, które potem następują – tym bardziej skutecznie możemy przewidywać zdarzenia niepożądane i im zapobiegać.

W przypadku HPE Nimble Storage takimi mechanizmami objęte są wszystkie instalowane macierze dyskowe, a bardzo szczegółowe rozeznanie co do ich kondycji monitorowanej za pomocą sprzętowych i programowych sensorów, wraz z informacjami kontekstowymi dotyczącymi konfiguracji, systemów operacyjnych, otoczenia i środowiska IT w którym funkcjonują pozwalają na tworzenie bardzo dokładnych i skutecznych sposobów zapobiegania uszkodzeniom lub wdrażania rozwiązań naprawczych zanim uszkodzenia nastąpią. Dzięki temu około 90% przypadków interwencji systemu AI następuje zanim użytkownik zorientuje się, że wystąpił problem (bo temu problemowi zapobiegamy). W 86% przypadków następuje skuteczne zastosowanie przewidywanych mechanizmów zapobiegania uszkodzeniom/awariom lub neutralizowania i niwelowania ich skutków dzięki czemu sprawność rozwiązania jako całości jest zachowana, a użytkownik nie odczuwa żadnych konsekwencji.

Ta zaawansowana analityka biznesowa jest wbudowana w rozwiązania HPE Nimble Storage od samych podstaw. Sensory i punkty kontrolne rozmieszczone w sprzęcie i kodzie pozwalają na bieżąco i z niezwykłą dokładnością śledzić, monitorować i oceniać stan systemu. Dane te są zbierane ze wszystkich pracujących macierzy dyskowych i za pomocą sztucznej inteligencji i uczenia maszynowego przekształcane w użyteczne źródło informacji. Miliony punktów kontrolnych monitorowanych w ciągu każdej sekundy generują ogromne zbiory danych, które mogą być analizowane i przetwarzane w celu poszukiwania ko- relacji i interesujących wzorców zachowań.

99,9999%: doświadczenie i gwarancja

Sposób pomiaru dostępności (System Availability) stosowany przez HPE gwarantuje przejrzystość i obiektywność uzyskiwanego wyniku. Sześciodziewiątkowa dostępność systemów HPE Nimble Storage ma bowiem taką charakterystykę:

  • jest mierzona dla jako realna wartość osiągana w praktyce, a nie przewidywany czy prognozowany parametr;
  • jest mierzona dla wszystkich zainstalowanych systemów we wszystkich wykorzystanych konfiguracjach ze wszystkimi systemami operacyjnymi i środowiskami IT;
  • stale się zwiększa – zaczynając od początkowych wartości, które i tak były najlepsze w branży stale rośnie ze względu na rosnącą bazę instalacyjną i kumulowane od 8 lat doświadczenia eksploatacyjne;
  • jest standardem dla wszystkich wdrażanych systemów, nie wymaga specjalnych warunków serwisu czy dopłat.

Wdrożenie rozwiązania HPE Nimble Storage pozwala więc korzystać z dotychczasowego, skumulowanego doświadczenia skutkującego osiąganiem 99,9999% dostępności, na bazie którego HPE oferuje każdemu klientowi program gwarancji satysfakcji, w tym gwarancji dostępności nie mniejszej niż 99,9999%.