IBM Storwize V7000

Jak zaoszczędzić miejsce na dyskach?

Zasoby dyskowe, bez względu na to, ile byśmy ich w przedsiębiorstwie mieli, należą do tych dóbr, których nam zawsze będzie za mało. Oszczędna gospodarka zasobami i ograniczenia w przydziale zasobów użytkownikom i systemom pozwalają uzyskać wymierne rezultaty, ale równie ważne jest wykorzystanie technologii pozwalającej bez strat na wydajności oszczędzić miejsce na dyskach.


Rozwiązania IBM Storwize wyposażone zostały w mechanizm nadalokacji, czyli technologii thin provisioning. Umożliwia on uzyskanie oszczędności miejsca i konkretnych korzyści biznesowych z tym z związanych, czyli redukcję wydatków na dyski twarde wypełniające macierz. Dzięki IBM Storwize V7000 mechanizm thin provisioning możemy wdrożyć praktycznie w każdej macierzy dyskowej podłączonej do nowego urządzenia IBM. Dotyczy to także mechanizmu odzyskiwania zer, który jest również na każdej maszynie.

Wzrost ilości danych wymusza na przedsiębiorstwach zwiększanie pamięci masowej. Redukcja potrzebnej przestrzeni dyskowej nawet o kilkanaście procent może przynieść wymierne oszczędności. Dane o szacowanym wzroście zapotrzebowania na powierzchnię dyskową uzyskane na podstawie informacji od klientów IBM.

Nadalokacja – efektywne zarządzanie przestrzenią dyskową


Nadalokacja – thin provisioning pozwala na przydzielenie systemom
i użytkownikom większej pojemności (soft) niż jest obecnie dostępna (pojemność hard). W efekcie można w ten sposób oszczędzić około 20% powierzchni dyskowej, a w niektórych przypadkach nawet więcej. Przydzielanie przestrzeni dyskowej w ten sposób zapobiega nadmiernej rezerwacji zasobów „na zapas” i nieefektywnemu gospodarowaniu przestrzenią dyskową.

Po zaimplementowaniu thin provisioning wszystkie tworzone wolumeny dyskowe są tzw. cienkimi wolumenami w modelu thin provisioning. Oznacza to, że możliwe jest przydzielenie systemowi operacyjnemu większej pojemności (soft) niż de facto jest dla niego dostępna (pojemność hard). Graficzny interfejs zarządzający powierzchnią dyskową umożliwia wygodne administrowanie wszystkimi dostępnymi wolumenami i tzw. Storage Poolami. Dzięki temu narzędziu można np. dynamicznie, z pomocą suwaka zmieniać rozmiar dostępnych dysków logicznych.

Z punktu widzenia biznesu mechanizm nadalokacji pozwala na przydział poszczególnym systemom czy jednostkom biznesowym takiej przestrzeni dyskowej, jaką sam deklaruje na własne potrzeby. W rzeczywistości, ponieważ zazwyczaj deklaracje te znacznie przekraczają rzeczywiste potrzeby użytkowników w tradycyjnych systemach pozbawionych mechanizmu thin provisioning, dużo przestrzeni dyskowej pozostaje niewykorzystane. Dzięki nadalokacji można zapobiec marnotrawstwu i bardziej efektywnie kosztowo eksploatować macierze dyskowe. Oczywiście należy także pamiętać, że administrator ma pełną kontrolę nad zaalokowaną przestrzenią dyskową i gdy nadalokowane obszary zaczynają się niebezpiecznie rozrastać, jest monitowany i może na czas podjąć właściwe działanie.

Odzyskiwanie zer – utylizacja zasobów


Innym ważnym mechanizmem wykorzystywanym w najnowszych rozwiązaniach IBM Storwize jest tzw. mechanizm Zero Reclaim, czyli odzyskiwania „zer”. W dużym uproszczeniu polega on na uwolnieniu przestrzeni dyskowej zajmowanej przez zapisy powtarzającego się ciągu informacji, czyli tzw. zer. Tego typu informacja zapisywana jest często w materiałach multimedialnych – obrazach czy dźwięku. Powtarzające się zapisy „zerowe” są przez system oznaczane przy zapisie i nie zajmują niepotrzebnie powierzchni. Storwize „pamięta” o tym, że zapis został uproszczony i przy odtwarzaniu danych „dodaje” je do odczytywanych sekwencji. W ten sposób możliwe jest odzyskanie dość dużej powierzchni pozornie wykorzystanej na dane i realne korzyści biznesowe z zastosowania technologii Storwize.


Szybszy dostęp do danych


Według badań Storage Performance Council, technologia Easy Tier umożliwia trzykrotny wzrost szybkości przesyłania danych w tradycyjnych, najtańszych dyskach SATA przemieszanych z pewną liczbą droższych dysków SSD. Technologia ta dostępna jest obecnie jedynie w rozwiązaniach DS8000 lub rozwiązaniu SAN Volume Controller, ale już wkrótce wprowadzona zostanie do kolejnych urządzeń z serii StorWize.

Easy Tier jest technologią opartą na współpracy tradycyjnych dysków twardych (HDD), czyli urządzeń Serial Advanced Technology Attachment (SATA) lub Enterprise Fibre Channel (FC) oraz dysków nowoczesnych wykonanych w technologii Solid State Disk (SSD). Parametry typowych dysków SSD, zwłaszcza te dotyczące zapisu, mogą być dodatkowo znacznie poprawione dzięki wykorzystaniu obszarów pamięci cache. Poniższa tabela ilustruje różnice wydajnościowe dysków SSD i HDD.


Porównanie wydajności dysków SSD i HDD

Typ operacji

Wynik dla typowego dysku SSD w porównaniu do dysku HDD

Losowy odczyt

100 razy szybszy

Losowy zapis

40 razy szybszy

Sekwencyjny zapis lub odczyt

2 razy szybszy


Korzyści

Zaletą dysków SDD jest szybsze przetwarzanie danych, ale ich wysoki koszt wciąż jeszcze sprawia, że nie mogą być wykorzystane w szerszym zakresie, wypierając korzystniejsze ekonomicznie dyski HDD. Easy Tier umożliwia stworzenie architektury złożonej z tych dwóch komponentów w taki sposób, by wykorzystać w pełni wyższą wydajność dysków SSD, na których składowane są dane częściej odczytywane i korzyści ekonomiczne związane z umieszczeniem na dyskach HDD danych nie tak często używanych. Przenoszenie danych przez system pamięci masowej (czyli dyski fizyczne) jest zawsze kosztowne w sensie dodatkowej pracy i zużycia energii oraz zajętości urządzeń. Mimo to jest często wskazane w celu dostosowania systemów storage do zmian w konfiguracji i nowych wymagań wydajnościowych systemów. Dotyczy to zwłaszcza tych przypadków, kiedy różne technologie dysku realizowane są na tym samym sprzęcie.

Easy Tier jest realizowany tak, by dane przenoszone były w sposób automatyczny i nieprzerwany na poziomie sub-LUN we wszystkich warstwach dysku. Łącząc różne dyski fizyczne w jeden zbiór, zwany z angielska Frame, uzyskiwana jest znaczna sumaryczna powierzchnia dyskowa, którą zarządza oprogramowanie posługujące się technologią Easy Tier. Sekret sprawnego administrowania nią polega na optymalnym doborze listy fragmentów danych (tzw. extendów), które powinny trafić do obszaru o najlepszych parametrach szybkości odczytu. Dane najczęściej odczytywane określane są często jako „gorące”, a te, które są wykorzystywane rzadko, określane są jako „zimne”. Lista extendów aktualizowana jest co 24 godziny, natomiast co 5 minut uruchamiany jest w tle proces migrujący nową partię danych między dyskami o szybkim i wolnym odczycie. Istnieje także możliwość „ręcznego” sterowania przydzielanymi zasobami w ramach pool i woluminów. Administrator decyduje wówczas sam, które z zasobów umieścić na powierzchni o wyższej wydajności.

Przebieg migracji danych

Kluczowym elementem działania technologii Easy Tier jest przeniesienie danych. Proces ten przebiega w kolejnych etapach. Migracja w automatycznym trybie Easy Tier odbywa się w taki sposób, by najczęściej wykorzystywane (gorące) dane z dysków przesuwane były na dyski fizyczne SDD o lepszych parametrach wydajnościowych. Zazwyczaj fragmenty danych (extendy) „rozrzucone są” na wielu dyskach – częściowo na dyskach SSD, a częściowo na HDD. Oczywiście jeżeli dany extend jest kluczowy i częściej wykorzystywany, wówczas większa jego część znajduje się na dyskach Solid State. Jeśli zaś dany extend znajduje się wyłącznie na dysku twardym HDD, nie jest on przesuwany, bez względu na to, jak bardzo dane znajdujące się tam były w danej chwili „gorące”. Przez cały czas działania całej powierzchni dyskowej monitorowane jest wykorzystanie przez poszczególne extendy zasobów – urządzeń wejścia-wyjścia. Jeżeli użycie ich jest bardziej intensywne, wówczas extendowi nadawany jest wyższy priorytet. W wyniku tego monitoringu generowana jest raz na 24 godziny lista (plan) migracji. Potem plan ten jest konsekwentnie realizowany – co 5 minut poszczególne fragmenty extendów migrowane są między dyskami HDD i SSD w taki sposób, by zoptymalizować szybkość ich działania. Plan relokacji danych dostosowany jest do aktualnego obciążenia dysków przez ich normalną pracę i przyspiesza wtedy, gdy dyski nie są zbytnio obciążone, lub zwalnia wtedy, gdy potrzebne jest spowolnienie procesu w momencie zbyt dużej zajętości normalną pracą dysków. Algorytm relokacji extendów jest tak przygotowany, by uwzględniać koszt przemieszczania danych. Jeżeli koszt (czas) przemieszczenia jest zbyt wysoki w stosunku do sumarycznych oszczędności czasowych związanych z tym przemieszczeniem, wówczas proces ten nie jest wykonywany. W momencie gdy liczba extendów kandydatów do przemieszczenia przewyższa dostępne zasoby na dyskach SSD, algorytm sam ocenia, które z gorących fragmentów danych powinny być migrowane, a które pozostawić na swoim miejscu. Lista algorytmu zawiera zarówno fragmenty, które powinny zostać przeniesione w miejsce szybszego odczytu, jak i fragmenty z dysków SSD, które powinny zostać przeniesione do obszaru o niższej wydajności, czyli „wymiecione” na dyski HDD.