Petabajt chytřeji a levněji

Vědecké a výzkumné instituce generují v dnešní době obrovské objemy dat, které neustále narůstají. Masarykova univerzita v Brně v letošním roce rozšířila svůj seznam datových úložišť o novou instalaci s celkovou kapacitou 1 024 TB, tedy 1 PB (petabajt). Ve výběrovém řízení zvítězilo úložiště postavené na technologii IBM Spectrum Scale a diskových polích Infortrend. Toto pole dodala specializovaná česká firma M Computers.

SDÍLET

Předmětem poptávky byla instalace a konfigurace „clusteru datových služeb“ o čisté kapacitě 1 000 TB. Dodávka zahrnovala montáž hardwaru, jeho zapojení a konfiguraci, instalaci a nastavení softwarových balíků a komponentů, vyladění výkonu, ověření bezchybného chodu všech komponentů úložiště, a nakonec demonstraci požadovaného výkonu provedením akceptačních testů. Datové úložiště slouží pro ukládání dat zpracovávaných ve výpočetním prostředí CERIT-SC a MetaCentra. Uživatelé jsou jak z Masarykovy univerzity, tak i z řad vědecké komunity z celé České republiky. Celkově jde tedy o zhruba 1 300 aktivních přístupů.

Požadavek na rychlost základem

Zadavatel kladl na úložiště řadu technických požadavků, jako vysokou dostupnost s maximální odolností proti výpadku jednotlivých komponentů, active-active přístupy přes protokoly NFSv4 a CIFS z důvodu připojení uživatelů z různých prostředí jako Windows či Linux, nebo využití technologie SSD disků pro maximální zrychlení souborových operací na úložišti.  Zvláště důležité byly požadavky na rychlost – 7 GB/s pro čtení a 5GB/s pro zápis 16 souborů paralelně.

Levnější, přesto výkonnější a rychlejší

Díky svému know-how mohli odborníci společnosti M Computers sáhnout po cenově velmi efektivním řešení založeném na diskových polích Infortrend řady ESDS 1000, v provedení se 16 pozicemi v 3U chassis. Přestože jde o disková pole cílená primárně pro segment SMB, vyznačují se vysokou rychlostí a spolehlivostí, velkou modularitou, zaručí silnou integritu dat, podporují připojení pomocí technologií SAS, Fibre Channel nebo iSCSI.  V neposlední řadě usnadní práci administrátorů díky uživatelsky otevřenému managementu.

Jedno diskové pole dosahuje výkonu až 550k IOPS a propustnosti až 5 500 MB/s, dodává se s duálními řadiči, redundantními zdroji a podporuje až 316 HDD v celkové kapacitě až 1 869 TB. Diskové pole nabízí možnost využití SSD cache, pro významné zrychlení čtecích IO operací a umožňuje víceúrovňový automatický tiering. Vzhledem k požadavkům na maximalizaci propustnosti celého úložiště využili specialisté společnosti M Computers rychlá rozhraní Fibre Channel pro přístup k datovým polím a Infiniband společně s 10Gbit Ethernetem pro uživatelský přístup k datům.

Řešení připravené pro velké objemy dat

Další požadavky byly kladeny na funkce snapshotů, tedy „zamrazení dat“ v určitém časovém okamžiku. V řešeném úložišti se používají pro efektivní operativní zálohy. Ty dovolují uživatelům návrat k předchozí verzi souboru, případně k obnovení omylem smazaných dat.  Pro aktuální den jsou pro velmi rychlou obnovu k dispozici snapshoty vytvářené po patnácti minutách, pro dalších až 14 dní je pak k dispozici jeden snapshot denně.

Velký objem a vysoká požadovaná rychlost klade na fungování snapshotů značné požadavky, jež výrazná většina systémů dostupných na trhu nedokáže splnit. Systém IBM Spectrum Scale však i v této oblasti umožňuje funkce snapshotů využít skutečně naplno bez degradace výkonu či jiných omezení.

Řídicí software

Softwarovým srdcem úložiště se stal systém Spectrum Scale společnosti IBM. Systém řeší problematiku ukládání a přístupu k velkým objemům dat v oblastech vědeckých výpočtů, big data, analýz, objektů, obecných nestrukturovaných dat a dalších. Vysoká škálovatelnost systému umožňuje maximální velikost souborového systému až 299 bytu a maximum 16 384 uzlů v storage clusteru.

Systém je od začátku koncipován pro enterprise nasazení, velkou robustnost a vysoký výkon. Podporuje technologii hierarchických datových úložišť s možností integrace diskových, páskových i externích cloudových úložišť v jednom souborovém systému s jednotným uživatelským přístupem k datům uložených na různých médiích.

Podpora a servis

Řešení bylo dodáno včetně servisní a záruční podpory na 5 let s reakční dobou nejpozději následující pracovní den od nahlášení závady, s výměnou vadných komponent v místě instalace.

Systém je připojen na non-stop dohledové centrum společnosti M Computers. Technici dohledového centra mají k dispozici kompletní sadu náhradních dílů a mohou tak reagovat okamžitě na servisní požadavky.

 

 

Fakta o případové studii

Jméno klienta:

Masarykova univerzita Brno

Požadované funkce:
  • vysoká dostupnost;
  • odolnost vůči výpadku jednotlivých komponentů;
  • zrychlení souborových operací na úložišti;
  • možnost rychlé obnovy dat.
Řešení:

disková pole Infortrend řady ESDS 1000
Systém IBM Spectrum Scale

Parametry dodaného řešení:

Čistá kapacita: 1PB (1 024 TB)
Rychlost zápisu: 5 GB/s
Rychlost čtení: 7 GB/s
Počet přístupových serverů v HA clusteru: 3
Škálovatelnost:

  • až 299 bytu/fs;
  • 16 384 uzlů v cluster.

Počet snapshotů: neomezený, snadná integrace pro zálohování, do cloudů nebo object storage
Cena: 4,2 mil Kč bez DPH

Hlavní přínosy řešení:
  • rychlost čtení dat 7 GB/s a rychlost zápisu dat 5 GB/s;
  • obnova dat během aktuálního dne co 15 minut a dle konkrétního dne až dva týdny zpět;
  • pětiletá servisní a záruční podpora;
  • neustálý dohled nad systémem ze strany dodavatele pro zajištění případných oprav.