Nastupující technologie úložišť (blízké) budoucnosti

Data jsou v pohybu, a dynamická tak musejí být i zařízení, která je uchovávají. Kvality moderních úložišť se dnes posuzují odlišně, než před lety. Čím dál více se apeluje na bezpečnost, škálovatelnost, mobilitu, a třeba i udržitelnost ve smyslu ekologie provozu a výroby.

232
0
SDÍLET

Od dob magnetických pásek přes diskety až k pevným diskům se v oblasti skladování dat vždy počítalo především se dvěma proměnnými: kapacitou úložiště a rychlostí zápisu, popřípadě čtení. Je docela možné, že kdyby dnes záleželo jen na těchto dvou aspektech a kapacitu a rychlost klasických disket by bylo možné zvyšovat až k dnešním standardům, používali bychom je jako primární zálohovací médium dodnes. Tedy, kdyby jejich výroba nebyla tak nákladná. Jenže to naštěstí není pravda.

Kvality moderních úložišť se dnes posuzují jinak a odlišné jsou i nároky uživatelů. Čím dál více se apeluje na bezpečnost, škálovatelnost, mobilitu, a třeba i udržitelnost ve smyslu ekologie provozu a výroby. Díky novým a stále se rozšiřujícím technologiím skladování dat se úložiště již nedají chápat jen jako média, jako skladovací nástroj, na který se provede zápis, a pak uložená data „leží“ zamčená v trezoru. Data jsou v pohybu, a dynamická tak musejí být i zařízení, která je uchovávají.

Nadcházející roky slibují ještě vyšší kulminaci dat s dalším rozšiřováním internetu věcí, s nástupem 5G sítí a také s vyšším podílem začlenění umělé inteligence do firemních procesů. Kvantita dat roste téměř exponenciálně. V dnes již slavné studii společnost IDC v roce 2018 odhadovala, že po celém světě je v nějakém smyslu uloženo na 33 zettabytů dat a že v roce 2025 to bude víc než pětinásobek. Pro mlhavou představu, pokud by kdokoliv z nás takové množství dat chtěl stáhnout se současným připojením, čekal by dalších 1,8 miliardy let.

Naštěstí existují jiné technologie, které nám blížící se záplavu dat pomohou zvládnout. Podívejme se na trojici těch nejdůležitějších, které v dalších letech ovlivní to, jak pracujeme se svými cennými daty.

Softwarově definovaná úložiště na každém hardwaru

Jednou z nejnadějnějších technologií, která již nyní pomalu mění to, jak pracujeme s daty, jsou takzvaně softwarově definovaná úložiště. Jde o metodu známou pod zkratkou SDS, odvozenou z anglického software-defined storage. Tato poměrně mladá technologie, která se svého uvedení na světlo IT světa dočkala někdy kolem roku 2014, pracuje na poněkud odlišné myšlence než většina druhů doposud známých metod pro ukládání dat.

Doposud jsme se s pořízením nějakého řešení k ukládání svých dat v jistém smyslu vždy zároveň zavazovali pro specifický hardware, samotný storage a každé takové řešení bylo a je optimalizované pro tento určitý druh zařízení. Na trhu jsou tedy desítky, stovky značek, výrobců a specifikací, téměř každá z nich s vlastním softwarem pro správu. Nastupující SDS systémy jsou však koncipovány tak, aby byly hardwarově neutrální a na fyzických zařízeních, na kterých běží, úplně nezávislé. Díky tomu umožňují využívat přístroje jakékoliv firmy a výroby, stačí, aby byly založené na rozšířené architektuře x86.

Výhody takového SDS úložiště jsou nevídané a přinášejí uspokojující odpověď pro firmy, které si nemohou dovolit migrovat svou datovou strukturu na modernější hardware. Dejme tomu, že vaše společnost už fungující řešení má. To je ale složené z úložišť různé kapacity, rychlosti, a dokonce i různé výroby, některé je staršího data a některé jste si pořídili docela nedávno. Každé takové zařízení vyžaduje vlastní druh softwaru, platformy, na které funguje. Co ale dělat v případě, že vám už jeho kapacita nedostačuje a vy ji potřebujete rozšířit? Je obtížné říct, s kterou částí struktury bude nové rozšíření kompatibilní a s kterou bude mít problém. Mimořádná škálovatelnost SDS toto překonává. Je jedno, která firma vám zařizovala serverovnu, stačí rozšiřující řešení zapojit do systému a je hotovo.

SDS je součástí velké myšlenky IT ekosystému známého jako hyperkonvergentní infrastruktura. V té má být systém (nejenom ten datový) kompletně nezávislý na veškerém hardwaru, na kterém běží. Jde vlastně o přímé a koncepční využití možností, které naskýtá virtualizované prostředí, a to včetně automatizace, potenciálně nekonečné škálovatelnosti, blockchainu i vyšší bezpečnosti pramenící z virtuálního stroje.

Intent-based data management aneb aby se data nezašantročila

S agregací a hromaděním čím dál většího množství dat se váže také další problém: jde o to nejen data uskladnit, ale také přesně definovat, kde jsou. Uživatelé dnes mají svá data k dispozici téměř neustále, ale málokdo se ptá, kde se vlastně nacházejí. Jsou na cloudu? Někde na fyzickém serveru na jiném kontinentu? Jsou uskladněná on-premise, nebo na k síti připojeném k NAS úložišti? Asi se shodneme, že je důležité data mít nejen k dispozici, ale také vědět, že jsou tam, kde jsou skutečně užitečná.

V mnoha případech organizace ukládají kopie těch samých dat na různorodé lokace, a spíš tak jejich správu komplikují. Množství dat, spolu s různorodostí úložišť a jejich formátů, se může pro mnohé firmy stát v blízké době osudovou překážkou. Z lidské perspektivy je už dnes nemožné se ve struktuře úložišť vyznat. Zdaleka ale nejde jen o to mít přehled. Je dobré mít svá data katalogizovaná, ale také je žádoucí je vytěžovat.

S tím organizacím pomůže nastupující technologie v zahraničí známá jako intent-based data management, zkráceně IBDM. Jde o sofistikovanou metodu využívající principů umělé inteligence, hlubokého učení a správcovských nástrojů, které zaručí, že každý kousek dat, které organizace vygeneruje, se uloží do optimální lokace. A tím myslím nejen virtuálně, tedy na správné místo v systému, ale i fyzicky, na ten nejvhodnější druh serveru, cloudu nebo jiného typu úložiště, a to tak, aby se minimalizovala latence a maximalizoval přístup těch uživatelů, kteří s takovými daty pracují. A nejen to. Každý soubor je opatřen a dál generuje metadata, která definují, k čemu slouží, a tak se tento dynamický ekosystém učí, k čemu jsou která data určená, kdo k nim potřebuje mít přístup, a pak všechna vzájemně propojená úložiště zcela automaticky spravuje.

NVMe/NVMe-oF

Posledním nastupujícím trendem, kterým se budeme zabývat, je na rozdíl od dvou předchozích softwarových řešení spíše charakteru hardwarového. Na jeho potenciálním vlivu na budoucí trh úložišť to však nijak neubírá, spíše naopak. Dá se předpokládat, že jeho rozšíření bude velmi rychlé a univerzální.

Řeč je o architektuře rozhraní NVMe a s ním souvisejících možnostech NVMe-oF neboli NVMe over Fabrics. Jde o nový typ specifikace interfacu, který umožňuje rychlý přístup k připojeným fyzickým zařízením, především moderním úložištím. Mnoho takových zařízení dodnes využívá k propojení SSD disků ke zbytku systému zastaralou technologii SATA, popřípadě SAS, které však zaostávají svou propustností dat a vyžadují pro připojené úložiště host adapter. Na rozdíl od SATA a SAS umí NVMe úložiště komunikovat se základní deskou a procesorem přímo, přes PCIe sběrnici, a tak nevyžaduje žádný další ovladač ve formě adaptéru. Díky vysoké optimalizaci není pro NVMe obtížné dosáhnout propustnosti až jednoho milionu vstupních a výstupních výpočetních operací za sekundu a se třemi mikrosekundami zpoždění, a s minimálními nároky na CPU jednotku jde o řešení, které doplní chybějící dílek do technologické skládanky vysoce výkonných high-endových SSD úložišť, která dosud postrádala dostatečně rychlé spojení se svým hostitelským systémem. Právě při začlenění do storage té nejvyšší třídy si totiž NVMe vede zdaleka nejlépe, při přibližně desetinásobku operací za sekundu má oproti starším řešením méně než 10% latenci. Tak se řadí mezi nejnadějnější a nejuniverzálnější technologie, které slibují svůj nástup a rozšíření v nejbližších letech.

Podobné výhody má také s touto technologií úzce související NVMe-oF, která představuje téměř stejnou koncepci, pozměněnou tím, že mezi úložištěm a hostitelem se veškerá komunikace řeší pomocí připojené sítě. Jde opět o nástupce staršího a pomalu dosluhujícího protokolu iSCSI a nabízí podstatně nižší latenci. Tím v podstatě minimalizuje reálný rozdíl mezi tím, jestli nějaké operace probíhají na zařízení on-premise, nebo na vzdáleném úložišti. Největší výhoda NVMe-oF však pramení z její zpětné kompatibility. Technologie může být použitá k přístupu do úložišť a serverů postavených na protokolech předchozích generací, včetně SATA. Nicméně největší rozmach se váže právě až s nástupem rychlých a moderních NVMe rozhraní, se kterými sdílí a kombinuje benefity propustnosti a rychlosti.

Ačkoliv tento článek pojednává o blízkých technologických trendech, tedy takových, které máme takříkajíc na dosah ruky, je třeba si uvědomit, že všechny zde zmíněné přístupy jsou teprve na začátku svého vývoje. Ještě čekají na první skutečnou zatěžkávací zkoušku, ve které by naplno ukázaly své přednosti a přesvědčily pragmaticky smýšlející IT svět o tom, jak jsou pro něj nepostradatelné. To, jestli jejich nástup nezbrzdila situace kolem pandemie, nebo zdali naopak nepřinese onu zatěžkávací zkoušku, při které tyto technologie zazáří, se dozvíme až v následujících letech.