Odborná sekce
VEEAM: Zálohování ve virtualizovaném prostředí
19.11.2014, 15:39
Účinná ochrana dat je nezbytným prvkem v moderním IT prostředí. Strategie zálohování ale v minulosti nezaujímaly tak důležité místo jako dnes. Informace o zálohování byly většinou uváděny v několika posledních kapitolách příručky pro administrátory a byly brány spíše jako dodatečná poznámka. To se však změnilo a dnes stojí v popředí zájmu každého CIO. Schopnost provádět obchodní operace i po selhání systému a povinnost splňovat přísné požadavky dělá ze zálohování nutnost, a to nejen při zajištění kontinuity provozu, ale také pro přežití firmy. Otázka, kterou by si firmy měly položit, tedy nezní zda zálohovat svá data, ale jak je zálohovat.
IT systémy se rychle vyvíjejí a představují neustále se měnící oblast, proto se také způsoby ochrany těchto systémů musí rychle vyvíjet. Jednou z nejvýznamnějších změn, které v uplynulých letech proběhly, byl pravděpodobně nástup virtualizace. Ve virtuálním světě přestaly starší záložní systémy splňovat svůj účel, protože počet zálohovacích oken narostl nad zvládnutelné množství. Nový model představuje jednak příležitosti v podobě zvýšení efektivity včetně nových výzev, ale přináší i snížení nákladů a rizik.
VIRTUALIZACE A STRATEGIE ZÁLOHOVÁNÍ
Strategie zálohování před nástupem virtualizace byly založeny na operačním systému (OS) a funkcích na úrovni aplikací. Typická implementace zahrnovala instalaci zálohovacího agenta do OS, který uvedl aplikace do stavu pro zálohování, kopíroval data v rámci sítě na záložní server a monitoroval probíhající změny. Ve fyzickém světě toto schéma fungovalo dobře, ale virtualizace všechno změnila, protože operační systémy začaly sdílet stejný fyzický hardware.
Místo jednoho zálohovacího agenta pro jeden fyzický počítač existoval jeden agent pro každý virtuální stroj na počítači. Znamená to tedy, že deset a více agentů (na základě poměru konsolidace 10:1) si mohlo konkurovat na hostitelském CPU, RAM a discích. Tato konkurence probíhala nejenom mezi jednotlivými agenty, ale také mezi aplikacemi nainstalovanými na ochranu dat. Množství dat začalo narůstat do objemů, které již nebylo možné zvládnout standardním přesunem skrze celé produkční prostředí na záložní server. Tento stav pak nemohl nadále přetrvávat, když se virtualizace stala běžnou praxí v data centrech po celém světě.
Přenesení konceptu backup agentů, který fungoval ve fyzickém světě vede ve virtuálním světě k množení vzájemně si konkurujících backup agentů nad identickým hardware.
Virtualizace přinesla nové výzvy a také nové příležitosti. Fyzický svět se sestával pouze z vrstev aplikací a OS, zatímco virtuální svět zavedl další vrstvy jako virtualizační vrstvu (hypervizor) a vrstvu datových úložišť. Obě nové vrstvy přináší mnohem více možností pro dostupnost, kopírování a ochranu dat. Hypervizor umožňuje centralizovanou správu těchto procesů, aniž by byly třeba agenti uvnitř každého virtualizovaného stroje. Sdílená úložiště ve vrstvě datových úložišť jsou centralizovaná, což znamená, že nabízí mnohem účinnější metody pro přesun dat z úložiště pro primární zálohování bez nutnosti použít produkční prostředí.
Pro ochranu nebo zálohu virtuálního stroje vytvoří SAN kopii LUN, ve které je umístěn virtuální stroj, k určitému času. Základním mechanismem pro vytvoření kopie virtuálního stroje k určitému času je „snapshot“ LUN (neboli snapshot SAN či úložiště). SAN při něm vytvoří snapshoty dat na úrovni datových úložišť. Snapshot LUN zmrazí celý objem dat v časovém úseku, kdy je pořízen, zatímco operace čtení a zápisu pokračují bez nutnosti zastavení. Je důležité zmínit, že snapshot LUN není to samé jako snapshot na úrovni hypervizoru, tedy virtualizační vrstvy (např. VMware snapshot), ten probíhá ve stacku o úroveň výše. Proces vytváření snapshotů úložiště je extrémně rychlý a přináší možnost velmi krátkých RPO (Recovery Point Objectives) – běžně se snapshot pořizuje každých 30–60 minut.
Příklad úložiště podporující tvorbu snapshotů a klonů - Systémy Hitachi Unified Storage.
Co se tedy skutečně děje během tohoto procesu? První snapshot z LUN zmrazí celý LUN přesně v okamžiku, kdy je snapshot pořízen. Vytvoří se tak první, základní snapshot. SAN ale nezkopíruje data na jiné místo, všechna zůstanou na stejném místě. K přepsání dat nedojde, protože zápisy na disku pro LUN, ze kterého byl vytvořen snapshot, jsou přesměrovány do jiného místa na disku. Při pořizování dalších snapshotů se stejný proces zmrazení bloků dat děje na jiném místě, ale obsahuje již pouze ta data, která se změnila od chvíle pořízení prvního základního snapshotu. Tento postup napodobuje tradiční strategii inkrementálního zálohování, která užívá plnou zálohu a následné zálohy obsahují pouze ty změny, které nastaly mezi jednotlivými cykly.
OBNOVA DAT ZE SNAPSHOTŮ
Operace obnovení ze snapshotů úložiště, která má za účel obnovit celý LUN v určitém okamžiku v čase, probíhá tak, že SAN dá dohromady příslušné bloky tak, aby byl LUN obnoven v takové podobě, jaká je vyžadována. Na prvním obrázku jsou znázorněny jednotlivé snapshoty úložiště v čase, na druhém obrázku je obnova snapshotu 3.
V případě obnovení celého LUN je tedy postup jednoduchý, v případě potřeby obnovení jednotlivých částí, tedy virtuálních strojů, disků, souborů a nebo aplikací, se ale proces začíná komplikovat. Vyžaduje, aby byla obnovena a sestavena celá LUN, aby bylo možné zpřístupnit data i na jiných úrovních. Jsou zde také nezbytné další softwarové funkce, které rozpoznají, načtou a obnoví tyto jednotlivé položky.
SNAPSHOTY ÚLOŽIŠTĚ – PROBLÉMY A JEJICH ŘEŠENÍ
Je mnoho oblastí, ve kterých může pořizování snapshotů úložišť poskytnout benefity, přináší s sebou ale také problémy, které mohou toto řešení odsunout do pozadí. Ukažme si nyní některá z těchto omezení a možnosti, jak je lze překonat pomocí disk-to-disk řešení jako například Veeam Backup & Replication™.
Omezení z hlediska nákladů – ukládání snapshotů na primární diskový systém musí nutně vést k nákupu více disků a diskových polic, aby bylo možné dále schraňovat primární data a zálohu na stejném zařízení. To vede mimo jiné i k nárůstu nákladů.
Propojení snapshotů – propojení snapshotů mezi sebou navzájem a navázání na základní snapshot může být problémem. I malé poškození jakékoli vazby v řetězci totiž může ovlivnit všechny další snapshoty, čímž se výrazně zvyšuje riziko.
ŘEŠENÍ: VEEAM BACKUP & REPLICATION
Řešení v obou případech nabízí Veeam Backup & Replication. Samotné snapshoty SAN vytváří sady vnitřně propojených záloh na primárním úložišti, Veeam Backup & Replication oproti tomu vytvoří soubor deduplikovaných a komprimovaných záloh na sekundárním úložném zařízení. Tyto soubory jsou stejné jako standardní soubory Windows, takže jsou snadno přenositelné, segmentovatelné a lehce se přesouvají. Veeam Backup & Replication je nezávislý na úložišti a je schopný skladovat soubory na široké škále zařízení nehledě na operační systém či konkrétního prodejce SAN. Umožňuje tak dále redukovat náklady na sekundární úložiště. Předchází také možným problémům vzniklým v případě poškození dat. Veeam Backup & Replication totiž obsahuje funkci SureBackup®, která kontroluje, že žádný soubor dat není poškozen a vše je plně obnovitelné.
Granularita – používání LUN jako primární jednotky pro management přináší omezení tam, kde je potřeba vyšší granularita – tedy při kontrole na úrovni virtuálního stroje, souboru či aplikace.
Konzistence záloh – existují tři úrovně konzistence záloh, které je možné dosáhnout: konzistentní zálohy při zhroucení, konzistentní zálohy na úrovni souborů a konzistentní zálohy na úrovni aplikací. Nejmenší objem dat a nejrychlejší obnova je možná s konzistentními zálohami na úrovni aplikací. Pro dosažení této úrovně konzistence na produktech SAN v prostředí VMware použije většina prodejců VMware snapshoty a další nástroje jako např. pausing. Bohužel ale tyto nástroje řeknou aplikacím, aby se připravily na kopírování spíše než na zálohování. Aplikace tak nikdy nejsou připraveny na kompletní zálohovací proces a nejsou ani ve stavu, ze kterého je možné je plně obnovit.
Zálohování pomocí Veeam Backup & Replication oproti tomu probíhá v hypervizoru – tedy na úrovni virtuálního stroje, takže umožňuje obnovit jak celé virtuální stroje, tak samostatné virtuální disky, soubory či aplikace a to z jedné zálohy. Pro případ selhání sítě SAN totiž potřebujete skutečné zálohy, které použijete k obnově.
SNAPSHOTY NEBO DISK-TO-DISK?
Pokud si nejste jistí, jestli na ochranu dat použít snapshoty úložiště nebo disk-to-disk řešení, položte si otázku: “Jak mohu využít obojí v komplexní strategii na ochranu dat?“ Disk-todisk řešení může zahrnovat všechny povinné požadavky na moderní zálohování dat, ale snapshoty úložiště mohou být použity spolu s ním ke snížení RPO a RTO při obnově dat s krátkodobou retencí.
Komplexní strategie ochrany dat použije ten správný nástroj pro tu kterou činnost. Použití snapshotů, zálohování, pásky a cloudu může být vždy posouzeno jako optimální a nejefektivnější, protože záleží na tom, jak dlouho chceme data uchovávat – jaká retence dat je požadována. Snapshoty úložiště slouží dobře při požadavku krátkodobé retence dat, protože jsou nejrychlejší, ale na druhou stranu zabírají velké množství místa. Pro střednědobou retenci jsou vhodná spíše disk-to-disk řešení především z hlediska granularity dat a možnosti obnovy na všech úrovních. Pro dlouhodobou retenci jsou pak nejvhodnějšími řešeními úložiště na páskách a cloudu. Snapshot samotný ale není možné považovat za řešení pro zálohování a zcela jistě nemůže naplnit všechny funkční a regulační požadavky kladené na taková řešení.
I přesto ale mohou snapshoty úložiště hrát roli silného nástroje pro ochranu dat v moderním virtualizovaném prostředí. Pokud se tento nástroj použije v kombinaci s řešením pro zálohování ve virtualizovaném prostředí, jako je např. Veeam backup & Replication, a společně s ukládáním dat na pásku nebo cloud, může být důležitým a potřebným prostředkem v širší a komplexní strategii na ochranu dat. Oddělené úložiště je klíčem k absolutní ochraně virtualizovaných prostředí. Mnoho nejlepších případových studií, které ve Veeam máme k dispozici, rozebírá selhání SAN, které zahrnuje i logiku snapshotů. V éře zálohování na disky je tedy nejlepším řešením poskytnout úložiště určené pouze pro ochranu dat, které je oddělené od hlavního úložiště virtuálního stroje.
Pro 3S.cz - Petr Šváb, Senior Systems Engineer, Veeam Software