Zavřít
Vstoupit Následujte nás

3S.cz

Odborná sekce

Definice a rotace záloh

27.02.2012, 12:38

Jedním z klíčových prvků každého zálohování dat je určení rotačního schématu tak, aby byla zaručena ochrana minimálně jeden den zpětně. Nejlepší rotační scéma médií je takové, které zaručí co možná nejdelší, nejrozsáhlejší a nejrůznorodější kopie podnikových dat.

Oproti Tape-A-Day schématu, například když přepisujeme data z předešlého dne zálohou následujícího dne, toto zálohování považujme za nejméně bezpečné a užitečné.

Zálohování dat a jejich následné uchování po dobu více než jednoho dne je nezbytné. Nicméně, náklady nebo čas potřebné pro každodenní plnou zálohu můžou být nepraktické, zvláště pak pro společnosti z větším množstvím podnikových dat. Mnoho uživatelů z toho důvodu provádí buď rozdílové nebo inkrementální zálohy po většinu pracovních dnů.
 
Typy záloh
Plná záloha (full backup) – u plné zálohy jsou zvolené soubory zazálohovány a současně je u nich odstraněn atribut Archive. Atribut slouží pro rozlišení již zazálohovaných a nezazálovaných dat. Při změně obsahu souboru je atribut Archive znovu nastaven. Plné zálohy jsou většinou předstupněm pro použití záloh typu Incremental a Differental, s jejichž pomocí je možné šetřit čas nutný k provedení zálohy. Pokud je pro zálohování použita plná záloha, pro obnovu původního stavu dat stačí pouze obnova této jediné zálohy.
 
Inkrementální záloha (incremental backup) – u zálohy typu icremental jsou zálohovány pouze soubory, u nichž je nastaven atribut Archive, přičemž tento atribut je u nich po zálohování odstraněn. Zálohují se tak pouze soubory, které byly změněny (či u kterých byl od poslední plné zálohy ručně nastaven atribut Archive). Záloha je podstatně kratší než u plné zálohy, proto se používá zpravidla pro zálohování během pracovního týdne. Ze zálohy typu Incremental nepostačuje pro obnovu stavu obnova pouze této zálohy. V případě havárie serveru nebo diskového pole je nutné nejprve obnovit poslední plnou zálohu a posléze v časovém sledu všechny zálohy typu Incremental od nejstarší až po nejnovější vytvořené v období po poslední plné záloze. Z toho vyplývá, že inkrementální zálohy jsou sice rychlejší na vytvoření, čas obnovy je však díky nutnosti obnovy z několika různých zálohovacích sad delší. Pravděpodobnost velké havárie však není tolik pravděpodobná, proto výhody inkrementálního zálohování určitě využijete.
 
Rozdílová záloha (differential backup) – u rozdílové zálohy jsou zálohovány pouze soubory, u nichž je nastaven atribut Archive, přičemž tento atribut u nich není po zazálohování odstraněn. Zálohují se tak pouze soubory, které byly změněny (či u nich byl od poslední plné zálohy ručně nastaven atribut Archive. Záloha je podstatně kratší než u typu full backup, proto ji lze podobně jako u inkrementální zálohy používat pro zálohování během pracovního týdne. Ze zálohy tytu differential také nepostačuje pro obnovu do původního stavu obnova pouze této zálohy. V případě havárie serveru či diskového pole je nutné nejprve obnovit poslední zálohu typu full backup a posléze v časovém sledu poslední zálohu typu Differential v období po poslední zálozetypu Full backup. Z toho vyplývá, že diferenciální (rozdílové) zálohy jsou z pohledu vytvoření srovnatelně rychlé jako inkrementální, čas obnovy je díky nutnosti obnovit pouze jedinou diferenciální zálohu kratší, přičemž zde je patrná závislost na tom, kolik nekompletních záloh od poslední plné zálohy proběhlo. První den po plné záloze je čas na zálohování u ikrementálního i diferentálního typou shodný, v průběhu dalších dnů narůstá čas pro zálohování diferenciální metodou, čas na obnovu se však relativně zkracuje.
 
Zda tedy jako doplněk plné zálohy zvolíte metodu zálohování inkrementální nebo diferenciální záleží jen na prostředí Vaší společnosti. V těchto případech je však lepší si nechat udělat analýzu a návrh politik od odborníků, aby se včas předešlo chybám ve špatně navržené politice zálohování, která může společnosti způsobit špatné vynaložení prostředků do oblasti storage. Po krátkém přiblížení dostupných typů záloh se můžeme pustit do stručného popisu nejpoužívanějších metod rotací pásek s použitím výše uvedených typů záloh.

Rotace pásek

Round Robin (schéma s jednou páskou pro každý den)
Nejjednodušší schéma rotace pásek získáme, když vyhradíme pro každý den pracovního týdne jednu pásku. Pásky jsou označeny (pondělí, úterý, středa, čtvrtek, pátek). Každý den je provedena na danou pásku plná záloha všech dat vyhrazených pro zálohování. Tato rotace umožňuje obnovu dat s maximálním posunem zpět – jeden týden. Schéma je vhodné pro použití v menších společnostech s využitím interní nebo externí páskové mechaniky a nebo s využitím zařízení NAS s vytvořenou VDL, (virtual disk library) která může sloužit jako primární úložiště dat. Toto řešení je vhodné také tam kde je možné provádět každý den plnou zálohu a časový posun o 1 týden zpět je dostačující.

Grandfather-Father-Son (GFS)

Mezi nejběžněji používané schémata zálohování patří metoda „Grandfather-Father-Son“ Toto schéma využívá denní (Son), týdení (Father) a měsíční (Grandfather) media sety. Čtyři media sety jsou označeny pro každodenní zálohu v pracovním týdnu (např. pondělí až čtvrtek). Na tyto media sety (označeny ve schematu GFS jako Son) pak probíhají inkrementální zálohy. Tyto media sety (Son) jsou opětovně přepisovány v dalším týdnu. Další skupinou čítající pět media setů, která je obsažena v zálohovacím schématu GFS jsou jsou media sety označeny jako Week 1, Week 2, atd. (Father). Viz obrázek:


Na tyto media sety (Father) probíhají každý týden plné zálohy, media sety ze setu Son nejsou použity a pro skupinu „Father“ je nastavena doba expirace jeden měsíc. Poté následuje jejich opětovný přepis. Finální media set „Grandfather“ se skládá ze 3 media setů (media set může být tvořen jak jednou páskou tak i několika páskami ) a je označen „Month 1, Month 2, Month 3, atd.“ Na tyto media sety pak probíhá opětovný zápis jednou za tři měsíce a více měsíců (záleží kolik media setů je vyčleněno pro skupinu „Grandfather“. U těchto media setů je nastavena expirace (tj. možnost dalšího přepisu) dle počtu media setů ve skupině Grandfather. Každý „medium set“ ze skupiny pásek (Son, Father a nebo Grandfather) je buď samostatná páska nebo skupina pásek. Což je závislé na velikosti zálohovaných dat. Celkový počet použitých media setů v zálohovacím schématu GFS je dvanáct. Z důvodů opotřebení pásek a z důvodů zachování delší historie (archivace) záloh je doporučeno media sety v daném časovém intervalu měnit za nové.
 
Tower of Hanoi (Hanojská věž)
Schéma Hanojské věže vychází z logické hry, které má svůj původ v Číně. Hra je postavena na přesunutí pěti kotoučů z jednoho kolíku na některý další, a to s minimálním početem tahů. Přitom hráč nikdy nesmí mít v ruce více než jeden kotouč a nikdy nesmí dát větší kotouč na menší. Je dokázáno, že nejmenší počet tahů je 31.
 

Metoda Hanojské věže využívá pro zálohování pět media setů:

  • Media set A je použit každý jiný den
  • Media set B je použit každý čtvrtý den
  • Media set C je použit každý osmý den
  • Media sety D a E jsou použity střídavě každý šestnáctý den
Naplánování schématu Tower of Hanoi je následující:
Záloha začíná na media set „A“ a pak následně pokračuje v každý jiný den. Další záloha probíhá na media set „B“ (ne však v den kdy proběhla záloha na media set „A“) a následně se opakuje každou čtvrtou zálohu. Media set „C“ začíná ne v den zálohy media setů „A“ a „B“ a opakuje se každou osmou zálohu. Pro média sety „D“ a „E“ je nastavena politika následovně. První záloha nezačíná v den zálohy media setu „A“, „B“ a nebo „C“ a opakuje se každou šestnáctou zálohu.
 
Předností tohoto schématu je především možnost přídání nového média setu a tím získání větší historie zálohy (obdobně jako u GFS). Častěji používané media sety obsahují novější kopie souborů, zatímco méně používané media sety obsahují starší verze souborů.

Toto schéma je celkem obtížné na manuální správu. Proto je pro toto schéma doporučeno používat zálohovací software s možností schedulingu celého procesu (např. NetVault 7.1) a hlavně za použití páskového autoloaderu (např. Tandberg, autoloader SLR140) nebo vhodnější řešení s více sloty a to páskové knihovny (např. ADIC Scalar 24, ADIC Scalar 100) pro dostatečný počet media setů zahrnující pásky pro zálohování, archivaci a disaster recovery řešení. Stejně jako schéma Grandfather-Father-Son umožňuje řešení Tower of Hanoi periodické vyjmutí media setu za účelem archivace.
 
 

Závěrem

Nynější trendy zálohování přináší navíc do zálohacích schémat využití primárních a sekundárních úložišť dat pro vyšší bezpečnost. Jako primární úložiště dat ve většině společností slouží zařízení NAS (Network Attached Storage) kam většinou probíhají zálohy v pracovním týdnu na disky a poté migrují na páskové mechaniky či páskové knihovny.

 
Při návrhu celého řešení je dobré vycházet z níže uvedených rovnic pro výpočet počtu potřebných pásek umoňující bezpečnou zálohu, archivaci dat a řešení Disaster recovery. O využití primárních úložišť postavených na zařízeních NAS (např. Iomega NAS p400/p800) a následné migraci dat na sekundární úložiště postavené na páskové technologii s využitím zálohovacích schémat si řekneme něco víc příště.

Kalkulace počtu pásek pro zálohování včetně archivace a Disaster Recovery:

Pásky dedikované pro zálohy
Xs = D * T * S * R + N
Xs = počet pásek potřebných pro zálohování na dobu jednoho roku
D = počet zálohovacích mechanik
T = počet pásek v media setu
S = počet media setů v zálohovacím schématu
R = počet rotací zalohovacího schématu za rok
 
Pásky dedikované pro archivaci
Xa = T * S * A
Xa = počet pásek potřebných pro archivaci
T = počet pásek potřebných pro kopii zálohy každého serveru
S = počet serverů
A = počet archivních setů za rok
 
Pásky dedikované pro Disaster Recovery
Xr = T * S * R
Xr = počet pásek potřebných pro recovery
T = počet pásek potřebných na Disaster Recovery zálohu jednoho serveru (viz archivace)
S = počet serverů (viz archivace)
R = počet požadovaných rotací disaster recovery za rok
 
Celková roční potřeba datových pásek
X = Xs + Xa + Xr + R X = celkový počet pásek potřebných po dobu jednoho roku
Xs = počet pásek potřebných pro zálohování na dobu jednoho roku
Xa = počet pásek potřebných pro archivaci
Xr = počet pásek potřebných pro recovery
R = přibližný počet pásek, které bude třeba nahradit novými