Záloha není archiv?
Lze zálohování sloučit s archivací, nebo jsou požadavky na tyto funkce tak odlišné, že záloha v klasickém slova smyslu nikdy nebude schopna zachytit potřeby pro archivaci dat?
Mezi zálohováním dat a archivací dat existuje několik klíčových rozdílů. Za prvé, zálohování dat zpravidla kopíruje data do médií pro obnovu, které mají sekvenční přístup, zatímco archivace dat obvykle přesune data do média s nižší úrovní náhodného přístupu a současně zanechává odkaz. Mimo to u zálohování uchováváme více kopií chráněných dat, zatímco archivy si uchovávají jednu kopii, která je uložena buď pomocí deduplikace nebo technologie CAS (Content Addressable Storage). Dalším důležitým rozdílem je, že archivace dat poskytuje možnosti indexování a vyhledávání v souborech, zatímco zálohy dat nabízejí maximálně vyhledávání klíčových slov nad politikami. A zejména, zálohování dat je obecně určeno pro krátkodobé ukládání pro účely obnovy, na rozdíl od archivů dat, které jsou určeny pro dlouhodobé uchovávání zejména z legislativních důvodů.
Většina platforem pro archivaci dat podporuje deduplikaci, a to jak na úrovni bloků, tak na úrovni souborů, nebo umožňuje využívat CAS algoritmů. Až donedávna bylo jedinou možností jak dosáhnout těchto vlastností použít dedikovanou in-stream appliance pro deduplikaci dat a dedikovaná média pro uložení (např. Fujitsu ETERNUS CS). Nyní společnosti jako Commvault nebo Veritas nabízejí softwarové produkty pro deduplikaci dat bez omezení možností výběru koncového úložného média. Tato vlastnost softwaru odstraňuje paradigma, že zálohování potřebuje dedikovanou storage, resp. dedikovaná úložná média.
Dalším pokrokem v oblasti zálohování je implementace řízení životního cyklu dat. Na rozdíl od jednoduché expirace dat záloh založené na kombinaci stáří dat a typu úložného média většina zálohovacích softwarů dnes umožňuje přístupy založené na požadované úrovni služeb (SLA) a také kombinaci požadavků na RTO a RPO. Základní koncept spočívá v tom, že kritické aplikace mají své zálohy uložené na disku (rychlý přístup) a méně kritické aplikace mají své údaje uložené na nějakém typu sekvenčního média, typicky pásce. Zálohovací software nyní umožňuje migraci mezi vrstvami na základě stáří dat a potřeby přístupu k nim. Současně ovšem celý obraz zálohy migruje nebo vyprší během životního cyklu, takže granularita není srovnatelná s archivy (které spravují životní cykly na úrovni souborů).
Existuje několik zajímavých funkcí archivace dat, které se s největší pravděpodobností nikdy nebudou implementovat do prostředí pro zálohování dat jednoduše proto, že jejich účel je v rozporu se základním návrhem dobrého zálohovacího systému. Jednou z funkcí je schopnost vyhledávat a indexovat v souborech. Protože granularita záložních indexů se zastaví na úrovni souborů, systém zálohování nebude nikdy potřebovat indexovat na základě obsahu souboru.
Zatímco zálohování dat prošlo dlouhou cestou a přijalo několik klíčových rysů dobrého archivačního řešení, potřeby a požadavky stále nejsou stejné. Současně ale výrobci, jako například Commvault, vyvíjejí zálohovací a archivační funkce ruku v ruce, a umožňují pro využití obou řešení profitovat z jedné platformy s jedním management nástrojem.