Hrozí českým firmám datový kolaps?

2. 11. 2009. (redaktor: Milan Loucký, zdroj: )
Ročně se rozroste množství dat na firemních discích až o 60 procent. Příští rok se bude celosvětový objem elektronicky uchovávaných informací rovnat sloupci knih, od Slunce na Pluto a zpět. Až 90 procent záložních dat však firmy ukládají zbytečně.

Pokud bobtnající data firmy nedostanou pod kontrolu, mohou o cenné informace přijít. Řešením je takzvaná deduplikace dat, která umí „zhustit data“ tak, že se žádná informace na disku zbytečně neopakuje.

Tuzemské firmy se začínají utápět ve velkém množství elektronických dat, vyplývá z analýzy technologických společností EMC a S&T CZ. Nejen velké firmy, ale i ty menší se začínají pomalu ztrácet v datech, která za léta provozu nashromáždily. Průměrná firma o 50 zaměstnancích ročně vyprodukuje 2 TB dat, což představuje zhruba 40 GB dat na uživatele, tvrdí společnost S&T CZ. Podle analytiků společnosti IDC se objem ukládaných digitálních informací každé čtyři roky zpětinásobí. Stále častější otázkou proto je: Kam všechna ta data ukládat a jak je efektivně zálohovat?

Ve firemním sektoru vzroste množství dat meziročně o 40 až 60 procent, tvrdí odborníci na zálohování dat ze společnosti EMC. Nejvíce prostoru na discích zabírá obrazová dokumentace a audiovizuální data, kterých přibývá kvůli postupné digitalizaci veškerých dat – od smluv až například po nahrávky telefonních hovorů se zákazníky. Další digitalizace tempo růstu objemu dat ještě urychlí.

Klíčové informace se mohou v záplavě dat ztratit

Pokud firmy nezačnou ukládání a zálohování dat systematicky řešit, dnes uložená data nemusí být za několik let, či dokonce měsíců dostupná. Případně firmy budou muset vynakládat desítky tisíc korun na stále nová zejména zálohovací média. Rizika ztráty dat se přitom nezbaví, spíše naopak.

Až 90 procent záložních dat ukládají firmy zbytečně

Lékem na záplavu dat je odstranění duplicitních, tedy nadbytečných kopií dat – provést takzvanou deduplikaci dat. Běžně jde o soubory či části souborů uložené na disku vícekrát – například kvůli chaosu ve firemní síti či nevhodnému způsobu zálohování dat. Může se tedy stát, že až 90 procent dat je duplicitních.

Avšak ani ti, kdo zálohují data pokročilými metodami (například uchovávají jen změněné soubory), se nechovají dostatečně úsporně. I tady je možnost mít až 40 procent dat duplicitně uložených. V deduplikaci dat je proto možné jít ještě o jednu úroveň výše a zbavit se kopií dokonce na úrovni částí jednotlivých souborů.

Data totiž zbytečně „nafukují“ nikoli nadbytečné kopie souborů, ale kopie jednotlivých částí souborů – číslicových bloků –, které se v souborech opakují.

Touto metodou lze „zhustit data“ na zálohovací média tak, že žádné informace se na disku zbytečně neopakují. „Vyspělou deduplikací se nám podařilo zmenšit objem zálohy MPEG videa, které je samo o sobě již velmi úsporné, o dalších 20 procent,“ popsal možnosti deduplikace dat Vladimír Kyša, odborník na zálohování dat ze společnosti EMC.

OBJEM DAT DRAMATICKY ROSTE KAŽDÝ ROK

• Nároky na uložení velkého množství dat stoupají každým rokem. V roce 2006 činilo podle studie IDC množství ve světě vytvořených a replikovaných informací 161 exabytů (161 miliard gigabytů).

• To je třikrát více než všechny knihy, které byly kdy napsány. Ještě lépe si lze toto množství informací představit jako dvanáct komínků knih dosahujících ze Země na Slunce.

• Do roku 2010 bude toto množství šestinásobné. Při použití analogie s knihami by komínek knih sahal od Slunce až na Pluto a zpět. (zdroj: studie IDC).

  • Pro tuto zprávu byly využity informace ze studie analytické společnosti IDC The Expanding Digital Universe, kterou sponzorovala společnost EMC a naleznete ji zde.