IDC Big Data
Tato výstižná definice zazněla hned v úvodní přednášce Thomase Vavry z IDC.
Objem informací vyroste od roku 2009 do roku 2020 podle výzkumů 44krát, avšak kapacita datových úložišť pouze 30krát a personální obsazení jen o faktor 1,4.
Podniky pracují s 80 % všech dat a podle průzkumů IDC v organizacích následně přistupuje k uloženým datům pouze k 15 % z nich, z toho k 65 % z těchto 15 % dat se přistoupí pouze jednou. Data neznamenají jen RDBMS (databázi), ale čím dál více nestrukturované informace, jako například údaje ze sociálních sítí nebo systémové logy.
Thomas Vavra také definoval pojem 4V jako Volume – objem, Variety – různorodost, Velocity – rychlost, Value – hodnota, a co přinášejí:
• zpracování dat v téměř reálním čase;
• ukládání většího množství dat a rostoucího rychleji než kdykoliv dříve;
• snižování nákladů – má vliv na prevenci systémových a výrobních chyb;
• generování příjmu – díky prevenci výpadku on-line úložišť.
CIO se s tím vším budou potýkat, včetně dalšího tlaku na snižování nákladů, a kromě toho se dostávat do potíží v oblasti správy podnikových dat a jejich vlastnictví.
Analýzy IDC přitom ukazují, že firmy, které jsou analyticky orientované a jsou schopny těžit z dat informace, jsou ve svých segmentech trhu konkurenceschopnější a mají více než dvojnásobnou pravděpodobnost, že svoje protějšky předčí.
Následovaly přednášky partnerů konference - NetApp, Alfresco, SAP, Microsoft a EMC. Nakonec vystoupil Mario Meir-Huber z IDC Austria s přednáškou na téma Velká data - mýty a fakta.