Řekni, kde ta data jsou, co se s nimi mohlo stát...?
Ať už se nám to líbí nebo ne, světu dnes vládnou data. Data si můžeme představit jako nejrůznější informace v roztodivných podobách. Může jít o vaši soukromou fotografii, o textový dokument, webovou stránku, email, video, ale také třeba o trendy vývoje cen na burze, předpověď počasí, dopravní situaci na dálnici D1, obsazenost parkoviště u nákupního centra, firemní obchodní strategii, data letového provozu, elektronickou třídní knihu a další a další... Je to nepředstavitelné množství informací, které nějakým způsobem zaznamenáváme, ukládáme, vyhodnocujeme... A právě o datech a souvisejících službách bude i náš rozhovor s panem Jiřím Dvořákem, odborníkem z datového centra firmy COOLHOUSING, s. r. o., která sídlí v Praze na Vinohradech.
zpět na začátek1. Data a cloudy
V dnešní době se hodně věcí „točí“ kolem uskladnění dat a jejich následné dostupnosti. Všechna ta data z chytrých telefonů, tabletů, notebooků, ... většinou končí v nějakém „cloudovém úložišti“. „Cloud“ (čti „klaud“) je skoro takové novodobé zaklínadlo. Jak a kde jsou všechna ta naše data vlastně uložena?
Data jako taková jsou samozřejmě uložena na nějakém datovém nosiči. Používané označení cloud je hodně vágní, všichni ho sice skloňují, ale málokdo vám vysvětlí, co to vlastně je. Když se dnes podíváme třeba na online obchody, tak vám všichni budou tvrdit, že jsou v cloudu. Nakonec, ona i jakási definice cloudu je hodně „volná“. Já vnímám cloud jako soubor technologií pro ukládání dat, který nesmí být závislý na jednom místě. Musí být tedy minimálně ve dvou různých lokalitách a přitom musí splňovat podmínku plné zastupitelnosti. Uložená data musí být uživatelům stále dostupná na všech zařízeních napříč platformami a i když dojde k chybě v jedné z lokalit, uživatel to nepozná. Přitom různých typů zařízení je dnes celá řada: počítače, mobilní telefony, tablety, chytré hodinky, …, ale také např. zařízení chytré domácnosti, internetu věcí (IoT). Podobně pak s operačními systémy: MS Windows, macOS, Linux, Android, … Skutečný cloud musí všechna tato různorodá zařízení nativně podporovat. Pak jde o systém, který si zaslouží označení „cloud“.
Měl byste nějaký příklad, co se běžně jako cloud označuje, a přitom předchozím požadavkům nevyhoví?
Magické zaklínadlo „cloud“ se dnes někdy používá ihned, jak začneme hovořit o virtualizaci serverů. Když začneme pracovat s více virtuálními servery a umístíme je do dvou datových center, můžeme mít pocit, že pracujeme v cloudu. Co se ale stane, když budeme aktualizovat server A a ten se stane nedostupný? Existuje plnohodnotná zástupnost serverů A a B? Převezme jeho roli server B? Budou všechna data dostupná? Pozná uživatel, že se něco děje? Virtualizace sama o sobě neznamená, že provozuji cloud. A právě to se často zaměňuje.
A máme tedy v našem dosahu nějaký skutečný cloud?
Samozřejmě. Pravděpodobně využíváte služby Googlu nebo Microsoftu. Jejich on-line datová úložiště (např. Google Disc, OneDrive, Office365) naši definici cloudu splňují. Zde se dá skutečně hovořit o cloudu.
Vaše společnost provozuje datové centrum. Má to něco společného se zmiňovanými „cloudy“?
Datové centrum je v tomto případě základ. Potřebujete nějaké zázemí, kam umístíte technologie, které vám umožní cloud vytvořit. Představte si, že potřebujete virtualizovat pět serverů. Vezmete potřebnou technologii a umístíte ji v našem datacentru. Následně vezmete tu samou technologii a odvezete ji do datového centra ve Frankfurtu. Pak budete potřebovat technologii tzv. hypervizora, pomocí kterého si cloud vytvoříte a nastavíte. A výsledek? Pokud budou nedostupné vaše servery ve Frankfurtu, uživatel nic nepozná, protože servery v Praze jsou dostupné. A v případě potřeby to samozřejmě bude fungovat i přesně naopak. Řada našich zákazníků právě takováto řešení provozuje.
zpět na začátek2. Služby datového centra
Jaké služby ve svém datovém centru nabízíte? Na co se specializujete?
Naše poskytované služby hezky demonstruje historický vývoj Coolhousingu. Když Coohousing začínal, tak poskytoval především prostory. To obnáší nejen vlastní prostor pro umístění serveru, ale také zálohované napájení (baterie, diesel agregát – podívejte se na video názorně ukazující průběh výpadku a obnovení napájení datového centra), stabilní teplotu a samozřejmě konektivitu do internetu. To, co jsem popsal, je služba „serverhostingu“. Zákazník si donese svůj server a umístí ho u nás.
Ale asi ne každý hned chce pořizovat svůj vlastní server...
Přesně tak. A tím se dostáváme ke službě označované jako „dedikovaný server“. Zákazník chce provozovat svůj server, ale nemá v peněžence dost peněz na jeho koupi, a tak by uvítal možnost pronájmu serveru. My s ním zkonzultujeme jeho požadavky a sestavíme server o požadované konfiguraci. Zákazník tím získá k pronájmu server přesně takový, jaký potřebuje. Zároveň začne využívat služby serverhostingu, protože pronajímaný server musí být někde umístěn a připojen. Dedikovaný server je z tohoto pohledu jakási nástavba serverhostingu.
Přitom nemusí jít vždy jen o situaci, kdy zákazník na koupi serveru nemá prostředky. Jedná se třeba o krátkodobý projekt, po jehož ukončení by se na server už jen prášilo. Pak je zde dedikovaný server optimálním řešením. Pokud by nestačil jeden dedikovaný server, nabízíme i pronájem několika serverů ve službě „dedikovaná farma“.
Co když jsou mé požadavky tak malé, že bych mohl server s někým sdílet? Stačil by mi jen takový „kousek“ serveru. Budete mít nějakou službu i pro mě?
Řadě našich zákazníků skutečně stačí třeba jen jedno procesorové vlákno, 2 GB operační paměti a 30 GB diskového prostoru. Takový počítač stavět je v dnešní době nesmyslné. Tím se otevírá prostor pro virtualizaci. Jde o to, že vezmete jeden velmi výkonný server a jeho prostředky rozdělíte na takové malé samostatné „servříky“. Na každý takový „servřík“ můžete nainstalovat operační systém a samostatně ho provozovat. Na jednom fyzickém serveru tak provozujete několik virtuálních serverů. Jeden server tak může sdílet třeba 40 různých uživatelů, kteří o sobě neví, navzájem se neovlivňují, ale přitom využívají prostředky jednoho fyzického serveru. A to je služba „VPS hosting“. Výhodou VPS hostingu je nejen cena, ale také možnost „růstu“. Pokud zákazník zjistí, že potřebuje větší výkon, více prostoru, může přejít na výkonnější VPS hosting a když ani to časem nestačí, tak může nakonec přejít třeba na již zmíněný dedikovaný server.
Jaký je rozdíl vašeho řešení oproti službám, které nabízí Google, Microsoft nebo třeba Amazon? Můžete je stručně srovnat a vysvětlit rozdíly?
My jako datacentrum poskytujeme zákazníkovi prostory a technologie (IaaS, infrastruktura jako služba), pomocí kterých může realizovat svůj projekt. Dá se říct, že náš zákazník si může v podstatě dělat, co chce. Zákazník si tak instaluje operační systém a dále nějaké řešení, které bude využívat sám, nebo ho bude poskytovat nějaké třetí straně. Pokud si na server zákazník nainstaluje ownCloud, má k dispozici vlastní diskové úložiště, může k tomu přidat rozšíření o kalendář, kontakty atd. Tak si může vytvořit vlastní řešení, které bude poskytovat některé služby obdobné službám Googlu nebo Microsoftu. Ale tyto služby si sám provozuje na svém serveru, spravuje si je samostatně, jednoduše řečeno, musí se o server starat.
Další možností jsou služby SaaS (software jako služba). To mohou být např. služby webhostingu. Může to ale být i účetní software. Zákazník se nechce zabývat instalací a aktualizací operačního systému, bezpečnostními nastaveními atd. Zákazník potřebuje pouze pronájem užívání určitého SW řešení, např. účetnictví Pohoda. A právě služby, které poskytuje např. Microsoft, jako OneDrive nebo aplikace v rámci Office365, Skype, …, fungují v tomto režimu. Jako uživatele mne nezajímá, co se děje na serverech, jaký je tam operační systém, kdy nebo co aktualizovat, …, pouze využívám určitou softwarovou službu, ať už zdarma, nebo za úplatu.
3. Datové centrum, školy a učitelé
Vezměme si modelový příklad školy. Jaké vaše služby může škola využívat?
V podstatě vše, co jsem zmiňoval. Záleží na tom, co konkrétně potřebujete řešit. My vám pomůžeme postavit řešení přesně podle vašich požadavků. Jako scénář do výuky si dovedu představit potřebu nějakého „pískoviště“, kde si mohou žáci „hrát“. Stačí jednoduchá služba VPS. Mohou si nainstalovat operační systém, např. Ubuntu, a následně se věnovat třeba problematice webových stránek, programovat v Pythonu, seznámit se se síťovým provozem, zabezpečením síťové komunikace (firewall, VPN, …) a spoustu dalšího. K serveru se, na rozdíl od počítače ve škole, žák dostane odkudkoli a kdykoli. Při nějaké chybě se přitom dá celý virtuál jednoduše a rychle obnovit do původního stavu. Co dál? Namísto budování klimatizované serverovny a pořizování drahého serveru může být pro školy alternativou třeba právě služba dedikovaného serveru. Školy by také možná mohlo zajímat hostování určité aplikace – a nemusí to být pouze zmiňované účetnictví.
A co v případě učitele jako jednotlivce? Kdy má smysl využívat vašich služeb a kdy bude lepší zůstat u velkých hráčů typu Google s jeho službami? Třeba takové sdílení materiálů s žáky?
Pokud má učitel potřebu sdílení materiálů s žáky, tak asi nejjednodušší cestou je využít některé z hotových řešení jako OneDrive, Google Disc nebo Dropbox. Za Coolhousing takovou službu nenabízíme. Ono by to sice teoreticky šlo v rámci SaaS, ale cenově bychom byli někde jinde než v případě Googlu, který bude k těmto účelům stačit i ve variantě zdarma.
Napadá mě ještě bezpečnost dat. Nebyl by tady prostor pro nějaké jiné řešení než Google a jemu podobní?
Když řešíme se zákazníky datová úložiště, tak jedním z důvodů, proč nevolí taková ta velká hotová řešení, je právě bezpečnost. Ať už je to potřeba vědět, kde jsou data fyzicky uložena, nebo je to určitá nedůvěra a potřeba mít citlivá data, jako třeba biometrická data svých zákazníků, pouze pod svojí kontrolou. Pak to samozřejmě začne dávat smysl, ale pro běžného učitele to jistě nebude ten správný důvod. I když, třeba v souvislosti s GDPR bychom asi nějaký důvod našli. V rámci GDPR např. nesmí určitá data opustit Evropskou unii a to se službami Googlu nebo Microsoftu asi těžko zajistíte, protože jejich datacentra jsou rozložena napříč celým světem. V rámci určitého projektu pak může být nejjednodušší, když budete moci uvést, že data budou po celou dobu trvání projektu uložena na adrese Vinohradská 190, Praha.
Stále více se zdůrazňuje problematika bezpečnosti dat. Co ale tato „bezpečnost“ prakticky znamená na úrovni datového centra? Jak data svých zákazníků zabezpečujete?
Můžeme se bavit o dvou úrovních, o fyzické a virtuální. Ta fyzická je poměrně jednoduchá. Je to zabezpečení prostor – stálý monitoring prostor, kontrolovaný přístup, zabezpečení před živelnými katastrofami. Virtuální bezpečnost je komplikovanější. Poskytujeme konektivitu do internetu, takže musíme zabezpečit bezpečné připojení a dovést ho v nezměněné podobě skrze infrastrukturu Coolhousingu k zákazníkovi, resp. k zařízení zákazníka. Jakmile jsme u zařízení zákazníka, tak od té chvíle hraje roli zabezpečení koncového zařízení. Není to podmínkou, typicky je to však na zákazníkovi. Opakujícím se nešvarem jsou například slabá hesla. Problémem ale může být i špatně zkonfigurovaná zcela legitimní služba, jako je například DNS server zákazníka, který je zneužitelný k DDoS útoku. Tomu se snažíme předcházet aktivním monitoringem provozu, a to nejen příchozího, ale i odchozího.
zpět na začátek4. Co je to ten DDoS útok?
Zmínil jste DDoS útoky. V médiích se čas od času objevuje zpráva o DDoS útoku a vyřazení nějakého serveru, typicky s nějakou významnou webovou prezentací či síťovou službou. Co to je DDoS útok a jak vlastně takový útok probíhá?
Principem útoku je generování takového síťového provozu, který se zdá být legitimní, ale ve skutečnosti není. Tyto útoky se dnes bohužel často používají k vydírání nebo v rámci konkurenčního boje třeba mezi e-shopy, často před Vánocemi. Představme si situaci, kdy máme určitý e-shop a najednou je spousta webových návštěvníků, kteří si chtějí zobrazit jeho titulní stránku. Náš e-shop je postaven tak, že je schopen obsloužit, dejme tomu, 10 000 zákazníků za minutu. Najednou ale přichází milion požadavků za minutu. Ve skutečnosti je to uměle vygenerovaný provoz, nejde o skutečné zákazníky, to ale server neví. Dopadne to tak, že e-shop takovou návštěvnost nezvládne a celý web se jeví jako nedostupný. A zatímco má administrátor takového webu plné ruce práce s tím, jak zajistit opětovnou dostupnost e-shopu, zákazníci se přesunou na jiný e-shop, kde je požadované zboží k dispozici, i když třeba o 10–20 Kč dráž. Takový útok může běžet hodiny, dny, ale i týdny.
Kde se při DDoS útoku najednou vezme takové množství návštěvníků? To musí mít útočník tolik počítačů?
Hodně počítačů mít musí, ale nemusí je vlastnit. V této souvislosti se setkáváme s pojmem botnet. To je síť vytvořená z infikovaných počítačů, třeba i z vašeho. Tím se dostáváme k problematice zabezpečení domácích počítačů. Stačí kliknutí na zdánlivě nevinnou přílohu v emailu a můžete „chytit“ virus, který nedělá nic jiného, než že umožní připojení vašeho počítače do botnetu. Pak už stačí jen instrukce od majitele botnetu: „Začni útočit na adresu...“, a váš počítač je rázem součástí DDoS útoku.
Máte s DDoS útoky nějaké vlastní zkušenosti? Dá se proti těmto útokům nějak efektivně bránit?
Bohužel, úplně zabránit takovému útoku nelze. Lze ho ale jistým způsobem zmírnit. Služby AntiDDoS fungují většinou tak, že monitorují provoz a pokud se vyskytne např. mnoho požadavků z jedné IP adresy v rychlém sledu za sebou nebo se opakuje určitý pravidelný scénář (1000 požadavků z jedné IP adresy a následně několik sekund pauza a opět 1000 požadavků), tak se můžete rozhodnout, zda takovou IP adresu/počítač blokovat. Takovou technologií v našem datacentru disponujeme a aktivně ji využíváme, a to v obou směrech (monitorujeme to, co k nám přichází, i to, co od nás odchází). Využíváme přitom několik různých řešení, která kombinujeme.
zpět na začátek5. Datové centrum vs. telehouse
Četl jsem, že jste také telehouse. Co to znamená?
Telehouse dokáže nabízet služby napříč celým spektrem IT. Máme vlastní prostory, ve kterých můžeme poskytovat komplexní služby. Nejlépe to můžeme demonstrovat na případu zákazníka, který u nás v hostingu bude chtít provozovat nejen svůj server, ale bude také chtít optické propojení mezi serverem a kanceláří a k tomu ještě potřebuje na střechu instalovat parabolu pro příjem satelitního signálu. Všechno toto jsme schopni zajistit bez nějakého třetího prostředníka.
zpět na začátek6. Vývoj, trendy, situace...
Jistě velice bedlivě sledujete vývoj v oblasti IT a uchovávání dat. Jaké trendy můžeme v této oblasti v příštích letech očekávat?
Asi nemusím zmiňovat, že kapacita disků se stále zvyšuje a ceny na trhu přitom klesají. SSD disky jsou finančně dostupnější a jejich kapacity rostou. V serverech se nasazují až 8 TB SSD disky. To je sice ještě stále drahé, ale jde to. V případě klasických HDD do serverů dáváme hned několik 10 TB disků. Můžeme očekávat, že i nadále budou disky stále větší, a přitom levnější.
Další oblast, která se rozvíjí, jsou NAS úložiště s přidanými službami. Například firma Synology nabízí NAS řešení, ale navíc vám k tomu nabízí zálohu dat z vašeho NAS do Synology cloudu. No a poslední věc, kterou bych chtěl uvést, je virtualizace datových úložišť, čímž se dostáváme na začátek našeho rozhovoru. Virtualizovaná datová úložiště mají „nehorázně“ velkou kapacitu a mohou být rozložena napříč celým světem.
Uchovávání dat je jedna věc. Druhá, úzce spjatá, je konektivita. Jak to vidíte na poli datových přenosů? Co nás čeká? Budeme komunikovat a přenášet data rychleji a spolehlivěji? Jaké technologie se využívají dnes a co nás v blízké budoucnosti asi čeká?
Problematika konektivity je přece jen mediálně více známá. V rámci EU musí být ideálně internet v každé domácnosti a přitom dostatečně rychlý (pravidla EU pro otevřený internet). Souvisí to s požadovaným nárokem na informace v rámci EU, takže se o tom v médiích dosti mluví. Pokud pomineme 5G a 6G sítě, tak fyzicky jsou kabely natažené a pokud se bavíme o zrychlování, omezuje nás fyzika. Otázkou tedy je, jak do určitého frekvenčního pásma dostat více dat. Řešením jsou například efektivnější kodeky pro kompresi dat vedoucí ve výsledku k menšímu datovému toku. Vše se zde podřizuje slovíčku „efektivita“. Budeme tedy více komprimovat, komunikovat více kanály, vyvíjet lepší kontrolní algoritmy, …
Na závěr si dovolím otázku na nedávnou a stále živou kontroverzní kauzu Huawei? Jak to celé vnímáte?
Na to je těžké něco říkat. Kolem Huawei vznikl velký mediální humbuk a je otázkou, zda v tom není více politika než cokoli jiného. To, co se diskutuje, může teoreticky platit o každé značce. Žádné jednoznačné důkazy nejsou, alespoň jsem na ně nikde veřejně nenarazil, a vše je na úrovni domněnek a spekulací. Pokud by existoval nějaký důkaz, bylo by to samozřejmě jiné. Co se týká mobilních telefonů, tak já osobně Huawei nevlastním, ale pokud bude mít lepší parametry než moje Lenovo, tak si ho klidně koupím. Čínské sledování mě určitě neznepokojuje. Myslím, že je to kauza, která zbytečně straší lidi a ve výsledku nikomu neprospívá.
Děkuji za rozhovor. Ať se vám v Coolhousingu daří posílat data bezproblémově a rychle!
Tomáš Feltl
FELTL, Tomáš. Řekni, kde ta data jsou, co se s nimi mohlo stát...?. e-Mole: časopis o výuce nejen s digitálními technologiemi [online]. 2019 (10/1). Vydáno: 1. 10. 2019. vyd. Tomáš Feltl – TFSoft, 2019. [cit. datum citování]. ISSN 2336-5714. Dostupné z: https://www.e-mole.cz/clanek/rekni-kde-ta-data-jsou-co-se-s-nimi-mohlo-stat