Co umějí Big Data? Třeba pošlou Formuli 1 do boxů nebo poradí fotbalistům

  • 17
Červená světla při závodě Velké ceny Formule 1 zhasínají a Jenson Button startuje do závodu. V tomto okamžiku začne do sídla týmu McLaren-Mercedes ve Wokingu plynout obrovské množství dat. V každém kole to může být až 50 MB a závodní inženýři je mohou v grafické podobě okamžitě analyzovat.

Během jediného závodu tak může auto vygenerovat gigabyty dat. Ta se přitom nevyhodnocují až po závodě, ale v reálném čase. Právě díky takto získaným výsledkům se tým může rozhodnout pro zastávku v boxech o několik kol dříve, než bylo plánováno, nebo třeba pro změnu strategie a nasazení jiné sady pneumatik. Jak přesně tyto analýzy vypadají a jaká všechna data přesně sledují, závodní týmy samozřejmě tají.

Big Data

Pojmem "velká data" se rozumí pokročilá analýza ohromného objemu údajů, které by dříve vůbec nebylo možné zpracovat.

To je možné teprve díky rychlejším počítačům, levnému úložnému prostoru a novým softwarovým nástrojům.

„Závodění je závislé na technologiích. Díky nim můžeme dělat během závodu informovaná rozhodnutí, která stojí na skutečných datech. Vlastně tak dostáváme šanci změnit původní rozhodnutí,“ říká Jonathan Neale, ředitel McLaren Racing.

Poznejte nejen formuli

O fenoménu Big Data se hodně mluví, ale málokdo si pod tím umí něco konkrétního představit. Podle odhadů analytické firmy IDC překročil celkový objem dat umístěných v databázích v roce 2013 šest bilionů terabytů (1 TB = 1 099 511 627 776 bytů). Donedávna zůstávala tato data ležet ladem, protože nebyl k dispozici dostatečný výkon pro jejich zpracování. Nárůst výkonu počítačů a zejména pokles cen rychlých flash pamětí však situaci změnil.

Otevřel se prostor pro tzv. in-memory databáze. Ty už pro ukládání velkých objemů dat nepoužívají disková pole s pomalým přístupem, ale ukládají je přímo do paměti serveru. Díky tomu je možné zpracovávat i obrovské objemy dat v reálném čase a okamžitě je vizualizovat na obrazovce.

Závodní tým McLaren-Mercedes má díky technologickému partnerství se společností SAP k dispozici in-memory platformu HANA. A právě s jejím využitím mohou závodní inženýři upravovat strategii a klidně i na dálku nastavit některé parametry závodního vozu. I když o výsledku v závodě pořád rozhoduje především umění pilota, bez pomoci technologií by dnešní závodníci měli pozici mnohem těžší.

Big Data na vlastní oči

Analýzu hráčů německé reprezentace můžete vidět na vlastní oči. A dokonce i kamion, který jinak převáží vozy Formule 1. K vidění v něm bude samozřejmě i celá řada dalších příkladů, jak mohou Big Data posloužit třeba i vaší firmě.

Do Česka totiž dorazí SAP Big Data Truck. Veřejnost jej bude moci navštívit ve středu 15. 10. 2014 v Dejvicích před Fakultou informačních technologií ČVUT v Praze (Thákurova 9, 160 00 Praha 6) od 10 do 17 hodin nebo 16. 10. 2014 u stanice metra Budějovická od 15 do 17 hodin.

Vice informací získáte na této adrese.

Uvnitř náklaďáku plného velkých dat - SAP Big Data truck

SAP Big Data truck

Ovšem analýzy velkých dat nemusí pomáhat jen v tak vysoce technologickém prostředí, jakým je Formule 1. I když v běžném automobilu je senzorů nepoměrně méně než ve formuli, například ve spojení s GPS a GSM modulem dokážou poskytnout velké množství užitečných informací. Dopravní firmy tak mohou například prostřednictvím svých automobilů sledovat provoz na silnicích, a přizpůsobit tak například trasy řidičům, aby se dostali do cíle rychleji a s nižšími náklady.

Asi nikoho nepřekvapí, že senzory jsou dnes i v silnicích, semaforech a dalších dopravních prvcích. I tady tak mohou Big Data najít uplatnění a ostatně se to už často děje. Dopravní centra měst mohou na základě jejich analýzy například upravit preference na jednotlivých semaforech, aby byla doprava ve městě plynulejší. Informace z celého města se totiž mohou v reálném čase zobrazovat v grafické podobě, a obsluha tak může okamžitě reagovat na nenadálé situace.

Budou vás špehovat, ale ne tak úplně

Ale nemusíte být ani řidičem, aby vám Big Data mohla zpříjemnit život. Napadlo vás třeba, co by o vás mohl vědět automat, ve kterém si kupujete kolu? Možná to zní jako sci-fi, ale nemusí to tak být. Čím dál častěji se totiž budeme potkávat s automaty, které budou připojeny nejen k elektřině, ale také k internetu. Třeba proto, abychom v nich mohli platit kartou nebo mobilem pomocí technologie NFC (Near Field Communication).

A v tu chvíli už může automat provozovateli nejen posílat informace o platebních transakcích, ale třeba i o tom, co si zákazníci kupují. Přitom kouzlo velkých dat je v tom, že nemusí nutně znát identitu konkrétního zákazníka, ale může analyzovat chování všech najednou.

Navrhněte a vyhrajte

Napište nám konkrétní příklad, kde by mohla Big Data zlepšit váš život nebo život ve vašem městě. Jak by to mělo fungovat?

1. cena tablet Lenovo IdeaPad Yoga 10 Full HD,
2. cena tablet Lenovo IdeaPad Yoga 8,
3. smartphone Lenovo A536

Pište nám na soutěž@technet.cz.

Pravidla soutěže

Vyhrávají nejvtipnější, nejzajímavější a nejkomplexnější odpovědi. Soutěž končí 15.října 2014 ve 23:59.

Tablety pro komunikaci, práci i zábavu

Výsledky soutěže:

Vážení čtenáři,

z mnoha došlých nápadů a návrhů se nám těžko vybíralo, ale nakonec nejlépe splnil podmínky zadání soutěžící s e-mailem začínajícím na jachymcz.

Druhé místo obsadil čtenář s e-mailem začínajícím na fsykala.

Třetí místo patří soutěžícímu, jehož e-mail začíná na vodnikk.

Všem účastníkům děkujeme a omlouváme se za zpoždění.

Big Data tak mohou být velmi prospěšná obchodníkům, kteří budou moci účiněji nabízet zboží. Pro některé zákazníky pak může být výhodou, že jim stroj ulehčí rozhodování. Zůstaneme-li však u nápojového automatu, bude takové „ulehčení“ pouze marketingovým tahem založeným na „většinovém vkusu a typu chování v daném období na daném místě“, pokud automat zároveň neanalyzuje i další vstupní faktory ovlivňující nákup nápoje, jako jsou například venkovní teplota a počasí (ledový, studený, nebo teplý nápoj), fyzický stav zákazníka (zda například právě doběhl, a potřebuje tudíž doplnit minerály a povzbudit kofeinem) atd.

Užijte si fotbal jinak

V létě během mistrovství světa ve fotbale jste si na Technet.cz mohli přečíst o tom, jak pomáhají Big Data fotbalistům Německa vylepšit hru. Ale produkty jako SAP Match Insight nemusí sloužit jen týmům k vylepšení tréninku. Možná až půjdete v budoucnu na fotbal, hokej či jiný sport, bude zážitek z utkání úplně jiný. Dnes si vlastně musíme vybrat mezi atmosférou na stadionu, a informacemi, které dostanete navíc při sledování přímého přenosu.

První vlaštovkou může být řešení na MetLife Stadium v New Yorku, kde hrají zápasy týmy NFL New York Jets a New York Football Giants. Majitelé stadionu ve spolupráci s firmami SAP, EMC a operátorem Verizon využívají Big Data k automatické navigaci aut návštěvníků na volná parkovací místa a následně tomu přizpůsobují i kapacitu vstupních bran.

Fanoušci tak netráví čas ve frontách, jak je znají tuzemští návštěvníci například z pražských arén, kde ještě po začátku programu stojí značná část diváků venku. V New Yorku se všech 82 500 návštěvníků na své místo dostane pohodlně a rychle. Do budoucna se také počítá s tím, že na chytrých telefonech budou moci diváci kromě údajů o utkání a slevových kuponů do obchodů na stadionech, sledovat i aktuální informace přímo ze hry. V reálném čase uvidí statistiky z utkání, podívají se, jak který hráč držel míč, jak se pohyboval po hřišti nebo se dokonce podívají na poslední akci.

Co jsou to velká data?

Dirk deRoos, který je analytickým odborníkem IBM a poslední dva roky strávil vysvětlováním výhod analýzy velkých dat firmám i na konferencích definuje velká data „jako soubor informací, které nelze jednoduše zpracovat pomocí tradičních metod, jakými jsou třeba databáze nebo tabulkový procesor. U ohromných souborů dat je často obtížné tato data dobře vytěžit, zjistit, co se v nich vlastně skrývá. A podle mého názoru je teď velký přebytek dat, která neumíme analyzovat.“

Proč nelze analyzovat tato velká data již známými metodami?
Ten problém tkví ve třech oblastech.

  1. První je objem dat. Je nesmírně obtížné dělat okamžitou statistickou analýzu 500 terabajtů dat.
  2. Dalším může být rychlost, se kterou se na vás data hrnou a vy je potřebujete analyzovat v reálném čase. Když třeba počítače analyzují stovky kamer na letištích, musejí informace o hrozícím nebezpečí vyhodnotit okamžitě, aby taková informace měla nějaký význam. Hrnou se na vás tuny informací ze všech senzorů, ale ty informace nemá cenu ukládat, pokud je nedokážete velmi rychle zpracovávat a dát jim význam.
  3. Třetím problémem je komplexnost dat (v originále variety). Tradičně jsou počítače velmi dobré ve zpracování číselných dat a statistických analýzách. Proto tak snadno analyzují databáze nebo počítají průměry. Komplexní data jsou naopak přirozená řeč, obrazová data, různá analogová a nestrukturovaná data, která se velmi obtížně analyzují jednoduchými statistickými metodami.

Příklady použití velkých dat: doporučení i předpovědi

Analýza velkých dat zní dost abstraktně. Podívejme se na známé příklady použití velkých dat ke zvýšení zisku, predikci prodejů nebo mapování terénu. Společné mají jedno: před 20 lety by patřily do kategorie sci-fi.

  • Knihkupectví Amazon.com umí zákazníkům nabídnout knížky na základě toho, jaké tituly si koupili lidé s podobným vkusem. Tato doporučení jsou "šita na míru" právě díky ohromnému množství dat.
  • Vyhledávač Google zaznamenává každé stisknutí klávesy, když zadáváte hledaný výraz. Naučil se tedy časté překlepy, které lidé udělají a pak je po sobě opraví. Tak si vytváří ohromnou databázi obvyklých překlepů a vylepšuje celkové porozumění hledanému textu.
  • IBM na základě analýzy krátkých výkřiků na Twitteru během reklamní přestávky dokázala odhadnout, jaké tržby bude mít film, na který běžela upoutávka. Využili k tomu analýzu velkých dat i strojovou analýzu nálady (sentimentu).
  • Město Boston zjistilo, které ulice potřebují opravit díky aplikaci Street Bumb. Tisíce lidí si ji nainstalovaly do smartphonů s GPS a zabudované senzory pak měřily, které ulice mají nejvíce hrbolů. Město pak naneslo výsledky na mapu a opravilo cesty, kde lidé nejčastěji narážejí na hrboly a díry v silnici. Kritici však upozorňují, že opraveny byly jen ulice v bohatých čtvrtích, protože chudší lidé neměli smartphony.
  • Superpočítač Watson na základě paralelní analýzy ohromného množství dat a posuzování jejich relevance k tématu dokázal porazit člověka ve vědomostní hře Jeopardy! Nyní se Watson chystá do zdravotnictví, kde pomůže doporučit onkologickým pacientům léčbu na míru.

Doplněno: Výsledky soutěže najdete ve spodní části boxíku s jejím vyhlášením.

,

Sport v roce 2024

4. - 26. 5. Cyklistické Giro d´Italia
10. - 26. 5. MS v hokeji, Praha a Ostrava
26. 5. - 8. 6. Tenisové Roland Garros, Paříž