Pozadí astronaut Brázda
Pozadí astronaut Brázda

Reklama

Často hledáte, jak…

Denní menu, Politika, Společnost

Lži, zatracené lži a statistika? Jak se manipuluje velkými čísly

Pravidelný výběr ze světových médií: Co víme o Nice • Nahoru a dolů • Statistice věřte. Ale ostražitě • Sheep View • Hvězdy dneška • Vrkající dinosauři

Statistika (ilustrační foto) • Autor: Alexander Baxevanis/Flickr (CC-BY 2.0)
Statistika (ilustrační foto) • Autor: Alexander Baxevanis/Flickr (CC-BY 2.0)

Co zatím víme o útocích v Nice, kde zatím neidentifikovaný útočník najel nákladním autem do davu slavícího pád Bastily:

  • zemřelo přinejmenším 84 lidí, další jsou vážně zraněni
  • podle některých zpráv byly zbraně, které měl útočník v kabině auta, falešné. To by nasvědčovalo tomu, že jednal sám. Policie ho při zásahu zastřelila
  • k činu se zatím nepříhlásila žádná teroristická skupin
  • podle zpráv byl v kabině nalezen průkaz totožnosti, který patřil 31letému Francouzi, obyvateli Nice, s dvojím, tuniským občanstvím
  • francouzský mimořádný stav bude prodloužen o další tři měsíce
    Útok v Nice • Autor: Profimedia, MAXPPP
    Útok v Nice • Autor: Profimedia, MAXPPP
    Útok v Nice • Autor: MAXPPP, Profimedia

A nyní k veselejším tématům. Před víc než dvaceti lety přednesl Kurt Vonnegut jen zpola vážně míněnou přednášku o “tvaru příběhů” - každý příběh má nějaký tvar. Když se postavám daří, když je příběh emotivně pozitivní, křivka směřuje nahoru. A naopak. Sám Vonnegut to svým posluchačům přiblížil příběhem “člověk spadne do díry, člověk vyleze z díry”. Je to samozřejmě hrubé zjednodušení, ale všichni tušíme, o čem je řeč.

Nuže, badatelé z Vermontské univerzity se rozhodli toto hrubé zjednodušení ještě více zjednodušit pomocí statistické a datové analýzy. Sebrali 1700 povídek a románů, a jejich slovům (respektive odstavcům) přiřadili “emocionální hodnotu” (k dispozici je i přesnější popis toho, jak postupovali). A pak už jen nechali pracovat procesor.

Výsledkem je zjištění, že literatura má v zásadě šest tvarů.

  • stále nahoru (Alenka v Říši divů)
  • stále dolů (Romeo a Julie)
  • pád a vzlet (případ s Vonnegutovým člověkem v díře)
  • vzlet a pád (mýtus o Ikarovi)
  • vzlet a pád a vzlet (Popelka)
  • pád a vzlet a pád (mýtus o Oidipovi)

Což není zase tak překvapivé. Čtenářské potěšení začíná, když se do předepsaných šablon snažíte napasovat jiné knihy. Co taková Anna Karenina? Je to spíš Romeo a Julie, nebo mýtus o Ikarovi? Možná je více oidipovská… těžko říct.

A co Vinnetou? A Poslední Mohykán? Joyceův Oddyseus? To je vlastně to nejzábavnější na tomto celém, vcelku banálním literárně-vědeckém datovém bádání.

Zůstaňme u statistiky. Britský viktoriánský premiér Benjamin Disraeli se údajně nechal jednou slyšet, že jsou tři druhy lží: lži, zatracené lži a statistika.

To samozřejmě není pravda. Sama statistika, jediný matematický obor, v němž neexistují výjimky, je v tom nevinně. Jsou to koneckonců čísla, a ač to bude znít banálně: sama čísla nelžou. Data se nedají zkroutit.

Jak ale argumentuje esej na serveru Aeon, v době posedlé “velkými daty” a důvěrou v kvantitativní měření, je namístě jiná ostražitost. Čísla vždycky popisují skutečnost. Ale ne vždycky takovou skutečnost, jakou nám jejich autoři říkají.

Vezměme si známou statistiku, kterou se měří úspěšnost a kvalita nemocnic. Ta je daná tím, kolik pacientů přežije třicet dní po opuštění nemocnice, tak se dlouhodobě měří, nazývá se “šance přežití”. S tímto datovým souborem je možné téměř nekonečně operovat a vytvářet zdánlivě podrobný a přesný, nezpochybňovaný popis reality - na jehož základě se třeba rozhodnete, kam odvézt své rodiče nebo děti.

Fajn. A proč ne 32? Proč ne 40? Proč ne 50? To je samozřejmě nepřekvapivý dotaz. Ale vede k tomu, co daná, respektovaná statistika měří: neměří šanci přežití po opuštění té konkrétní nemocnice. Měří něco výsekovějšího, a totiž “šanci, že přežijete třicet a právě třicet dní po jejím opuštění, a to, co se stane tři dny potom, už neměří, i když je to v praxi stejně relevantní”. To neznamená, že o nemocnicích taková data nevypovídají nic: neměli bychom ale přehlížet jejich zjednodušování.

Anebo jiný příklad: letecké společnosti se mohou v posledních letech chlubit naprosto skvostnými statistikami ohledně včasnosti příletů. Letecká doprava se prostě lepší, protože každým rokem víc a víc letů přiletí načas, anebo dokonce ještě dřív! Což by byla skvělá zpráva, pokud by ovšem aerolinky zároveň své lety v letovém řádu neplánovaly v průměru o čtvrtinu delší, než je jejich skutečné trvání. Pořádnou rezervu mají i včasné přílety.

To už je pochopitelně za hranou manipulace. Poučení v době datové a statistické ale z toho plyne: věřte statistikám. A taky vždycky mějte na paměti, kdo vám ji předkládá a jak ji vyrobil.

Co se týče mapování a práce s terénem, obzvláště inovativní jsou obyvatelé krajů, kde byste to čekali méně než jinde. To proto, že všechno inovativní se děje buď v Kanadě, nebo v Dánsku nebo v Jižní Koreji, samozřejmě. Nedávno toto menu informovalo o tom, že Mongolsko opouští starý systém adres a místo toho oficiálně využívá aplikaci, která svět dělí na čtverečky, ke kterému přiřazuje unikátní kombinace tří slov.

Nyní se obyvatelé Faerských ostrovů orginálně vypořádali s vlastní touhou mít fotograficky zmapované své souostroví, a zároveň s vlastní pohodlností, neboť Faery nejsou zrovna dvakrát příjemné místo k nekonečným vandrům po krajině s kamerou.

Takže zaangažovali ovce (poměr lidé:ovce na ostrovech je 5:8), na těla jim připevnili nahrávací zařízení - a unikátní Google Sheep View je na světě.

Chybí světovému sportu vzory? Těžko říct. Cristiano Ronaldo to asi nebude, Lionel Messi soudem potvrzeně šidí na daních. Není ale všechno ztraceno: jsou tu tenisové hvězdy Serena Williams a Andy Murray. A tady je důvod, proč jsou výjimeční nejen na kurtu.

Vědci zjistili z kosterních pozůstatků, že dinosauři pravděpodobně monumentálně neřvali. Spíš trochu obhrouble vrkali.

Video: Navzdory dobrým zprávám o ozonové díře se Grónsku nedaří netát.

Kulturní tip: Autorský film Jana Němce Noční hovory s matkou, oceněný na festivalu v Locarnu. ČT art, 21:10.

Pokud jste v článku našli chybu, napište nám prosím na [email protected].