0:00
0:00
Civilizace19. 8. 20125 minut

Křemíkový žurnalista

Počítačem generované texty se již vyrovnají těm, které napsali lidé

66 R34 2012
Autor: Respekt

 

V roce 2009 předstoupila skupina studentů Medill School of Journalism, fakulty žurnalistiky americké Northwestern University, před komisi s prezentací své ročníkové práce. Do počítačového programu, který vznikl spoluprací studentů žurnalistiky a počítačového inženýrství, zadali data o odehraném baseballovém utkání. Během dvanácti vteřin se na obrazovce před zraky udivených univerzitních profesorů (a zástupců několika společností) objevil výsledek: novinový článek napsaný počítačovým programem, který nejen že podal barvitou zprávu o průběhu onoho utkání, ale také zabrousil do čtyřicetileté historie baseballové ligy, vybral nejvhodnější fotografii a nabídl chytlavý titulek.

↓ INZERCE

Dnes, po třech letech vývoje, umí počítačová inteligence zvaná Quill vytvořit ze zadaných dat článek za zhruba třicet vteřin. Trochu tedy zpomalila, v próze se ale zlepšila natolik, že jsou její texty, alespoň při určitých zadáních, nerozeznatelné od článků profesionálních novinářů.

Vítězství v pěti směnách

Počítače tak začínají pronikat do jedné z posledních oblastí lidské činnosti, kam dosud neměly přístup – do oblasti kreativity. Nápad zmíněných studentů nyní rozvíjí společnost Narrative Science sídlící v Chicagu. Umělá inteligence Quill dokáže pracovat s ohromným množstvím dat podobně, jako to dělá člověk, a psát podle nich texty, za které by se nemusel stydět žádný publicista, manažer nebo třeba finanční analytik.

Quill nejprve analyzuje výchozí údaje a zjistí, o jaká data jde, zda jsou to třeba sportovní výsledky nebo finanční zpráva. Testováním přednastavených pravidel (jaké jsou podmínky vítězství, co znamená gól, faul, vyloučení…) poté konstruuje ze zadání první datový obraz výsledného článku. V dalším kroku vstupují do hry šablony vytvořené žurnalisty, které počítači umožňují různé „úhly pohledu“ na hrubá data. Kdo vyhrál zápas? Bylo to v normální hrací době, nebo v nastaveném čase? Padlo abnormální množství gólů? Za co se vylučovalo? Měl někdo z hráčů obzvláště úspěšný den? Algoritmus přitom zvažuje i data z dalších databází, například jakou bilanci spolu měly tyto dva týmy loni nebo za posledních dvacet let, jaká je statistická šance na obrat série a podobně.

V druhé fázi využívá Quill toho, že se texty psané lidmi řídí určitými pravidly, a mají tedy předvídatelnou strukturu. Algoritmus se „dívá“ do slovníku, který mu rovněž připravili žurnalisté (a který má vždy specifický nádech i výrazivo dle aktuálního tématu), konstruuje věty a řadí je tak, aby vytvořily smysluplný článek.

Algoritmus se podařilo vyladit natolik, že se logické nesmysly ve výsledném textu objeví jen výjimečně. Společnost rozvíjí i kontrolní algoritmy, které mají postupně chyby odstranit. Výsledky jsou velmi zajímavé. Quill se může pochlubit třeba následující zprávou o baseballovém utkání středoškolských týmů: „Friona v pondělí doma podlehla týmu Boys Ranch 10:8 v pěti směnách, ačkoli zaznamenala sedm bezchybných odpalů a osm oběhů. Na pálce Frionu vedl Hunter Sundre, který proti nadhozu Boys Ranch uspěl dvakrát ze čtyř startů. Ve třetí směně Sundre dosáhl první mety a ve čtvrté třetí mety.“

Klidný analytik i rozzuřený makléř

Na rozdíl od prvního prototypu už dnes Quill dokáže produkovat mnohem širší spektrum textů, byť jde vždy o jednodušší články s předvídatelnou strukturou. Umí do přehledného textu zpracovat třeba burzovní i firemní výsledky nebo napsat oslavnou legendu o tom, jak konkrétní hráči počítačové hry World of Warcraft přemohli na své odpolední výpravě jednu z hlavních oblud. Dovede spolupracovat se sociálními sítěmi a psát krátké zprávy o tom, co si kdo myslí a jak na tento názor hledí ostatní, čímž se stává užitečným i pro internetový marketing. Dokonce přizpůsobí styl konkrétnímu zákazníkovi; můžete tak mít finanční zprávu, kterou by napsal klidný analytik, nebo její obdobu, již jakoby na celé kolo vykřičel burzovní obchodník.

Zatím Quill píše krátké finanční analýzy o různých obchodních společnostech pro magazín Forbes, krátké sportovní výsledky pro server BTN nebo měsíční zprávy o stavebním trhu na serveru builderonline.com. Když se ale před rokem novinář časopisu Wired zeptal ředitele společnosti Narrative Science Kristiana Hammonda na to, kolik procent článků bude do patnácti let psáno jen počítači, zněla odpověď, že až 90 procent. Může to však být přílišný optimismus: skutečně kreativním počítačovým mozkem schopným nahradit člověka zatím Quill zdaleka není. Doktor Filip Železný, vedoucí výzkumné laboratoře IDA na Fakultě elektrotechnické ČVUT, upozorňuje, že systém Narrative Science je stále jen postupem, jak pomocí předepsaných jazykových pravidel spojit v jeden smysluplný celek různé množství dat, a má tedy své hranice. Dodává ale, že přesnost a kvalita podobných systémů se bude postupně zlepšovat.

Už dnes přitom Quill výrazně pomůže s denním rutinním zpravodajstvím, které ubírá čas na opravdu kreativní práci. Může se tak uplatnit třeba v tiskových agenturách. Masový úbytek pracovních pozic v médiích ale pravděpodobně kvůli němu ještě mnoho let nezaznamenáme.


Pokud jste v článku našli chybu, napište nám prosím na [email protected].

Mohlo by vás zajímat

Aktuální vydání

Vyhraje Izrael?Zobrazit články