Pozadí astronaut Brázda
Pozadí astronaut Brázda
Často hledáte, jak…

Civilizace, Technologie

Duch ve stroji

Počítače se učí rozumět nejen slovům, ale i gestům

Ráno přicházíte do kanceláře. Jako mávnutím kouzelného proutku se deska vašeho stolu promění v interaktivní pracovní prostor. Rukama se „dotýkáte“ souborů, které se na ni shora promítají jako na filmové plátno, a přesouváte je, vytváříte, ukládáte. Kolegovi předáte data v podobě světelné tečky, kterou si odnese v ruce na své pracoviště. Místo myší volíte v menu pohybem ruky v prostoru. Na dopolední poradě přesunete svoji prezentaci ze stolu na zeď pouhým dotykem.

A když už je po pracovní době, proč se nevěnovat koníčkům? Jakže se jmenovalo to pěkné auto, co jsem včera viděl? Nevadí, prostě ho počítači popíšete pomocí gestikulace stejně jako ráno kolegovi. Nebyla by taková spolupráce s výpočetní technikou příjemnější?

 

Od her k životu

Zkusme si uvědomit, jak často využíváme ke komunikaci vlastní ruce. Když něco popisujeme, kreslíme to obvykle rukama ve vzduchu. Druhá osoba tak získává celkový vjem. Nejen že slyší, co říkáme, ale spojí si to i s gesty. Tento celkový obraz je v mezilidské komunikaci nenahraditelný. Pokud by byl schopen naše gesta podobným způsobem vnímat i počítač, znamenalo by to další vývojové stadium v komunikaci mezi člověkem a strojem. Stroj by nejen dokázal rozeznávat objekty, které mu nejsnáze popíšeme právě rukama, ale bylo by možné jej i lépe interaktivně ovládat.

Uskutečnění této vize dosud bránily především peníze, náklady na sledování pohybu v trojrozměrném prostoru šplhaly do milionů dolarů. To však už dnes neplatí. Od loňského listopadu prodává společnost Microsoft doplněk Kinect pro herní konzoli Xbox 360, díky němuž je možné ovládat řadu her pomocí pohybu vlastního těla. Senzor na vaší televizi vlastně snímá prostor před ní a zaznamenává vaše pohyby, které počítač zpracovává podobně, jako byste mačkali tlačítka na herním ovladači.

Radost z toho nemají jen milovníci počítačových her, ale i různé vědecké týmy po celém světě – senzor z Kinectu totiž stojí jen kolem sto dolarů a je v podstatě komplexním kusem hardwaru, k němuž následně stačí pouze vytvářet příslušný software. Součástka z herní konzole tak nyní umožňuje zkoumat různá zákoutí interakce mezi člověkem a počítačem velmi levně, třeba jen s jedním přenosným computerem.

Díky tomu se už pracuje na tom, abyste si s počítačem mohli povídat stylem „představ si…“. Například na univerzitě v německé Postupimi se tomu tématu věnuje doktorand Christian Holz. Jeho výzkum je součástí projektu s názvem Data Miming, zaměřeného na využití gestikulace v komunikaci mezi člověkem a strojem. Cílem je v počítači napodobit něco, čemu lidé říkají vizuální představivost.

 

Vypadalo to asi takhle…

Funguje to jednoduše. Počítač pomocí senzoru Kinect zaznamenává pohyby rukou a překresluje je jako stopy v imaginárním virtuálním datovém prostoru. Lze si to představit podobně jako stopy, které nechávají pohybující se zdroje světla na fotografiích s dlouhou expozicí. Software pak následně umí gesty popsaný tvar vyhodnotit a pomocí filtrů odstranit náhodné pohyby, jež k popisovanému útvaru nepatří. Získaný obrys je možné velmi rychle porovnat s rozsáhlou databází a vyhledat odpovídající tvar, podobně jako internetový vyhledávač nachází odpovídající webové stránky či obrázky.

Tak třeba na dotaz, kde najít židli, která vám utkvěla v paměti během návštěvy obchodního domu a která „byla tady zahnutá takhle a takhle a opěradlo měla asi takovéhle“, vám počítač v samoobslužném skladu poradí, že ji najdete v oddělení 3 v regálu číslo 6. Zpracovávat a vyhodnocovat přitom bude nejen vaše slova, ale i gesta. Stejně užitečný může být i v případě, pokud máte jen hrubou představu o tom, jak by měl kus nábytku, jejž chcete koupit, vlastně vypadat.

Výzkum se nezaměřuje jen na zprostředkování informace počítači, jeho součástí je i studium využití gestikulace v komunikaci jako takové. Čím lépe pochopíme význam gest, tím dokonaleji jej převedeme do řeči strojů, což umožní vytváření nových aplikací.

Možná se velmi brzy dočkáme i v úvodu popsané kanceláře, kterou už vývojové centrum společnosti Microsoft představilo světu pod názvem LightSpace. Konstruktéři ji sestrojili pomocí tří levných Kinect senzorů a několika standardních projektorů doplněných šikovně napsanými programy. A protože ne vše jde popsat slovy, podívejte se na internetovou adresuhttp://research.microsoft.com/enus/um/people/awilson/publications/WilsonUIST2010/WilsonUIST2010.html, kde uvidíte, jak by taková interaktivní místnost mohla fungovat. 

Pokud jste v článku našli chybu, napište nám prosím na [email protected].

Text vyšel v Respektu 35/2011 pod titulkem Duch ve stroji