Pozadí astronaut Brázda
Pozadí astronaut Brázda
Často hledáte, jak…

Od věci, Společnost

Korpusový pionýr

Henry Kučera při udělení čestného doktorátu na MU v Brně. (1990)
Henry Kučera při udělení čestného doktorátu na MU v Brně. (1990)

U nás jméno lingvisty Henryho Kučery vyjma odborných kruhů nejspíš nikomu nic moc neřekne, nicméně tento rodák z Československa vytvořil spolu s kolegou W. Nelsonem Francisem právě před 55 lety vůbec první jazykový korpus na světě známý jako Brown Corpus. „Je to vlastně paradoxní, že korpus americké angličtiny nevytvořil rodilý mluvčí,“ říká slavistka Masako Fidler z americké Brownovy univerzity.

Co přineslo Kučerovi největší věhlas? Právě to, že vytvořil úplně první korpus současné americké angličtiny na světě?

Ano, nicméně věhlas nepřišel automaticky ihned. Polovina šedesátých let byla doba, která nepřála kvantitativnímu směru v lingvistice.

Byl upřednostňován proud formální lingvistiky představovaný Noamem Chomskym, jenž kladl důraz na idealizovaný, gramaticky správný tvar věty bez kontextu. Ovšem čas nakonec potvrdil, jak významný počin Kučera a Francis učinili – nejenže je Brown Corpus nejhojněji citovaným korpusem na světě, ale korpusy jsou běžně využívány ve všech jazycích včetně češtiny.

Jak složité bylo v „počítačovém pravěku“ takový korpus vytvořit?

Dnes máme spoustu softwarů a statisticky propracovaných metod, nicméně infrastruktura výpočetní techniky v tehdejší době byla v podstatě v plenkách. Pro srovnání – Brown Corpus obsahoval něco přes milion slov, dnes korpusy obsahují miliardy slov. Ale na tehdejší dobu to byl neobyčejně velký objem…

Tento článek je v plném znění dostupný předplatitelům.

Odemkněte si všech 39 článků vydání zakoupením předplatného. Pokud jste již předplatitel/ka, přihlaste se.

Pořízením předplatného získáte přístup k těmto digitálním verzím už v neděli ve 12 hodin:

Respekt.cz
Android
iPhone/iPad
Audioverze

Pokud jste v článku našli chybu, napište nám prosím na [email protected].