Pozadí astronaut Brázda
Pozadí astronaut Brázda

Rozhovory

Na to, jestli lidé mají pračku, se neptáme už desítky let

S Robertem Šandou z Českého statistického úřadu o sčítání lidu 

Autor: ČTK
Autor: ČTK

„Chtěli bychom se obejít jak bez elektronického sčítání, tak přítomnosti sčítacích komisařů a všechny údaje získávat z registrů,“ nastiňuje ředitel odboru statistiky Českého statistického úřadu Robert Šanda budoucnost Sčítání lidu, domů a bytů, která se u nás jako v řadě dalších zemí koná vždy v intervalu deseti let a ze zákona se jí musí zúčastnit všichni obyvatelé. Zatím tak mohou učinit buď pomocí e-formuláře, který je vůbec poprvé možné vyplnit online, nebo si mohou od sčítacího komisaře převzít jeho papírovou verzi; do konce sčítací akce zbývají více než dva týdny.

 Sčítání lidu se věnujete už čtrnáct let. Je letošní cenzus výjimečný právě tím, v jak velké míře se lidé pravděpodobně sečtou pomocí online formuláře? Zatím se jich tímhle způsobem sečetla více než polovina. Nebo lze o výjimečnosti hovořit u každého sčítání?

Je to mé profesně druhé sčítání a máte pravdu, že každý cenzus je svým způsobem výjimečný. Při minulém sčítání bylo poprvé možné sečíst se elektronicky, tedy přes odeslání PDF formuláře, nyní je možné ho vyplnit rovnou online - a díky tomu jsme na úplně jiných číslech. Minule se elektronicky sečetla jen čtvrtina obyvatel. Tehdy byly chytré telefony v zárodcích a přístup k internetu nebyl tak masivní. Takže hlavní posun vidím v tom, že se dnes sčítání děje primárně online, a to papírové je tak trochu doplňkové.

Robert Šanda
Robert Šanda

Jaké poučení vám přineslo minulé sčítání?

Příprava trvá několik let, ale pozornost bývá soustředěná obvykle na dobu, kdy se chodí do terénu a probíhá vlastní sběr dat. Jedno z poučení se týkalo online sčítání – a toho, že by mělo být co nejpohodlnější. Dříve člověk před vyplněním elektronického formuláře musel sehnat papírový, odkud si opsal alfanumerický kód, a teprve pak se mohl přihlásit do e-formuláře. Některé země dál pokračují tímto způsobem, ale nám ze zpětné vazby vyplynulo, že takový postup „degraduje“ pohodlí online sčítání, proto stačí zadat číslo občanky a datum narození. Co se týče papírového formuláře, ten byl dřív za osobu, dům a byt, což při zpracování zvyšovalo pravděpodobnost chyb, takže teď už je vše dohromady v jednom „sešitu“. Zároveň víme, které údaje se minule těžko zpracovávaly a na co měli lidé problém odpovědět. Každopádně není snadné položit otázku tak, aby se vešla na formulář, byla srozumitelná a odpovídala metodickým požadavkům.

Které části dotazníku se zpětně jevily jako problematické?

Především odpovědi, které lidé vyplňují sami, poté je rozpoznává stroj, a do databáze se dostávají prostřednictvím digitalizačních technik. Takže třeba obor vzdělání byla jedna z otázek, kterou jsme vyřadili - bylo těžké odpovědi identifikovat tak, aby byly zařaditelné k příslušnému seznamu, a zejména u starších generací může být tahle kategorie jiná, nebo si ji už nepamatují.

Dá se říct, že pokud by se většina lidí sečetla online, zkrátila by se doba zpracování formulářů?

Jsou to řádové rozdíly. Převod papírových dotazníků do databáze obvykle trvá několik měsíců, například Česká pošta, která pro nás nyní digitalizaci zajišťuje, na to má podle smlouvy až pět měsíců. Problematické je už samo vyplnění adresy: v elektronickém formuláři máte našeptávač, v listinném ji vyplňujete sama. Máme algoritmy, které si umějí poradit s drobnými chybami, ale pokud je špatně napsaná, nezbývá než posuzovat zápisy individuálně, a to znamená hromadu ruční práce. Neberte to přímo jako výpočet, ale pokud by se všichni lidé sečetli elektronicky, mohli bychom první výsledky publikovat už měsíc po konci sčítání. Za současných podmínek budeme rádi, když to bude na konci roku.

Sčítání lidu 2011 - místopředseda ČSÚ Stanislav Drápal;  ilustrační foto
Sčítání lidu 2011 - místopředseda ČSÚ Stanislav Drápal; ilustrační foto

Takže elektronické formuláře znamenají i přesnější data?

Ano, je to podobné jako u adresy. Elektronický formulář u řady odpovědí nabízí seznam možností, vy si pouze vybíráte a díky tomu jsou odpovědi kvalitnější.

Každopádně i letos do terénu vyrazili sčítací komisaři, kteří mají pro zájemce papírové formuláře. Je to naposledy, nebo by bez nich určité údaje prostě nebylo možné zjistit?

Tahle představa je skvělá, ale sčítání je zákonnou povinností a zatím máme daleko k tomu, abychom všem nařídili sečíst se elektronicky. Nicméně my bychom se v budoucnu chtěli obejít jak bez elektronického sčítání, tak přítomnosti sčítacích komisařů - a všechny údaje získávat z veřejně dostupných registrů. Ani v roce 2031 se to sice nejeví jako pravděpodobné, ale rádi bychom se touto cestou ubírali.

Vy se právě otázkou využití registrů profesně zabýváte, proč je tato možnost tolik vzdálená?

Především nám chybí údaje o domácnostech, lidé jsou totiž evidováni na úrovni adres, takže všichni, kteří bydlí v jednom paneláku, jsou na jedné adrese - a z toho nejsme schopni domácnosti rozpoznat. A to je jeden z našich velkých handicapů v porovnání s řadou jiných zemí. Třeba kolega z Maďarska byl velmi překvapený, že u nás nemáme evidenci bytů: neuměl si představit, jak nám chodí dopisy, a jak vůbec můžeme sčítání v terénu zajistit. Pokud bychom měli registr, kde by každý byt by musel mít něco jako číslo popisné, pak bychom už byli schopní popsat domácnosti. Samozřejmě bychom nevěděli, jaký je mezi lidmi v nich vztah, ale to se dá dedukovat. Funguje to tak v řadě zemí; jedním z velkých vzorů je v tomhle Nizozemsko nebo severské země, v Dánsku se sčítalo z registrů už v roce 1980.

Mají ještě v něčem výhodu?

U nás si třeba navíc nevystačíme s údajem o trvalém bydlišti. Kvůli tomu, jak byrokraticky náročné je přestěhovat se, zůstává spousta lidí evidovaná na jiné adrese, než skutečně bydlí, zejména ve velkých městech. Což je třeba v Nizozemsku mnohem snazší, proto jsou schopní s evidovaným bydlištěm nakládat jako se skutečným. Takže registr bytů, evidence obyvatel na úroveň bytů a trochu méně byrokracie při hlášení trvalého pobytu jsou tři základní složky, které potřebujeme k posunu ke sčítání z registru. V rámci Evropské unie sčítá z registru jedenáct zemí.

Jak byste pak zjišťovali tak individuální údaj, jako je třeba dojíždění do práce?

Z mého pohledu patří dojížďka nejdůležitějším údajům sčítání, protože se nedá jinak zjistit. A je fakt, že pokud bychom sčítali z administrativních zdrojů, přijdeme o informaci o využívaném dopravním prostředku, protože není možné vést evidenci toho, jak lidé jezdí do práce. Klíčové je pro nás hlavně místo pracoviště - od České správy sociálního zabezpečení máme poprvé k dispozici informaci, u koho jsou lidé zaměstnaní, ale už ne o skutečném místě jejich pracoviště, a to je pro nás zásadní. Chybí nám i registr vzdělání, takže nemáme odkud zjišťovat úroveň vzdělání v populaci.

A tyhle překážky jsou zatím nepřekročitelné?

Umím si představit, že při troše vůle by to šlo. Začal bych registrem bytů. Než jsme začali připravovat letošní sčítání, jedním z našich cílů bylo domluvit vznik registru bytů, ale narazili jsme na nepředstavitelné problémy. Zástupci ministerstev uznali, že by bylo bezvadné ho mít, ale nemohou pro to nic udělat, protože to je mimo jejich agendu - což je možná pravda, ale registr bytů zkrátka vyžaduje koordinaci a meziresortní spolupráci. Zároveň je to mimo možnosti samotného ČSÚ. Jako jedno z řešení jsme nabízeli, že by komisaři chodili od bytu k bytu a pomáhali s jejich očíslováním. Ale zastavili jsme se mimo jiné na tom, že není jasné, kdo by pak měl zajišťovat aktualizaci systému.

Elektronické sčítání
Elektronické sčítání

O sčítání mluví jako o jedné z nejnáročnějších statistických úloh… Dá se říct, že přípravy probíhají od publikace výsledků po celých deset let?

Je to tak. Ve chvíli, kdy se publikují výsledky jednoho sčítání, už se uvažuje o tom následujícím. Takže jsem psal analýzy k minulému sčítání a už jsme měli porady k letošnímu. Pro ČSÚ to byl prioritní úkol od roku 2015 a od té doby také probíhala systematická příprava. Zjišťuje se, co je realizovatelné, připravuje se věcný záměr zákona o sčítání. Celá příprava opravdu zabere roky. Přitom jde doba kupředu, takže nemá smysl držet technické ani lidské kapacity. Každé sčítání se tak v podstatě buduje od začátku, i proto je příprava tak náročná.

čem spočívá hodnota získaných údajů? K jakým změnám třeba mohou pomoci na úrovni měst a obcí? Byly by tyto problémy bez sčítání dohlédnutelné?

Sčítání jednak zjišťuje počet obyvatel, ale především je nepostradatelné k tomu, abychom mohli každoročně publikovat informace o počtu obyvatel, jejich přírůstku a úbytku a jejich rozmístění. Sčítání představuje základ, od kterého se odečítají zemřelí a vystěhovalí a přičítají se narození a přistěhovalí - a z toho se pak každý rok vychází například při rozpočtovém určení daní. Máme také povinnost dělat co pět let prognózy obyvatelstva: pro odchod do důchodu nebo kvůli důchodové reformě, plánování služeb, jako jsou školky, domovy pro seniory. I to by bez údajů ze sčítání nebylo možné. Když budeme mluvit o zmiňované dojížďce, ta je důležitá třeba pro ministerstvo průmyslu a obchodu. Potřebuje vědět, jací v dané lokalitě žijí lidé: jaké mají vzdělání, jaká je jejich profese, a jak daleko jezdí do práce. Z toho se dá rozpoznat, jestli je tu potenciální pracovní síla pro určitý typ podniků, kam by lidé nemuseli dojíždět dvě hodiny. Kromě toho nám dojížďka prozrazuje prostorové územní vztahy - to znamená, že lidé sice administrativně mohou spadat pod určitý kraj, ale reálně je vidět, že za prací jezdí jinam.

Sčítání v Domově seniorů • Autor: ČTK
Sčítání v Domově seniorů • Autor: ČTK

Takže hlavní přínos spočívá v kombinaci zjištěných údajů.

Přesně tak, jde o územní detail a možnost kombinovat jednotlivá data. Některé údaje sice můžeme zjistit i v rámci výběrových šetření, ale jsou pak vypovídající třeba jen na úroveň kraje. Kvůli epidemiologické situaci rezonovaly údaje jako věková struktura obyvatel, kolik kde žije seniorů. Když se řešila uzavírka okresů, bylo jistě relevantní, kolik lidí přejíždí hranice okresu kvůli práce. Takže i v tomto případě je vidět, že využitelnost dat ze sčítání je dalekosáhlá. Mimo to týden co týden poskytujeme data z minulého sčítání pro různé projekty, naposledy pro jedno akademické pracoviště, které dělalo zakázku pro město Jihlavu kvůli zjištění budoucího vývoje obyvatelstva a sociální stratifikace.

Vnímáte, že využitelnost a smysl sčítání přesto musíte obhajovat před širokou veřejností?

Myslím si, že se o jejich využitelnosti málo ví – a málokdy se naskytne prostor ji vysvětlit, navíc jde o komplexní věc. A protože se děje jednou za deset let, pořád přetrvávají stereotypy. Někteří lidé mají dodnes zažito, že nás bude zajímat, jestli mají pračku, přitom se jich na to už desítky let nikdo neptá. Současně panuje pocit, že se ptáme na něco, co už víme, ale opravdu se ptáme jen na to, co nejsme schopní zjistit z registrů. Lidi se často při vyplňování ptají: „Co je komu do toho, jak jezdím do práce?“ Ale z pohledu statistiky je jedno, čím do práce jezdí konkrétní člověk, takové údaje zjišťujme na individuální úrovni, abychom z nich mohli udělat agregovaná data. Tohle je další z důvodů, proč lidé občas vnímají sčítání negativně - ale mohlo by to být i horší. Řada lidí to zkrátka vnímá jako nutnost: dotazník vyplní a větší odpor nepanuje.

Horší ve smyslu, že by ho lidé začali bojkotovat?

Vše je velmi citlivé - a jakmile se stane sebemenší průšvih, veřejnost se rychle naladí na negativní notu. Na začátku online sčítání jsme měli půldenní výpadek a od té doby systém běží nádherně, ale počáteční problémy velmi rezonovaly. Úspěch sčítání je založený na důvěře lidí, protože ve finále záleží na tom, jak jsou ochotní nám odpovědět a jak pečliví budou.

Zmínil jste, že na některé otázky se už neptáte desítky let. Letos odpadly údaje týkající se připojení k internetu, vybavení domácnosti. Neuniknou vám tím pádem některé údaje? Jak vypadá v praxi filtrace otázek?

Obsah sčítání celkově nezávisí na nás, ale na tom, jaký bude přijat zákon. Některé charakteristiky dnes v podstatě ztrácí smysl zjišťovat nebo na ně stačí ona výběrová šetření. Některá témata jsou složitá a je u nich nutná přítomnost školeného tazatele, což u sčítání není. Například otázku na připojení k internetu jsme konzultovali s telekomunikačním úřadem, který ji původně požadoval ve sčítání ponechat. Je pro nás dobré mít informace, kde je dostupný internet a jací lidé ho využívají. Jenže v praxi bylo složité vymezit, kdo jsou vlastně potenciální uživatelé, třeba zda přístupem k internetu rozumět už to, že má člověk telefon s daty. A dospěli jsme k tomu, že se na to není možné jednoduše zeptat tak, aby lidé otázku pochopili jednotně a byli schopni bez pomoci tazatele odpovědět.

Je sběr dat pro vás osobně vrcholem sčítání nebo je to spíše doba, kdy jsou na světě první výsledky a data?

Nynější období je bezesporu intenzivní. Rozhodující byl okamžik byl z pátku 26. března na sobotu 27. -  od té doby  stále odpovídáme na dotazy, do terénu vyrazili sčítací komisaři. Spíše než radost je to zatím velký adrenalin. Asi nejhezčí je, když se zpracovávají výsledky a dostaneme se do fáze čištění dat, pak zpracujeme výsledky a můžeme je začít porovnávat s předchozími cenzy.

Pokud jste v článku našli chybu, napište nám prosím na [email protected].