Zisti kto si a rob to úmyselne.

Realita bezpečnosti dat při sčítání lidu 2011 v ČR

9. března 2011 v 15:04 | afinabul |  Ponerológia
Realita bezpečnosti dat při sčítání lidu 2011 v ČR

Na webu ČSÚ se dočteme:
Jakmile budou papírové formuláře naskenovány, dojde před samotným zpracováním k jejich anonymizaci. To v praxi znamená, že budou z databází odstraněna všechna jména a rodná čísla. Z výsledků sčítání tak pouze zjistíte, že např. v Bruntále v Jiráskově ulici žije žena, které je 35 let, má dvě děti, každý den dojíždí do práce vlakem do Opavy, vystudovala vysokou školu a narodila se v Ostravě, ale nikdo už nikdy nezjistí, jak se jmenuje, ani jaké má rodné číslo.
Bylo by to pěkné, že? Ale realita je jiná. ČSÚ provádí při sčítání lidu jakousi anonymizaci pouze "na oko". Odstraňuje jméno, příjmení, rodné číslo, den a měsíc narození (resp. z data narození ponechá věk). Po té "anonymizaci" tedy zbude údaj o čísle domu, bytu, pohlaví, věku apod. Začátek odstavce by tedy měl znít:
Z výsledků sčítání tak pouze zjistíte, že např. v Bruntále v Jiráskově ulici, číslo popisné 17, v přízemí v 1. bytě, žije ve vlastním domě žena, které je 35 let, má dvě děti (z toho jedno z posledního manželství), je rozvedená, každý den dojíždí 60 až 90 minut do práce vlakem do Opavy, kde pracuje na adrese Oprava, Lipová 15 jako technolog výroby v potravinářstvé výrobě, vystudovala VŠE, a narodila se v Ostravě. A spoustu dalších informací včetně informací o bytě, domě (tyto informace lze podle čísla bytu a domu velmi snadno propojit).
To už nezní tak dobře, že?
Dále se tvrdí, že nikdo už nikdy nezjistí, jak se jmenuje. Ale je to pravda? Nemám k dispozici přesné údaje, ale mnoho lidí žije ve vlastním domě nebo bytě. A nezanedbatelná část lidí žije sama nebo jde o rodinu, kde lze členy jasně rozlišit podle pohlaví a věku. U takových lidí stačí nahlédnout např. do katastru nemovitostí a hned zjistíte jméno oné osoby (pravda, může se stát, že třeba dům pronajímá, ale takových případů není mnoho). Pokud jde např. o podnikatele, tak zjistíte i rodné číslo z živnostenského rejstříku. Způsobů, jak doplnit podle přesné adresy, věku, pohlaví a dalších údaje z formuláře jméno, je spousta. Závěr odstavce je tedy zcela nepravdivý -i po anonymizaci není problém u většiny osob přiřadit údaje ke konkrétnímu jménu.

Přístup k datům a statistické účely

Je zřejmé, že výsledkem sčítání nebudou anonymní data, tedy data, která by nešla ve většině případů s velkou pravděpodobností spojit s konkrétními osobami, byty a domy. Ale pojďme se podívat, kdo může data využívat a k čemu.
Na každém formuláři se píše, že "Údaje budou využity výhradně ke statistickým účelům." Já jsem si pod tím představoval jen nějaké souhrnné informace - např. kolik lidí daného věku žije v dané obci apod. Ale ČSÚ má zjevně zcela jinou představu o statistických účelech.
Koukněme se na článek přímo z webu ČSÚ, který hovoří o využití dat ze sčítání lidu.
Když vyráží jednotka k požáru, musí si velmi rychle zjistit informace o objektu, ke kterému jede. Velitel si proto vyžádá základní informace a dozví se například, že se jedná o dům, který má šest nadzemních poschodí. Podle toho se musí zařídit a připravit plán zásahu. Jiný postup je třeba zvolit u dřevěného objektu, jiný u objektu z cihel. Všechny tyto informace musí mít jednotka co nejrychleji k dispozici, nemohou zjistit teprve po příjezdu, co je to za objekt, a shánět nějaké informace.
Pod statistickými účely tedy podle ČSÚ patří získávání konkrétních informací z jednoho konkrétního dotazníku sčítání lidu. Tedy vyhledání a využití vyplněných dat na formuláři konkrétního domu podle adresy. Nehleďme teď na užitečnost tohoto konkrétního využití, ale na princip. Obecně prostě budou využívána konkrétní data z dotazníků a nikoli jen data souhrnná (agregovaná). Přístup k těmto údajům nebudou mít samozřejmě pouze hasiči, ale např. ministerstva apod. Vytvořené statistiky, které jsou veřejně dostupné na webu ČSÚ jsou jen nepatrná část nasbíraných dat, které bude stát využívat. Buduje se tak velká databáze domů, bytů a osob. V dřívějších dobách to takový problém nebyl, protože bez počítačů šly takové informace těžko používat a zneužívat. Dnes je to snadné. Databáze bude existovat v mnoha kopiích (v dřívějších dobách nebylo reálné okopírovat miliony papírů, dnes to bude třeba na jednom DVD). Ta nasbíraná data už pravděpodobně nikdy ze světa nezmizí. Zda v takových datech chcete být nebo ne, to je pouze na vás.

Buď první, kdo ohodnotí tento článek.

Nový komentář

Přihlásit se
  Ještě nemáte vlastní web? Můžete si jej zdarma založit na Blog.cz.