{"id":57733,"date":"2012-09-24T08:00:00","date_gmt":"2012-09-24T08:00:00","guid":{"rendered":"https:\/\/bm.dev.synology.me\/?p=57733"},"modified":"2026-04-03T08:52:17","modified_gmt":"2026-04-03T08:52:17","slug":"data-punct-gov-punct-ro","status":"publish","type":"post","link":"https:\/\/bm.dev.synology.me\/?p=57733","title":{"rendered":"Data punct gov punct ro"},"content":{"rendered":"<p>Aproape de fiecare dat\u0103 c\u00e2nd m\u0103 duc la paginile web ale ziarului The Guardian arunc o privire \u015fi la sec\u0163iunea numit\u0103 DataStore (care are \u015fi un motto: &#8220;Facts are sacred&#8221;). E de-a dreptul periculos s\u0103 popose\u015fti aici, mai ales dac\u0103 se apropie un termen de predare, pentru c\u0103 ri\u015fti s\u0103 petreci c\u00e2teva ore minun\u00e2ndu-te unde a ajuns ceea ce se cheam\u0103 &#8220;data journalism&#8221;. O mul\u0163ime de seturi de date, o mul\u0163ime de instrumente de vizualizare \u015fi o mul\u0163ime de comentarii pe marginea acestor date. Iar ceea ce este \u015fi mai atr\u0103g\u0103tor, toate aceste seturi de date pot fi desc\u0103rcate f\u0103r\u0103 nici o restric\u0163ie, \u00een diverse formate. Mai mult chiar, editorii chiar \u00eencurajeaz\u0103 publicul s\u0103 le descarce, s\u0103 le analizeze cu propriile lor instrumente, s\u0103 le combine cu alte seturi, s\u0103 colaboreze cu al\u0163ii \u015fi, astfel, s\u0103 ajung\u0103 la o \u00een\u0163elegere mai bun\u0103 a faptelor pe care aceste date (de cele mai multe ori \u00een stare brut\u0103 &#8211; &#8220;raw data&#8221;) le relev\u0103. Ideea este c\u0103 ast\u0103zi fiecare dintre noi poate fi, \u00eentr-o oarecare m\u0103sur\u0103, jurnalist de date.<\/p>\n<p>Totul este minunat, p\u00e2n\u0103 c\u00e2nd consta\u0163i c\u0103 o bun\u0103 parte dintre datele cu care lucreaz\u0103 sunt furnizate de administra\u0163ie sau organisme publice \u015fi sunt accesibile pe web la &#8220;data.gov.uk&#8221;. Am vrut s\u0103 m\u0103 conving singur c\u0103 e a\u015fa de simplu, a\u015fa c\u0103 am intrat \u015fi am c\u0103utat &#8220;census&#8221; (recens\u0103m\u00e2nt). \u00cen mai pu\u0163in de un minut am putut s\u0103 descarc orice fel de date (\u00een format XLS sau CSV). Pe varianta american\u0103, pe l\u00e2ng\u0103 acelea\u015fi facilit\u0103\u0163i de desc\u0103rcare, am beneficiat \u015fi de ni\u015fte instrumente de vizualizare, a\u015fa c\u0103 \u00een 30 de secunde am generat o frumoas\u0103 hart\u0103 pe baza anumitor valori din datele brute. Am prins pu\u0163in curaj \u015fi am introdus \u00een bara browserului &#8220;data.gov.ro&#8221;, dar mi s-a r\u0103spuns cu un mesaj de eroare. Am g\u0103sit \u00een schimb &#8220;data.gov.md&#8221;! Moldovenii au \u00eenc\u0103 destul de pu\u0163ine date, care pot fi desc\u0103rcate doar \u00een format Excel, dar lucreaz\u0103 cu platforma Zoho, care permite exporturi \u00eentr-o mul\u0163ime de formate.<\/p>\n<p>Totu\u015fi, vreau date de recens\u0103m\u00e2nt din Rom\u00e2nia! Am r\u0103scolit paginile INS, dar p\u00e2n\u0103 la urm\u0103 tot cu Google am g\u0103sit RecensamantRomania.ro, cu rezultate. Dar toate \u00een format PDF (&#8220;cimitirul datelor&#8221;), care nu-mi folosesc la nimic. Nu le pot analiza, nu le pot folosi \u00een aplica\u0163ii, nu pot s\u0103 le compar cu date mai vechi. M-am \u00eentors la INS ca s\u0103 v\u0103d ce s-a mai \u00eent\u00e2mplat cu nomenclatoarele de care toat\u0103 lumea are nevoie (SIRUTA, CAEN etc.). \u00cen fine, le-am g\u0103sit \u015fi am constatat c\u0103 au \u015fi pagin\u0103 de desc\u0103rcare. Fi\u015fierele erau furnizate ca arhiv\u0103 ZIP, a\u015fa c\u0103 am desc\u0103rcat la nimereal\u0103 CAEN, am deschis arhiva \u015fi am g\u0103sit un fi\u015fier \u00een format Word. Am \u00eencercat SIRUTA, iar aici am g\u0103sit \u00een arhiv\u0103 tot felul de documente Word, DBF \u015fi mdb (adic\u0103 FoxPro \u015fi Access). De fapt n-am fost surprins, pentru c\u0103 \u00een urm\u0103 cu un an chiar am avut nevoie de aceste nomenclatoare \u015fi am muncit o s\u0103pt\u0103m\u00e2n\u0103 ca s\u0103 le extrag \u015fi s\u0103 le convertesc \u00een XML \u015fi CSV. Apoi le-am oferit public, a\u015fa c\u0103 INS le putea ob\u0163ine pe gratis. \u015ei tot pe gratis administra\u0163ia rom\u00e2neasc\u0103 ar putea ob\u0163ine o variant\u0103 open source a portalului american Data.gov, dar se pare c\u0103 nu exist\u0103 niciun interes. Nici m\u0103car pentru pre\u0163ul zero, din care nu se pot socoti procente.<\/p>\n<p>\u00cen aceste condi\u0163ii, &#8220;data journalism&#8221; este o meserie grea. Spre deosebire de 2010, c\u00e2nd am publicat aici articolul &#8220;Jurnalism cu cifre&#8221;, acum exist\u0103 o pleiad\u0103 de instrumente uluitoare care s\u0103 faciliteze colectarea, agregarea, vizualizarea \u015fi diseminarea datelor primare. Google Fusion Table are posibilit\u0103\u0163i extraordinare, dar este poate prea complex, \u00eens\u0103 Tableau, OutWit \u015fi \u00eenc\u0103 vreo c\u00e2teva sunt unelte ideale pentru oameni obi\u015fnui\u0163i, care nu vor s\u0103 exploreze interfe\u0163e de programare \u015fi s\u0103 scrie cod. M-am \u00eentors \u00een cele din urm\u0103 la The Guardian, unde am urm\u0103rit cu oarecare interes grafice descriind evolu\u0163ia cheltuielilor membrilor Parlamentului (datele primare sunt \u015fi ele disponibile), am explorat o hart\u0103 a zonelor defavorizate din Anglia realizat\u0103 prin combinarea cu Google Fusion a mai multor seturi de date guvernamentale, apoi m-am oprit la analiza statistic\u0103 a datelor de la Jocurile Olimpice.<\/p>\n<p>Jurnali\u015ftii s-au g\u00e2ndit c\u0103 num\u0103rul medaliilor nu reprezint\u0103 situa\u0163ia sportului \u00eentr-o \u0163ar\u0103, a\u015fa c\u0103 au combinat datele cu popula\u0163ia, cu PIB-ul, cu num\u0103rul sportivilor participan\u0163i \u015fi au ponderat datele. S-a v\u0103dit c\u0103 americanii nu sunt o mare na\u0163iune sportiv\u0103, iar Rom\u00e2nia st\u0103 mai bine la rezultatul efectiv dec\u00e2t la mediile ponderate. Am desc\u0103rcat datele \u015fi le voi combina cu rezultatele testelor PISA, ca s\u0103 aflu care este influen\u0163a educa\u0163iei \u00een rezultatele sportive. \u00cen cele administrative \u015ftiu deja, f\u0103r\u0103 date primare.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Deja \u015ftie mai toat\u0103 lumea c\u0103 statisticile pot min\u0163i frumos \u015fi cu damf de veridicitate. Jurnalismul \u201ede date&#8221; ne \u00eenva\u0163\u0103 s\u0103 le verific\u0103m \u015fi s\u0103 le combin\u0103m cu alte date ca s\u0103 afl\u0103m mai multe. Problema e c\u0103 datele primare de interes public nu sunt publice pe toate meridianele.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[529],"tags":[10467,7107,7104,7105],"class_list":["post-57733","post","type-post","status-publish","format-standard","hentry","category-opinii","tag-jurnalism","tag-mircea-sarbu","tag-opinii","tag-weboscop"],"_links":{"self":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/57733","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=57733"}],"version-history":[{"count":1,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/57733\/revisions"}],"predecessor-version":[{"id":73923,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/57733\/revisions\/73923"}],"wp:attachment":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=57733"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=57733"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=57733"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}