{"id":43302,"date":"2010-10-11T09:00:00","date_gmt":"2010-10-11T09:00:00","guid":{"rendered":"https:\/\/bm.dev.synology.me\/?p=43302"},"modified":"2026-04-02T18:26:35","modified_gmt":"2026-04-02T18:26:35","slug":"jurnalism-cu-cifre","status":"publish","type":"post","link":"https:\/\/bm.dev.synology.me\/?p=43302","title":{"rendered":"Jurnalism cu cifre"},"content":{"rendered":"<p>Primul numar al ziarului Guardian a fost publicat la Manchester<br \/>\nin data de 5 mai 1821. Conform uzantelor din acele vremuri, stirile<br \/>\nocupau ultima pagina, iar printre acestea se afla un tabel care<br \/>\nprezenta intr-o maniera usor de inteles costurile suportate de<br \/>\nscolile din zona. Nu stiu daca acesta este primul exemplu de<br \/>\nprezentare a faptelor intr-o maniera numerica, dar este cert ca nu<br \/>\nera un obicei raspandit in epoca si, cu siguranta, dificultatile in<br \/>\nculegerea si procesarea datelor primare (caci despre asta este de<br \/>\nfapt vorba) erau majore. In schimb, suportul pe care puteau sa-l<br \/>\nofere unui material publicat era semnificativ.<\/p>\n<p>Astazi, jurnalismul nici nu poate fi conceput fara computere si<br \/>\ninternet. Incepand cu redactarea articolelor sau punerea in pagina<br \/>\nsi terminand cu documentarea si chiar culegerea unor informatii<br \/>\nvaloroase din surse mai mult sau mai putin oficiale. In acest<br \/>\ncontext a aparut o noua specie, numita &#8220;data journalism&#8221;, care se<br \/>\nocupa cam cu ceea ce primul numar din Guardian a realizat la<br \/>\ninceputul secolului XIX, dar la cu totul alta scara. E vorba, in<br \/>\nesenta, de culegerea si asamblarea datelor primare, prezentarea lor<br \/>\nin forme cat mai sugestive si, in final, interpretarea lor in<br \/>\ncontextul unui articol sau mixarea diferitelor seturi de date<br \/>\npentru a obtine noi rezultate. Pare simplu la prima vedere, insa<br \/>\nproblemele cu care jurnalistul de date se confrunta sunt numeroase<br \/>\nsi nu intotdeauna banale. Prima dintre ele este ca profesia lui se<br \/>\nafla la intersectia dintre jurnalism si informatica, asa ca va avea<br \/>\nnevoie de o dubla pregatire. De-abia de-aici incepe aventura.<\/p>\n<p>Gasirea si culegerea datelor este o arta in sine. Exista, desigur,<br \/>\nnumeroase surse publice de date, dar foarte adesea cele mai<br \/>\nrelevante pentru un anume subiect sunt greu de gasit. Insa<br \/>\npresupunand ca le-am gasit, vom constata ca cel mai adesea sunt<br \/>\ndisponibile in formate care nu se potrivesc cu instrumentele uzuale<br \/>\nde stocare si interogare. Ca exemplificare, sa presupunem ca ne<br \/>\nintereseaza datele de la ultimul recensamant al populatiei (2002),<br \/>\npentru ca dimensiunea demografica este importanta in foarte multe<br \/>\nanalize. Rezultatele sumare sunt prezentate ca tabele HTML, analiza<br \/>\nrezultatelor preliminare este un document in format Word intesat cu<br \/>\ntabele, in vreme ce rezultatele preliminare sunt livrate ca o<br \/>\narhiva cuprinzand cateva zeci de fisiere PDF.<\/p>\n<p>Jurnalistul de date va trebui probabil sa foloseasca cateva<br \/>\nprograme specializate sau chiar sa scrie propriile programe pentru<br \/>\na aduce datele intr-o forma unitara si apoi sa le transforme intr-o<br \/>\nstructura utilizabila in analize si prezentari. Mai apare si<br \/>\nproblema spinoasa a &#8220;curatarii&#8221; datelor, mai ales cand provin din<br \/>\nmai multe surse, fiindca se folosesc conventii si reprezentari<br \/>\ndiferite si nu intotdeauna corecte &#8211; e suficient sa ne gandim la<br \/>\nnenumaratele moduri in care se scriu datele calendaristice.<\/p>\n<p>Interogarea si analiza datelor odata culese va necesita pe de-o<br \/>\nparte abilitati informatice, deoarece va fi implicata probabil o<br \/>\nbaza de date, dar chiar si in cazul unui spreadsheet lucrurile pot<br \/>\nfi complicate si probabil sa ceara ceva programare. Analiza este la<br \/>\nrandul ei pretentioasa si va pune in joc cunostinte de statistica,<br \/>\nprecum si abilitati de utilizare a unor instrumente specializate<br \/>\ncapabile sa realizeze &#8220;felieri&#8221; (slicing), rezumate si detalieri<br \/>\n(drill-up\/down) si altele asemenea.<\/p>\n<p>Chiar daca nu se ajunge pana la &#8220;minerit&#8221; (data mining) pentru<br \/>\ndescoperirea unor tipare, jurnalistului de date ii trebuie si un<br \/>\nanume fler, un simt care sa-l ajute sa sesizeze discrepantele sau<br \/>\nsa evidentieze evolutiile si tendintele. Chiar daca forma grafica a<br \/>\nprezentarii datelor este treaba designerului, tot jurnalistul de<br \/>\ndate trebuie sa decida tipurile de grafice, modul de tabelare si<br \/>\nnivelul de detaliere, aspectele care trebuie evidentiate si asa mai<br \/>\ndeparte. Lucrurile nu se termina insa odata cu publicarea. Datele<br \/>\ntrebuie intretinute, imbogatite, contextualizate si, nu in ultimul<br \/>\nrand, partajate cu publicul si confratii de breasla, astfel incat<br \/>\nsa permita celor interesati abordari noi sau combinatii de date din<br \/>\ndiverse surse (mashups).<\/p>\n<p>The Guardian este astazi unul dintre reperele jurnalismului de<br \/>\ndate. O intreaga sectiune a site-ului cotidianului se cheama<br \/>\nDataStore, iar datele culese pe diverse tematici sunt puse la<br \/>\ndispozitia publicului in diverse forme. Din fericire pentru<br \/>\nenglezi, majoritatea informatiilor publice de la ei sunt cu<br \/>\nadevarat publice si accesibile. Din nefericire pentru noi, mai avem<br \/>\nmult pana acolo.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tim Berners-Lee, creatorul web-ului, a pledat adesea pentru publicarea datelor primare insotite de descrieri standardizate. Deja tendinta exista, iar cand aceasta practica se va extinde, internetul va deveni si mai util. Mai ales pentru o anumita ramura a jurnalismului.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[529],"tags":[171,7107,87,7105],"class_list":["post-43302","post","type-post","status-publish","format-standard","hentry","category-opinii","tag-internet","tag-mircea-sarbu","tag-opinie","tag-weboscop"],"_links":{"self":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/43302","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=43302"}],"version-history":[{"count":1,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/43302\/revisions"}],"predecessor-version":[{"id":60915,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/43302\/revisions\/60915"}],"wp:attachment":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=43302"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=43302"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=43302"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}