{"id":55512,"date":"2012-05-21T08:00:00","date_gmt":"2012-05-21T08:00:00","guid":{"rendered":"https:\/\/bm.dev.synology.me\/?p=55512"},"modified":"2026-04-03T07:53:32","modified_gmt":"2026-04-03T07:53:32","slug":"de-la-cuvinte-la-semantica","status":"publish","type":"post","link":"https:\/\/bm.dev.synology.me\/?p=55512","title":{"rendered":"De la cuvinte la semantic\u0103"},"content":{"rendered":"<p>Motoarele de c\u0103utare au ap\u0103rut \u00eenc\u0103 de la \u00eenceputurile web-ului \u015fi au adus \u00een joc mul\u0163i competitori, \u00eens\u0103 mul\u0163i au capitulat dup\u0103 ce Google a \u00eenceput s\u0103 fac\u0103 primii pa\u015fi \u00een acest domeniu. Secretul succesului Google a constat \u00een faptul c\u0103 reu\u015fea s\u0103 ordoneze rezultatele mai bine dec\u00e2t al\u0163ii, folosind un algoritm numit PageRank. Mecanismul este \u00een aparen\u0163\u0103 simplu \u015fi const\u0103 \u00een trei pa\u015fi. \u00cen primul r\u00e2nd e vorba de indexare: ni\u015fte robo\u0163i software cutreier\u0103 web-ul \u015fi memoreaz\u0103 leg\u0103tura dintre cuvintele unei pagini web \u015fi adresa acesteia. Pasul doi este g\u0103sirea paginilor pe baza cuvintelor-cheie introduse de utilizator &#8211; o relativ simpl\u0103 potrivire a cuvintelor cu cele indexate.<\/p>\n<p>Ultimul pas const\u0103 \u00een calcularea unor scoruri de relevan\u0163\u0103, pe baza c\u0103rora se stabile\u015fte ordinea rezultatelor. Aici se iau \u00een calcul a\u015fezarea cuvintelor \u00een pagin\u0103 (de exemplu, dac\u0103 figureaz\u0103 \u00een titlu sau \u00eentr-un subtitlu, scorul e mai mare) \u00eempreun\u0103 cu num\u0103rul referin\u0163elor la pagina respectiv\u0103 \u015fi &#8220;calitatea&#8221; acestora (\u00een sensul c\u0103 referin\u0163ele venind de pe situri foarte vizitate sunt mai valoroase). Desigur, treaba e mult mai complicat\u0103 \u00een realitate, ultimele dou\u0103 faze nu sunt delimitate, viteza este foarte important\u0103 \u015fi o mul\u0163ime de alte detalii intr\u0103 \u00een joc, \u00eens\u0103 \u00een cele din urm\u0103 e vorba despre potriviri de cuvinte. Chiar dac\u0103 PageRank este brevetat de Google, toate celelalte motoare de c\u0103utare folosesc mecanisme asem\u0103n\u0103toare.<\/p>\n<p>\u00cens\u0103 competi\u0163ia este acerb\u0103 \u00een acest sector, a\u015fa c\u0103 s-a mers mai departe. Mai \u00eent\u00e2i cu c\u0103ut\u0103rile &#8220;universale&#8221; care g\u0103sesc \u015fi imagini, secven\u0163e video sau h\u0103r\u0163i. A urmat personalizarea rezultatelor, adic\u0103 o ordonare specific\u0103 fiec\u0103rui utilizator. Cu siguran\u0163\u0103, Google are o urm\u0103 a c\u0103ut\u0103rilor mele \u015fi probabil \u00eemi cunoa\u015fte preferin\u0163ele (a\u015fa cum le \u015ftie \u015fi Amazon) \u015fi \u0163ine seama de ele. De exemplu, o c\u0103utare pe Google dup\u0103 &#8220;Python&#8221; \u00eemi aduce \u00eentre primele rezultate \u015fi pagina proiectului Jython, \u00een vreme ce Bing (pe care nu prea-l folosesc) mi-o listeaz\u0103 abia pe a patra pagin\u0103. \u00cens\u0103 istoricul c\u0103ut\u0103rilor nu pare s\u0103 fie suficient, iar ma\u015fin\u0103riile ar vrea s\u0103 \u015ftie mai multe despre noi; sursa potrivit\u0103 ar fi re\u0163elele de socializare. Aici Bing este \u00een avantaj datorit\u0103 colabor\u0103rii dintre Microsoft \u015fi Facebook, a\u015fa c\u0103 miza major\u0103 a serviciului Google Plus cam aici trebuie c\u0103utat\u0103. \u00cen mod normal, o c\u0103utare dup\u0103 &#8220;Weather Report&#8221; ar trebui s\u0103 aduc\u0103 o mul\u0163ime de situri specializate, ceea ce Google face cu succes, \u00een vreme ce \u00een prima pagin\u0103 de rezultate de la Bing am patru referin\u0163e la forma\u0163ia de jazz-rock cu acest nume. De ce? Pentru c\u0103 am postat pe Facebook un video de pe YouTube cu piesa &#8220;Birdland&#8221;. La un minut dup\u0103 ce am postat acela\u015fi video pe Google Plus, aceea\u015fi c\u0103utare cu Google mi-a adus alte rezultate.<\/p>\n<p>Mai este loc de \u00eembun\u0103t\u0103\u0163iri? Se pare c\u0103 Google \u00eencearc\u0103 s\u0103 treac\u0103 de simpla potrivire de cuvinte \u015fi s\u0103 ajung\u0103 la \u00een\u0163elesul lor, adic\u0103 &#8220;things, not strings&#8221;, cum spune blogul oficial al companiei \u00een anun\u0163ul privind ceea ce se nume\u015fte Knowledge Graph. \u00cen esen\u0163\u0103 e vorba de semantic\u0103, de\u015fi &#8220;web-ul semantic&#8221; propov\u0103duit de Tim Berners-Lee este \u00eenc\u0103 departe. Folosind diverse surse publice \u00een frunte cu Wikipedia, Freebase (pe care Google a cump\u0103rat-o \u00een 2010) sau CIA Word Factbook, cei de la Google au acumulat \u00een Knowledge Graph peste 500 de milioane de persoane, locuri \u015fi diverse alte lucruri, \u00eempreun\u0103 cu toate conexiunile dintre ele, astfel c\u0103 \u00een cur\u00e2nd pentru multe c\u0103ut\u0103ri vom primi nu doar referin\u0163e, ci \u015fi o caset\u0103 cu toate informa\u0163iile relevante. De exemplu, o c\u0103utare dup\u0103 &#8220;Leonardo Da Vinci&#8221; va afi\u015fa o caset\u0103 al\u0103turi de rezultate, unde vor figura datele biografice principale, cele mai cunoscute opere \u015fi, de asemenea, trimiteri la alte personalit\u0103\u0163i pe care cei interesa\u0163i de Leonardo le-au c\u0103utat. Informa\u0163iile de baz\u0103 sunt ajustate \u00een func\u0163ie de subiect, astfel \u00eenc\u00e2t pentru un astronaut vom afla timpul petrecut \u00een spa\u0163iu \u015fi misiunile la care a participat, \u00een vreme ce pentru o cl\u0103dire vom ob\u0163ine o hart\u0103, numele arhitectului, \u00een\u0103l\u0163imea \u015fi a\u015fa mai departe. Noua facilitate va deveni opera\u0163ional\u0103 mai \u00eent\u00e2i \u00een Statele Unite pentru utilizatorii \u00eenregistra\u0163i, urm\u00e2nd ca apoi s\u0103 fie extins \u00een toat\u0103 lumea.<\/p>\n<p>\u00cens\u0103 lucrurile nu par s\u0103 se opreasc\u0103 aici. Un indiciu apare \u00een videoclipul care prezint\u0103 Knowledge Graph, \u00een care un inginer ne spune c\u0103 vom putea c\u0103uta r\u0103spunsul unor \u00eentreb\u0103ri de genul &#8220;C\u00e2te femei au primit premiul Nobel?&#8221;. Dac\u0103 lu\u0103m \u00een calcul cercet\u0103rile pe care Google le-a f\u0103cut \u00een domeniul comenzilor vocale \u015fi al \u00een\u0163elegerii vorbirii, e foarte posibil ca Siri (de la Apple) s\u0103 aib\u0103 cur\u00e2nd un concurent.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Google nu se mai mul\u0163ume\u015fte cu potrivirea cuvintelor \u015fi afi\u015farea unor referin\u0163e \u00een pagina de rezultate a motorului de c\u0103utare. Acum vrea s\u0103 ne prezinte al\u0103turi de acestea o caset\u0103 cu informa\u0163iile esen\u0163iale despre subiectul c\u0103ut\u0103rii. \u015ei poate chiar mai mult dec\u00e2t at\u00e2t.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[529],"tags":[7486,7107,27913,7105],"class_list":["post-55512","post","type-post","status-publish","format-standard","hentry","category-opinii","tag-cuvinte","tag-mircea-sarbu","tag-semantica","tag-weboscop"],"_links":{"self":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/55512","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=55512"}],"version-history":[{"count":1,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/55512\/revisions"}],"predecessor-version":[{"id":71947,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/55512\/revisions\/71947"}],"wp:attachment":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=55512"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=55512"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=55512"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}