{"id":226717,"date":"2024-05-14T16:54:14","date_gmt":"2024-05-14T16:54:14","guid":{"rendered":"https:\/\/bm.dev.synology.me\/?p=226717"},"modified":"2024-05-14T16:54:14","modified_gmt":"2024-05-14T16:54:14","slug":"o-echipa-de-cercetatori-romani-a-creat-un-model-de-limbaj-large-language-model-dedicat-limbii-romane-ce-poate-fi-folosit-pentru-dezvoltarea-unor-unelte-si-platforme-ai","status":"publish","type":"post","link":"https:\/\/bm.dev.synology.me\/?p=226717","title":{"rendered":"O echip\u0103 de cercet\u0103tori rom\u00e2ni a creat un model de limbaj \u2013 large language model &#8211; dedicat limbii rom\u00e2ne, ce poate fi folosit pentru dezvoltarea unor unelte \u015fi platforme AI"},"content":{"rendered":"<p>\nO echip\u0103 de cercet\u0103tori rom\u00e2ni a creat un model de limbaj (LLM \u2013 \u201elarge language model\u201d) dedicat limbii rom\u00e2ne, ce poate fi folosit pentru dezvoltarea unor unelte \u015fi platforme AI \u015fi care va putea fi accesat \u015fi folosit de oricine dore\u015fte s\u0103 construiasc\u0103 instrumente bazate pe inteligen\u0163a artificial\u0103. Proiectul este ini\u0163iat \u015fi derulat de c\u0103tre Politehnica Bucure\u015fti, Universitatea din Bucure\u015fti \u015fi Institutul de Logica \u015fi \u015etiin\u0163a Datelor, cu sprijinul BRD Groupe Soci\u00e9t\u00e9 G\u00e9n\u00e9rale, arat\u0103 un comunicat transmis de reprezentan\u0163ii organiza\u0163iilor.<\/p>\n<p>\n\u201eC\u00e2teva dintre exemplele de utilizare ale modelului rom\u00e2nesc sunt: c\u0103utarea de informa\u0163ii \u00een baza de cuno\u015ftin\u0163e a unei organiza\u0163ii, cu ghiduri \u015fi proceduri de lucru, sau robo\u0163i conversa\u0163ionali pentru clien\u0163ii companiilor sau ai institu\u0163iilor care s\u0103 \u00eei ghideze \u00een parcurgerea pa\u015filor necesari pentru utilizarea unui produs sau serviciu. \u00cen ambele cazuri, angaja\u0163ii \u015fi\/sau clien\u0163ii economisesc timp \u00een accesarea informa\u0163iei, beneficiind \u00een multe situa\u0163ii \u015fi de \u00eembun\u0103t\u0103\u0163irea calit\u0103\u0163ii acesteia\u201d, a spus Alin \u015etef\u0103nescu, directorul Departamentului de Informatic\u0103 din cadrul Universit\u0103\u0163ii din Bucure\u015fti \u015fi vicepre\u015fedintele Institutului de Logic\u0103 \u015fi \u015etiin\u0163a Datelor.<\/p>\n<p>\nModelul rom\u00e2nesc de LLM este adaptarea unui LLM public dezvoltat \u00een principal pentru limba englez\u0103, ce a fost expus la c\u00e2teva milioane de documente \u00een limba rom\u00e2n\u0103, pentru a \u00een\u0163elege mai bine semnifica\u0163ia cuvintelor. Acest lucru e esen\u0163ial pentru perfoman\u0163a unor astfel de modele \u00een situa\u0163ii unde exprimarea cerin\u0163ei sau a \u00eentreb\u0103rii introduse de utilizator, c\u00e2t \u015fi a r\u0103spunsului trebuie s\u0103 fie \u00een limba rom\u00e2n\u0103, arat\u0103 sursa citat\u0103 anterior. \u00cencep\u00e2nd din a doua parte a anului 2023, la dezvoltarea \u015fi instruirea acestui LLM a lucrat o echip\u0103 de cercet\u0103tori de la Politehnica Bucure\u015fti, Universitatea din Bucure\u015fti \u015fi Institutul de Logica \u015fi \u015etiin\u0163a Datelor.<\/p>\n<p>\n\u201eSper\u0103m ca lansarea acestui model s\u0103 fie doar \u00eenceputul unui efort de lung\u0103 durat\u0103 din care s\u0103 rezulte LLM-uri mai bune pentru limba rom\u00e2n\u0103. Deja am descoperit o metod\u0103 pe care vrem s\u0103 o aplic\u0103m altor modele lansate recent (Llama-3 \u015fi Mistral) \u015fi care au performan\u0163e \u00een general mai bune ca cel de la care am pornit (Llama-2). Totu\u015fi, pentru a avea modele performante pentru limba rom\u00e2n\u0103 avem nevoie de dou\u0103 tipuri de resurse: colec\u0163ii de date mari \u015fi curatoriate, de calitate bun\u0103, precum \u015fi resurse hardware (\u00een special, GPU-uri pentru antrenarea modelelor). Sper\u0103m ca at\u00e2t entit\u0103\u0163ile private, c\u00e2t \u015fi cele publice s\u0103 \u00een\u0163eleag\u0103 importan\u0163a dezvolt\u0103rii modelelor mari de limbaj \u015fi multimodale (text-imagini) pentru limba rom\u00e2n\u0103. Pe to\u0163i \u00eei a\u015ftept\u0103m s\u0103 ni se al\u0103ture \u00een cadrul ini\u0163iativei OpenLLM-Ro \u015fi a proiectelor de cercetare care o vor sprijini\u201d, a spus Traian Rebedea, conferen\u0163iar la POLITEHNICA Bucure\u015fti \u015fi cercet\u0103tor principal la NVIDIA, unul dintre coordonatorii tehnici ai ini\u0163iativei OpenLLM-Ro.<\/p>\n<p>\nOdat\u0103 cu publicarea acestui LLM, ini\u0163iatorii proiectului lanseaz\u0103 \u015fi comunitatea OpenLLM-Ro, care \u00ee\u015fi propune s\u0103-i aduc\u0103 \u00eempreun\u0103 pe to\u0163i cei care vor s\u0103 contribuie \u00een diverse forme la dezvoltarea tehnologiilor AI pentru limba rom\u00e2n\u0103.<\/p>\n<p>\n\u201ePentru ca mediul economic \u015fi\/sau institu\u0163ional din Rom\u00e2nia s\u0103 poat\u0103 folosi aceast\u0103 nou\u0103 tehnologie (&#8230;) este nevoie de modele specializate care s\u0103 fi \u00eent\u00e2lnit o mul\u0163ime de conversa\u0163ii \u015fi documente \u00een limba rom\u00e2n\u0103. Motivul este simplu: pentru a ne putea oferi informa\u0163iile de care avem nevoie. \u00cen BRD lucr\u0103m \u00een mod constant la solu\u0163ii care s\u0103 ne \u00eembun\u0103t\u0103\u0163easc\u0103 procesele de lucru, folosind cele mai noi tehnologii care pot aduce valoare ad\u0103ugat\u0103 \u00een primul r\u00e2nd clien\u0163ilor no\u015ftri. \u00cens\u0103 \u00een\u0163elegem totodat\u0103 c\u0103 nevoile noastre sunt comune cu ale multor altor actori institu\u0163ionali &nbsp;(&#8230;). Implic\u00e2ndu-ne \u00een peisajul extrem de animat al acesteia, putem ajuta ca cele mai noi tehnologii s\u0103 aib\u0103 un impact pozitiv \u00een societatea rom\u00e2neasc\u0103 aproape \u00een acela\u015fi ritm cu evolu\u0163iile din domeniu la nivel interna\u0163ional\u201d, a spus Horia Velicu, Head of Innovation Lab \u00een cadrul BRD Groupe Soci\u00e9t\u00e9 G\u00e9n\u00e9rale.<\/p>\n<p>\n&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>O echip\u0103 de cercet\u0103tori rom\u00e2ni a creat un model de limbaj (LLM \u2013 \u201elarge language model\u201d) dedicat limbii rom\u00e2ne, ce poate fi folosit pentru dezvoltarea unor unelte \u015fi platforme AI \u015fi care va putea fi accesat \u015fi folosit de oricine dore\u015fte s\u0103 construiasc\u0103 instrumente bazate pe inteligen\u0163a artificial\u0103. Proiectul este ini\u0163iat \u015fi derulat de c\u0103tre [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[510],"tags":[16273,7442,449,28675,8306],"class_list":["post-226717","post","type-post","status-publish","format-standard","hentry","category-actualitate","tag-cercetatori","tag-dezvoltare","tag-inteligenta","tag-limbaj","tag-resurse"],"_links":{"self":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/226717","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=226717"}],"version-history":[{"count":0,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=\/wp\/v2\/posts\/226717\/revisions"}],"wp:attachment":[{"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=226717"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=226717"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bm.dev.synology.me\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=226717"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}