ISO 9001, ISO 14001, OHSAS 18001 & ISO/IEC 27001 certified

Lansarea Corpusului computațional de referință pentru limba română contemporană CoRoLa

2017-12-19   Accesări: 559  Vizitatori unici: 417

Academia Română, Secţia de Ştiinţa și Tehnologia Informaţiei – prin Institutul de Cercetări pentru Inteligență Artificială „Mihai Drăgănescu” din București și Institutul de Informatică Teoretică din Iași – a lansat „Corpusul computaţional de referinţă pentru limba română contemporană (CoRoLa)”, rezultat al unui proiect prioritar al Academiei Române, derulat în perioada 2014-2017. CoRoLa reprezintă o colecție de texte contemporane (de după 1945) (în versiune scrisă și orală), având dimensiuni foarte mari (cca 1 miliard de ocurențe, adică întrebuințări ale cuvintelor, și peste 300 de ore de înregistrări vocale). Corpusul este completat cu un set de metadate (care se referă la autor, data publicării, editură, genul literar al textului etc.) și adnotări care prezintă informații de natură lingvistică și gramaticală (morfologice, lexicografice, sintactice etc.). Evenimentul a avut loc în Amfiteatrul „Ion Heliade Rădulescu” al Bibliotecii Academiei Române, București, Calea Victoriei nr. 125, joi, 14 decembrie 2017.

La eveniment au participat colaboratorii nemijlociți ai proiectului și colaboratori de la Institutul Limbii Germane din Mannheim, considerat creatorul celui mai mare corpus al limbii germane, împreună cu care se așteaptă includerea corpusului CoRoLa într-un circuit multilingual. Proiectul corpusului este susținut și de Fundația Alexander von Humboldt. În deschiderea evenimentului au vorbit: acad. Bogdan Simionescu, vicepreședintele Academiei Române; acad. Florin Filip, președintele Secției de Știința și Tehnologia Informației a Academiei Române; dr. Thomas Hesse, Secretar General adjunct al Fundației Alexander von Humboldt; cu un mesaj de salut din partea prof. dr. dr. h.c. mult. Ludwig M. Eichinger, director al Institutului Limbii Germane din Mannheim.

Prezentarea proiectului și moderarea evenimentului a revenit acad. Dan Tufiș, director al Institutului de Cercetări în Inteligență Artificială „Mihai Drăgănescu” al Academiei Române, București. În cadrul sesiunii CoRoLa în context multilingv și multimedia, dna conf. univ. dr. Ruxandra Cosma de la Universitatea din București a prezentat comunicarea CoRoLa in a multilingual context. Dr. Marc Kupietz, de la Institutul Limbii Germane din Mannheim a trecut în revistă realizările a trei corpusuri: DRuKoLA, KorAP and EuReCo: Contributions to a joint multilingual infrastructure for corpus based research, invocând, în contextul globalizării, importanța unei infrastructuri multilingve bazată pe corpus(uri). Directorul Institutului de Informatică Teoretică al Academiei Române (Iași), acad. Horia-Nicolai Teodorescu, a vorbit despre CoRoLa în context multdisciplinar.

Deosebit de utile s-au dovedit a fi demonstrațiile practice de lucru pe materialul corpusului, aspect căruia merită să i se dedice și câteva ateliere.  Dr. Verginica Barbu Mititelu de la Institutul de Cercetări în Inteligență Artificială „Mihai Drăgănescu” al Academiei Române (București) a demonstrat audienței cele mai importante Modalități de interogare a componentei scrise a corpusului, în timp ce dr. Radu Ion, de la același institut s-a referit atât la interfața de interogare a componentei scrise, cât și a celei orale. 

Conf. univ. dr. Adina Dragomirescu, director al Institutului de Lingvistică „Iorgu Iordan – Al. Rosetti” al Academiei Române (București), în comunicarea  Gramatica şi corpusul a argumentat importanța corpusului pentru descrieri pertinente ale nivelului gramatical al limbii; prof. univ. dr. Rodica Zafiu, șef al Catedrei de Limba Română, Facultatea de Litere, Universitatea din București, s-a referit la tendințele privind recvența unor termeni și îmbinări de cuvinte și regăsirea acestora cu tot cu contexte în corpusul de referință; dr. Gabriela Haja, de la Institutul de Filologie Română „A. Philippide” al Academiei Române (Iași), a făcut o confesiune a lexicografului: slăbiciunea sa în fața cuvintelor, a trecerii vremii și a Dicționarului limbii române (DLR). Elena Ungureanu, reprezentând Institutul de Filologie al AȘM și Institutul de Dezvoltare a Societății Informaționale (Chișinău, Republica Moldova), a propus audienței un scurt exercițiu comparativ între două corpusuri: CoRoLa vs IntraText. La finele evenimentului, prof. dr. Dan Cristea, membru corespondent al Academiei Române, de la Universitatea „Al. I. Cuza” din Iași și Institutul de Informatică Teoretică, s-a întrebat: Ce e de făcut mai departe?, răspunsul fiind completarea corpusului în flux continuu, atragerea și instruirea voluntarilor, perfecționarea instrumentelor elaborate și oferirea de servicii informatizate.

Discuțiile care au urmat au arătat importanța unui asemenea proiect de anvergură, nu doar pentru lingviști, ci și pentru publicul larg, dar și problemele care urmează să fie soluționate, revenirea la subiectul privind reprezentativitatea acestuia, precum și nevoia de colaborare, inclusiv cu institutele de profil din Republica Moldova.

A doua zi, 15 decembrie, Aula Academiei Române a găzduit ceremonia de decernare a Premiilor Academiei Române pentru anul 2015.
 


 

 

Categoria: Evenimente Cuvinte-cheie: limba română, Florin G.Filip, dictionar, corpus, CoRoLa, Biblioteca Academiei Române, Academia Română
Ultima actualizare:  26-12-2017 09:43:31
Sursa:   IDSI

 
2