znanost 14.2.2018 7:30

Slovenci na čelu novega evropskega jezikovnotehnološkega projekta

Ljubljana, 14. februarja - V Ljubljani se bo v četrtek začelo tridnevno uvodno srečanje evropskega projekta ELEXIS, katerega nosilec je Institut Jožef Stefan. Glavni namen projekta je vzpostaviti sodobno leksikografsko infrastrukturo za vse evropske jezike ob uporabi naprednih tehnologij strojnega učenja, tekstovnega rudarjenja, semantičnih tehnologij in umetne inteligence.

Ljubljana.
Jezikovne tehnologije, računalnik, tipkanje, knjiga, tekst.
Foto: Aljoša Rehar/STA

Ljubljana.
Jezikovne tehnologije, računalnik, tipkanje, knjiga, tekst.
Foto: Aljoša Rehar/STA

Kot je za STA pojasnil vodja projekta Simon Krek z Instituta Jožef Stefan (IJS), slovarji niso le obsežne, sistematično organizirane zbirke podatkov o jeziku, pomembni so tudi kot kulturni ali zgodovinski artefakti. Trenutno so jezikovni podatki v teh zbirkah nepovezani in nedostopni za napredno računalniško rabo.

Cilj projekta je povezati slovarske informacije v kompleksno organizirano semantično mrežo, vzpostaviti standarde in rešitve za sodobno digitalno leksikografijo, spodbuditi vseevropsko povezovanje in izmenjavo znanj na področju leksikografije ter promovirati kulturo odprtih podatkov.

"S projektom bo v sodobne zbirke podatkov o jezikih ter svetovne leksikografske trende vključena tudi slovenščina, kar povečuje možnosti za dolgoročno preživetje jezika v digitalni dobi," je povedal Krek.

Projekt bo povezan z obstoječima raziskovalnima infrastrukturama CLARIN in DARIAH, v Sloveniji bo kot opazovalka v projekt vključena tudi Univerza v Ljubljani s Centrom za jezikovne vire in tehnologije.

Poleg IJS kot nosilne ustanove v njem sodelujejo še Inštitut za nizozemski jezik, Inštitut za estonski jezik, Inštitut za bolgarski jezik, Združenje za danski jezik in literaturo, Španska kraljeva akademija, Inštitut za jezikoslovje pri Madžarski akademiji znanosti, Center za jezikovne tehnologije Univerze v Kopenhagnu, Inštitut za računalniško jezikoslovje v Pisi, Nova univerza v Lizboni, Center za digitalno humanistiko pri Avstrijski akademiji znanosti, Beograjski center za digitalno humanistiko, Center za digitalno humanistiko Univerze v Trieru, Irska nacionalna univerza v Galwayu, Univerza Sapienza v Rimu ter podjetji Lexical Computing s Češke in K Dictionaries iz Izraela.

Projekt s polnim imenom European Lexicographic Infrastructure (ELEXIS) je finančno podprt v okviru evropskega okvirnega programa za raziskave in inovacije Obzorje 2020. Njegova vrednost znaša pet milijonov evrov, trajal pa bo štiri leta, do januarja 2022. Podrobnejši podatki o projektu so dostopni na spletni strani www.elex.is.