Teknologia -
Itzulpen automatikoa
500.000 esaldi euskaraz eta gaztelaniaz, itzulpen automatikora bidean
EiTBk, MondragonLinguak eta Vicomtech-IK4k euskarazko eta gaztelaniazko albisteen corpus elebiduna osatu dute.
EITB.EUS
EiTBk, MondragonLinguak eta Vicomtech-IK4k 500.000 esaldiko euskarazko eta gaztelaniazko corpus elebiduna osatu dute eta itzulpen automatikorako bidean aurrerapausoa eman dute.
Garapen hori eginda, hiru erakundeek euskarazko eta gaztelaniazko beren lehen corpus elebiduna sortu dute. Bi hizkuntzen arteko itzulpen automatikoko sistema garatzeko oinarrizko baliabidea izango da.
Albisteen corpusa askotariko gaiek osatzen dutenez, euskarazko itzulpen automatikoak jauzi bat egin ahal izango du kalitateari dagokionez. Corpus elebiduna 500.000 esaldiz osatuta egongo da, eta, besteak beste, politika, nazioartea, kultura edota kirol arloko albisteak jasoko ditu.
Eusko Jaurlaritzako Garapen eta Lehiakortasun Sailak diruz lagundutako ikerketa eta garapen (I+G) proiektuen baitan garatutako egitasmoa izan da, eta horretarako bilaketa automatikoko metodo berritzaileak erabili dira. Halaber, sortutako corpusa META-SHARE Baliabide Linguistikoen Europako Sarearekin partekatu dute.
Bestalde, EiTBk, MondragonLinguak eta Vicomtech-IK4k corpusa komunitatearekin partekatu nahi dute euskararen itzulpen automatikoa bultzatzeko eta garatzeko.