«Munduko enpresa potoloenak adimen artifizialaren industrian sartuta daude»
Xabier Arregi Iparragirre (Zubieta, 1964) adimen artifizialean eta hizkuntzalaritza konputazionalean aditua da. Euskararen prozesamendu automatikoa lantzen duen Euskal Herriko Unibertsitatearen Ixa talderean nahiz HiTZ zentroaren partaide da gipuzkoarra. Hizkuntzalaritza konputazionalarekin erlazionatutako hainbat proiektu eta aplikazioren ekoizpenean eta garapenean parte hartu du.
Zelan defini daiteke Ixa taldea?
Ixa taldea EHUren ikerketa taldea da, 1988an sortua, hizkuntzaren tratamendu automatikoa lantzen duena. Duela zenbait urte, Aholab taldeagaz bat egin zuen; halaxe sortu zen HiTZ zentroa. Funtsean, Ixak testuekin lan egiten du, eta Aholabek ahotsarekin. Ixa barruan, batik bat, hizkuntzalariek eta informatikariek lan egiten dute. Helburua da makinek gizakion hizkuntza ulertzea, hura sortzeko gai izatea; finean, makinen eta gizakien arteko komunikazioa hizkuntza bidez ematea.
Gailuek, beraz, hizkuntza erabiltzen ikasi behar dute.
Horretan dihardugu: makinei nahiz gailuei hizkuntza irakurtzen eta erabiltzen irakasten ari gara, euskaragan ardura berezia ipinita. Egiteko horri, hain zuzen, hizkuntzaren tratamendu automatikoa edo hizkuntzalaritza konputazionala deitu ohi zaio. Makinei euskaraz irakatsi behar diegu, geure hizkuntzak arlo teknologikoan bere esparru propioa eduki dezan.
Egiteko horren peskizan, hainbat eta hainbat dira ondu dituzuen proiektuak.
Asko. Entzutetsuenetatik, lehenengoetarikoa Xuxen izan zen: euskarazko idatzizko testuentzako zuzentzaile ortografikoa. Bere garaian, 90eko hamarkada inguruan, ekarpen handia izan zen. Ostean etorri ziren hiztegiak, corpusak, itzultzaile automatikoak, eta abar luze bat.
Gaur-gaurkoz, zein proiektu nagusi duzue esku artean?
Chat GPT-ren pareko proiektua nabarmenduko nuke: Latxa. Sare neuronala erabiltzen duen hizkuntza eredu sortzailea da, eta hizkuntza sortzeko gai da. Oraindik ez du Chat PGT-k eduki dezakeen bezainbesteko gaitasun mailarik, baina garatze lanean ari gara. Hain zuzen, Latxa gai da testuak euskaraz sortzeko, pertsona batek egingo lukeen legez, baina elkarrizketa bati eusteko duen kapazitatea hobetzen ari gara. Chat GPT-k, esaterako, gaitasuna du eskatzen dioguna ulertzeko eta hori ahalbidetzeko; are gehiago, aurretiaz agindutakoak birgogoratzeko eta horien arabera funtzionatzeko ahalmena du, hau da, elkarrizketa bat jarraitzeko. Latxa gizakiokin interaktuatzeko gai izatea da gure hurrengo erronka: gure aginduak konprenitzeko eta prozesatzeko gai izatea.
Elkarrizketa hau Lea-Artibai, Mutriku eta Busturialdeko Hitza-tik ekarri dugu CC lizentziei esker. Hemen jarraitu dezakezue irakurtzen.