jueves, 5 de junio de 2008

EuskalWordnet

Eli Pociello: “Euskal WordNet Lengoaia naturalaren prozesamenduan erabiltzea nahi dugu, adibidez itzulpen automatikoan”
Elisabeth Pombo, 2008-06-05

Eli Pociello filologoa EHUko IXA taldeko kide izan da zortzi urtez. Bertan Euskal WordNet, euskarazko lehenengo ezagutza base lexikalaren sorreran parte hartu du. Hain zuzen ere, ezagutza base lexikal hori izan da unibertsitatean aurkeztu berri duen bere doktore tesiaren gaia. Oraindik proiektua garatze fasean dago, momentuz izenak eta aditz batzuk soilik landu baitituzte, baina adjektiboak, adberbioak eta aditz guztiak ere gehitu behar dira. Gaur egun Eli Elhuyarren dago, haren Zientzia eta Teknologia Hiztegia eta Euskal WordNet lotuko dituen proiektu batean lanean.

Zer da ezagutza base lexikala?

Datu base baten antzekoa da, baina desberdintasuna da hiztegi batean jasotzen den informazioaz gain –hitzen adierak eta adiera horien definizioak eta adibideak– kontzeptuak elkarren artean harremanetan jartzen direla. Adibidez, hatza eskuko zati bat dela esaten zaigu eta eskua aldi berean besoa kontzeptuarekin harremanetan jartzen dela. Azken finean, kontzeptu guztiak euren artean harremanetan jartzen dira hierarkikoki.

Euskal WordNet Lengoaia naturalaren prozesamenduan erabiltzea nahi dugu, adierari begira garatzen diren aplikazioetan. Adibidez, itzulpen automatikoan. Sistemak ulertu behar du zer hitz ari den itzultzen eta horretarako hiztegi baten beharra dauka. Agian hitz baten testuinguruan agertzen den beste hitz baten bidez jakin daiteke lehenengoak zer adiera duen eta horretarako erabiltzen dira kontzeptuen arteko erlazioak.

Gaur egun zer tresna daude itzulpen automatikoaren alorrean? Zer emaitza ematen dituzte?

Fakultatean eta Elhuyarren egon diren proiektu batzuetan euskara, gaztelania, galiziera eta katalanaren arteko itzulpen automatikoarekin egin dugu lan. Euskararen ezaugarriak oso desberdinak dira beste hizkuntzekin alderatuta. Beste hizkuntzen oinarria latinetik etorritakoa izanda, errazagoak dira itzultzen, baina euskararen kasuan, bere ezaugarriengatik, emaitzak ez dira hain onak. Euskararen alde lan gehiago egin behar da. Sistema hobetu behar da. Horretarako proiektu eta diru laguntza gehiago lortu behar dira.

IXA taldeak eta Elhuyar Fundazioak, beste batzuekin elkarlanean Open Trad tresna garatu dute. Oraingoz euskararentzat hori dago. Emaitza eskasak ez, baina hobetzeko modukoak dira, lehen aipatutako arrazoiengatik. Hala ere, testu baten ideia ulertzeko balio du.

Erabiltzaile arruntak zertarako erabil dezake Euskal WordNet?

Beste hiztegiek bezalako informazioa ekartzen du –itzulpen elebidunak– baina horretaz gain, informazio gehiago ere jakin daiteke. Adibidez, jakin ahal dugu pagoa zuhaitz mota bat dela eta zehazki zer zuhaitz mota den. Nik uste lexikografikoek erabilgarri izango dutela. Hori da orain Elhuyarren egotearen beste arrazoia. Hiztegigintzan lan egiten dutenentzat horrelako baliabideak erabiltzea interesgarria izan liteke hiztegiak sortzeko orduan.

Beraz, erabiltzaile arruntarentzat baino gehiago, profesionalentzat da erabilgarri.

Bai, erabiltzaile arruntek hiztegi bezala erabiliko dute gehiago. Eta horretarako azken finean ezagutzen dituzun baliabidetara jotzen duzu. Gainera, gure datu base lexikala ez badugu interfazeari dagokionez erabilerrazago jartzen, zailagoa da erabiltzaile arruntak berau erabiltzea.

No hay comentarios: