Eli Pociello: “Euskal WordNet Lengoaia naturalaren prozesamenduan erabiltzea nahi dugu, adibidez itzulpen automatikoan”
Elisabeth Pombo, 2008-06-05
Eli Pociello filologoa EHUko IXA taldeko kide izan da zortzi urtez. Bertan Euskal WordNet, euskarazko lehenengo ezagutza base lexikalaren sorreran parte hartu du. Hain zuzen ere, ezagutza base lexikal hori izan da unibertsitatean aurkeztu berri duen bere doktore tesiaren gaia. Oraindik proiektua garatze fasean dago, momentuz izenak eta aditz batzuk soilik landu baitituzte, baina adjektiboak, adberbioak eta aditz guztiak ere gehitu behar dira. Gaur egun Eli Elhuyarren dago, haren Zientzia eta Teknologia Hiztegia eta Euskal WordNet lotuko dituen proiektu batean lanean.
Zer da ezagutza base lexikala?
Datu base baten antzekoa da, baina desberdintasuna da hiztegi batean jasotzen den informazioaz gain –hitzen adierak eta adiera horien definizioak eta adibideak– kontzeptuak elkarren artean harremanetan jartzen direla. Adibidez, hatza eskuko zati bat dela esaten zaigu eta eskua aldi berean besoa kontzeptuarekin harremanetan jartzen dela. Azken finean, kontzeptu guztiak euren artean harremanetan jartzen dira hierarkikoki.
Euskal WordNet Lengoaia naturalaren prozesamenduan erabiltzea nahi dugu, adierari begira garatzen diren aplikazioetan. Adibidez, itzulpen automatikoan. Sistemak ulertu behar du zer hitz ari den itzultzen eta horretarako hiztegi baten beharra dauka. Agian hitz baten testuinguruan agertzen den beste hitz baten bidez jakin daiteke lehenengoak zer adiera duen eta horretarako erabiltzen dira kontzeptuen arteko erlazioak.
Gaur egun zer tresna daude itzulpen automatikoaren alorrean? Zer emaitza ematen dituzte?
Fakultatean eta Elhuyarren egon diren proiektu batzuetan euskara, gaztelania, galiziera eta katalanaren arteko itzulpen automatikoarekin egin dugu lan. Euskararen ezaugarriak oso desberdinak dira beste hizkuntzekin alderatuta. Beste hizkuntzen oinarria latinetik etorritakoa izanda, errazagoak dira itzultzen, baina euskararen kasuan, bere ezaugarriengatik, emaitzak ez dira hain onak. Euskararen alde lan gehiago egin behar da. Sistema hobetu behar da. Horretarako proiektu eta diru laguntza gehiago lortu behar dira.
IXA taldeak eta Elhuyar Fundazioak, beste batzuekin elkarlanean Open Trad tresna garatu dute. Oraingoz euskararentzat hori dago. Emaitza eskasak ez, baina hobetzeko modukoak dira, lehen aipatutako arrazoiengatik. Hala ere, testu baten ideia ulertzeko balio du.
Erabiltzaile arruntak zertarako erabil dezake Euskal WordNet?
Beste hiztegiek bezalako informazioa ekartzen du –itzulpen elebidunak– baina horretaz gain, informazio gehiago ere jakin daiteke. Adibidez, jakin ahal dugu pagoa zuhaitz mota bat dela eta zehazki zer zuhaitz mota den. Nik uste lexikografikoek erabilgarri izango dutela. Hori da orain Elhuyarren egotearen beste arrazoia. Hiztegigintzan lan egiten dutenentzat horrelako baliabideak erabiltzea interesgarria izan liteke hiztegiak sortzeko orduan.
Beraz, erabiltzaile arruntarentzat baino gehiago, profesionalentzat da erabilgarri.
Bai, erabiltzaile arruntek hiztegi bezala erabiliko dute gehiago. Eta horretarako azken finean ezagutzen dituzun baliabidetara jotzen duzu. Gainera, gure datu base lexikala ez badugu interfazeari dagokionez erabilerrazago jartzen, zailagoa da erabiltzaile arruntak berau erabiltzea.
jueves, 5 de junio de 2008
miércoles, 4 de junio de 2008
Teknologia berriak eta euskara
Bat soziolinguistikako aldizkaria.
http://www.soziolinguistika.org/
Azken zenbakia (66): Dosierra: /-Teknologi berriak eta euskara/
* Euskara XXI. Mendeko informazio eta komunikazio teknologietan
(Andoni Sagarna)
* Euskarazko informazioaren eta komunikazioaren teknologiak (IKTak)
(Araceli Diaz de Lezana )
* Hizkuntza-teknologia Ixa taldean, euskararen erabilera errazteko
eta sutatzeko aplikazioak (Iñaki Alegria, Xabier Artola, Arantza
Diaz de Ilarraza eta Kepa Sarasola)
* Hizkuntzaren Tratamendu Automatikoa Euskararen Irakaskuntzan
(Itziar Aldabe, Bertol Arrieta, Arantza Diaz de Ilarraza, Montse
Maritxalar, Ianire Niebla, maite Oronoz eta Larraitz Uria )
* Begiratu bat corpus-baliabideei (Nerea Areta, Antton Gurrutxaga,
Igor Leturia)
* Hizkuntzaren tratamendu automatikorako tresnak (Elena García
Berasategi)
* Itzulpen automatikoa: aukerak, arazoak eta erronkak (Iñaki
Alegria, Arantza Diaz de Ilazrraza, Gorka Labaka, Mikel Lersundi,
Kepa Sarasola)
* Euskara eta hizketa-teknologiak (Igor Odriozola, Inma Hernaez, Eva
Navas)
* Euskaljakintza: euskara eta teknologia berriak (Maite Goñi)
* IKASYS, norbere trebakuntza sistematikoaren bidez egiten den
ikasketa (Maite Gomez Lete)
* Teknologia idazlearen lagun (Fernando Morillo)
* Katalanaren itzulpen automatikoa (Mikel L Forcada)
http://www.soziolinguistika.org/
Azken zenbakia (66): Dosierra: /-Teknologi berriak eta euskara/
* Euskara XXI. Mendeko informazio eta komunikazio teknologietan
(Andoni Sagarna)
* Euskarazko informazioaren eta komunikazioaren teknologiak (IKTak)
(Araceli Diaz de Lezana )
* Hizkuntza-teknologia Ixa taldean, euskararen erabilera errazteko
eta sutatzeko aplikazioak (Iñaki Alegria, Xabier Artola, Arantza
Diaz de Ilarraza eta Kepa Sarasola)
* Hizkuntzaren Tratamendu Automatikoa Euskararen Irakaskuntzan
(Itziar Aldabe, Bertol Arrieta, Arantza Diaz de Ilarraza, Montse
Maritxalar, Ianire Niebla, maite Oronoz eta Larraitz Uria )
* Begiratu bat corpus-baliabideei (Nerea Areta, Antton Gurrutxaga,
Igor Leturia)
* Hizkuntzaren tratamendu automatikorako tresnak (Elena García
Berasategi)
* Itzulpen automatikoa: aukerak, arazoak eta erronkak (Iñaki
Alegria, Arantza Diaz de Ilazrraza, Gorka Labaka, Mikel Lersundi,
Kepa Sarasola)
* Euskara eta hizketa-teknologiak (Igor Odriozola, Inma Hernaez, Eva
Navas)
* Euskaljakintza: euskara eta teknologia berriak (Maite Goñi)
* IKASYS, norbere trebakuntza sistematikoaren bidez egiten den
ikasketa (Maite Gomez Lete)
* Teknologia idazlearen lagun (Fernando Morillo)
* Katalanaren itzulpen automatikoa (Mikel L Forcada)
Suscribirse a:
Entradas (Atom)