jueves, 5 de junio de 2008

EuskalWordnet

Eli Pociello: “Euskal WordNet Lengoaia naturalaren prozesamenduan erabiltzea nahi dugu, adibidez itzulpen automatikoan”
Elisabeth Pombo, 2008-06-05

Eli Pociello filologoa EHUko IXA taldeko kide izan da zortzi urtez. Bertan Euskal WordNet, euskarazko lehenengo ezagutza base lexikalaren sorreran parte hartu du. Hain zuzen ere, ezagutza base lexikal hori izan da unibertsitatean aurkeztu berri duen bere doktore tesiaren gaia. Oraindik proiektua garatze fasean dago, momentuz izenak eta aditz batzuk soilik landu baitituzte, baina adjektiboak, adberbioak eta aditz guztiak ere gehitu behar dira. Gaur egun Eli Elhuyarren dago, haren Zientzia eta Teknologia Hiztegia eta Euskal WordNet lotuko dituen proiektu batean lanean.

Zer da ezagutza base lexikala?

Datu base baten antzekoa da, baina desberdintasuna da hiztegi batean jasotzen den informazioaz gain –hitzen adierak eta adiera horien definizioak eta adibideak– kontzeptuak elkarren artean harremanetan jartzen direla. Adibidez, hatza eskuko zati bat dela esaten zaigu eta eskua aldi berean besoa kontzeptuarekin harremanetan jartzen dela. Azken finean, kontzeptu guztiak euren artean harremanetan jartzen dira hierarkikoki.

Euskal WordNet Lengoaia naturalaren prozesamenduan erabiltzea nahi dugu, adierari begira garatzen diren aplikazioetan. Adibidez, itzulpen automatikoan. Sistemak ulertu behar du zer hitz ari den itzultzen eta horretarako hiztegi baten beharra dauka. Agian hitz baten testuinguruan agertzen den beste hitz baten bidez jakin daiteke lehenengoak zer adiera duen eta horretarako erabiltzen dira kontzeptuen arteko erlazioak.

Gaur egun zer tresna daude itzulpen automatikoaren alorrean? Zer emaitza ematen dituzte?

Fakultatean eta Elhuyarren egon diren proiektu batzuetan euskara, gaztelania, galiziera eta katalanaren arteko itzulpen automatikoarekin egin dugu lan. Euskararen ezaugarriak oso desberdinak dira beste hizkuntzekin alderatuta. Beste hizkuntzen oinarria latinetik etorritakoa izanda, errazagoak dira itzultzen, baina euskararen kasuan, bere ezaugarriengatik, emaitzak ez dira hain onak. Euskararen alde lan gehiago egin behar da. Sistema hobetu behar da. Horretarako proiektu eta diru laguntza gehiago lortu behar dira.

IXA taldeak eta Elhuyar Fundazioak, beste batzuekin elkarlanean Open Trad tresna garatu dute. Oraingoz euskararentzat hori dago. Emaitza eskasak ez, baina hobetzeko modukoak dira, lehen aipatutako arrazoiengatik. Hala ere, testu baten ideia ulertzeko balio du.

Erabiltzaile arruntak zertarako erabil dezake Euskal WordNet?

Beste hiztegiek bezalako informazioa ekartzen du –itzulpen elebidunak– baina horretaz gain, informazio gehiago ere jakin daiteke. Adibidez, jakin ahal dugu pagoa zuhaitz mota bat dela eta zehazki zer zuhaitz mota den. Nik uste lexikografikoek erabilgarri izango dutela. Hori da orain Elhuyarren egotearen beste arrazoia. Hiztegigintzan lan egiten dutenentzat horrelako baliabideak erabiltzea interesgarria izan liteke hiztegiak sortzeko orduan.

Beraz, erabiltzaile arruntarentzat baino gehiago, profesionalentzat da erabilgarri.

Bai, erabiltzaile arruntek hiztegi bezala erabiliko dute gehiago. Eta horretarako azken finean ezagutzen dituzun baliabidetara jotzen duzu. Gainera, gure datu base lexikala ez badugu interfazeari dagokionez erabilerrazago jartzen, zailagoa da erabiltzaile arruntak berau erabiltzea.

miércoles, 4 de junio de 2008

Teknologia berriak eta euskara

Bat soziolinguistikako aldizkaria.
http://www.soziolinguistika.org/

Azken zenbakia (66): Dosierra: /-Teknologi berriak eta euskara/

* Euskara XXI. Mendeko informazio eta komunikazio teknologietan
(Andoni Sagarna)
* Euskarazko informazioaren eta komunikazioaren teknologiak (IKTak)
(Araceli Diaz de Lezana )
* Hizkuntza-teknologia Ixa taldean, euskararen erabilera errazteko
eta sutatzeko aplikazioak (Iñaki Alegria, Xabier Artola, Arantza
Diaz de Ilarraza eta Kepa Sarasola)
* Hizkuntzaren Tratamendu Automatikoa Euskararen Irakaskuntzan
(Itziar Aldabe, Bertol Arrieta, Arantza Diaz de Ilarraza, Montse
Maritxalar, Ianire Niebla, maite Oronoz eta Larraitz Uria )
* Begiratu bat corpus-baliabideei (Nerea Areta, Antton Gurrutxaga,
Igor Leturia)
* Hizkuntzaren tratamendu automatikorako tresnak (Elena García
Berasategi)
* Itzulpen automatikoa: aukerak, arazoak eta erronkak (Iñaki
Alegria, Arantza Diaz de Ilazrraza, Gorka Labaka, Mikel Lersundi,
Kepa Sarasola)
* Euskara eta hizketa-teknologiak (Igor Odriozola, Inma Hernaez, Eva
Navas)
* Euskaljakintza: euskara eta teknologia berriak (Maite Goñi)
* IKASYS, norbere trebakuntza sistematikoaren bidez egiten den
ikasketa (Maite Gomez Lete)
* Teknologia idazlearen lagun (Fernando Morillo)
* Katalanaren itzulpen automatikoa (Mikel L Forcada)

miércoles, 21 de mayo de 2008

Sakelako Hiztegia

Euskara- Gaztelania / Gaztelania-Euskara hiztegia eskuko telefonoan jaso daiteke sms bat bidalita: Hiztegia hitza idatzi eta 5464 zenbakira igorri behar da mezua aplikazioa jaisteko. Ikusi informazio gehiago hementxe .

miércoles, 30 de abril de 2008

Testua ahots bihurtzeko tresna euskaraz: Arantxa

Testua ahots bihurtzeko Arantxa makinaren ahotsa zer iruditzen zaizu?

Testua ahots bihurtzeko tresnak

miércoles, 16 de abril de 2008

Ruperren Hiriak

Ahozko tradizioa


Ahozko tradizioan, bertsolaritzan esaterako, badugu tresna automatikorik: bertsolarixa.

miércoles, 9 de abril de 2008

Tradizioak

lunes, 24 de marzo de 2008

Corpusak

  • Zientzia eta Teknologiaren corpusa.

EHUko kontsultaguneak

EHUk ere eskaintzen ditu zenbait baliabide.
Ez dira gutxi, ezta unibertsitate munduan ere, artikuluak-eta taxutzean zalantzak eta duda-mudak dituzten idazleak, hitz forma egokienak, esapide aukerakoenak, joskera zuzenenak hautatzeko orduan. Egoera horri aurre egiteko EHUko Euskara Zerbitzuak honako lanabes hau eskaintzen dizu. Bertan, gaur egungo hainbat euskal idazle ereduzkoren azken urteotako testuak bildu ditugu, horiekin corpus aski zabal bat eratuz. Corpus horri etekinik beteena ateratzeko aztergailu ahaltsu eta erabilerraz bat erantsi diogu. Horiek horrela, lanabes aski egokia duzu hau, gaurko euskal autore eredugarriak zure duda-mudei eman dizkien irtenbideak ezagutzeko.

Hiztegiak interneten

Eusko Jaurlaritzaren web berean beste zenbait hiztegi.

Euskararako tresnak

Eusko Jaurlaritzaren webean hainbat tresna baliagarri ditugu.

XUXEN zuzentzaile ortografikoa


XUXENen bertsio desberdinak hartzeko web helbidea: hemen.

viernes, 21 de marzo de 2008

Teknologia eta hizkuntza txikiak

Teknologia eta hizkuntza txikiak: hausnarketa.

Teknologia sorkuntzaren akuilu

Idazle azpeitiar baten artikulua baliatuko dugu gaiari hurbiltzeko. Fernando Morilloren hitzak lapurtuko ditugu:
Muga-aro batean bizi garela esaten da askotan (zintzoak izateko, beti
esan izan da). Egia eta gezurra: non, noiz eta norentzat esaten den,
noski. Ezin da ukatu, hala ere, garai zinez interesgarria dela gurea.
Halako alde handia egongo al da joan zaigunaren eta datorkigunaren
artean? Auskalo. Kontua da, oraingoan, teknologiak baduela
zer esanik ate joka ari zaigun eten, krisi, aldaketa edo dena delako horretan.
Beharbada, idazleek istorio bera kontatuko dute, behin eta berriro.
Baina (eta hor dago gakoa) begiratzeko beste modu, beste formatu batzuk
azaldu dira urteotan. Hobeak? Ziur asko ez. Bai desberdinak. Sormen
artistiko orok senari (arrazoiaz kanpoko zerbaiti) zor dio bere indarra,
eta ez inolako mekanismori. Guztiz ados. Teknologiak, ordea, ez dio bortxa egiten sen horri, bidea
ibiltzeko beste modu bat ekartzen baizik. Teknologia ez da zirkuluaren
koadratura, baina gure gihar nekatuentzako makulu bihur daiteke.

jueves, 20 de marzo de 2008

Hizkuntza Teknologiak
Blog honetan landuko den gaia hauxe da: euskara aberasteko tresnak eta baliabideak
XUXENen kontuekin hasi gara, hizkuntza tekonologietara hurbiltze aldera. Oraingoan, kontu horien inguruko blog bat proposatzen dizuet. Hurrengo saioetan, hizkuntza aberasteko edota lantzeko baliabide gehiago eskaintzen ahaleginduko naiz.
On egin dagizuela!

Xuxen egunkarietan


Xuxen-xuxen

Anjel LErtxundi
«Aspaldi ez haiz Xuxen-ekin sartu», adiskide batek. Arrazoi du, baina ez Xuxen-ekin ahaztu naizelako: ohitu egin naiz nire eguneroko alter ego-arekin lan egitera, lankide ona dut, kasu egiten diot gehienetan, antzarak ferratzera bidaltzen dut noizean behin. Ea honako kasu hau: inkontziente, kontziente eta kontzientzia hitzak onartzen dizkit; inkontzientzia, ez. Ea beste kasu hau: ez dizkit xuri, xuabe edo xikin bezalako adjektibo leunduak onartzen, nork, eta bere buruari Xuxen deitzen dion nire alter ego preziatuak. Ea, gaurkoagatik, azken kasua: gorriz ematen dizkit koipelustre bezalako adjektibo sano petoak.
Ez dago, jakina, hizkuntza osoa jasoko duen arautegirik. Hiztunon zorionerako. Eta gutxiago dago hizkuntza baten ahalbide guztiak jasoko dituen eta usaindu ere egingo dituen gramatikarik. Hiztunon gozamenerako.
Blog honen xedeak:

1. Blogean jauzi, salto egin, baina ez itotzea :-)!
2. Euskararen inguruko baliabide digitaletan murgiltzea.
3. Ideiak trukatzea.