Arantza Diaz De Ilarraza Sanchez: Informatikaria, ikertzailea eta unibertsitateko irakaslea

Arantza Díaz de Ilarraza Sánchez (Donostia, 1957ko apirilaren 18a) Euskal Herriko Unibertsitateko irakasle osoa da.

Donostiako Informatika Fakultatean lan egin du 1981etik 2023an erretiratu den arte.

Arantza Diaz de Ilarraza Sanchez
Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea
Bizitza
Jaiotzako izen-deiturakArantza Díaz de Ilarraza Sánchez
JaiotzaDonostia1957ko apirilaren 18a (67 urte)
HerrialdeaArantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea Gipuzkoa, Euskal Herria
Hezkuntza
HeziketaEuskal Herriko Unibertsitatea
Donostiako Informatika Fakultatea
Tesi zuzendariaFelisa Verdejo
Doktorego ikaslea(k)Eneko Agirre
Xabier Arregi Iparragirre
Bertol Arrieta
Montse Maritxalar Anglada
Aingeru Mayor
Gorka Labaka
Maite Oronoz Antxordoki
Itziar Gonzalez-Dios
Maxux Aranzabe
Itziar Aduriz Agirre
Mikel Iruskieta Quintian
Begoña Altuna
Nora de la Serna
Julián Gutiérrez Serrano
Jose Angel Vadillo
Hizkuntzakgaztelania
euskara
Jarduerak
Jarduerakinformatikaria eta unibertsitateko irakaslea
Enplegatzailea(k)Euskal Herriko Unibertsitatea
Donostiako Informatika Fakultatea
Lan nabarmenak
Jasotako sariak
KidetzaUdako Euskal Unibertsitatea
Ixa taldea
Sociedad Española para el Procesamiento del Lenguaje Natural
Erasmus mundus programme: an european oportunity for students and scholars (en) Itzuli

Inguma: Arantza-Diaz-de-Ilarraza-Sanchez

Euskal Herrian aitzindaria izan da Hizkuntzaren Prozesamenduaren eta Adimen Artifizialaren arloetan. 1990eko bere tesia arloko lehenetakoa izan zen. Arlo horretan bide-urratzailea eta ekintzailea izan da, eta eragin nabarmena izan du Euskal Herriko nahiz nazioarteko hainbat erakunderen eta ikerkuntza-sareren sorreran eta bilakaeran.

Ixa Taldearen sortzailea izan zen Iñaki Alegria, Xabier Arregi Iparragirre, Xabier Artola Zubillaga eta Kepa Sarasolarekin batera, eta taldearen koordinatzailea izan da hasiera-hasieratik, 30 urtean. Nabarmentzekoa da ibilbide osoan taldeari eman dion garrantzia eta lortu duen proiekzioa. Ixa Taldea erreferentziazkoa izan da eta da aipatutako arloan, nola Euskal Herrian hala nazioartean. Ikerketa-lan horrek gizartean eta, batez ere, euskal komunitatean eta euskal kulturan izan duten eragina ere nabarmentzekoa da. Xuxen zuzentzaile ortografikoa eta itzultzaile automatikoak dira tresna ezagunenak, baina badira beste asko ere. Hori dena aitortu zuen, besteak beste, 2013an jasotako Abbadia Sariak.

2018an HiTZ ikerketa-zentroa sortu zuen, Ixa eta Aholab taldeen indarrak batuz, eta bera izan zen zentroaren lehen zuzendaria, Eneko Agirrek eta German Rigauk 2020an ardura hori hartu zuten arte. Hizkuntza-teknologia ardatz duen zentro berri horretan 63 ikertzailek egiten dute lan 2021ean.

Lan aparta egin du adituak eta doktoreak formatzen hizkuntzaren prozesamenduaren arloan. Zuzendu dituen 14 tesietatik harantzago, arloko hainbat doktorego-programaren arduraduna izan da; guztira 55 tesi irakurri ziren euskaraz lerro honetan, 1988tik 2021era. Bestalde, Hizkuntzaren Azterketa eta Prozesamendua / Language Analysis and Processing masterraren zuzendaria ere izan da; master-titulu hori euskaraz eman izan da hasieratik, eta ingelesez 2014tik aurrera, Erasmus Mundus mailako master gisa. Guztira ia 200 lagun dira master horietatik sortu diren adituak. 2012an, UPV/EHUko Master eta Doktorego Eskolako idazkari akademikoa ere izan zen.

Bizialdia

Donostiako Amara Zaharra auzoan jaio zen. Haurtzaroan Venezuelan bizi izan zen, gurasoak bertara lanera joanda, eta bost urte zituela itzuli zen Donostiara. Ikasketak Donostiako Santa Teresa ikastetxean eta Usandizaga institutuan egin zituen, eta gero informatika ikasi zuen, artean Informatika Zentro eta gerora Donostiako Informatika Fakultatea izango zenean. Karrera egiten zuen bitartean euskaldundu zen.

1979an lortu zuen Informatikako Lizentziatura, eta handik bi urtera hasi zen irakasle fakultatean bertan. 1983an egin zuen graduko tesina eta 1990ean defendatu zuen Informatikako doktoretza-tesia, betiere Euskal Herriko Unibertsitateko Informatika Fakultatean.

Egun, Alkizan bizi da.

Irakasle osoa

Irakasle kontratatuen artean gorengo maila den irakasle oso kategoriako lehen emakumea izan zen UPV/EHUn, 2013an. Karrera zientifiko eta teknologikoetan gizonen eta emakumeen arteko parekotasuna benetakoa izan dadin, nesken interesa txikitatik pizteko beharra aldarrikatzen du, baita emakume erreferenteak ezagutzera ematekoa ere. Bestalde, berak sortutako ikerketa-taldean, eta bere argitalpen zientifikoetan agertzen diren egilekideak aztertuta, emakume eta gizonen arteko proportzioa oso gertu dago parekidetasunetik, ingeniaritzetan ohikoa ez bada ere.

Euskara unibertsitatean sartzeko prozesuaren barruan hainbat irakasgai irakatsi ditu euskaraz, eta horien artean ekarpen handiena egin zuen Programazioaren Metodologia I (93/94), Programazioaren Metodologia II (91/92) eta Hizkuntzaren Prozesamendua (1996/97) irakasgaiak euskaratzen.

Kudeatzailea eta antolatzailea

Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Informatika Fakultatea

Díaz de Ilarrazak ibilbide luzea egin du unibertsitate-kudeaketan. Honako kargu hauek izan ditu UPV/EHUn: Lengoaia eta Sistema Informatikoak Sailaren zuzendaria (1985-1987), UPV/EHUko Informatika Fakultateko Ikerkuntzarako eta Kanpo-Harremanetarako dekanordea (1992-1996). Horrez gain, Fakultate Batzarreko kidea izan da eta hainbat kudeaketa-batzordetan parte hartu du luzaro.

Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Ixa Taldea 2008an, Arantza aurrean.

Gorago esan bezala, IXA taldearen sortzaileetako bat izan zen 1988an. 2002an, ELEKA SL spin-off enpresaren sorrera bultzatu zuen, UPV/EHUko Ixa Taldearen eta Elhuyar Fundazioaren arteko lankidetzaren ondorioz. 2018an, berriz, HITZ ikerketa-zentroaren sortzaile eta lehen zuzendaria izan zen.

Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Hitz Zentroaren lehen zuzendaria (2018)

Adituak eta doktoreak hezten eragile

Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Díaz de Ilarrazaren tesi-zuhaitz partzial bat Emakume eta gizonen arteko proportzioa oso gertu dago parekidetasunetik (emakumeen nodoak kolore gorrian, gizonezkoenak urdinez).

Berak pertsonalki 14 doktorego-tesi zuzendu ditu eta 4 ikaslibururen egilekidea izan da. Baina berak zuzendu dituen tesietatik harantzago, 1991. urteaz geroztik Lengoaia eta Sistema Informatikoak Sailak sustatutako hainbat doktorego-programaren irakaskuntza-arduraduna eta partaidea izan da, eta 2006tik aurrera, berriz, master honen arduraduna: HAP: Hizkuntzaren Azterketa eta Prozesamendua / LAP: Language Analysis and Processing, baita izen bera duen doktorego-programarena ere.

Unibertsitateko graduen mailatik harantzago, hizkuntza-teknologian profesional adituak eta doktoreak hezten eragile nagusia izan da bere tesia bukatu zuenetik. Hasieran, gai hori lantzen zuten doktorego-ikastaro espezifikoak emanez; gero, 2001 eta 2006 urteen artean, UEUren eta UPV/EHUren artean sortu zuten Hizkuntza eta Teknologia (HIZTEK) berezko tituluaren proposatzaile, batzorde akademikoko kide eta irakasle izan zen. Eta, azkenik, 2006tik aurrera Hizkuntzaren Azterketa eta Prozesamendua master ofizialaren arduraduna izan da. Euskaraz eman izan da master-titulu hori hasieratik, eta ingelesez 2014tik aurrera, ordudanik koordinatu izan baita Europa mailako Language and Communication Technology Erasmus Mundus masterrarekin, zeinetan Díaz de Ilarraza batzordekide izan baita. Nazioarteko partzuergo zabal batean integratuta, partzuergoan oro har ematen den ingelesaren ikuspuntu globalaz gain, baliabide gutxiko hizkuntza baten ikuspegia gehitzen diote UPV/EHUko partaideek master horretan.

2001ean hasitako heziketa-lerro honetan 150 aditu sortu dira. Gaur egun hizkuntza-teknologiaren lan-eremua dinamizatzen ari diren informatikari eta hizkuntzalari gehienak hortik atera dira. Masterrean, hizkuntzaren prozesamenduan ezinbestekoak diren bi arloak uztartzen dira: teknologia, batetik, eta hizkuntzalaritza, bestetik.

Hizkuntzaren Azterketa eta Prozesamendua doktorego-programan guztira 55 tesi irakurri dira euskaraz lerro honetan 1988tik, eta horietako 20 tesi aurkeztu ziren 2012-2017 epean.

Esan bezala, Díaz de Ilarraza UPV/EHUko Master eta Doktorego Eskolako idazkari akademikoa izan zen 2012an.

Ikertzailea

Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Diaz de Ilarrazaren 50 egilekide, artikulu zientifikoetan (Ixa, Aminer)

Díaz de Ilarrazak 180 liburu-kapitulu argitaratu ditu, eta hainbat eta hainbat artikulu estatuko eta nazioarteko aldizkari eta biltzar zientifikoetan, informatikaren, adimen artifizialaren eta hizkuntzalaritza konputazionalaren arloetan. Euskal komunitate zientifikoaren Inguma datu-basean, esaterako, berak euskaraz idatzitako 60 lan baino gehiago agertzen dira.

1990ean defendatu zuen Informatikako doktoretza-tesian hizkuntza naturalezko elkarrizketen kudeaketa aztertu zuen, irakaskuntza adimentsuko sistema batean. Informatikako programak diseinatzen irakasten zuen CAPRA sistema tutore adimendunaren elkarrizketa-sistema bat programatu zuen. Horretarako, ikaslearen mezuak linguistikoki ulertu behar ziren eta irakaskuntza-sistemaren formalizazioa eta modelizazioa lortu behar ziren. Nonbait, hogeita hamar urte geroago hain ospetsu bihurtu ziren chatbotak edo ChatGPT aplikazioen aurrekariak ziren Díaz de Ilarrazaren lan haiek.

Hizkuntzaren prozesamenduaren arloan aritzen den Ixa ikertaldeko ikertzaile nagusia izan da 30 urtean zehar. Ixa Taldea A motako ikerketa-talde gisa onartuta dago Eusko Jaurlaritzan, hau da, gorengo mailan. 1988 eta 2020 urteen artean guztira 14 milioi euroren finantzazioa kudeatu zuen Díaz de Ilarrazak, nazioarteko beste hainbat ikerketa-talderekin lankidetzan; guztira, talde guztien artean, 44 milioi euroren aurrekontua osatuz. Berak koordinatu duen taldearen kide kopurua 30etik gorakoa izan da beti XXI. mendea hasi zenetik. Kopuru hori handituz joan zen, eta 2020an 73 pertsona ziren koordinatzen zituenak.

Ikerketa-lerroak

Ugariak dira Díaz de Ilarrazak ikertzaile moduan landu dituen arloak. Gehienak hizkuntzaren prozesamendu automatikoarekin eta Ixa Taldearekin lotuta badaude ere, sistema tutore adimendunen arloan ere aritu izan da hainbat urtetan, Galan Taldearekin. Hauek dira bere ibilbide osoan jorratu dituen sei ikerlerro nagusiak:

Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Díaz de Ilarrazaren ikertzailearen artikulu-egilekideen grafoa. Argitalpen guztiak ez dira kontuan hartu, 2020an Wikidatan zeudenak bakarrik. Emakume eta gizonen arteko proportzioa oso gertu dago parekidetasunetik (emakumeen nodoak kolore gorrian, gizonezkoenak urdinez).

Sistema Tutore Inteligenteak (1981tik).

Díaz de Ilarrazaren tesia arlo honetan kokatu zen: Informatikako programak diseinatzen irakasten zuen CAPRA sistema tutore inteligentearen elkarrizketa-sistema bat kudeatzen zuen. Felisa Verdejo informatikari aitzindaria izan zen bere tesi-zuzendaria. Tesia bukatuta, Isabel Fernández de Castrorekin batera gidatu zuen lerro hau, UPV/EHUko Informatika fakultatean, eta Galan ikertaldea sortu zuten. 1989an lehen europar proiektua lortu zuen taldeak. ITSIE: Intelligent Tutoring System for Industrial Environments izeneko proiektu hartan, lankidetzan aritu ziren zentro hauekin: UPV/EHU, Iberdrola, Labein, Heriot Watt University, Marconi (Edinburgo) eta CISE (Italia).

Hiztegi-ezagutzaren erauzketa eta egituraketa (1993-2000).

Xabier Arregi Iparragirreren eta Eneko Agirreren tesiak zuzendu zituen arlo horretan.

Oinarrizko analizatzaile linguistikoak (1994tik)

Hiru tesi zuzendu zituen lerro honetan: Itziar Aduriz (Patxi Goenagarekin batera), Maxux Aranzabe (Joxe Mari Arriolarekin batera) eta Bertol Arrietarena (Iñaki Alegriarekin batera).

Hainbat tresna linguistikoren integrazioa irakaskuntza-ingurune batean (1994tik)

Montse Maritxalarren eta Maite Oronozen tesiak zuzendu zituen arlo horretan, bigarrena Koldo Gojenolarekin batera.

Hizkuntza-tresna informatikoen integrazioa eta testuak linguistikoki etiketatzeko laguntzak (1995etik)

Besteak beste, sintaktikoki etiketatutako EPEC corpusa (EPEC-DEP) sortu zen lan horietatik.

Itzulpen automatikoa (2000tik)

Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Arantza Diaz de Ilarraza bulegoan(2000)

Díaz de Ilarrazak (Kepa Sarasolarekin batera) zuzendutako Aingeru Mayorren tesiaren emaitza Matxin programa itzultzailea izan zen (2007), euskararako sortu zen lehenengoa. Geroago katalana, galiziera, euskara eta gaztelaniaren arteko itzulpen automatikoa eskaintzen zuen Opentrad kode irekiko sistemaren barruan Matxin itzultzailea ere integratu zen 2009an, itzultzaileak www.opentrad.com web-orrian erabil zitezkeen doan.

Geroago, 2010ean, Gorka Labakaren tesian itzultzaile automatiko estatistiko bat sortu zen.

Paradigma neuronalaren ekarriarekin, 2017az geroztik izugarrizko hobekuntza nabaritu zen hizkuntza nagusien arteko itzulpen automatikoan. Geroxeago, eta arin, euskal munduko ikerkuntza-komunitatea gai izan zen euskaratik eta euskararako itzultzaile neuronalak mundu mailako egoeraren pare jartzeko.

2015ean hasi zen euskararako itzulpen neuronala aztertzen, TADEEP proiektuan. Ordurako Deepl itzultzaileak kalitatezko emaitzak ematen zituen 10 hizkuntzaren arteko itzulpenetan, baina euskara ez zegoen horien artean. Bi urte geroago, baina, lehen emaitza onak lortuta, lehen demoa publikoki eskura zegoen (2017). 2017an bertan, hainbat agente (Ixa Taldea, Elhuyar, Vicomtech, Ametzagaña, Mondragon Lingua...) elkartu eta MODELA izeneko proiektua abiatu zen. Beste urtebeteko epean, 2018an, MODELA itzultzailea plazaratu zen, Interneten publiko orokorrerako euskarazko itzulpen neuronala eskaintzen zuen lehen zerbitzua.

Abiada bizian mugitzen ari den arlo honetan, gutxienez beste hiru itzultzaile neuronal gehiago plazaratu dira harrezkero:

  • Eusko Jaurlaritzaren Itzultzaile neuronala: Eusko Jaurlaritzako itzulpen-memoriak erabiliz (IVAP-HAEEk 20 urtetan bildutako 10 milioi "esaldi" baino gehiago).
  • batua.eus: Vicomtech-ek MODELA sisteman hobekuntzak egin zituen (RNN teknologiatik Transformer teknologiara pasatu ziren) eta corpusa handitu zuten.
  • Itzultzailea.eus: Elhuyarrek ere antzeko hobekuntzak egin zituen, eta hizkuntza berriak gehitu zituen (ingelesa, frantsesa, espainiera, galegoa eta katalana).

Transferentzia zientifiko aplikatua

Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Xuxen 2020
Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Zuzentzaile ortografikoa (Xuxen, 1994) euskara batuaren erabilera normalizatzeko funtsezko tresna.

Díaz de Ilarrazak bere ibilbide zientifikoan ikerketa teorikoa sakonki landu du, eta ehunka argitalpen plazaratu ditu. Baina ikerketa hori ez da argitalpen soiletan geratu. Azterketa teorikoa egitearekin batera, proiektu gehienetan teknologia-transferentzia ere egin du Ixa Taldeak.

Zuzentzaile ortografikoa

Esate baterako, taldeak 1994an plazaratu zituen Xuxen zuzentzaile ortografikoa eta EDBL datu-base lexikala, lexikala, zeinak euskara batuaren erabilera normalizatzeko funtsezko tresna izan baitira harrezkero. Taldekide ziren Iñaki Alegria informatikariaren eta Miriam Urkia hizkuntzalariaren tesiek Xuxen zuzentzaile ortografikoaren oinarri informatikoa eta linguistikoa ezarri zuten.. Baina, aldi berean, Klaudio Harluxetek sortutako Hizkia enpresarekin lankidetzan eta Eusko Jaurlaritzako finantzazioari esker, zuzentzaile hori lehen urratsetako bat izan zen euskara mundu digitalean erabili ahal izateko; 1995 hartan Luistxo Fernandezek idatzitako Leihoak Zabalduz txostenean azaltzen zen hori, urte berean plazaratu baitziren Xuxen eta euskaraz lokalizatutako lehen sistema eragilea ere (Windows 95).

Itzulpengintza automatikoa

Berdin esan daiteke itzulpen automatikoaz. 2000. urtekoak dira taldearen lehen argitalpen zientifikoak gai horretaz, eta gero guztira 100 baino gehiago izan dira. Baina azterketa teorikoak egitearekin batera, teknologia-transferentzia ere egin dute. Matxin programa itzultzailea publikoki aurkeztu zen 2007an, euskararako sortu zen lehenengoa. Geroago, 2010ean, Gorka Labakaren tesian itzultzaile automatiko estatistikoa sortu zuten. Eta horrela, 2017 inguruan, paradigma neuronalaren iraultza zela-eta hizkuntza nagusien arteko itzultzaile automatiko eta izugarrizko hobekuntza lortu zenean, euskal ikertzaileak oso epe motzean (urtebete) gai izan ziren euskararako lehen itzultzaile neuronalak sortzeko.

Transferentzia: produktu erregistratuak

Ixa Taldeak hizkuntza prozesatzeko 27 produktu erregistratu ditu 27 urtetan, eta produktu horietako 9 hauen garapenean parte-hartze zuzena izan du Díaz de Ilarrazak:

  • 1994: XUXEN, euskararako zuzentzaile ortografiko eta analizatzaile morfologikoa.
  • 1997: EDBL: Euskararen datu-base lexikala. Hiztegi informatiko baten moduko zerbait da, baina hitzez gain, atzizkiak-eta ere hartzen ditu bere barruan. Maiz txarto idazten diren hitzak (Hitz ez estandarrak, esaterako: *eritzi, *iharduera) eta hitz anitzeko unitate lexikalak ere (adarra jo edo Amerikako Estatu Batuak bezalakoak, esaterako) jasotzen ditu. Esanahia barik, item bakoitzaren propietate lexikal eta morfologikoak zehazten ditu sarrera bakoitzak. Informazio hori Xuxen zuzentzaile ortografikoaren eta hizkuntzaren prozesamendurako beste tresna eta aplikazio askoren oinarri lexikala da.
  • EDBL datu-base lexikaleko elementuen proportzioak
  • Hitz ez-estandarrak
  • Hiztegi-sarrera, hitz flexionatu eta ez-independenteak
  • Hitz anitzeko unitate lexikalak
  • 2001: EUSTAGGER, euskararen lematizatzaile/etiketatzailea. Euskarazko edozein hitz emanda, programa honek hitzaren lema (erroa, hiztegian bilatu beharko litzatekeena), hitzaren kategoria morfologikoa (izena, aditza, adjektiboa...) eta hitzeko atzizkiak identifikatzen ditu. Adibidez: etxekoena hitza emanda, erroa edo lema etxe dela, kategoria izen arrunta dela, eta atzizkiak ko+en+a direla esango luke.
  • 2003: Basque WordNet / Euskal WordNet. Euskarazko lehen ezagutza-base lexikal edo hiztegi semantiko eleaniztuna da, ingelesezko WordNet eta hizkuntza anitzeko EuroWordNet-en eredua jarraitzen duena. Era honetan, euskal hitzak ingelesezko WordNet-ekoekin lotzen ditu era erdi-automatikoan. Euskal WordNet gaztelaniari, ingelesari, galizierari, portugesari eta katalanari lotuta dago, Multilingual Central Repository errepositorioan (MCR). Beste hizkuntza batzuei lotuta egoteaz gain, Euskal WordNet SUMO eta Top Ontology ontologietara mapeatuta dago. Erabiltzaile arruntei dagokienez, beste hiztegi arruntek eskaintzen dituzten itzulpen elebidunez gain, informazio gehigarria ematen du. Adibidez, pagoa hitza bilatuz gero, zuhaitz mota bat dela eta zehazki zer motatakoa den adierazten du. Sinatzaileak: Itziar Aduriz, Eneko Agirre, Iñaki Alegria, Olatz Ansa, Maxux Aranzabe, Xabier Arregi, Olatz Arregi, Bertol Arrieta, Jose Mari Arriola, Xabier Artola Zubillaga, Aitziber Atutxa, Arantza Díaz de Ilarraza, Nerea Ezeiza, Koldo Gojenola, Mikel Lersundi, Montserrat Maritxalar, David Martinez, Aingeru Mayor, Maite Oronoz, Eli Pociello, Kepa Sarasola, Aitor Soroa, Larraitz Uria eta Ruben Urizar.
  • 2008: IXAti, chunker-a. Euskarako azaleko analizatzaile sintaktikoa. Sinatzaileak: Izaskun Aldezabal, Iñaki Alegria, Maxux Aranzabe, Olatz Arregi, Jose Mari Arriola, Xabier Artola Zubillaga, Kepa Bengoetxea, Klara Ceberio, Arantza Díaz de Ilarraza, Nerea Ezeiza, Koldo Gojenola, Mikel Lersundi, Maite Oronoz eta Ruben Urizar.
  • 2008: Xuxeng, euskarazko testuetarako estilo eta gramatika zuzentzailea. Sinatzaileak: Itziar Aldabe, Bertol Arrieta, Arantza Díaz de Ilarraza, Nerea Ezeiza, Montserrat Maritxalar, Maite Oronoz, Kepa Sarasola eta Larraitz Uria.
  • 2008: libiXaml, anotazio linguistikoak kudeatzeko liburutegia. Sinatzaileak: Xabier Artola Zubillaga, Arantza Díaz de Ilarraza, Kike Fernandez, Koldo Gojenola, Aitor Sologaistoa eta Aitor Soroa.
  • 2012: EUSMT, itzulpen automatiko estatistikoa euskararako. Sinatzaileak: Iñaki Alegria, Arantza Díaz de Ilarraza, Gorka Labaka eta Kepa Sarasola.
  • 2019: EUSRST_TB, euskal RST erlazioez zuhaitz-bankua (testu etiketatua, diskurtso-markekin). Sinatzaileak: Jon Alkorta, Maxux Aranzabe, Arantza Díaz de Ilarraza, Kike Fernandez, Itziar Gonzalez-Dios, Mikel Iruskieta, Mikel Lersundi, Oier Lopez de Lacalle eta Esther Miranda.

Ikerketa-elkarteen sortzaile eta eragilea

Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 

Díaz de Ilarrazak estatu mailako eta nazioarteko biltzarrak antolatzen lagundu du, eta horietako askoren Antolakuntza Batzordean eta Batzorde Zientifikoan parte hartu du. Hizkuntzaren Prozesamendurako Espainiako Elkartearen (Sociedad Española para el procesamiento del Lenguaje Natural, SEPLN) zuzendariorde eta elkarteak argitaratzen duen aldizkariaren editore izan zen 1990etik 2004ra bitartean.

Liburuak

  • Hizkuntzalaritza konputazionala. Izaskun Aldezabal Roteta, Jose Mari Arriola Egurrola eta Kepa Sarasola Gabiolarekin (UEU, 2005).
  • Oinarrizko programazioa. Ariketa bilduma. Kepa Sarasola Gabiolarekin (UEU, 1999).
  • Programen egiaztapena eta eratorpena. Xabier Arregi Iparragirre eta Paqui Lucio Carrascorekin (UEU, 1993).
  • Verificación de programas y metodología de la programación (Spanish Edition). Xabier Arregi Iparragirre eta Paqui Lucio Carrascorekin.

Sariak eta errekonozimenduak

Hainbat sari lortu ditu Diaz de Ilarrazak koordinatzen duen Ixa Taldeak; besteak beste hauek:

  • Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
    Arantza Diaz de Ilarraza (IkerGazte, 2021)
    2021: IkerGazte biltzarrean hitzaldi gonbidatua: "Hizkuntza-teknologiaren bilakaera. Ixa Taldearen esperientzia. Erabili zientzia gizartearen alde."
  • 2021ko Espainiako Informatika Saria eman zion arloko SCIE elkarteak Eneko Agirre Ixakideari. (Sociedad Científica Informática de España). Epaimahaiak azaldu zuen hizkuntzaren prozesamenduaren esparruan egindako ekarpen bikainengatik eman ziotela; bereziki, testu-baliabide handien ustiapenean,, eta itzulpen automatikoari aplikatutako neurona-konputazioan oinarritutako ikasketa automatiko ez-gainbegiratuan. Aipatu zuen, gainera, zientzia-argitalpenen kalitate bikainagatik ez ezik (bere argitalpen horietako batzuk erreferentetzat hartzen dira mundu mailan), bere ikerketaren emaitza-transferentzia handiagatik, zientzia-lidergoagatik —Hitz ikerketa-zentro ospetsuaren zuzendaria da— eta nazioarteko ibilbide oso nabarmenagatik, bai prestakuntzan, bai lankidetzetan.
  • 2021: Ikertzaile gazteentzako Espainiako Informatika Saria jaso zuen Mikel Artetxe ixakideak, arloko SCIE elkarteak ematen duena (Sociedad Científica Informática de España). Epaimahaiak saria eman zion nazioartekoan duen presentzia handiagatik, hizkuntzaren prozesamenduaren arloko enpresa garrantzitsuenetan egindako egonaldiengatik eta ospe handiko biltzarretan egindako ekarpenengatik.
  • 2020: Hizkuntzaren prozesamendua lantzen duen COLING nazioarteko kongresuan Aparteko Artikuluaren Saria jaso zuen Ixa Taldeak (Outstanding Paper Award). Artikulua Ixa Taldeko ikertzaile hauen artean idatzi zuten: Jon Ander Campos, Kyunghyun Cho, Arantxa Otegi, Aitor Soroa, Eneko Agirre and Gorka Azkune. Izenburua hau zen: Improving Conversational Question Answering Systems after Deployment using Feedback-Weighted Learning. (Elkarrizketa moduko galdera-sistemak hobetzea inplementazioaren ondoren, atzeraelikadurako ikaskuntza haztatua erabiliz).
  • 2019: COVID-19 Open Research Dataset Challenge. Estatu Batuetako gobernuak bultzatutako COVID-19 gaixotasunaren inguruan antolatutako adimen artifizialeko txapelketan saria. Ixa Taldeko Arantxa Otegi eta Jon Ander Campos ikertzaileek eta Eneko Agirre eta Aitor Soroa irakasleek hartu zuten parte.
  • 2017, 2019 eta 2020: Eneko Agirre taldekide eta egun HiTZ zentroaren zuzendariak hiru aldiz jarraian irabazi zuen Google-ren sari bat. Google Faculty Research Award saria hirutan lortu duen ikertzaile bakanetakoa da bera. Proiektua batez ere ingelesezko elkarrizketetan zentratzen bada ere (sukaldaritzari eta elikadurari buruzko galderak), euskarazko elkarrizketekin ere lan egin dute. Horretarako, iaz Ixa Taldeak euskarazko elkarrizketak biltzeko boluntarioak erakartzeko kanpaina jarri zuen martxan. Kanpainak oso harrera ona izan zuen, eta pertsonei buruzko euskarazko elkarrizketak jaso ziren, Wikipedian dagoen informazioan oinarrituta.
  • 2009tik hona, nazioarteko kongresu zientifikoetan artikulurik onenari egindako 10 aipamen; horien artean, honako hauek: Europako Itzulpen Automatikoaren Elkartearen kongresuan (EAMT, 2009), testu klinikoen prozesamenduaren alorrean 2017ko 3 artikulurik onenetako bat eta Txiotesia lehiaketako saria (2014).
  • 2017: Bagerak bere 25. urteurrenean  Ixa Taldeari errekonozimendu saria
  • 2013: Abbadia saria jaso zuen Díaz de Ilarrazak, Ixa Taldearen izenean Gipuzkoako Foru Aldundiaren eskutik.
    Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
    IXA Taldea Abbadia Saria jasotzen (2013)
  • 2013: Donostiako udalaren eskutik Ixa Taldearen aldeko adierazpen instituzionala.
  • 2012: Ibilaldian omendua izan zen teknologia berrietan euskara sartzeko egindako lanengatik, beste hauekin batera: Lapurdiko Harluxetar lehengusu ingeniariak: Klaudio Harluxet eta René Harluxet; Aurki, Sustatu, Codesyntax: Luistxo Fernandez. UEUko Informatika saila: Olatz Arbelaitz; EHUko Donostiako Informatika Fakultatea (Ixa Taldea eta Díaz de Ilarraza tartean; EHUko Aholab Taldea: Inma Hernaez; puntueus: Iratxe Esnaola; kaixo.com: Aitor Lopez de Aberasturi; Erentzun ikastola: Fultxo Crespo; Hachtibista, sare sozialak: Gorka Julio; Euskal Jakintza: Maite Goñi.
  • 2011: Koldo Mitxelena Saria eskuratu zuen tesi baten zuzendari (Maite Oronoz, Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko baliabideen garapena: datak, postposizio-lokuzioak eta komunztadura).
  • 2002: Toribio Etxeberria saria, ELEKA INGENIARITZA LINGUISTIKOA, S.L. spin-off enpresa sortzeagatik.
  • 2001: Manuel Laborde Werlinden saria, ELEKA INGENIARITZA LINGUISTIKOA, S.L. spin-off enpresa sortzeagatik.

Ikerketa-proiektu nagusiak

Díaz de Ilarrazak eta Ixa Taldeak 200 ikerketa-proiektu eta 57 ikerketa-kontratu landu dituzte 32 urtetan, eta proiektu horien munta ekonomikoa 12 miloi euro baino handiagoa izan da. Finantziazio horren erdia baino gehiago kanpotik etorri da (% 24,2 Europatik edo Estatu Batuetatik, % 22,4 Madrilgo ministerioetatik eta % 7,3 kontratu eta patenteetatik), eta beste erdia bertako finantziazio-iturrietatik (Eusko Jaurlaritza, UPV/EHU, Aldundiak eta Euskaltzaindia). 200 proiektu horietako 20tan Diaz de Ilarraza izan da ikertzaile nagusia; hain zuzen ere, honako hauetan:

  • 2019: Itzulbide: Testu klinikoak euskaratik eta euskarara egokitzeko itzultzaile automatiko baten garapena eta ezartzea. Osakidetza. Osasun-txostenak gazteleratik euskarara eta euskaratik gaztelerara itzuliko dituen itzultzaile automatiko neuronal baten garapena.
  • 2016PROSA-MED: Testuen prozesamendu semantiko aurreratua, diagnostikoak, prozedurak, kontzeptu medikoak eta beraien arteko erlazioak txosten medikoetatik erauzteko. Madrilgo Ministerio de Economía y Competitividad. Osasun-sektoreak garrantzia handia du gizartearen bizi-kalitaterako eta baita bere diziplinarteko izaeragatik. Egunero, milaka dokumentu mediko sortzen dira osasun-sisteman (ospitaleak, osasun-zentroak), eta testuen analisi automatikorako tresnek aurrerapen handia ekar dezakete, testu horietan dagoen ezagutza prozesatuz. Proiektuan lan horiek egiteko tresna multzo zabala eta eraginkorra sortu ziren: 1) Testu medikoen analisi morfologiko, sintaktiko eta semantikoa. 2) Txosten medikoei CIE-10 kodeketaren bidezko esleipena egiteko tresna. 3) Kontzeptu medikoen arteko erlazioen detekzioa, aurkako erreakzioen detekzioa barne.
  • 2016: UPV/EHU taldea (A motako Eusko Jaurlaritzaren ikerketa-taldea). UPV/EHU.
  • 2016IXA taldea. A motako ikertalde finkatua. Eusko Jaurlaritza.
  • 2014EXTRECM: Kontzeptu medikoen arteko erlazioen erauzketa askotariko informazio-iturrietatik. Madrilgo Ministerio de Economia y Competitividad.
  • 2013: EHU-Azpiegitura 2013: Hizkuntzaren prozesamendurako eta hodei-konputaziorako konputagailu-klusterra. UPV/EHU.
  • 2010: EHU-Azpiegitura 2010: Corpus eta baliabide linguistikoen kudeaketarako zerbitzaria. UPV/EHU.
  • 2010: TIMM sare tematikoa: Tratamiento de Información Multilingüe y Multimodal / Informazio eleaniztun eta multimodalaren tratamendua. MICCINN.
    Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
    Isabel Fernandez de Castrok eta Díaz de Ilarrazak elkarrekin zuzendu zuten Europako ITSIE proiektua 1989an.
  • 2010-2015: IXA taldea, A motako ikertalde finkatua. Eusko Jaurlaritza.
  • 2009: RTTH: Hizketa-teknologiako sare tematikoa. MEC.
  • 2008: Itzulpen automatikorako sistema, Matxin. Eleka Ingeniaritza Linguistikoa.
  • 2000-2003: HERMES: Hemeroteka elektronikoetarako informazio-berreskurapen eleaniztun eta informazio-erauzketa semantikoa / Hemerotecas electrónicas: recuperación multilingüe y extracción semántica. Partaideak: CICyT, UPV/EHU, UNED, UPC eta UB.
  • 1996-1999: ITEM: Informazioa berreskuratzeko sistema eleanitza. Partaideak: CICyT, UPV/EHU, UNED eta UPC.
  • 1996: Hizkuntza baten ikaskuntza-prozesuaren ikerketarako sistema adimenduna. Ikaslearen Modelizazioa.
  • 1994: XUXEN: Euskararako zuzentzaile ortografiko eta analizatzaile morfologikoa.
    Arantza Diaz De Ilarraza Sanchez: Bizialdia, Irakasle osoa, Kudeatzailea eta antolatzailea 
    Xuxen (1994)
  • 1992: HAIN: Hizkuntz aplikazioetarako ingurunea. Eusko Jaurlaritza
  • 1991: Euskararako datu-base lexikal baten diseinua. GFA.
  • 1991: Euskararako analizatzaile morfologiko baten diseinua (GFA). Geroago, Morfologia konputazionala: euskararen morfologiaren deskribapena liburua argitaratu zen proiektuko emaitzekin (2002).
  • 1989-1991: Prestakuntzarako sistema adimendunak industriaguneetan / Intelligent Training Systems in Industrial Environments. Europako Batzordea, FP2-ESPRIT-2. Ikertzaile nagusia, Isabel Fernandez de Castrorekin batera.

Díaz de Ilarrazak zuzendutako Ixa Taldearen nazioarteko harreman-sarea mundu mailako 20 talde baino gehiagorengana hedatu da. Besteak beste, taldea proiektuetan lankidetzan aritu da unibertsitate hauekin: Helsinki, Berlin-UBER, Sidney, Lisboa, Groningen, Bangor, Dublin-DCU, Praga-CUNI, Budapest IICT-BAS, Cuscoko UNSAAC, Bartzelonako UPC eta UB, Deustua, UNED, Valentzia, Alacant, Jaén, Vigo eta Santiago de Compostela. Beste alde batetik, ikerketa-zentro hauekin ere aritu izan da lankidetzan: Sidneyko Health Language Analytics enpresarekin, Santiago de Cubako Centro de Lingüística Aplicada-rekin, German Research Center for Artificial Intelligence DFKI institutuarekin, Clarin sarea, ISCA-SALTMIL (Special Interest Group on Minority Languages), Baionako eta Toulouseko CNRS taldeekin. Eta, azkenik, noski, Euskal Herriko Tecnalia, Elhuyar, Vicomtech, Aholab taldea (UPV/EHU), Euskaltzaindia, UZEI eta Langune klusterreko beste kide guztiekin.

Erreferentziak

Ikus, gainera

Kanpo estekak

Gai honi buruzko informazio gehiago lor dezakezu Scholian

Tags:

Arantza Diaz De Ilarraza Sanchez BizialdiaArantza Diaz De Ilarraza Sanchez Irakasle osoaArantza Diaz De Ilarraza Sanchez Kudeatzailea eta antolatzaileaArantza Diaz De Ilarraza Sanchez Adituak eta doktoreak hezten eragileArantza Diaz De Ilarraza Sanchez IkertzaileaArantza Diaz De Ilarraza Sanchez Transferentzia zientifiko aplikatuaArantza Diaz De Ilarraza Sanchez Ikerketa-elkarteen sortzaile eta eragileaArantza Diaz De Ilarraza Sanchez LiburuakArantza Diaz De Ilarraza Sanchez Sariak eta errekonozimenduakArantza Diaz De Ilarraza Sanchez Ikerketa-proiektu nagusiakArantza Diaz De Ilarraza Sanchez ErreferentziakArantza Diaz De Ilarraza Sanchez Ikus, gaineraArantza Diaz De Ilarraza Sanchez Kanpo estekakArantza Diaz De Ilarraza Sanchez1957Apirilaren 18DonostiaDonostiako Informatika FakultateaEuskal Herriko Unibertsitatea

🔥 Trending searches on Wiki Euskara:

Pruden GartziaMaria Eugenia ArrizabalagaIraitz-sistemaReal SociedadEusko Abertzale EkintzaPanda handiGrândolaIrulegiko EskuaPavel TonkovKareharriNafarroa GaraiaSofonisba AnguissolaPi (zenbakia)ArabaEspainiako geografiaUrteGernu-aparatuDigestio-aparatuErrenteriaZeltaNikola TeslaXerxes I.aKoldo Romero EskamendiEmpar PinedaJutta PoikolainenKoebaluazioBuckingham jauregiaPolinizazioPlayStationOzeano AtlantikoaAntoni GaudíPoloniaLorea IntxaustiKlimaEspainiako Bigarren ErrepublikaMaitasunAs (egunkaria)Iberiar penintsulaPrudentzio (santua)BiotopoZuberoaSaguzarHerri palestinarraGotzone SagarduiXabier García RamsdenJorma SandelinTxomin Agirre1991ko Nafarroako Foru Erkidegoko SariaSare pribatu birtualOpilaren egunaEstirpe ImperialAlexandro HandiaAntzinako ErromaBilintxCarles PuigdemontPaduraALMENPetrolioOperaDCCPNekazaritzaNeomakIhes beteaKubismoMoskuDeiaGonzalo BoyeFelix MarañaImanol PradalesIratiMunduko biztanleriaGazteluBernart Etxepare🡆 More