Arantza Díaz de Ilarraza Sánchez (Donostia, 1957ko apirilaren 18a) Euskal Herriko Unibertsitateko irakasle osoa da.
Donostiako Informatika Fakultatean lan egin du 1981etik 2023an erretiratu den arte.
Euskal Herrian aitzindaria izan da Hizkuntzaren Prozesamenduaren eta Adimen Artifizialaren arloetan. 1990eko bere tesia arloko lehenetakoa izan zen. Arlo horretan bide-urratzailea eta ekintzailea izan da, eta eragin nabarmena izan du Euskal Herriko nahiz nazioarteko hainbat erakunderen eta ikerkuntza-sareren sorreran eta bilakaeran.
Ixa Taldearen sortzailea izan zen Iñaki Alegria, Xabier Arregi Iparragirre, Xabier Artola Zubillaga eta Kepa Sarasolarekin batera, eta taldearen koordinatzailea izan da hasiera-hasieratik, 30 urtean. Nabarmentzekoa da ibilbide osoan taldeari eman dion garrantzia eta lortu duen proiekzioa. Ixa Taldea erreferentziazkoa izan da eta da aipatutako arloan, nola Euskal Herrian hala nazioartean. Ikerketa-lan horrek gizartean eta, batez ere, euskal komunitatean eta euskal kulturan izan duten eragina ere nabarmentzekoa da. Xuxen zuzentzaile ortografikoa eta itzultzaile automatikoak dira tresna ezagunenak, baina badira beste asko ere. Hori dena aitortu zuen, besteak beste, 2013an jasotako Abbadia Sariak.
2018an HiTZ ikerketa-zentroa sortu zuen, Ixa eta Aholab taldeen indarrak batuz, eta bera izan zen zentroaren lehen zuzendaria, Eneko Agirrek eta German Rigauk 2020an ardura hori hartu zuten arte. Hizkuntza-teknologia ardatz duen zentro berri horretan 63 ikertzailek egiten dute lan 2021ean.
Lan aparta egin du adituak eta doktoreak formatzen hizkuntzaren prozesamenduaren arloan. Zuzendu dituen 14 tesietatik harantzago, arloko hainbat doktorego-programaren arduraduna izan da; guztira 55 tesi irakurri ziren euskaraz lerro honetan, 1988tik 2021era. Bestalde, Hizkuntzaren Azterketa eta Prozesamendua / Language Analysis and Processing masterraren zuzendaria ere izan da; master-titulu hori euskaraz eman izan da hasieratik, eta ingelesez 2014tik aurrera, Erasmus Mundus mailako master gisa. Guztira ia 200 lagun dira master horietatik sortu diren adituak. 2012an, UPV/EHUko Master eta Doktorego Eskolako idazkari akademikoa ere izan zen.
Donostiako Amara Zaharra auzoan jaio zen. Haurtzaroan Venezuelan bizi izan zen, gurasoak bertara lanera joanda, eta bost urte zituela itzuli zen Donostiara. Ikasketak Donostiako Santa Teresa ikastetxean eta Usandizaga institutuan egin zituen, eta gero informatika ikasi zuen, artean Informatika Zentro eta gerora Donostiako Informatika Fakultatea izango zenean. Karrera egiten zuen bitartean euskaldundu zen.
1979an lortu zuen Informatikako Lizentziatura, eta handik bi urtera hasi zen irakasle fakultatean bertan. 1983an egin zuen graduko tesina eta 1990ean defendatu zuen Informatikako doktoretza-tesia, betiere Euskal Herriko Unibertsitateko Informatika Fakultatean.
Egun, Alkizan bizi da.
Irakasle kontratatuen artean gorengo maila den irakasle oso kategoriako lehen emakumea izan zen UPV/EHUn, 2013an. Karrera zientifiko eta teknologikoetan gizonen eta emakumeen arteko parekotasuna benetakoa izan dadin, nesken interesa txikitatik pizteko beharra aldarrikatzen du, baita emakume erreferenteak ezagutzera ematekoa ere. Bestalde, berak sortutako ikerketa-taldean, eta bere argitalpen zientifikoetan agertzen diren egilekideak aztertuta, emakume eta gizonen arteko proportzioa oso gertu dago parekidetasunetik, ingeniaritzetan ohikoa ez bada ere.
Euskara unibertsitatean sartzeko prozesuaren barruan hainbat irakasgai irakatsi ditu euskaraz, eta horien artean ekarpen handiena egin zuen Programazioaren Metodologia I (93/94), Programazioaren Metodologia II (91/92) eta Hizkuntzaren Prozesamendua (1996/97) irakasgaiak euskaratzen.
Díaz de Ilarrazak ibilbide luzea egin du unibertsitate-kudeaketan. Honako kargu hauek izan ditu UPV/EHUn: Lengoaia eta Sistema Informatikoak Sailaren zuzendaria (1985-1987), UPV/EHUko Informatika Fakultateko Ikerkuntzarako eta Kanpo-Harremanetarako dekanordea (1992-1996). Horrez gain, Fakultate Batzarreko kidea izan da eta hainbat kudeaketa-batzordetan parte hartu du luzaro.
Gorago esan bezala, IXA taldearen sortzaileetako bat izan zen 1988an. 2002an, ELEKA SL spin-off enpresaren sorrera bultzatu zuen, UPV/EHUko Ixa Taldearen eta Elhuyar Fundazioaren arteko lankidetzaren ondorioz. 2018an, berriz, HITZ ikerketa-zentroaren sortzaile eta lehen zuzendaria izan zen.
Berak pertsonalki 14 doktorego-tesi zuzendu ditu eta 4 ikaslibururen egilekidea izan da. Baina berak zuzendu dituen tesietatik harantzago, 1991. urteaz geroztik Lengoaia eta Sistema Informatikoak Sailak sustatutako hainbat doktorego-programaren irakaskuntza-arduraduna eta partaidea izan da, eta 2006tik aurrera, berriz, master honen arduraduna: HAP: Hizkuntzaren Azterketa eta Prozesamendua / LAP: Language Analysis and Processing, baita izen bera duen doktorego-programarena ere.
Unibertsitateko graduen mailatik harantzago, hizkuntza-teknologian profesional adituak eta doktoreak hezten eragile nagusia izan da bere tesia bukatu zuenetik. Hasieran, gai hori lantzen zuten doktorego-ikastaro espezifikoak emanez; gero, 2001 eta 2006 urteen artean, UEUren eta UPV/EHUren artean sortu zuten Hizkuntza eta Teknologia (HIZTEK) berezko tituluaren proposatzaile, batzorde akademikoko kide eta irakasle izan zen. Eta, azkenik, 2006tik aurrera Hizkuntzaren Azterketa eta Prozesamendua master ofizialaren arduraduna izan da. Euskaraz eman izan da master-titulu hori hasieratik, eta ingelesez 2014tik aurrera, ordudanik koordinatu izan baita Europa mailako Language and Communication Technology Erasmus Mundus masterrarekin, zeinetan Díaz de Ilarraza batzordekide izan baita. Nazioarteko partzuergo zabal batean integratuta, partzuergoan oro har ematen den ingelesaren ikuspuntu globalaz gain, baliabide gutxiko hizkuntza baten ikuspegia gehitzen diote UPV/EHUko partaideek master horretan.
2001ean hasitako heziketa-lerro honetan 150 aditu sortu dira. Gaur egun hizkuntza-teknologiaren lan-eremua dinamizatzen ari diren informatikari eta hizkuntzalari gehienak hortik atera dira. Masterrean, hizkuntzaren prozesamenduan ezinbestekoak diren bi arloak uztartzen dira: teknologia, batetik, eta hizkuntzalaritza, bestetik.
Hizkuntzaren Azterketa eta Prozesamendua doktorego-programan guztira 55 tesi irakurri dira euskaraz lerro honetan 1988tik, eta horietako 20 tesi aurkeztu ziren 2012-2017 epean.
Esan bezala, Díaz de Ilarraza UPV/EHUko Master eta Doktorego Eskolako idazkari akademikoa izan zen 2012an.
Díaz de Ilarrazak 180 liburu-kapitulu argitaratu ditu, eta hainbat eta hainbat artikulu estatuko eta nazioarteko aldizkari eta biltzar zientifikoetan, informatikaren, adimen artifizialaren eta hizkuntzalaritza konputazionalaren arloetan. Euskal komunitate zientifikoaren Inguma datu-basean, esaterako, berak euskaraz idatzitako 60 lan baino gehiago agertzen dira.
1990ean defendatu zuen Informatikako doktoretza-tesian hizkuntza naturalezko elkarrizketen kudeaketa aztertu zuen, irakaskuntza adimentsuko sistema batean. Informatikako programak diseinatzen irakasten zuen CAPRA sistema tutore adimendunaren elkarrizketa-sistema bat programatu zuen. Horretarako, ikaslearen mezuak linguistikoki ulertu behar ziren eta irakaskuntza-sistemaren formalizazioa eta modelizazioa lortu behar ziren. Nonbait, hogeita hamar urte geroago hain ospetsu bihurtu ziren chatbotak edo ChatGPT aplikazioen aurrekariak ziren Díaz de Ilarrazaren lan haiek.
Hizkuntzaren prozesamenduaren arloan aritzen den Ixa ikertaldeko ikertzaile nagusia izan da 30 urtean zehar. Ixa Taldea A motako ikerketa-talde gisa onartuta dago Eusko Jaurlaritzan, hau da, gorengo mailan. 1988 eta 2020 urteen artean guztira 14 milioi euroren finantzazioa kudeatu zuen Díaz de Ilarrazak, nazioarteko beste hainbat ikerketa-talderekin lankidetzan; guztira, talde guztien artean, 44 milioi euroren aurrekontua osatuz. Berak koordinatu duen taldearen kide kopurua 30etik gorakoa izan da beti XXI. mendea hasi zenetik. Kopuru hori handituz joan zen, eta 2020an 73 pertsona ziren koordinatzen zituenak.
Ugariak dira Díaz de Ilarrazak ikertzaile moduan landu dituen arloak. Gehienak hizkuntzaren prozesamendu automatikoarekin eta Ixa Taldearekin lotuta badaude ere, sistema tutore adimendunen arloan ere aritu izan da hainbat urtetan, Galan Taldearekin. Hauek dira bere ibilbide osoan jorratu dituen sei ikerlerro nagusiak:
Díaz de Ilarrazaren tesia arlo honetan kokatu zen: Informatikako programak diseinatzen irakasten zuen CAPRA sistema tutore inteligentearen elkarrizketa-sistema bat kudeatzen zuen. Felisa Verdejo informatikari aitzindaria izan zen bere tesi-zuzendaria. Tesia bukatuta, Isabel Fernández de Castrorekin batera gidatu zuen lerro hau, UPV/EHUko Informatika fakultatean, eta Galan ikertaldea sortu zuten. 1989an lehen europar proiektua lortu zuen taldeak. ITSIE: Intelligent Tutoring System for Industrial Environments izeneko proiektu hartan, lankidetzan aritu ziren zentro hauekin: UPV/EHU, Iberdrola, Labein, Heriot Watt University, Marconi (Edinburgo) eta CISE (Italia).
Xabier Arregi Iparragirreren eta Eneko Agirreren tesiak zuzendu zituen arlo horretan.
Hiru tesi zuzendu zituen lerro honetan: Itziar Aduriz (Patxi Goenagarekin batera), Maxux Aranzabe (Joxe Mari Arriolarekin batera) eta Bertol Arrietarena (Iñaki Alegriarekin batera).
Montse Maritxalarren eta Maite Oronozen tesiak zuzendu zituen arlo horretan, bigarrena Koldo Gojenolarekin batera.
Besteak beste, sintaktikoki etiketatutako EPEC corpusa (EPEC-DEP) sortu zen lan horietatik.
Díaz de Ilarrazak (Kepa Sarasolarekin batera) zuzendutako Aingeru Mayorren tesiaren emaitza Matxin programa itzultzailea izan zen (2007), euskararako sortu zen lehenengoa. Geroago katalana, galiziera, euskara eta gaztelaniaren arteko itzulpen automatikoa eskaintzen zuen Opentrad kode irekiko sistemaren barruan Matxin itzultzailea ere integratu zen 2009an, itzultzaileak www.opentrad.com web-orrian erabil zitezkeen doan.
Geroago, 2010ean, Gorka Labakaren tesian itzultzaile automatiko estatistiko bat sortu zen.
Paradigma neuronalaren ekarriarekin, 2017az geroztik izugarrizko hobekuntza nabaritu zen hizkuntza nagusien arteko itzulpen automatikoan. Geroxeago, eta arin, euskal munduko ikerkuntza-komunitatea gai izan zen euskaratik eta euskararako itzultzaile neuronalak mundu mailako egoeraren pare jartzeko.
2015ean hasi zen euskararako itzulpen neuronala aztertzen, TADEEP proiektuan. Ordurako Deepl itzultzaileak kalitatezko emaitzak ematen zituen 10 hizkuntzaren arteko itzulpenetan, baina euskara ez zegoen horien artean. Bi urte geroago, baina, lehen emaitza onak lortuta, lehen demoa publikoki eskura zegoen (2017). 2017an bertan, hainbat agente (Ixa Taldea, Elhuyar, Vicomtech, Ametzagaña, Mondragon Lingua...) elkartu eta MODELA izeneko proiektua abiatu zen. Beste urtebeteko epean, 2018an, MODELA itzultzailea plazaratu zen, Interneten publiko orokorrerako euskarazko itzulpen neuronala eskaintzen zuen lehen zerbitzua.
Abiada bizian mugitzen ari den arlo honetan, gutxienez beste hiru itzultzaile neuronal gehiago plazaratu dira harrezkero:
Díaz de Ilarrazak bere ibilbide zientifikoan ikerketa teorikoa sakonki landu du, eta ehunka argitalpen plazaratu ditu. Baina ikerketa hori ez da argitalpen soiletan geratu. Azterketa teorikoa egitearekin batera, proiektu gehienetan teknologia-transferentzia ere egin du Ixa Taldeak.
Esate baterako, taldeak 1994an plazaratu zituen Xuxen zuzentzaile ortografikoa eta EDBL datu-base lexikala, lexikala, zeinak euskara batuaren erabilera normalizatzeko funtsezko tresna izan baitira harrezkero. Taldekide ziren Iñaki Alegria informatikariaren eta Miriam Urkia hizkuntzalariaren tesiek Xuxen zuzentzaile ortografikoaren oinarri informatikoa eta linguistikoa ezarri zuten.. Baina, aldi berean, Klaudio Harluxetek sortutako Hizkia enpresarekin lankidetzan eta Eusko Jaurlaritzako finantzazioari esker, zuzentzaile hori lehen urratsetako bat izan zen euskara mundu digitalean erabili ahal izateko; 1995 hartan Luistxo Fernandezek idatzitako Leihoak Zabalduz txostenean azaltzen zen hori, urte berean plazaratu baitziren Xuxen eta euskaraz lokalizatutako lehen sistema eragilea ere (Windows 95).
Berdin esan daiteke itzulpen automatikoaz. 2000. urtekoak dira taldearen lehen argitalpen zientifikoak gai horretaz, eta gero guztira 100 baino gehiago izan dira. Baina azterketa teorikoak egitearekin batera, teknologia-transferentzia ere egin dute. Matxin programa itzultzailea publikoki aurkeztu zen 2007an, euskararako sortu zen lehenengoa. Geroago, 2010ean, Gorka Labakaren tesian itzultzaile automatiko estatistikoa sortu zuten. Eta horrela, 2017 inguruan, paradigma neuronalaren iraultza zela-eta hizkuntza nagusien arteko itzultzaile automatiko eta izugarrizko hobekuntza lortu zenean, euskal ikertzaileak oso epe motzean (urtebete) gai izan ziren euskararako lehen itzultzaile neuronalak sortzeko.
Ixa Taldeak hizkuntza prozesatzeko 27 produktu erregistratu ditu 27 urtetan, eta produktu horietako 9 hauen garapenean parte-hartze zuzena izan du Díaz de Ilarrazak:
Díaz de Ilarrazak estatu mailako eta nazioarteko biltzarrak antolatzen lagundu du, eta horietako askoren Antolakuntza Batzordean eta Batzorde Zientifikoan parte hartu du. Hizkuntzaren Prozesamendurako Espainiako Elkartearen (Sociedad Española para el procesamiento del Lenguaje Natural, SEPLN) zuzendariorde eta elkarteak argitaratzen duen aldizkariaren editore izan zen 1990etik 2004ra bitartean.
Hainbat sari lortu ditu Diaz de Ilarrazak koordinatzen duen Ixa Taldeak; besteak beste hauek:
Díaz de Ilarrazak eta Ixa Taldeak 200 ikerketa-proiektu eta 57 ikerketa-kontratu landu dituzte 32 urtetan, eta proiektu horien munta ekonomikoa 12 miloi euro baino handiagoa izan da. Finantziazio horren erdia baino gehiago kanpotik etorri da (% 24,2 Europatik edo Estatu Batuetatik, % 22,4 Madrilgo ministerioetatik eta % 7,3 kontratu eta patenteetatik), eta beste erdia bertako finantziazio-iturrietatik (Eusko Jaurlaritza, UPV/EHU, Aldundiak eta Euskaltzaindia). 200 proiektu horietako 20tan Diaz de Ilarraza izan da ikertzaile nagusia; hain zuzen ere, honako hauetan:
Díaz de Ilarrazak zuzendutako Ixa Taldearen nazioarteko harreman-sarea mundu mailako 20 talde baino gehiagorengana hedatu da. Besteak beste, taldea proiektuetan lankidetzan aritu da unibertsitate hauekin: Helsinki, Berlin-UBER, Sidney, Lisboa, Groningen, Bangor, Dublin-DCU, Praga-CUNI, Budapest IICT-BAS, Cuscoko UNSAAC, Bartzelonako UPC eta UB, Deustua, UNED, Valentzia, Alacant, Jaén, Vigo eta Santiago de Compostela. Beste alde batetik, ikerketa-zentro hauekin ere aritu izan da lankidetzan: Sidneyko Health Language Analytics enpresarekin, Santiago de Cubako Centro de Lingüística Aplicada-rekin, German Research Center for Artificial Intelligence DFKI institutuarekin, Clarin sarea, ISCA-SALTMIL (Special Interest Group on Minority Languages), Baionako eta Toulouseko CNRS taldeekin. Eta, azkenik, noski, Euskal Herriko Tecnalia, Elhuyar, Vicomtech, Aholab taldea (UPV/EHU), Euskaltzaindia, UZEI eta Langune klusterreko beste kide guztiekin.
Gai honi buruzko informazio gehiago lor dezakezu Scholian |
This article uses material from the Wikipedia Euskara article Arantza Diaz de Ilarraza Sanchez, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). Eduki guztia CC BY-SA 4.0(r)en babespean dago, ez bada kontrakoa esaten. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki Euskara (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.