2024/11/19
Azaroaren 7an ospatu zen Donostiako Carlos Santamaria zentroan Informatikari Euskaldunen Biltzarrean (IEB) izan ginen. Aurten, bilkuraren gai nagusia Adimen Artifizial Sortzailea izan zen eta bertan, CodeSyntax-ek eman zidan aukera aprobetxatuz, etxean nire kontura egindako lana aurkeztu nuen "LibreTranslate itzultzaile neuronalari euskara irakatsi diogu" tituluarekin.

Aitor Bengoetxea eta Aitzol Astigarragak hasierako ongi etorri protokolarioa egin ostean, Mikel Artetxe Zurutuzak (Reka startuparen sortzailea, Ixa taldeko eta Hitz zentroko langilea eta Metako langile ohiak) ekin zion lehenengo hitzaldiari: "Adimen artifizial sortzailea: historiatik eta histeriara?"

Niretzat, masterclass bat izan zen eta ziurrenik eguneko hitzaldirik onena. Adimen artifizialaren historia kontatu zuen, oker ez banago 70. hamarkadatik honaino arlo hau nola eboluzionatu den esplikatuz. LLMek (Large Lenguage Model) nola funtzionatzen duten eta hauen erabilera nola aldatu den oso garbi eta modu ulerkor batean azaldu ere. Eta horren ostean, 2019tik hona OpenIAren eta ChatGPTren eskutik egon den iraultza nola gertatu den ere bai. Funtsean, ikuspegi zientifikotik eginiko aldaketa txikiak modeloetan inplementatu eta esperimentatzetik, datu kantitate masiboen bidez entrenatutako modeloak erabiltzeko saltoa azaldu zigun. Eta beno, azken aldian denok ikusi dugun AAren fenomeno honen oinarriak zeintzuk izan ziren ederki azaldu zituen.

Ondoren, Teknikatik lanbide heziketan dabiltzan bi hizlarik hartu zuten parte: Iñaki Telleria eta Rakel Alonsok. "Adimen Artifiziala lanbide heziketan: ikaskuntza aberasteko erronka" izenburupean egin zuten aurkezpena, eta oinarrian, bai irakasle eta baita ikasleek ere ikasketa prozesuan adimen artifizialak izan duen eragina aipatu zuten. Hainbat erronka planteatu zituzten heziketan adimen artifiziala modu eraikitzaile batean txertatzeko.

Publikotik egin zen galdera batek atentzioa eman zidan: "Zer gertatzen da, irakasleak etxerako lan bat ChatGPT bidez sortzen badu, gero ikasleak etxeko lan hori ChatGPTri egiteko eskatu eta horrela entregatzen badio eta irakasleak ikaslearen lan hori berriz ere ChatGPTri baloratzeko eskatzen badio?". Hezitzaile hauen erantzuna: "Adimen artifizialak laguntzen du, baina pertsonon gainbegiratze bat behar beharrezkoa da".

Eta atsedenaldia aurretik, Ainhoa Iturrioz, Abantail koperatibako kideak Mendix plataforma aurkeztu zuen "Low-code eta Mendix plataforma" hitzaldiarekin. Plataforma hau programatu ahal izan gabe, interfaze grafikoak erabiliz webgune eta aplikazioak sortzeko erabiltzen da eta horretarako azpitik Java kodea erabiltzen du. Konponente ezberdinak dauzka eta programatzen jakin gabe adibidez scratch izango balitz bezala, aplikazio ezberdinak programatzeko erabiltzen da.

Atsedenaldi ostean, bi hitzaldi teknikoago izan genituen komunikazioekin hasi aurretik. Ander Corral Navesek (Orai NPL) "LLMtan oinarritutako soluzioak" aurkeztu zuen, eta bertan azkena findu duten Llama ereduaren gaineko hainbat xehetasun esan zituen. Nola lehendabizi, euskarazko oinarrizko LLM eredu onargarri bat sortu zuten eta bigarren fase batean, eredu horri instrukzio batzuk jarraitzen erakutsi dietela eta hori fintzen ari direla. Instrukzio hauekin ChatGPTren antzerako bat sortu nahi dute, baina euskalduna. Lehen aipatutako hasierako entrenamendurako, ZelaiHandi datu sorta libre erraldoia sortu dute: https://huggingface.co/datasets/orai-nlp/ZelaiHandi. Datu sorta hori sortzeko erabilitako iturrietako batzuk aipatzearren:

CC lizentzien potentziala argi geratu zen. Gainera, datu sorta hau etengabe elikatzen jarraitzeko asmoa dute.

Eta ondoren Naiara Perez Miguel Ixa eta Hitz zentroko ikerlariak, "Zein da LLMrik onena?" hitzalidia eskeini zigun. Bertan, LLM bat baloratzeko ematen dituzten pausoak zehaztu zituen eta balorazio horiek egiteko dituzten zailtasunak zeintzuk diren. Atentzio handia eman zidan kontuetako bat da, bere garaian Latxa ereduak Egunean Behinen parte hartu zuenean jokatutako partiden emaitzak balorazio moduan erabili zituztela. Izan ere, test motako aukeraketa oso erraza zaie balorazioak egiteko. %63 edo honelako portzentai batean asmatu zituen galderak, aste horretan jokatu zuten pertsonen %80k baino hobeto erantzunda. Agian elkarlanen bat atera daiteke hor CodeSyntax eta LLM entrenatzaileen artean, batek daki.

Horrez gain, https://hitz-zentroa.github.io/arena/ tresna erakutsi zigun. 7 bat LLM eredu konparatzeko tresna bat da eta ausaz bi aurkezten dizkigute A eta B (atzetik zeintzuk diren guk jakin gabe). Guk prompt edo galdera bat idazten diegu eta biek ematen duten erantzuna baloratu behar dugu: A hobea da, B hobea da, biak ondo edota biak gaizki erantzunez. Emaitzekin, LLM onena aukeratzea izan zen xedea. 24 orduz martxan eduki zuten eta behekoa moduko probak egin genituen:

IEB-HizkuntzaZentroenArena-EHU.png

Eta amaitzeko komunikazioak aurkeztu genituen. 2 saio paralelo egon ziren, ikasleena eta komunikazio orokorrena. Ikasleena ez genuen ikusi, beraz, komunikazio hauetatik apamen batzuk:

  • Josu Waliñorena .EUS zibersegurtasun estrategiarena gustatu zitzaidan, aurretik ere Bilbon egin zuen berdintsua izan zen, esanez beraiek domeinu guztiei jarraipena egiten dietela. Eta Zibersegurtasunaren behatokia aurkeztu zuen: https://puntu.eus/zibersegurtasun-behatokia/. Bertan, puntueusen zibersegurtasuna proban jartzeko tresna bat ere badago, kalifikazio bat lortzen delarik: https://puntu.eus/webgune-zibersegurtasuna.Taldekook barrez jardun genuen, han zuzenean https://ueu.eus webgunearekin testa egin baizuen eta A+ (kalifikazio onena) lortu baizuen. Zorionak beraz UEU taldekooi!
  • Gero Gorka Julio eta Mattin Solis agertu ziren Torrekuan izango diren hainbat hitzaldi zikloz eta Torrekuako proiektuari buruz hitz egitera: Sareak berreskuratu eta berrasmatu edota Komunitate libreago baterantz trantsizioan
  • ONDARE izeneko proiektu bat ere aurkeztu zuten, "Ongizaterako adimen artifizialaren ekarpenak", Adimen artifizialaren erabilera etikoagoa egiteko pauta batzuk jarri beharraz hitz egin zuten.
  • Asier Urio Larrea Nafarroako unibertsitatetik etorri zen "Adimen artifizial Sortzailetik haratago" aurkezpena egitera. Gehienbat adimen artifizialaren erabilera praktikoak erakutsi zizkigun, eta esango nuke kasurik gehienak klinikoak izan zirela: Mugimendu murriztua duten pertsonentzat exoeskeletoak mugitzeko aplikazioak, gaitzak detektatzeko softwarea, bideojokoen pertsonaien mugimenduen inteligentzia etabar...
  • Ondoren nire komunikazioa "LibreTranslate itzultzaile neuronalari euskara irakatsi diogu" aurkeztu nuen. Bere garaian Blogak.eus-en ere idatzi nuen honi buruz eta, honen sitentesi bat izan zen gutxigora behera.
  • Gero Josu Igoa Errandonek "Ideckia" aurkeztu zuen. Ordenagailuko agindu ezberdinak kontrolatu ahal izateko mugikorreko aplikazio bat. Funtsean streamingak egiteko erabitzen diren deck horietakoa, baina birtuala. Oso hitzaldi dibertigarria, bidenabar.
  • Eta azkenik EHUko bi ikasle (Paula Ontalvilla eta Xabier Irastorza) agertu ziren Euskal Herri osoko datu meteorologikoak Wikipedia/Wikidatan nola sartu zituzten azaltzera. Kriston lana, asko gustatu zitzaidan hau ere.

Eta horrekin amaitu zen dena. Gero sari banaketa bat egon zen ikasleen komunikazio onenak aukeratzeko eta horren ostean gehienok bazkaltzera joan ginen.

Egun paregabea ezbairik gabe!! Hurrengo arte!

Agian interesatuko zaizkizu beste artikulu hauek