Euskarazko hizkuntza teknologiak abian, BerbaTek proiektuaren eskutik
BerbaTek ikerketa proiektu estrategikoaren helburua hizkuntzen industriarako irtenbide praktikoak aurkitzea izan da. Hiru urte iraun dituen ikerketa honetan hiru demo garatu dituzte, eta atzo aurkeztu zituzten Usurbilen, Elhuyar Fundazioaren egoitza nagusian.
Ana ABARIZKETA | USURBIL
Hiru urteko lanaren ostean, BerbaTek ikerketa-proiektuaren aurkezpen ofiziala egin zuten atzo. Proiektuan bost kidez osatutako partzuergoak hartu du parte; hain zuzen, Elhuyar Fundazioak, EHUko IXA eta Aholab ikerketa taldeek, Vicomtech teknologia-zentroak eta Tecnalia Research & Innovation fundazioak, eta Lakuako Gobernuko Industria, Berrikuntza, Merkataritza eta Turismo Sail eta Kultura Sailaren laguntza izan dute.
Eragile horiek hizkuntza-teknologiak garatzen aritu dira 2009 eta 2011 artean, hizkuntza-teknologien alorrean erabilera praktikoa izango duten aplikazioei arreta berezia eskainiz. Izan ere, atzo azaldu zutenez, hizkuntza-industrien euskarri teknologikoa bilakatzea da BerbaTek-en helburua.
Usurbilen, Elhuyar Fundazioaren egoitza nagusian, egindako ekitaldian hizlari aritu ziren Igor Leturia, Elhuyarreko I+G taldeko arduradun eta BerbaTek ikerketa proiektuaren koordinatzailea, eta Itziar Nogeras, Fundazioko zuzendari nagusia; Edorta Larrauri, Lakuako Industria, Berrikuntza, Merkataritza eta Turismo Saileko Teknologia zuzendaria eta Lakuako Kultura Sailaren Euskara Sustatzeko zuzendari Begoña Muruaga.
Ikerketa-lanari erabilera praktikoa ematea izan da hasieratik ikertzaileen helburu nagusietarikoa. Ahalegin horren erakusgarri, demo bana aurkeztu zuten industria horretako hiru azpisektoretarako: batetik, edukien sektorerako, bilatzaile semantiko multimedia baten demoa; bigarrenik, itzulpenen sektorerako, dokumentalen bikoizketa automatikorako demoa; eta, azkenik, irakaskuntza sektorearentzat, tutore pertsonal baten demoa. Guztiak www.berbatek.com-en ikusgai.
Demoei buruzko azalpena
Igor Leturiak azaldu zituen demoen funtzioak. Esaterako, bilatzaile semantiko multimediak semantikoki lotzen ditu kontzeptuak sarean. Elhuyarrek sortutako edukien gainean egiten ditu bilaketak, eta, Tecnaliak garatutako teknologiaren bidez, termino bat bilatzen denean, ontologian oinarritu eta termino horren sinonimoak, azpiklaseak eta superklaseak ere bila ditzake. Aldiz, emaitza irudia bada, antzeko irudiak ematen ditu, Vicomtech-IK4n oinarrituta.
Filmak automatikoki bikoiztea oraingoz erronka zaila bada ere, bikoizketa automatikoaren demoak egoki egiten du lan ezaugarri zehatzeko dokumentalekin: hizlari bakarra dagoenean eta ezpainen mugimenduarekin koordinatzea ezinbestekoa ez denean. Gaztelaniazko dokumental bat eta horren transkripzioa izanik, Vicomtech-IK4ren denbora-lerrokatze automatikoaren bidez, azpititulu-fitxategi bat sortzen da. Gero, IXA Taldearen Matxin itzultzaile automatikoak euskarara itzultzen ditu azpititulu horiek, eta Aholab-en testu-ahots bihurketa sistemak euskarazko ahots sinkronizatua sortzen du.
Hizkuntzak irakasteko tutore pertsonala berriz, emozioak adieraz ditzakeen 3Dko pertsonaia bat da. Euskaraz hitz egiten du, eta euskaraz esaten zaiona ulertzeko gai da, Aholab-en teknologiari esker. Horrela, IXAren sortutako teknologiaren bidez automatikoki sortutako gramatika-ariketak edo ulermen-ariketak egiten lagundu diezaguke. Azkenik, idazten ere lagun gaitzake (hiztegiak kontsultatzea ahalbidetzen du, hitzak nola deklinatzen diren eta zenbakiak nola idazten diren esan...).
BerbaTek proiektuaren aurretik, bost eragileek osatutako partzuergoak Anhitz proiektua gauzatu zuen 2006. eta 2008. urteen artean, eta zientzia-aditu birtual baten demoa garatu zuten. 2002-2004 aldian, berriz, Hizking XXI proiektua garatu zuten.
Orain, enpresen eskari eta beharretara egokitzea eta bere txokoa hartzea baino ez zaio falta proiektu berritzaile honi.