BritCats Studio/Shutterstock |
El Govern espanyol va anunciar el 20 de gener de 2025 la família ALIA de models fundacionals d'intel·ligència artificial (IA) (els també anomenats LLMs, large language models). Ha sigut dissenyada per a 35 llengües d'Europa, incloent-hi les cooficials espanyoles: català, gallec, valencià i basc. El projecte està coordinat per el Barcelona Supercomputing Center (BSC-CNS), sota el lideratge de la Secretaria d'Estat de Digitalització i Intel·ligència Artificial (SEDIA).
ALIA és el primer pas cap a la millora i l'ús dels LLMs en espanyol. Però, i potser per damunt d'això, suposa un pas important en el camí per a la independència tecnològica en llengua espanyola de les grans corporacions Big Tech nord-americanes, entre elles OpenAI, creadora de ChatGPT, amb Sam Altman al capdavant.
La importància d'un model de llenguatge espanyol
Els grans models fundacionals de llenguatge que ja estan en ús (GPT, Flama, Gemini, etc.) estan entrenats en anglés, amb un percentatge xicotet en espanyol. Això pot suposar mancances en la qualitat del llenguatge, no disposar de dites, frases fetes, context de l'espanyol, etc. ALIA és una família de models de IA que abordarà estes mancances i permet aprofitar el ric patrimoni lingüístic de l'espanyol, idioma parlat per més de 600 milions de persones.
Público i obert
Els models propietaris com GPT aconseguixen un bon nivell en l'ús de l'espanyol, però no poden ser executats pels usuaris, empreses i administracions en les seues màquines locals o centres de dades. L'ús d'estos models privats implica enviar la informació a un núvol de tercers (les grans corporacions). Si les grans corporacions_ apagaren_ els seus núvols, ho perdríem tot. A més, es convertixen en propietaris de tot el que emmagatzemem, inclosos les nostres dades.
A nivell pràctic, les empreses que controlen estos models privats, com OpenAI, poden actualitzar-los o canviar les seues condicions sense previ avís. Els usuraris som dependents per a qualsevol servici implementat sobre ells.
Ja existixen models oberts, com Flama, que tenen alta qualitat en anglés, però les seues prestacions són baixes en altres idiomes, l'espanyol entre ells.
Transparència i autonomia tecnològica
Ací és on cobra importància ALIA, una iniciativa basada en models de IA públics i oberts, dissenyats específicament per a funcionar en espanyol, sense necessitat d'enviar les nostres dades al núvol de tercers.
Això significa que institucions, empreses i usuaris poden utilitzar-los de manera local, mantenint el control sobre la seua informació. Amb ALIA es podrien manejar textos complexos, com a informes mèdics o legals, amb total seguretat.
Els models d'ALIA serviran com a base per a desenrotllar ferramentes específiques, com a assistents virtuals o aplicacions adaptades a diferents àrees mitjançant ajustos fins. Això és clau perquè petites i mitjanes empreses puguen integrar la IA en els seus processos sense dependre de grans corporacions Big Tech.
L'aposta per models oberts com ALIA milloren la privacitat i la transparència, i impulsen l'autonomia tecnològica i l'economia de l'idioma espanyol.
El Govern ja ha anunciat dos proves pilot amb ALIA: un assistent virtual per a l'Agència Tributària que agilitze gestions, i una ferramenta per a millorar el diagnòstic precoç de les insuficiències cardíaques en Atenció Primària, que ajude a millorar els diagnòstics de manera més ràpida i eficient.
ALIA és una gran oportunitat per a portar la IA al següent nivell en espanyol, amb models més oberts, accessibles i respectuosos amb la privacitat.
Les crítiques
Des que el Govern va fer l'anunci, s'han publicat crítiques a la qualitat d'ALIA.
Les crítiques ens conduïxen a un debat que pot enfocar-se des de diferents prismes: la inversió, la qualitat amb la qual es comporta ALIA des de l'inici, els temps de desenrotllament, si s'aconseguirà la qualitat òptima dels models, el seu pes en el debat econòmic com a país, etcètera.
És important tindre en compte que hi ha molts interessos econòmics darrere de la IA. Si Espanya té tecnologia pròpia oberta pot significar un avanç important en la innovació espanyola en IA. A més, pot impulsar l'economia de l'idioma espanyol. El seu desenrotllament facilita l'ús dels LLMs en les PIMES amb costos baixos i els seus potencials beneficis. Amb ALIA es pot aconseguir un estalvi important en l'Administració Pública.
En resposta a les crítiques sobre la qualitat
ALIA és una família que compta amb diversos models: els models de generació de text multilingües ALIA-40B, Salamandra-7B i Salamandra-2B. Addicionalment, es dissenya el model SalamandraTA-2B (basat en Salamandra-2B) per a la traducció automàtica precisa en frases i paràgrafs per a 30 idiomes diferents.
És normal que es dispose de diversos models fundacionals de diferent grandària.
La família ALIA està composta per models xicotets, i encara es troben lluny d'aconseguir el comportament dels models de les Big Tech americanes.
D'ALIA 40B (40 000 milions de paràmetres) s'ha publicat una versió intermèdia del model fundacional. Per a Salamandra-7B està publicada la versió definitiva, que té un comportament correcte per a la seua grandària. És el camí: es dissenyaran models més grans que aniran guanyant en capacitats.
La inversió per a estos models ha sigut xicoteta en comparació amb la inversió de les grans tecnològiques i el govern dels EUA. Per això, no podem plantejar tindre resultats similars ja en el present, des del seu llançament. ALIA no es pot avaluar des de la competència en resultats amb altres models més madurs, que han requerit més inversió. S'hauria d'avaluar com un primer pas en un camí per a aconseguir la sobirania tecnològica nacional en IA.
A més, els models fundacionals xicotets són essencials.
Els (SLM, sigles de small language models) són el futur per al desenrotllament de IA per a les PIMES, per a la seua aplicació en tots els sectors. Són més sostenibles, garantixen la privacitat de les dades i tenen molt bona adaptació a baix cost per a contextos concrets de coneixement. Com indicava en un article de prediccions per al 2025 en IA, són els xicotets ChatGPT que entraran en el mòbil.
Donald Trump i la IA ètica i de confiança
El president nord-americà Donald Trump ha anunciat una inversió d'US$ 500 000 milions en infraestructura de IA en EE. UU.. El projecte es denomina Stargate i construirà “la infraestructura física i virtual per a impulsar la pròxima generació de IA”.
Trump també va revocar un decret aprovat per l'expresident Joe Biden el 30 d'octubre de 2023 que tenia com a objectiu monitorar i regular els riscos de la IA. Això marca un camí allunyat de l'objectiu europeu de desenrotllament d'una intel·ligència artificial responsable i de confiança, basada en el respecte als drets fonamentals dels ciutadans.
Cap a on avança Europa si el poder i els beneficis de la IA seguixen en mans d'unes poques grans corporacions tecnològiques ara agrupades entorn de Donald Trump?
El camí espanyol cap a la sobirania en IA
El dia 20 de gener es va presentar un treball prospectiu davant els reptes que suposarà la IA per a la societat, denominat HISPÀNIA 2040, sota el subtítol “Com la IA millorarà el nostre futur?”. Esta anàlisi presenta dotze accions prioritàries, i l'acció número 4 aposta per esta sobirania i independència tecnològica en IA com a país:
“Impulsar la creació d'una Xarxa Público-Privada de Centres d'Investigació en IA que ens dote de la capacitat per a desenrotllar models fundacionals propis”.
Hem de treballar alineats amb els altres països europeus en el desenrotllament d'una IA de confiança i humanista, que respecte els principis ètics que volem.
Com fer que la tecnologia de IA siga responsable i pense en espanyol? Este és el repte i el camí a seguir.
Francisco Herrera Triguero, Catedràtic de Ciències de la Computació i Intel·ligència Artificial, Director Institut d'Investigació DaSCI, Acadèmic de la Reial Acadèmia d'Enginyeria, Universitat de Granada
Este article va ser publicat originalment en The Conversation. Llija el original.
* ho pots llegir perquè som Creative Commons
Cap comentari :