ALIA y el problema de construir una IA pública sin usuarios
El proyecto ALIA se presentó como una de las grandes banderas tecnológicas del Gobierno de España en materia de inteligencia artificial. La idea, sobre el papel, sonaba bien: crear una infraestructura pública de IA, entrenada en castellano y en las lenguas cooficiales, que redujera la dependencia de modelos extranjeros y reforzara la soberanía digital. Sinceramente, me sentí muy orgulloso de ese paso y de querer hacer algo propio para no depender, en una matería tan crítica, de potencias extranjeras.
No se trataba de hacer “el ChatGPT español”, sino algo más ambicioso. Una familia de modelos abiertos que pudiera usarse en la administración pública, en universidades y en empresas, con aplicaciones tan concretas como chatbots para la Agencia Tributaria o herramientas de apoyo en sanidad.
El problema es que como suele ocurrirnos con frecuencia, una cosa es el relato y otra muy distinta la realidad. Por si fuera poco, el proyecto ALIA no comenzó con buen pie; un artículo de Jot Down puso contra las cuerdas la manera en la que había sido entrenado el modelo, al parecer, usando contenidos privados y protegidos sin haber pedido permiso o pagado por ello.
¿Cuánto dinero público se ha invertido en ALIA?
Según lo que ha comunicado el gobierno, más de 10 millones de euros se destinaron al desarrollo inicial de ALIA dentro de la Estrategia Nacional de Inteligencia Artificial 2024. A esto hay que sumar un elemento clave que muchas veces se pasa por alto cuando hablamos de IA: la infraestructura.
Buena parte del proyecto se apoya en el superordenador MareNostrum 5, cuya actualización superó los 150 millones de euros. Aunque ese coste no sea exclusivo de ALIA, sí forma parte del contexto real en el que se mueve el proyecto.
Cuando se habla de inversión pública en tecnología, el coste de oportunidad es tan importante como el gasto directo. Y aquí empiezan los problemas.
¿Qué uso real tiene hoy el modelo ALIA?
El dato que lo resume todo es sencillo de analizar. El modelo insignia, ALIA-40b-instruct-2512, ha registrado alrededor de 174 descargas en un mes según los datos que arroja Hugging Face y que El Español ha hecho público en su artículo.
Si se cruza esa cifra con la inversión directa de 10,2 millones de euros, el resultado es difícil de defender: más de 58.000 euros de dinero público por descarga mensual. Y lo más preocupante no es solo el número, sino la tendencia.
No hay crecimiento orgánico. No hay comunidad técnica activa. No hay empresas integrándolo de forma natural en sus procesos. El uso real es casi testimonial y solo muestra picos puntuales coincidiendo con anuncios oficiales o eventos institucionales. Los datos no es que sean preocupantes, es que son demoledores. Ningún proyecto privado hubiera continuado.
¿Por qué ALIA no ha conectado con empresas y desarrolladores?
Creo que en el artículo que os he compartido antes lo definen muy bien: El problema no es ideológico, es técnico y estratégico. Y yo añadiría que no han sabido conectar con las necesidades y oportunidades reales de las empresas españolas. Quizá haber comenzado con un Producto Mínimo Viable y puesto a funcionar en ciertos sectores públicos hubiera dado la tracción necesaria para que otras pymes se subieran al carro.
Pero el enfoque ha sido otro. ALIA apostó por un modelo enorme, de 40.000 millones de parámetros, en un momento en el que la industria ya estaba orientada hacia la eficiencia. Para la inmensa mayoría de pymes españolas, desplegar un modelo así es directamente inviable debido a los costes que implica. Mientras tanto, alternativas abiertas como Llama 3 (Meta) o Mixtral (Francesa) ofrecen un rendimiento comparable, incluso superior en algunos casos, con requisitos mucho más asumibles. Se pueden ejecutar en hardware modesto o incluso en equipos de consumo avanzado.
Se ha financiado un camión pesado, caro y lento, cuando lo que el mercado necesitaba eran furgonetas ágiles.
¿Tiene sentido hablar de soberanía tecnológica en este contexto?
Uno de los grandes argumentos de ALIA era la soberanía del dato y la autonomía estratégica frente a modelos estadounidenses. La promesa de ejecutar IA de forma local, con control total de los datos y sin depender de “cajas negras” externas me sigue pareciendo lógica y adecuada. Tan sólo hemos fallado en la ejecución de la idea. Y es una lástima. A día de hoy, podemos alcanzar esos objetivos con modelos de código abierto como los de Mistral o Meta que permiten exactamente lo mismo: ejecución local, privacidad y cumplimiento normativo europeo, pero con costes mucho más bajos y un soporte comunitario real.
Cuando una alternativa privada ofrece lo mismo, mejor y más barato, el argumento de la infraestructura pública pierde fuerza rápidamente.
¿Era este un fracaso anunciado?
Algunos dicen que sí, pero yo no lo tengo tan claro. Creo que había buena intención y un enfoque técnico ambicioso. Pero no siempre conseguimos lo que queremos. Si tuviera que centrarme en el punto central de por qué ALIA no ha funcionado, creo que fue debido a quese diseñó como infraestructura pública, y no como producto útil desde el primer día. Se priorizó el tamaño, el simbolismo y el discurso político por encima del valor real.
Debemos llevarnos el aprendizaje de que la innovacción no es sólo meter billetes en un proyecto. Necesitamos tecnócratas y cabezas pensantes que entienda la evolución del sector y que sepan cómo conectar los desarrollos con las empresas y personas que los usarán.
ALIA no fracasa por falta de dinero ni de ambición. Fracasa por diseñarse desde arriba, sin pisar lo suficiente el suelo de las empresas y los desarrolladores que, al final, son quienes deciden qué tecnologías viven y cuáles se quedan en un repositorio olvidado.