España contará en septiembre con su primer modelo de lenguaje de IA entrenado en español

18/05/2024 - 

VALÈNCIA (EFE/Belén Molleda). España contará en septiembre con su primer modelo de lenguaje de inteligencia artificial (IA) entrenado en castellano y lenguas cooficiales del país, tras 2 millones de euros de inversión, y que constituirá la primera versión del denominado modelo "Alia", bautizado ya como el "ChatGPT español".

Este proyecto "Alia", desarrollado en colaboración con el Centro de Supercomputación de Barcelona (BSC), se aplicará a sectores concretos a finales de año después de otros 3 millones de inversión, según han informado fuentes del Gobierno.

A ello, se sumará la construcción del mayor repositorio de datos para entrenamiento de modelos en castellano y lenguas cooficiales, que estará listo a finales de 2025 tras una inversión de 3,4 millones.

Se plantea, con ello, manejar como mínimo 4 millones de palabras.

Estos modelos tendrán más de un 20 % de entrenamiento en castellano y lenguas cooficiales, frente a menos del 5 % de los modelos actuales.

Este porcentaje del 20 % permitirán reducir los sesgos y mejorar las aplicaciones prácticas que las empresas y administraciones de nuestro país pueden desarrollar.

El objetivo de "Alia" es generar modelos de hasta 175.000 millones de parámetros, que serán certificados por la Aesia (Agencia Española de Supervisión de Inteligencia Artificial), de una forma abierta y transparente, de una manera que se protejan además los derechos de autor.

Más de 1.500 millones de inversión en IA

Estas iniciativas se enmarcan dentro de la nueva Estrategia de Inteligencia Artificial para 2024-2025, que ha presentado el Gobierno español esta semana y que contempla una inversión de 1.500 millones.

De estos 1.500 millones, más de 90 se destinarán al superordenador MareNostrum 5, el primero en Europa en capacidad de rendimiento y el tercero en rendimiento máximo, con el fin de mejorar sus prestaciones. Se quiere aumentar su capacidad en un 50 %.

El objetivo es poner en marcha un conjunto de modelos y datos que constituyan una infraestructura pública de inteligencia artificial, en una iniciativa cuya puesta en marcha ya avanzó el presidente del Gobierno, Pedro Sánchez, en el MWC de Barcelona en febrero.

Con el proyecto Alia, se prevé crear una familia de modelos de inteligencia artificial partiendo del español y las lenguas cooficiales, habladas por 600 millones de personas.

El objetivo es facilitar el desarrollo de servicios y productos avanzados en tecnologías del lenguaje.

Se quiere además generar estándares de IA ética y confiable.

Con esta iniciativa España se situará a la vanguardia del desarrollo y uso de los modelos de lenguaje y además se diferenciará de otros modelos por su transparencia.

El Gobierno pretende hacer pública la información que permitirá conocer desde la composición de los corpus hasta los entrenamientos realizados, la estructura de los modelos y los recursos utilizados para ello. 

Noticias relacionadas

next
x