El Centro Singular de Investigación en Tecnoloxías Intelixentes da Universidade de Santiago de Compostela (CiTIUS) protagoniza un avance destacado en el ámbito de la inteligencia artificial (IA) lingüística al colaborar con Microsoft en el desarrollo de un modelo de IA para la lingua galega. Esta iniciativa se enmarca en un acuerdo de la multinacional con tres centros de investigación de referencia en España —CiTIUS, el Barcelona Supercomputing Center (BSC) y el centro HiTZ de la Universidade do País Vasco— para desarrollar modelos fundacionais multilingües enfocados en preservar y potenciar las lenguas oficiales del Estado, que en este caso incluyen el catalán, el éuscaro y, en particular, el gallego.
Este proyecto tiene como objetivo principal impulsar tecnologías de lenguaje basadas en IA que sean abiertas, responsables y adaptadas a la diversidad lingüística europea, reconociendo la necesidad de cerrar la brecha lingüística digital y garantizar que todas las lenguas oficiales europeas estén representadas en la inteligencia artificial del futuro. Los modelos creados estarán alojados en la plataforma Azure AI Foundry dentro del programa Microsoft Open Innovation Center (MOIC), estableciendo las bases para una presencia sólida del gallego en las tecnologías digitales más influyentes actuales y futuras.
La elección del CiTIUS para desarrollar el modelo en gallego es un reconocimiento al papel de la USC como referente en tecnologías lingüísticas avanzadas y sitúa a Galicia en un lugar destacado a nivel internacional en innovación en inteligencia artificial. Esta colaboración pública-académica refuerza la apuesta por la diversidad y la inclusión digital desde el territorio gallego, consolidando a CiTIUS como un nodo clave en la transformación digital inclusiva en España y Europa.
Este desarrollo se apoya en el trabajo previo del Proxecto Nós, lanzado en 2020 y promovido por la Xunta de Galicia a través de CiTIUS y el Instituto da Lingua Galega (ILG). Este proyecto ha sido fundamental para garantizar la presencia digital del gallego creando infraestructuras lingüísticas básicas, como corpus abiertos, bancos de datos, herramientas de traducción automática y sistemas de síntesis y reconocimiento de voz. En 2023, el equipo presentó Carballo, el primer modelo lingüístico de gran escala entrenado íntegramente en gallego. Los avances logrados con 'Nós' no solo aumentaron la capacidad digital del gallego sino que posicionaron a Galicia en el mapa europeo de la IA, preparando el terreno para la actual colaboración con Microsoft.
Por otro lado, esta colaboración con Microsoft se enmarca en una estrategia europea y estatal más amplia que incluye proyectos como ILENIA y ALIA, apoyados por el Ministerio de Asuntos Económicos y Transformación Digital. Estas iniciativas trabajan en el desarrollo de recursos y herramientas lingüísticas para las lenguas cooficiales y modelos fundacionales de IA orientados a la Administración pública multilingüe.
¿En qué consiste la cerrar la brecha lingüística digital y como la IA puede ayudar a combartirla?
La brecha lingüística digital es una forma específica de desigualdad dentro del ámbito digital que se refiere a la ausencia o limitación del acceso y uso efectivo de tecnologías digitales en determinadas lenguas, especialmente las minoritarias o con menos recursos tecnológicos. Esta brecha implica que ciertos idiomas no estén adecuadamente representados en herramientas digitales, plataformas o sistemas de inteligencia artificial, lo que reduce su capacidad para mantenerse vivos y activos en la era digital, afectando a la difusión cultural y el acceso a la información en esas lenguas.
Cerrar esta brecha significa garantizar que todas las lenguas, incluidas las cooficiales y las minoritarias como el gallego, tengan presencia y soporte tecnológico suficiente para manejar con normalidad sistemas digitales avanzados, traductores, asistentes virtuales, reconocimiento y síntesis de voz, entre otros.
La inteligencia artificial (IA) puede ser clave para combatir la brecha lingüística digital porque permite desarrollar modelos lingüísticos avanzados que integren perfectamente diferentes idiomas en la tecnología digital. Gracias a la IA, es posible crear herramientas que entiendan, procesen y generen texto o voz en lenguas como el gallego, abriendo las puertas para que estas comunidades accedan a servicios digitales en su idioma propio. Esto mejora la calidad de vida, facilita la administración pública multilingüe, y abre nuevas oportunidades económicas y educativas.
La IA ayuda a superar varios obstáculos que causan la brecha lingüística digital: por un lado, reduce la falta de recursos tecnológicos específicos para idiomas minoritarios; por otro, mejora la accesibilidad de estos idiomas en entornos digitales complejos, como asistentes de voz o traductores automáticos, que en muchos casos antes solo estaban disponibles para lenguas mayoritarias.