banner
Centro de Noticias
Servicio al cliente excepcional

IA: se necesitan más datos galeses para mejorar la precisión, dicen las empresas

Jul 20, 2023

Los desarrolladores de tecnología dicen que se necesita una mejor cooperación en Gales para garantizar que la inteligencia artificial (IA) funcione en Gales.

La capacidad del Chatbot ChatGPT para comprender y comunicarse en galés ha impresionado a los investigadores y algunos dicen que el idioma era "parte de la revolución de la IA".

Pero dijeron que era necesario poner a disposición material en galés protegido por derechos de autor para entrenar el software de computadora.

El gobierno galés dijo que su estrategia se renovaría pronto.

Una empresa que ya utiliza inteligencia artificial para brindar servicios bilingües es Haia, con sede en Anglesey.

La empresa de eventos en línea utiliza software de traducción simultánea para permitir a los oradores hablar en galés o inglés con subtítulos traducidos.

Pero su cofundador, Tom Burke, dijo que su producto podría mejorarse si hubiera más datos en galés disponibles legalmente.

"Uno de los problemas que tenemos es su precisión. Si se compara con el alemán o el español, el galés es un conjunto de datos pequeño", dijo el señor Burke.

"A menudo encontramos imprecisiones en la traducción o transcripción y la manera de mejorarlas es tener acceso a la gran cantidad de datos que realmente están disponibles para el idioma galés".

La tecnología Language AI funciona con grandes modelos de lenguaje computarizados, que utilizan enormes cantidades de datos, como páginas web, libros y artículos, para predecir qué palabras y frases van juntas.

Los datos sobre el idioma galés también podrían incluir programas de radio y televisión.

"Si podemos conseguir esos datos y utilizarlos para entrenar modelos, entonces los modelos en galés serán más precisos", añadió Burke.

"Eso nos da una ventaja en esa tecnología y nos permite observar otros lenguajes de menor uso en todo el mundo donde podemos utilizar las lecciones que hemos aprendido aquí en Gales para impulsar las tecnologías en esos mercados también.

"A largo plazo, esto permitirá que se formen nuevas empresas, permitirá nuevas innovaciones y Gales podría convertirse en un centro para las tecnologías lingüísticas".

Investigadores de Canolfan Bedwyr de la Universidad de Bangor lanzaron Macsen, un prototipo de chatbot en galés, hace ocho años.

Ahora lo ejecutan con ChatGPT, desarrollado por OpenAI en EE. UU.

Además del potencial económico, el jefe de la Unidad de Tecnologías Lingüísticas de Canolfan Bedwyr, Gruffudd Prys, afirmó que debería ponerse a disposición material en galés para que la tecnología sea más "adecuada a las necesidades del idioma galés y de Gales en general". ".

Dijo: "Una de las cosas que podemos hacer para mejorar la calidad de la inteligencia artificial es permitir que los datos disponibles estén disponibles bajo licencias permisivas para que los modelos reflejen la realidad de Gales y no sean demasiado estadounidenses o modelos internacionales."

Tom Burke dijo que el acceso a los datos debía ocurrir pronto.

"Ya hemos perdido 12 meses de tiempo de innovación y lo que sucederá es que eventualmente nos quedaremos atrás y cuando podamos comenzar a utilizarlo, el resto del mundo ya lo tendrá", dijo.

"Tenemos esta gran posición, tenemos este país bilingüe.

"Tenemos una universidad fantástica como Bangor trabajando en esta tecnología. Necesitamos hacerlo ahora para que las empresas puedan empezar a utilizarla y salir al mercado".

El ministro del gobierno galés responsable del idioma galés, Jeremy Miles MS, dijo que utilizar la IA para desarrollar el idioma galés era "muy importante".

"Ha sido una prioridad importante en nuestra estrategia Welsh in Technology, que estamos a punto de renovar para el próximo período", afirmó Miles.

"Hemos gastado £2 millones en esto y sigue siendo una prioridad realmente importante para nuestra próxima estrategia, por lo que podremos tener todas estas preguntas en cuenta en ese momento.

"Es realmente importante con los avances tecnológicos que los hagamos disponibles en galés y en otros idiomas".

La obra del artista copiada por la IA más veces que Picasso

¿Galés? Podría haber un dispositivo para eso.

Haia - M-SParc