euskadi.eus

Inicio

Estás en :
  1. Inicio
El papel de las nuevas tecnologías en la normalización del galés


Introducción

Jeremy Evas

En un Gales verdaderamente bilingüe, tanto el galés como el inglés prosperarán y recibirán un trato igual. Un Gales bilingüe quiere decir un país donde la gente puede elegir vivir sus vidas a través de cualquiera de los dos idiomas o bien en ambos; un país donde la presencia de dos lenguas nacionales, además de otras lenguas y culturas distintas, sea una fuente de orgullo y fuerza para todos. (Asamblea Nacional Para Gales  2002:5)

Este es el fundamento filosófico del documento de política estratégica de la Asamblea Nacional Para Gales (1)Iaith Pawb (Lengua de Todos). Dado que nuestras vidas están tan influenciadas hoy en día, directa e indirectamente, por las Tecnologías de la Información (IT), esta filosofía evidentemente puede tener muchas implicaciones para las lenguas regionales o minoritarias  (2) como el galés en el contexto de la revolución del conocimiento. Para que se haga realidad la visión del Gobierno de un País de Gales bilingüe, el galés debe ocupar el lugar que le corresponde en el mundo tecnológico, pero hace falta un planteamiento estratégico de largo alcance para asegurar que así suceda. Por ello, Iaith Pawb aconsejaba la elaboración de una Estrategia de Tecnología de la Información para la Lengua Galesa por parte de la Comisión de la Lengua Galesa (Bwrdd yr Iaith Gymraeg, o Welsh Language Board). Tras emprender una primera consulta pública durante el 2003 y una segunda en 2005, la Comisión publicó un documento definitivo y "vivo" en abril de 2006. Ahora está a punto de publicar en su sitio Web el primer plan anual de implementación de dicha estrategia.

Al igual que otras muchas lenguas regionales o minorizadas a lo largo y ancho de Europa, la lengua galesa ha sufrido un brusco descenso en el número de sus hablantes desde principios del siglo XX; descenso que, sin embargo, empieza a frenarse a partir de los años setenta. El último censo mostraba que el 20,8% de la población de Gales dice saber hablar galés, lo cual supone un aumento de 80.000 hablantes, o un 2,1% respecto al censo anterior de hace diez. Por otra parte, va cambiando el perfil de la población galesófona en cuanto a sus edades. Así por ejemplo, de los de entre cinco y quince años, el 40,8% se declararon hablantes. (3) En este contexto, hay que insistir en la importancia de hacer esfuerzos para que de los instrumentos tecnológicos que estos jóvenes habitualmente emplean dentro de la escuela o fuera de ella, el mayor número posible esté libremente disponible en lengua galesa.

Aquí daremos por sentado que el desarrollo de una estrategia coherente para las IT en relación con el galés es imprescindible dado el papel central desempeñado actualmente por la tecnología de la información en muchas áreas de la vida cotidiana de los ciudadanos: en el funcionamiento interno de las instituciones que prestan servicios al público, en los sitios Web, en todo tipo de equipos domésticos, o bien en el entorno profesional, etc. La estrategia sobre las IT de la Comisión de la Lengua Galesa, de la cual el que escribe estas líneas fue principal autor, pretende recoger una formulación definitiva de políticas, una enumeración de los pasos necesarios para garantizar el uso normalizado de las IT en todas las áreas pertinentes, así como la puesta al día ante los nuevos avances tecnológicos. Dicha estrategia comparte muchos rasgos, naturalmente, con las de otras regiones que se encuentran en situaciones sociolingüísticas comparables a la del País de Gales.

Una de las aportaciones a dicha normalización ha sido la publicación de directivas técnicas detalladas que dan consejos sobre la mejor manera de crear aplicaciones y sitios Web multilingües, poniendo énfasis en el concepto de facilitar en lo posible la libre alternancia entre idiomas (véase abajo). En abril de 2006 la Comisión lanzó al público un documento detallado titulado Guidelines and Standards document for Bilingual Computing (4)  (Directivas y normas para la computación bilingüe) y lo distribuyó a todas las organizaciones que poseen un plan lingüístico oficial según la Ley de la Lengua Galesa (Welsh Language Act) de 1993. Es de esperar que, con el tiempo, los consejos proporcionados en ese documento y un aparato de seguimiento de su implementación darán como resultado una mejor oferta bilingüe de toda clase de servicios por medios electrónicos, y que de este modo se podrán llegar a superar los resultados descritos en dos estudios de los sitios Web de instituciones públicas que la Comisión realizó en 2001 y 2003.  (5) (6)   

Políticas sobre licencias para el uso y distribución de productos IT en lengua galesa
Para lograr estos objetivos, de ahora en adelante, en todos los casos en los que la Comisión dé subvenciones en apoyo de la creación de productos IT o encargue la elaboración de ellos, recomendará o exigirá que se cumplan tanto las normas internacionales y de uso generalizado como las recomendadas en su propio documento normativo al que acabamos de aludir. Por otra parte, la Comisión garantizará que, en los casos donde sea conveniente y factible, los productos y sus componentes se hagan disponibles bajo una licencia libre, no comercial, de un tipo apropiado y siempre asegurando el cumplimiento de las leyes de copyright (si son aplicables); y sin que se origine ningún coste adicional para el usuario final en el caso de los componentes de productos comerciales que ofrezcan una funcionalidad multilingüe. En esto la Comisión pretende aplicar el principio elemental según el cual el usuario final no debe tener que pagar nada por usar la lengua galesa en un software por encima de lo que sea el precio que tenga ese software como tal.

En un campo como las IT multilingües, es muy importante la coherencia en la utilización de la terminología. Se trata de una premisa básica en cualquier tecnología y en el idioma que sea, que para garantizar una experiencia óptima para los usuarios debe ser tenida en cuenta desde el primer momento del proceso de diseño. Como veremos, la tecnología también puede servir para facilitar la gestión terminológica y promocionar la coherencia en diversas áreas.

Recursos terminológicos
La Comisión ve en la estandarización terminológica y el desarrollo de los recursos lexicográficos una de las prioridades para la normalización del galés, y de hecho tiene su propia Unidad de Estandarización de Terminología y Traducción dedicada a esta tarea. Ha encargado al Canolfan Bedwyr de la Universidad de Gales en Bangor (7) una base de datos nacional de términos estandarizados que posteriormente ha sido implementado y completado. (8)  Dicha base de datos recoge la totalidad de listas de términos publicadas y encargadas por la Comisión, presentándolas a través de un interfaz de fácil utilización que cumple las normas ISO pertinentes. La primera lista que se ofreció en esta base de datos fue la lista estandarizada de términos para la tecnología de la información. Todos los términos incorporados a la base de datos pueden buscarse por separado, o descargarse como partes de sus listas correspondientes, bien en hojas de datos, o bien preparados para su incorporación a programas especializados para la gestión terminológica.

La localización
La localización ("L8N") ha de ser cimentada, como primer requisito, sobre una terminología estandarizada de calidad. Esto no quiere decir traducida, si bien es cierto que la traducción representa una proporción muy grande de la localización. Para nuestros propósitos podemos definirla como la adaptación de software y sitios Web al galés. Puede verse más información sobre esto en el sitio Web de la Asociación para Normas de la Industria de la Localización (Localisation Industry Standards Association). (9)

Las herramientas de código abierto y la lengua galesa
Durante algún tiempo el galés se ha beneficiado de una comunidad virtual de voluntarios que han entregado su tiempo libremente para la traducción al galés de muchos programas informáticos, tales como los siguientes, entre otros:

  • el sitio Web kyfieithu, que reúne muchos recursos de código abierto para la lengua galesa. (10)
  • Meddal, un extenso catálogo de software de código abierto para la lengua galesa. Meddal ha lanzado un CD con varios programas de código abierto para el galés con garantías de control de calidad. (11)
  • El grupo Cymrux ha elaborado una versión en lengua galesa del sistema operativo de código abierto Linux. (12)
  • También se ha emprendido, desde 2002, una traducción voluntaria de GNOME, una de las principales aplicaciones de escritorio dentro de Linux.

Merece nuestra admiración la dedicación y entrega de estos voluntarios y sus esfuerzos pioneros en materia de terminología. Como botón de muestra, una de las mayores localizaciones voluntarias de software al galés ha sido la de OpenOffice (13) (un paquete integrado de código abierto (14)  de aplicaciones Office) llevada a cabo por un grupo virtual de voluntarios. La Comisión ha concedido un contrato de 35.000 libras esterlinas a lo largo de tres años al Centro Mercator (15) , de la Universidad de Gales en Aberystwyth, para impulsar el uso de OpenOffice; esto incluye la traducción de todos los archivos de ayuda y manuales y la creación de una versión del paquete que permita pasar  libremente del galés al inglés y viceversa. Dicha subvención también ha posibilitado el plan "Agored", lanzado en noviembre de 2006 en la sede de la Asamblea Nacional Para Gales, consistiendo en ensayar el uso de este paquete integrado en diversas instituciones.

"Agored"

La localización de otras aplicaciones en galés
La Comisión también tiene mucho interés en que las empresas de software localicen sus aplicaciones de software en galés para así impulsar aún más la normalización de la lengua galesa. Por lo tanto, otra localización muy significativa, que ya ha sido realizada, es la del programa Microsoft Language Interface Pack (16) , llevada a cabo en colaboración con la propia Comisión.

Panel Rheoli


Dichos paquetes de interfaz, que se lanzaron en Gales en diciembre de 2004 con una financiación íntegra de Microsoft, permiten a los usuarios utilizar de forma gratuita los interfaces en lengua galesa de Microsoft Office 2003 y Windows XP. El galés sólo forma una parte de este programa mundial multilingüe, en donde también están representados el euskera, el catalán y el gallego. Al igual que en el caso de la localización de código abierto descrita arriba, este programa ha generado la adquisición de nuevas competencias en la industria de la localización en Gales desde el punto de vista de la creación y el uso de una terminología estandarizada en el área, así como al nivel de formación de todos los participantes en el proyecto (de los que la empresa de traducciones Cymen y la Draig Technologies fueron los principales socios a nivel de implementación). (17) Como con todas las localizaciones de este tipo, la publicidad que ha acompañado el lanzamiento del proyecto ha propiciado un impulso significativo para la imagen del galés. Según las últimas noticias, Microsoft sigue apostando por la localización en lenguas regionales y minoritarias; la última lengua que se ha añadido es el bretón, en cuyo caso se va a estrenar un nuevo tipo de localización con Windows Vista y Office 2007.

Documento word


Otra novedad en 2005 fue la formación de Cymdeithas Meddalwedd Cymraeg (la Asociación de Software en Galés). En su sitio Web afirma que impulsará:

  • el uso del galés en todos los sectores de la tecnología de la información;
  • el desarrollo de software original en galés y para las tecnologías de la lengua;
  • la traducción y adaptación al galés de software de calidad;
  • la creación de contenidos de calidad en lengua galesa;
  • la elaboración de materiales didácticos y cursos sobre la tecnología de la información a través del galés.

Dicho sitio Web cita las siguientes palabras del profesor David Crystal: "Una lengua avanzará si sus hablantes pueden valerse de la tecnología electrónica." Como veremos más adelante, ya existe una buena cantidad de tecnología electrónica en galés, y se puede sostener que ya es hora de que se amplíe el discurso hacia la promoción y facilitación del uso de las herramientas ya disponibles, además de garantizar la continuidad del proceso localizador;  éste es uno de los objetivos que es favorecido de forma palpable por las actividades de esta asociación.

Switchability, o la importancia del software bilingüe
Como ocurre en las situaciones de otras lenguas comparables al galés, muchos de los actuales hablantes del galés tienen hogares bilingües: es significativo que sólo el 21% de los galesófonos entre 3 y 15 años, y el 45% de todos los hablantes de galés, viven en hogares totalmente galesófonos (18). Por otra parte, muchos trabajan en entornos laborales bilingües o donde se usa mayoritariamente el inglés. Por lo tanto, es enormemente importante que el interfaz y los atributos de idioma de un determinado sistema informático sea "switchable", o sea, capaz de alternar entre el inglés y el galés a discreción del usuario, para asegurar que unas personas con competencias lingüísticas diferentes puedan compartir las mismas máquinas y aplicaciones. Por otra parte, la necesidad de impulsar el uso de la lengua galesa en el trabajo es de todos conocida, y existe la posibilidad de aumentar significativamente la cantidad de tiempo dedicada a tareas a través de una lengua determinada por medio de las tecnologías descritas en el presente artículo.

También es interesante la posibilidad de asociar preferencias de idioma al perfil del usuario; así, por poner un ejemplo, no habrá inconveniente en que un padre o una madre no galesófonos compartan el ordenador en su casa con su hija o hijo de habla galesa.

En Microsoft Office 2003, KDE y GNOME (así como también en la versión de OpenOffice en lengua galesa que ha sido patrocinada por la Comisión de la Lengua Galesa), es muy sencillo cambiar el idioma del interfaz. En junio de 2006, la Comisión lanzó una versión de prueba de un 'Language Control Centre' (19) que alterna los idiomas tanto de Office 2003 como de Windows XP (siendo esto una opción que no está disponible en los demás idiomas del Microsoft Local Language Program). A la vista de la respuesta favorable a esa versión experimental, posteriormente la Comisión ha encargado la elaboración de otra versión más definitiva del referido centro de control de idiomas. Este podrá cambiar el idioma en otras muchas aplicaciones, a la vez que asociará preferencias de idioma con cada perfil de usuario, también ofreciendo ayuda sobre cómo escribir los acentos (cuestión con la cual muchos hablantes de galés no están familiarizados, al estar acostumbrados a teclear en inglés, lengua que no utiliza acentos escritos), así como otras opciones de idioma más detalladas.

Language Control Centre


Por otra parte, Microsoft ha producido una consola de control de idiomas suplementaria que permite a los usuarios modificar su interfaz de idioma, teclado y configuración local. (20)

Ayuda para la creación de contenidos
Según muchos estudios, un número importante de hablantes de galés considera que su competencia en el uso del galés es inferior a su competencia en inglés, cosa que no es muy de extrañar dada la situación sociolingüística de diglosia que ocurre en Gales y en otros países de parecidas características. A raíz de esto, una de las prioridades con las que la Comisión comenzó a trabajar dentro del campo de la tecnología de la información fueron las herramientas para facilitar la creación de contenidos en galés, poniéndose el énfasis en el desarrollo de correctores de ortografía y correctores de gramática capaces de dar más confianza a los usuarios, así como diccionarios que permitieran a los usuarios buscar las traducciones de palabras concretas, bien al galés o bien al inglés, con facilidad y rapidez.

Correctores de ortografía, correctores de gramática y diccionarios electrónicos
Con el fin de abordar estos problemas relacionados con la creación de contenidos que acabamos de mencionar, la Comisión encargó y patrocinó el desarrollo de diversos correctores de ortografía y de gramática así como de diccionarios electrónicos. El primer paso fue la producción de Cysill, cuyo desarrollo le fue encargado a la Universidad de Gales en Bangor. La gran innovación de Cysill era que también corregía los usos incorrectos de las "mutaciones" (cambios en la consonante inicial de cualquier palabra, según complejas reglas gramaticales; las mutaciones consonánticas son característicos del galés y de las demás lenguas célticas). Aunque las mutaciones incorrectas rara vez llegan a cambiar el sentido de una oración, pueden originar dudas para cualquier hablante poco acostumbrado a escribir galés formal. A esta herramienta le siguió Cysgair, un diccionario electrónico que se integraba en Word, que también se financió por medio del patrocinio de la Comisión y fue desarrollado por el Canolfan Bedwyr de la Universidad de Gales en Bangor. Ambos productos fueron actualizados en 2004 y se incluían en un CD de recursos electrónicos para la lengua galesa, de nuevo con ayuda de la Comisión, distribuido bajo el nombre de Cysgliad (21). Dicho paquete es actualizable por medio de Internet.

Existen los siguientes correctores de galés entre otros:

  • Un corrector de ortografía para Microsoft Office XP (22), de distribución gratuita
  • Un corrector de ortografía, también de distribución gratuita, para OpenOffice (23)
  • Un corrector de ortografía de distribución gratuita para Microsoft Office 2003, que forma parte del Language Interface Pack para Microsoft Office 2003 al que ya nos hemos referido antes
  • Un corrector de ortografía de distribución gratuita para Neo Office (Apple Mac) 
  • Un corrector de ortografía de distribución gratuita para Microsoft Office 2007
Teclados, acentos y fuentes
Otro aspecto de la creación de contenidos en galés que ha causado dificultades a la hora de usar un ordenador era la ausencia del juego de caracteres estándares de dos formas de letra galesas: la w y la y con el acento circunflejo (o sea: ŵ, ŷ). Al principio esto se solucionaba con la creación de fuentes especializadas para el galés que imitaban las fuentes del sistema normalmente incluidas en los ordenadores pero con la diferencia de incluir dichos caracteres. Posteriormente se incluyeron ambos caracteres en el juego de caracteres Unicode (UTF-8) estándar, obviando a los usuarios la necesidad de comprar o descargar unas fuentes especiales.

No obstante, lo que aún no se ha aclarado muy satisfactoriamente es la cuestión de cómo cada usuario debe acceder a estos caracteres acentuados a través del teclado de una manera uniforme, dándose el caso de que cada individuo y cada organización - ¡y a veces incluso cada individuo dentro de una misma organización!- haya elegido su propio método en el teclado, o simplemente se haya conformado con teclear los códigos numéricos correspondientes para cada carácter. Ahora por fin el problema de estandarización en el uso del teclado para insertar estos acentos se ha solucionado.

Los acentos y la Web galesa
También en las páginas Web en lengua galesa, los acentos sobre la w y la y han dado muchos quebraderos de cabeza a las organizaciones que las producen. Pero ahora esto también ha dejado de ser problemático, y el documento normativo publicado por la Comisión ofrece instrucciones técnicas detalladas sobre como superar tales dificultades por medio del uso de la codificación más apropiada.

Tras este repaso de la tecnología de base necesaria para apoyar la creación de contenidos en galés y para la corrección de los textos en esta lengua, podemos pasar a considerar lo que puede aportar la IT a un campo bastante amplio dentro de la creación de contenidos en galés: el de la traducción.

La traducción y la terminología
La Comisión de la Lengua Galesa posee una Estrategia para la Traducción (25), y también provee fondos a la Asociación de Traductores de Galés (26).  En esta sección no entraremos a considerar el contenido de esa estrategia, ni los objetivos de dicha Asociación, ya que los lectores que estén interesados podrán acceder a tal información a través de los respectivos sitios Web de la Comisión y de la Asociación. En cambio, en esta sección hablaremos de los usos de la tecnología en relación con la traducción y de lo que la tecnología puede aportar a la industria de la traducción para el galés y para cualquier otro idioma en una situación sociolingüística parecida. Empezaremos con una descripción de las herramientas IT que permiten mejorar la consistencia y velocidad de la traducción a la vez que proporcionan una manera de que los traductores puedan compartir su trabajo, de modo que haya una reducción significativa en el número de repeticiones. Se trata de la Traducción Asistida por Ordenador, mejor conocida por sus siglas inglesas: CAT.

La Traducción Asistida por Ordenador (CAT)
El término CAT se utiliza en un sentido muy amplio para referirse a un área de la tecnología informática que consiste en aplicaciones que automatizan o ayudan en el proceso de traducir de un idioma a otro. Tales herramientas son un modo eficaz de mejorar la productividad en la traducción, especialmente a la hora de facilitar una traducción muy rápida de textos-fuente muy repetitivos. Al respecto, Partners.com ofrece un manual elemental en inglés que es muy útil (27).  El sitio Web de la Comisión de la Lengua Galesa incluye una lista de proveedores de software de memoria de traducción.

Herramientas de memoria de traducción ya están siendo utilizadas por una larga lista de instituciones públicas en y fuera de Gales, y entre ellas están el Gobierno de la Asamblea Galesa y la propia Comisión de la Lengua Galesa. Una de las grandes ventajas de tales tecnologías es que a través de ellas los traductores pueden compartir su trabajo, cualquiera que sea su ubicación geográfica, por medio de unas bases de datos centralizadas de memoria de traducción que se suministran a ordenadores individuales a través de redes empresariales o incluso por el Internet. Estos recursos permiten que se pueda omitir la traducción de los segmentos de texto repetidos en un 100%, lo cual conlleva a aumentos en la consistencia y velocidad de la traducción (sobre el tema de la consistencia terminológica hablaremos más adelante).

Las aplicaciones de memoria de traducción también pueden proponer traducciones de textos que sólo coinciden parcialmente con textos guardados en sus bases de datos (fuzzy matches), lo cual también ayuda a agilizar la traducción. Habrá que tener en cuenta que, por supuesto, la calidad de las traducciones que se comparten a través de las memorias de traducción que se almacenan centralmente dependerá en todo caso de la calidad y consistencia del conjunto de traducciones que entren en ellas. Es evidente, por lo tanto, que hace falta un control editorial a alto nivel en los proyectos de gran magnitud. Lo que no hay que perder de vista en ningún momento es que siguen siendo muy necesarios los traductores humanos; la tecnología aquí descrita tiene por finalidad mejorar su productividad, su consistencia y su calidad de vida, sin pretensión de ocupar su lugar.

La gestión terminológica
Una vez más, el presente artículo no pretende explicar el campo general de la estandarización terminológica como tal, sino que se limita a la cuestión de cómo facilitar la difusión de una terminología estandarizada por medio de las IT, al entender que esto es uno de los objetivos del proceso de normalización lingüística. Igual que en el caso del software de memoria de traducción antes descrito, ya existe la tecnología necesaria para hacer llegar hasta cada uno de los usuarios finales listas de términos estandarizados e integrarlas con programas de gestión terminológica vinculados a esas aplicaciones de memoria de traducción. Algunos de estos programas proporcionan opciones para resolver casos ambiguos facilitando al usuario información adicional, como podría ocurrir, por ejemplo, al traducir al galés el nombre de una calle conocida del pueblo de Aberystwyth que en inglés se llama "Queen's Road" pero que en galés se denomina "Morfa Mawr" (literalmente "Gran Marisma"); esta puede no ser una traducción adecuada de una "Queen's Road" en cualquier otro pueblo o ciudad (notemos que "Ffordd y Frenhines", o sea "Calle de la Reina", es una construcción y "traducción" gramaticalmente impecable, que casualmente no se utiliza para referirse a ninguna calle en Aberystwyth). Una palabra como "acceso" puede significar muchas cosas: entre ellas, un sustantivo que denota el lugar desde donde uno se acerca a un edificio, un verbo que expresa la acción misma de acceder al edificio, u otro verbo que se refiere al acceso a la información; pues bien, cada significado podría diferenciarse por medio de un sistema que facilite la resolución de ambigüedades.

El flujo de trabajo de traducción y la Gestión de Documentos Bilingües
La IT y los sistemas de flujo de trabajo informatizados pueden ser de gran ayuda a la hora de gestionar múltiples y simultáneos proyectos de traducción. También pueden utilizarse para monitorear la disponibilidad y capacidad de un conjunto de traductores externos o independientes para emprender trabajos adicionales, proporcionando datos como por ejemplo el número de palabras que se pueden traducir al día sobre un tema determinado, o un listado de tarifas. Algunos de estos sistemas, de tipo "panel de control", incluso son capaces de comunicarse directamente con las herramientas CAT para reducir el número de traducciones repetitivas que se encarguen al traductor. Por supuesto el mismo tipo de tecnología puede usarse para regir las oficinas, como por ejemplo en las instituciones como administraciones locales que dispongan de un equipo interno de traductores. Asimismo podría permitirse que los traductores independientes y externos se apuntasen para recibir encargos de modo regular, y también actualizaciones de la memoria de traducción y del fondo terminológico, lo que daría lugar a la creación de un gran corpus de memorias de traducción consistente y de calidad controlada, que iría evolucionando y mejorándose con el paso del tiempo.

El flujo de trabajo de traducción y los Sistemas de Gestión de Contenidos
Los sistemas de memoria de traducciones aquí descritas pueden integrarse en todo tipo de sistemas de gestión de documentos y contenidos, además de incorporarse en las soluciones para el flujo de trabajo de unidades y empresas de traducción y traductores independientes. En un mundo en el que la información cambia incesantemente, es importante que las versiones en ambos idiomas se publiquen y se actualicen al mismo tiempo.

Por poner un ejemplo, en la página Web de un ente gubernamental o administrativo que atienda a un público galés, es posible que algunas páginas o párrafos tengan que modificarse cada día. Ahora bien, en casos donde el sistema de gestión de contenidos esté en manos de personas que no sepan galés, esta tecnología podría encargarse de enviar los componentes o elementos de texto modificados a un traductor automáticamente; el traductor los traducirá con la ayuda de la memoria de traducción además de un programa de gestión terminológica. Al terminar la traducción, esta será devuelta automáticamente por el sistema de flujo de trabajo al sistema de gestión de contenidos, que lo publicará simultáneamente con la versión inglesa que, mientras tanto, ha sido almacenada a la espera del contenido correspondiente en galés. Se trata de una herramienta importante para la continuada normalización del galés, ya que garantiza en todo momento el acceso de los usuarios a los mismos textos en inglés y en galés. Se puede apreciar la importancia de esto si tenemos en cuenta que una de las conclusiones de los estudios sobre los sitios Web a los que nos referíamos antes, fue la constatación de que en algunos sitios Web de la administración pública, las versiones en galés no se actualizaban tan asiduamente como las correspondientes versiones en lengua inglesa.

Traducción automática
La traducción automática o mecánica (o MT, por machine translation) es un tema que se menciona a menudo al hablar de la lengua galesa, la traducción y cuestiones sobre las IT. Pese a muchos años de investigación y algunos logros significativos, la tecnología MT aún no es capaz de proporcionar traducciones de una calidad comparable a la que pueden producir los traductores humanos. No obstante, los datos de uso de los sistemas en-línea de MT ofrecidos gratuitamente por Internet indican que, para algunos tipos de texto, la MT puede dar traducciones de un nivel aceptable y útil en algunos casos para él que la use. Además, utilizada en combinación con la aplicación de ciertos controles sobre el lenguaje, como es factible a veces en los textos de carácter marcadamente técnico, puede dar lugar a una traducción de alta calidad como borrador inicial que requiera poca revisión, y así resultar de un gran ahorro en costos de traducción. Por otra parte, sirve para proporcionar traducciones aproximadas desde el galés, lo cual le permite a la comunidad internacional acceder a la información y facilita que miembros del personal, aunque no sepan galés, puedan procesar mensajes escritos de sus compañeros o correspondencia escrita por ciudadanos de habla galesa.

Un estudio de viabilidad (28) de la Comisión de la Lengua Galesa sobre la traducción automática encargada al profesor Harold Somers de la Universidad de Manchester (que además es director de la revista especializada International Journal of Machine Translation) recomienda el uso de un sistema de traducción tripartito cuyos componentes serían, respectivamente, la EBMT (traducción mecánica basada en ejemplos), la RBMT (traducción mecánica basada en reglas) y la SBMT (traducción mecánica basada en estadísticas). Esta combinación posibilitaría traducciones aproximativas (gist translations) entre el galés y el inglés y, en el futuro, permitirían la integración con otras aplicaciones tales como la viñeta de investigaciones de MS Office y los sistemas de memorias de traducción. Como ya hemos puntualizado, esto debe considerarse como una ayuda para los traductores, editores etc., y en ningún caso como un medio de sustituirlos.

Los corpus
Uno de los requisitos para seguir avanzando en el desarrollo de la tecnología lingüística galesa -tecnología que, a su vez, proporciona la base de otras tecnologías de la lengua galesa como son los sistemas de procesado del habla o la ya comentada traducción automática- es la existencia de unos corpus del galés escrito de tamaño suficiente (los cuales pueden contener, entre otras cosas, una multitud de versiones electrónicas de publicaciones impresas). Habiendo sido pioneros en este campo durante años, los del centro Canolfan Bedwyr han desarrollado lematizadores (que analizan las palabras y etiquetan sus formas gramaticales), corpus (grandes bases de datos de textos en galés escrito o hablado), algoritmos de clasificación alfabética (el orden del alfabeto utilizado en galés es diferente del inglés; véase también el documento normativo de la Comisión), y otros aspectos de la ingeniería lingüística. Aunque la mayoría de estos recursos por sí solos únicamente tendrán interés para un especialista, se trata de herramientas absolutamente necesarias cuyos efectos llegan muy lejos y son de gran importancia, ya que otras aplicaciones de la tecnología lingüística se basan en ellas. (Véanse también los recursos del programa Open Source Konjugator) (29)

Tecnología del habla en lengua galesa
La tecnología del habla abarca tanto la síntesis de voz como el reconocimiento de una voz humana por parte de un sistema IT determinado. Este tipo de tecnología ya ha empezado a insinuarse en nuestra vida cotidiana: por ejemplo, muchos centros de atención telefónica ya han automatizado sus procesos usando la síntesis de voz, y algunos servicios de telefonía móvil que pueden recibir correos electrónicos han empezado a ofrecer la posibilidad de leer en voz alta los correos para que su receptor pueda escucharlos. La tecnología del habla puede aportar una ventaja añadida para cualquier programa de IT: puede simplificar el acceso a los datos, agilizar la entrada de datos, y posibilitar el control sin tener que usar las manos. No menos importante es el hecho de que puede ser muy ventajoso para los invidentes.

Como ocurre con la mayoría de los grandes avances tecnológicos, inicialmente la labor de investigación para su desarrollo se realizó teniendo en cuenta las lenguas mayoritarias. Sin embargo, ya que todo parece indicar que la tecnología del habla, al integrarse en diferentes aplicaciones técnicas de la vida cotidiana, va a tener una gran presencia en nuestras vidas diarias en el futuro, es importante que la lengua galesa no se quede apartada en esta área tampoco. Notemos, pues, que la Comisión de la Lengua Galesa, junto con INTERREG, ya ha asignado fondos para el proyecto WISPR  (30) (Recursos para el Procesado de Habla en Galés e Irlandés) que se está realizando en el Canolfan Bedwyr de la Universidad de Gales en Bangor.

Síntesis de Voz
El proyecto WISPR ya ha elaborado un primer sistema de síntesis del habla para el galés que cumple las normas SAPI (Speech Application Programming Interface) y esto ha hecho posible un procesador texto-a-voz (text to speech, TTS) de distribución libre. Entre otros muchos usos posibles, se pueden utilizar los sistemas de síntesis del habla para convertir las palabras en un documento electrónico (p.ej. un documento de un procesador de textos o una página Web) u otro interfaz en palabras habladas, que se pueden oír a través del equipo de sonido del ordenador. Esto será útil para quienes necesiten o deseen una verificación acústica de lo que ven escrito. También puede ser integrado en un sinfín de otras aplicaciones, incluyendo las descritas en este artículo.

Reconocimiento de voz
Según la definición utilizada por el equipo del proyecto WISPR, el reconocimiento de voz (o speech to text, voz-a-texto) consiste en capturar y digitalizar ondas sonoras que provienen de un micrófono, convertirlas en unidades básicas del lenguaje (fonemas), construir palabras con los fonemas y analizar las palabras en contexto para asegurar su correcta representación ortográfica (como en el caso de haya y halla, por ejemplo). El resultado final se visualiza en el monitor en forma de texto.

Una vez más, aunque los detalles técnicos de todo esto pueden parecerle al no especialista algo impenetrables, no debemos subestimar el alcance y las implicaciones de estas operaciones dado que ya existen muchos sistemas operativos que ofrecen el reconocimiento de voz como un componente estándar, e indudablemente con el paso del tiempo irán en aumento. Probablemente en el futuro realizaremos nuestros pedidos, llevaremos a cabo nuestras operaciones bancarias y nos valdremos de numerosos otros servicios por medio del reconocimiento de voz.

Integrar la traducción automática con la tecnología del habla
Un campo que merece nuestra consideración como cuestión a medio plazo es la integración de la tecnología del habla con la tecnología de la traducción automática que hemos descrito previamente. Pensemos en un escenario imaginario en el que dos personas mantendrán una conversación, uno hablando en galés y el otro en inglés. Para lograr esto se utilizaría el reconocimiento de voz encadenado a un sistema de traducción automática que producirá la correspondiente traducción, que será procesada, a su vez, por medio de la síntesis de voz. Por muy fantástico que esto nos pueda parecer hoy en día, el hecho es que ya están en marcha, en diversos centros, investigaciones encaminadas a este tipo de tecnología integrada: en el Language Technologies Institute de la Universidad Carnegie Mellon, por poner un ejemplo (31).  No hace falta insistir en el potencial que tendría este tipo de integración para los servicios en lengua galesa, así como para las reuniones bilingües, en estos días cada vez más marcados por el uso de las IT.

Formación en IT en galés
Debemos prestar especial atención al tema de la formación de usuarios y capacitación por medio del galés en el campo de las IT. Uno de los principales recursos en lengua galesa para formación en IT es el European Computer Driving License (el "carnet de conducir" informático europeo), que ha sido financiado parcialmente por la Comisión de la Lengua Galesa. En marzo de 2007, Microsoft lanzó una versión en lengua galesa de su proyecto Digital Literacies ("alfabetización digital") utilizando la terminología estandarizada y pantallas de las versiones galesas de sus propios productos. Dado el ritmo rápido de los avances en las IT, harán falta actualizaciones constantes para este tipo de formación; ELWa (Education and Learning Wales, que se fusionó con el Gobierno de la Asamblea Galesa el 1 de abril de 2006) ha publicado un estudio de evaluación sobre la provisión en este campo (33).  Por otra parte, Monitor Cymru, que ha producido el informe sobre la utilización de servicios IT en galés del que se hablará más adelante, ha publicado un curso interactivo en CD-ROM que está ilustrado con pantallas en galés obtenidas de los Microsoft Language Interface Packs. (34)

Aparatos portátiles
Entre los elementos de la tecnología de la información que en los últimos años han pasado a formar parte de nuestra vida cotidiana se cuentan los teléfonos móviles, los asistentes personales y otros aparatos portátiles. Al fusionarse estos con lo que anteriormente eran aparatos diferenciados como por ejemplo las radios, los organizadores personales o los aparatos de música, van convirtiéndose en artículos cada vez más poderosos y más necesarios para el buen funcionamiento de nuestra comunicación, nuestros quehaceres diarios y nuestro ocio. Todo esto cobra aún más importancia, si tomamos en consideración la necesidad de impulsar el uso de la lengua galesa entre la juventud (véase también, sobre este punto, la Estrategia para la Juventud de la Comisión de la Lengua Galesa) (35).  Por todo ello, es comprensible que la Comisión plantee la necesidad de prever el uso del galés en estos aparatos. Como ya se ha dicho, muchos teléfonos ya ofrecen la posibilidad de que los correos electrónicos puedan ser leídos por una voz sintetizada. También otro ejemplo evidente sería el interfaz de la telefonía móvil que es vista por el usuario.

También promete ser sumamente importante la tecnología de texto predictivo, un sistema de teclear mensajes en un móvil en el que el usuario pulsa una serie potencialmente ambigua de teclas mientras el aparato intenta predecir el mensaje intencionado. En agosto de 2006 la Comisión lanzó a modo de prueba una aplicación de texto predictivo en galés. El programa, que permite la creación de contenidos a través del teclado de un teléfono móvil, es gratis y se puede descargar a muchos modelos de teléfono móvil sin importar cuál es el operador ni el fabricante. Al igual que con el Language Control Centre descrito arriba, tras estudiar las reacciones de los usuarios la Comisión procederá a hacer pública una versión definitiva en el año 2007. (36) (37)

Intercambio internacional de experiencias
Muchas regiones que viven situaciones similares a la de Gales han logrado avances significativos en el campo de la IT, como por ejemplo las comunidades autonómicas del País Vasco, Galicia y Cataluña y la República de Irlanda. Por lo tanto, es importante el intercambio de ideas entre dichas regiones en todos los aspectos de la planificación lingüística. La Comisión de la Lengua Galesa es miembro de la Red Europea de Comisiones de Planificación Lingüística que se estableció en octubre de 2001 para impulsar las lenguas regionales y minoritarias a nivel europeo. También es miembro del Grupo de Trabajo para Lenguas Regionales y Minoritarias, un subgrupo ICT del British Irish Council. (38)

Dicho esto, no hay nada que impida ni que los trabajos de investigación y desarrollo llevados a cabo sobre lenguas más mayoritarias sean aprovechados para el bien del galés, ni que parecidos trabajos sobre el galés puedan ser de utilidad para aquellas lenguas.

Conclusión
El mundo de las IT cambia a una velocidad de vértigo. Hace pocas décadas nadie habría creído que la informática iba a afectar tantas facetas de nuestras vidas ni que el trabajo de cualquier oficina y gran parte de la correspondencia personal iban a estar dominadas por el uso del correo electrónico y los ordenadores; sin olvidar la influencia de Internet. Del mismo modo que los equipos de mecanógrafos ya son cosa del pasado, la tecnología "moderna" del momento actual también evolucionará rápidamente. Ya están en circulación las propuestas sobre el futuro sucesor de "la Web", y se están planteando preguntas acerca de las posibles implicaciones lingüísticas de la "Web 2.0". Como se ha sugerido aquí, ya existen muchos recursos tecnológicos para la lengua galesa, y ha llegado la hora  de asegurar que nuestro discurso atenderá la promoción de su uso, a la vez que seguiremos con la creación de nuevas herramientas y la actualización de las que ya disponemos. Por ello, en diciembre de 2006 la Comisión dio inicio a un proyecto experimental a pequeña escala para promocionar los interfaces de software en galés en la Isla de Môn (Anglesey en inglés). (39)

Los resultados de este experimento mostraron que "hace falta una estrategia continua a largo plazo enfocada a fortalecer los vínculos con personas, empresas, escuelas y universidades para transmitir el mensaje de que es posible y fácil hacer pleno uso de la lengua galesa en el mundo actual de la tecnología de la información […] En la actualidad el galés no es, en realidad, la primera 'elección lingüística' para la mayoría de las personas en el campo de las Tecnologías de la Información […] Se evidenció la falta de confianza entre hablantes de galés en el uso del galés en los ordenadores aún cuando tenían un completo dominio de la lengua hablada." Sin embargo, y a pesar de estos datos iniciales, la encuesta halló que, después de una breve presentación y explicación de todas las herramientas disponibles para asegurar el uso sin complicaciones de un interfaz en galés, y del hecho de la disponibilidad para los participantes del vocabulario por medio del Language Control Centre en el escritorio de su ordenador, "el experimento obtuvo una buena respuesta en todos los casos."

Está claro, pues, que todavía existen barreras socio-psicológicas y culturales que dificultan la introducción de la lengua "L" del paradigma diglósico, es decir el galés en nuestro caso, en ámbitos donde antes no sólo no se encontraba, sino que además nadie esperaba encontrarlo. (40)  En todos los campos, cambiar los hábitos del uso lingüístico (una de las cuatro metas principales marcadas en el documento de la Comisión de la Lengua Galesa publicado en 1996, Strategy for the Welsh Language) lleva su tiempo. Pero lo que sí ha quedado claro teniendo en cuenta el alto nivel de actividad tanto en el software en lengua galesa de código abierto como en el comercial, y las reacciones positivas ante el proyecto experimental de promoción de la Comisión, es que los ciudadanos están abiertos al uso de software en galés de fácil disponibilidad y buena calidad siempre y cuando se den unos pasos para deshacer el misterio que rodea este tema. Por lo tanto, hay un enorme potencial, no sólo en cuanto a la normalización del galés en el campo de la IT, sino en las aportaciones de la IT a la normalización del galés.

(1) Véase  www.wales.gov.uk o bien www.cymru.gov.uk [Volver]

(2) Utilizo el término "Lengua regional o minoritaria" según la definición de la Carta Europea para las Lenguas Regionales o Minoritarias y los instrumentos asociados con su ratificación. El Gobierno del Reino Unido ha ratificado 52 cláusulas de la Carta para el Galés, y el Consejo de Europa acaba de publicar su segundo informe de seguimiento de la implementación de la Carta para todas las lenguas regionales o minoritarias del Reino Unido para las cuales ha ratificado la Carta. Para más información bajo la "E" del siguiente sitio Web:  http://www.bwrdd-yr-iaith.org.uk/cynnwys.php?cID=&pID=109&azID=2&langID=2  [Volver]

(3) Véase   www.welsh-language-board.org.uk para las fuentes de estos datos y un resumen general de los datos e investigaciones de la Comisión de la Lengua Galesa (Bwrdd yr Iaith Gymraeg) junto con información sobre la evolución histórica de la lengua galesa. [ Volver]

(4) http://www.bwrdd-yr-iaith.org.uk/cynnwys.php?pID=109&langID=2&nID=2063. Este documento fue encargado por la Comisión a la empresa Draig Technologies Ltd, que fue su autor principal. Draig tuvo a su disposición la plena cooperación del centro Canolfan Bedwyr de la Universidad del País de Gales en Bangor, así como del propio personal de la Comisión, para la elaboración de este documento. En cumplimiento de las provisiones legales el documento ha sido distribuido a las más de 400 organizaciones que pertenecen al Plan Lingüístico oficialmente reconocido bajo la Ley de la Lengua Galesa de 1993; a su debido tiempo, cada una de estas organizaciones remitirán una evaluación de su grado de cumplimiento del Plan. [ Volver]

(6) Para una información elemental continuamente actualizada sobre el nivel de bilingüismo de una muestra seleccionada de sitios Web pertenecientes al sector público, véase   http://topia.com/. [ Volver]

(7) El sitio Web   http://www.canolfanbedwyr.org le ofrece al lector interesado información de fondo sobre la larga lista de proyectos pioneros en la Tecnología Lingüística y otras áreas realizados por Canolfan Bedwyr, un centro que forma parte del campus que tiene la Universidad de Gales en el pueblo nor-galés de Bangor. Canolfan significa "centro", y lleva el nombre del difunto director del Departamento de Lengua Galesa de dicha universidad, el profesor Bedwyr Lewis Jones. [ Volver]

(17) http://www.cymen.co.uk ,  http://www.draig.co.uk [ Volver]

(18) Fuentes: Censo de 2001, la tabla estandarizada S143 y la tabla por encargo C0055. [Volver]

(37) También existen otros formatos de texto predictivo; véase por ejemplo http://wiki.eatoni.com/wiki/index.php/Products#Languages. [Volver]

(40) Véase entre otros: Williams, G. & Morris, D. Language planning and language use: Welsh in a global age, Cardiff: University of Wales Press, 2000. . [Volver]

Fecha de la última modificación: 26/04/2007
Euskadi, bien común