¿Puede el sector farmacéutico subirse al tren de la IA y beneficiarse de la traducción automática? ¡Claro que sí! Aunque no es oro todo lo que reluce…

imagen autor
María do Campo Bayón. Machine Translation Program Manager. CPSL Language Services.

¿Puede el sector farmacéutico subirse al tren de la IA y beneficiarse de la traducción automática? ¡Claro que sí! Aunque no es oro todo lo que reluce…

08/5/2023
2443
Lo que los proveedores lingüísticos pueden esperar de la traducción automática en los próximos años en cuanto a calidad y confidencialidad en proyectos técnicos del ámbito farmacéutico (y cómo obtener lo mejor de ambos mundos).

La opinión que tienen sobre la traducción automática (TA) quienes trabajan con ella o el sector de la investigación académica parece estar en muchas ocasiones muy alejada de la realidad del trabajo cotidiano de un proveedor de servicios lingüísticos (PSL) y de las expectativas que pueden tener las empresas del sector farmacéutico cuando demandan el uso de esta tecnología para sus traducciones. Esa distancia parece la responsable del escepticismo que muestran algunos PSL y traductores ante esta herramienta de traducción. En este artículo hablaremos de lo que realmente es posible hacer con la TA aplicada a textos del sector farmacéutico y de su nivel de equiparación con la traducción humana desde la perspectiva de un PSL (Proveedores de Servicios Lingüísticos) que lleva una década trabajando con la traducción automática. También trataremos los efectos de la nueva generación de motores de TA en la práctica de los PSL y su relación con los traductores y, por último, presentaremos algunas ideas sobre las nuevas realidades con las que pueden encontrarse los PSL en proyectos de la industria farmacéutica.

Durante el 2022 han aparecido diversas publicaciones que afirmaban haber alcanzado niveles de calidad humana en el ámbito del aprendizaje automático, en concreto en la traducción automática (TA), especialmente tras la aparición de los grandes modelos lingüísticos y los transformadores generativos preentrenados. Dichos avances no están exentos de polémica: algunos expertos han alzado la voz sobre algunos problemas graves que plantea el uso de esta tecnología. Por otro lado, estos constantes anuncios de mejoras de la TA ya no se limitan a la industria de la traducción y, de hecho, están llegando al público general, que incluye a empresas del sectores especializados como el farmacéutico.

Esta democratización de la inteligencia artificial (IA) está provocando, por un lado, que la especialización tecnológica pase a ser el factor diferenciador y, por otro, que los proveedores de servicios lingüísticos (PSL) se encuentran ante la necesidad de responder a las expectativas de los clientes del sector farmacéutico en cuanto al uso de la TA, que incluyen tarifas bajas, volúmenes mayores, plazos más cortos, más lenguas de destino y, como consecuencia, diferentes niveles de calidad. A esto hay que sumar los nuevos retos que se han puesto sobre la mesa, a saber, la correcta integración de la tecnología de la IA en los flujos de trabajo de los PSL, la adaptación de la TA al contexto y a los textos farmacéuticos, las relaciones de confianza con los poseditores y una adecuada evaluación de la calidad de la TA. En este artículo, explicaremos estos retos y cómo superarlos, los posibles efectos en los PSL y las medidas que estos deben tomar, así como las expectativas que puede mantener el sector farmacéutico de cara al futuro.

En primer lugar, cabe diferenciar dos conceptos básicos en la industria de la traducción: la traducción automática y la traducción asistida por ordenador (TAO). La traducción asistida o TAO hace referencia al proceso de reproducción de la información en una lengua fuente a una lengua meta que lleva a cabo un traductor con la ayuda de programas informáticos desarrollados específicamente para esta labor, que incluyen funciones de gestión de memorias de traducción y bases de datos terminológicas o de edición de contenido textual, lo cual ayuda al traductor a incrementar su productividad y a mantener la coherencia tanto en este texto como en otras traducciones similares. Por su parte, la TA es el proceso que realiza una máquina para traspasar la información de una lengua fuente a una lengua meta sin intervención humana directa. Esta modalidad de traducción incluye herramientas disponibles en línea, que son genéricas y no ofrecen garantías en cuanto a calidad y confidencialidad, y motores de traducción automática especializados, ofrecidos por PSL profesionales, que sí ofrecen seguridad y están alimentados con materiales seleccionados para una industria o una empresa específicas.

En cuanto a la calidad que puede ofrecer la TA, impresiona estudiar su curva de crecimiento, que, como ocurre con otras tecnologías, es imparable y en forma de «S». La inversión en este campo de investigación debe continuar para que la curva de crecimiento sea constante y pueda alcanzar nuevos objetivos y satisfacer las expectativas de los clientes. En consecuencia, cualquier PSL debe vigilar de cerca las últimas tendencias, aprovechar los avances y adaptar sus flujos de producción en consonancia. Sin embargo, debemos ser meticulosos al diseñar el proceso de adopción de esta tecnología y adaptarlo a cada ámbito, como puede ser el caso del sector farmacéutico.

Uno de los desafíos que plantea esta nueva tecnología de IA-TA es la tendencia a desvariar o inventarse información y presentarla como real. Este fenómeno se ve agravado por el hecho de que los modelos son como cajas negras, es decir, los expertos no pueden evaluar si los motores de TA lo están haciendo bien ni saben cómo replicar los errores para poder solucionarlos, por no hablar del problema adicional que son las incoherencias. Por ello, la ingeniería de datos reales es la clave para que estos modelos lleguen a ser sólidos. Su labor debe consistir en la investigación de modelos, y además debe trabajar para etiquetar datos, recopilar datos de aprendizaje de alta calidad del mundo real, ampliar esta recopilación a más lenguas aparte del inglés y crear más opciones de personalización para los usuarios de la TA. Todo ello, aplicado a ámbitos concretos, como el sector farmacéutico.

También debemos tener en cuenta las capacidades del hardware y la inversión necesaria para integrar esta nueva era de grandes modelos multilingües. Si bien para la traducción automática neuronal (TAN) se pueden combinar CPU y GPU, los grandes modelos necesitan más capacidad computacional para gestionar una cantidad tan descomunal de datos y algoritmos. Para pasar a modelos más grandes, las empresas necesitan recuperar sus inversiones anteriores en la TAN tradicional, para lo que seguramente deberán pasar algunos años.

A la luz de todo lo anterior, podemos anticipar que el primer gran desafío para los PSL es poder confiar en la TA. Debido a que todavía no es fiable al 100 %, los PSL deben centrarse en cómo usarla con responsabilidad y controlarla correctamente en cada caso. Por tanto, las empresas que solicitan estos servicios, incluidas las farmacéuticas, deben exigir modelos de evaluación de la calidad de la TA previa.

En cuanto a resultados, en general podemos decir que la TA funciona bien con textos altamente técnicos, con contenido repetitivo y con documentación e instrucciones. Si nos fijamos en los documentos típicos del sector farmacéutico, podríamos hablar de instrucciones, prospectos de medicamentos o manuales, por ejemplo. Sin embargo, el tipo de texto no es la única variable que hay que tener en cuenta; también influye la combinación lingüística, el motor de TA que se use, el volumen y el plazo. Lo recomendable, por tanto, es hacer un estudio de idoneidad para estar seguros de que la calidad ofrecida se corresponde con la calidad deseada.

Retos
Además, nos encontramos con retos propios de cada sector a la hora de aplicar esta tecnología. En el caso del farmacéutico, uno de ellos es garantizar el uso correcto de la terminología específica, para lo cual es primordial la creación de un glosario con términos específicos que alimente el motor y que se tenga en cuenta durante la posedición. Además, para obtener el máximo nivel de calidad posible, un lingüista especializado en la materia debe realizar una posedición completa con una posterior revisión por parte de otro lingüista especializado. A fin de cuentas, el factor humano sigue siendo fundamental para aportar el estándar de excelencia necesario en cualquier posedición, especialmente en ámbitos como el farmacéutico, donde la calidad ha de ser excepcional.

El lingüista (o traductor humano) debe intervenir en todas las fases de la TA para garantizar un estilo adecuado, una terminología precisa, el correcto traspaso de información de la lengua fuente a la lengua meta y, por supuesto, un texto final sin errores. En un sector donde la calidad de la traducción debe ser excelente, invertir en la creación de corpus especializados en el sector (o incluso en una compañía concreta) es esencial para disponer de una TA que arroje resultados óptimos. Para ello, se emplea como punto de partida la terminología específica del sector farmacéutico, que adicionalmente se puede alimentar con términos propios del cliente o del tipo textual que se desee traducir. El uso de bases de datos terminológicas especializadas, junto con nuestras memorias de traducción del ámbito farmacéutico a las que se puede agregar un corpus similar al texto origen, ayudan a obtener el tono, el registro y el estilo deseados en la traducción, así como a mantener la coherencia entre todos los proyectos del cliente. Al emplear un motor de TA alimentado con materiales específicos, en lugar de un motor genérico, la tarea de posedición resulta más eficiente, lo cual garantiza la rigurosidad que se espera en este sector.

En este contexto, los PSL deben aprender a trabajar con diferentes niveles de calidad en función de las necesidades del cliente y deben asegurarse siempre de que el trabajo que requiere más calidad siempre sea revisado por un ser humano, lo que nos lleva a hablar de la función del lingüista profesional. En CPSL, por ejemplo, disponemos de cuatro niveles de calidad: la traducción automática directa, (es el producto directo del motor de traducción, no requiere posedición y resulta ideal para comprender superficialmente un texto de uso interno), la posedición rápida (conlleva una edición superficial, está pensada para entender un texto de manera superficial y es perfecta para traducciones urgentes de uso interno), posedición completa (incluye una corrección exhaustiva por parte de un poseditor profesional, es recomendable para grandes volúmenes con un plazo ajustado y permite un nivel de calidad admisible para su publicación) y, por último, posedición completa con revisión (incluye la corrección de un poseditor profesional y la revisión de un segundo lingüista, aporta un nivel de calidad muy similar a la tradicional traducción humana y se puede aplicar a textos que se van a publicar).

Por tanto, podemos afirmar que los profesionales que poseditan textos farmacéuticos seguirán desempeñando una labor fundamental en la industria de la traducción. Para ello deben formarse específicamente en cómo reconocer los principales errores cometidos por la TA, algo que puede resultar muy difícil a medida que se vaya perfeccionando, pero que también puede ofrecer nuevas oportunidades laborales en cuanto a evaluación de calidad. Es probable que la TA cometa menos errores en el futuro, de modo que la labor de posedición se centrará más en la adaptación al contexto del cliente solicitante, la terminología farmacéutica y la adecuación a la cultura de destino. Es importante que los PSL formen a sus lingüistas especialistas en este sector en posedición, como hicimos nosotros con nuestro curso, para que puedan contar con un grupo de expertos de confianza.

En cuanto a otras estrategias, las tecnologías de evaluación de la calidad, como comentábamos anteriormente, ocupan un papel central en la totalidad del proceso, así como los servicios de ingeniería de datos, y ambas labores tendrán un peso cada vez mayor. Conocerlas en profundidad será esencial para los PSL, y eso será fundamental para determinar qué compañías se adaptan al futuro y cuáles no. El éxito, por tanto, estará en manos de quien domine la IA mejor que la competencia.

Si se tienen en cuenta las características del sector farmacéutico y sus necesidades, podemos concluir que el uso de motores de TA con este enfoque puede ofrecer mejores resultados que el uso de los motores genéricos disponibles en la nube. Un motor entrenado con textos específicos de la materia siempre ofrecerá un mejor resultado que un motor genérico. No obstante, entrenar un motor específico requiere la creación de un corpus bilingüe de textos suficientemente representativo del sector, esto es, con varios millones de oraciones bilingües, y es probable que no se disponga de una cantidad tan elevada de textos paralelos, por lo que otra posible solución es usar un motor genérico y alimentarlo con un glosario específico del sector.

En resumen, la TA permite ahorrar costes, reducir el plazo de entrega y, si se prepara de manera específica como hemos expuesto, puede resultar especialmente útil para traducciones urgentes de textos farmacéuticos. Si la documentación que se desea traducir cumple con los criterios mencionados más arriba y es una buena candidata para ser poseditada, el uso de esta herramienta supone grandes ventajas desde el punto de vista económico y reduce significativamente los tiempos de entrega.

Más toque humano
Entonces, ¿cómo puede un PSL como CPSL integrar la nueva generación de TA en los flujos de trabajo pensados para el sector farmacéutico? Por un lado, debe continuar automatizando los procesos a través de la integración de la TA con todas las herramientas de la empresa y, por otro, debe mantener un proceso que implique intervención humana y cuyo objetivo sea siempre obtener la máxima calidad, que es una de las exigencias del sector. Recientemente hemos creado un nuevo departamento denominado «Nuevas Tecnologías y Soluciones de IA», cuyas funciones incluyen, entre otras cosas, estudiar las últimas tendencias y establecer directrices para la evaluación de la calidad que permitan una integración correcta y reactiva de la TA. La idea esencial es adoptar con una gran acogida cada avance garantizando siempre la calidad.

En CPSL estudiamos cada proyecto y las particularidades del sector y para prestar el mejor flujo de trabajo. Para ello, primero analizamos la viabilidad del uso de la TA y seleccionamos el motor que mejor se ajuste al texto en cuestión. Si nuestro estudio es favorable, proponemos un flujo que integre la TA, la alimentamos con nuestros materiales (memorias y glosarios) del sector farmacéutico, contamos con lingüistas especializados, aplicamos la terminología del cliente en caso de disponer de ella y empleamos nuestras herramientas de evaluación de calidad.

La traducción automática inteligente es la mejor alternativa cuando el tipo de texto es muy técnico, cuando el contenido es similar a documentos de instrucciones, manuales o prospectos, cuando el cliente tiene la necesidad de traducir mucho volumen en poco margen de tiempo, cuando el proyecto es urgente y cuando las lenguas fuente y destino son lenguas con suficientes datos paralelos para poder entrenar los motores de TA.

En cuanto a las nuevas tendencias que puedan aparecer próximamente, los grandes modelos multilingües serán la tecnología más extendida en el mercado. Además, la IA se aplicará en otros campos aparte de la TA, por ejemplo, para mejorar el texto de origen, evaluar automáticamente la calidad de la TA o para ayudar al poseditor en su trabajo poseditando automáticamente textos con el fin de resaltar algunos errores o corregir los más comunes. Adicionalmente, la TA podría ser adecuada para nuevas áreas, como las creativas, con lo que se crearía más contenido sobre la marcha y, probablemente, se haga directamente a varias lenguas. Por último, en lugar de tener varios motores de búsqueda para cada área, seguramente contaremos con un gran modelo en el que podremos crear entradas de registro para el área y el idioma y, de este modo, ajustar cada modelo en función de nuestras necesidades.

En resumen, el uso de la TA y de la IA supone grandes avances y ventajas si está integrado en un flujo de trabajo que tiene en cuenta las peculiaridades de cada sector, su estilo, tono y registro y si sigue incorporando traductores humanos para aprovechar lo mejor de ambos mundos. Además, es una valiosa herramienta cuando se trata de un texto muy técnico (como pueden ser unas instrucciones, un manual o un prospecto), cuando se dispone de un corpus suficiente de textos paralelos en el par de lenguas o cuando el cliente tiene la necesidad de traducir mucho volumen en poco tiempo.

Puede obtener más información en este pódcast.

Categorias:

Articulos relacionados:

Logo
Javier M Floren. Founder & CEO. 3DforScience.
¿Email Marketing para farmacéuticas? ¿De qué va?, y ¿Por qué el contenido ahora tiene que ser personalizado?

En la era digital actual, las empresas farmacéuticas recurren cada vez más al email marketing para conectar con su audiencia. Sin embargo, simplemente enviar correos masivos ya no es suficiente para destacar. En este artículo exploramos la importancia del... El Papel del Email Marketing en las Farmacéuticas El email marketing es fundamental para las empresas farmacéuticas,...

Abr. 2024
Logo
Rocío Rodríguez. Consultant. Cegedim Healthcare Spain.
¿Pueden la Inteligencia Artificial o el Machine Learning trabajar sin datos de calidad?

La Inteligencia Artificial y el Machine Learning están de moda. Las empresas y cualquier sector de la sociedad comentan las bondades de esta tecnología innovadora. Pero ¿qué es la Inteligencia Artificial (IA)? La IA es una tecnología que muestra la culminación de la inteligencia humana y el procesamiento informático. Fundamentalmente lo que se hace es recopilar información de varias fuentes y utilizar los algoritmos adecuados para...

Abr. 2024