Este libro es muy útil herramienta para perfeccionar algoritmos de traducción: la Biblia

Este libro es muy útil herramienta para perfeccionar algoritmos de traducción: la Biblia
Sin comentarios Facebook Twitter Flipboard E-mail

La Biblia en inglés viene en muchos estilos escritos diferentes, por lo que es el texto de origen perfecto para trabajar en la traducción de estilos.

Por ello, según la investigación publicada en la revista Royal Society Open Science, este no es el primer conjunto de datos paralelos creado para la traducción de estilos, pero es el primero que utiliza la Biblia.

Traducción de estilos

La creación de traductores de estilo (herramientas que mantienen el texto en el mismo idioma, pero que transforman el estilo) es compleja por la dificultad de adquirir la enorme cantidad de datos requeridos. Por ejemplo, un traductor de estilos podría tomar una selección en inglés de "Moby Dick" y traducirla a diferentes versiones adecuadas para lectores jóvenes o hablantes en inglés no nativos.

En este estudio, sin embargo, se sugiere que la Biblia puede ser un importante recursos para lograrlo: cada versión de la Biblia contiene más de 31.000 versos que los científicos usaron para producir más de 1,5 millones de combinaciones únicas de versos de origen. Los textos se incorporaron a dos algoritmos: un sistema estadístico de traducción automática denominado "Moses" y un marco de red neuronal comúnmente empleado en la traducción automática, "Seq2Seq".

Child 945422 960 720

Ya en 2011, un grupo de desarrolladores israelí presentó un software revolucionario que está dando nuevas pistas acerca de quién o quiénes escribieron la Biblia hebrea (Aleppo Codex). Este algoritmo, desarrollado por el equipo liderado por Moshe Koppel de la Universidad de Bar-Ilan, analizó el estilo y el conjunto de palabras para seleccionar partes de un texto que hubieran sido escritas por diferentes autores, poniendo en evidencia su diversidad.

El equipo utilizó 34 versiones bíblicas estilísticamente distintas que iban desde la complejidad lingüística, desde la "Versión King James" hasta la "Biblia en inglés básico".

Como un beneficio adicional para el equipo de investigación, la Biblia ya está completamente indexada por el uso consistente de números de libros, capítulos y versículos.

Según señala el colaborador del estudio Daniel Rockmore, profesor de Informática en Dartmouth:

Los seres humanos han estado realizando la tarea de organizar textos bíblicos durante siglos, por lo que no tuvimos que poner nuestra fe en algoritmos de alineamiento menos fiables.

Comentarios cerrados
Inicio