Google Translate (GT) es definitivamente el mejor y más utilizado software de traducción del mundo. Admite hasta 103 idiomas, 10 000 pares de idiomas y procesa hasta 500 millones de traducciones todos los días. Los expertos predicen que el sistema neuronal de GT pronto podrá procesar archivos de audio y video además de textos.
Google Translate desde 2016 utiliza el Sistema de Traducción Automática Neural (GNMT). Un sistema basado en una red neuronal artificial es mejorado significativamente la calidad de la traducción. Han pasado tres años desde entonces, y ahora podemos evaluar su eficacia. ¿Realmente ha mejorado la calidad de las traducciones y qué se debe cambiar aún para que mejore?
¿Cómo funciona el algoritmo de Google Translate?
Traductor de Google son desarrollado en 2006 e inicialmente trabajó con ayuda métodos estadísticos de traducción automática. Eso significa que almacenó billones y billones de palabras en su programa. Al traducir, simplemente eligió los equivalentes más apropiados o populares de ambos idiomas y los escribió. Google utilizado en la creación del traductor Documentos de las Naciones Unidas (inglés, árabe, francés, chino, ruso y español) y así produjo un corpus de seis idiomas del mundo con aproximadamente 20 mil millones de palabras. Este proceso era lento, impreciso y consumía mucha potencia informática.
Hoy en día, Google Translate utiliza el llamado método de aprendizaje profundo (Método de aprendizaje profundo), en el que una gran red neuronal artificial es especialmente importante.
Antes de que Google comenzara a usar redes neuronales, la traducción era palabra por palabra. El sistema tradujo fácilmente cada palabra por separado, siguiendo las reglas gramaticales básicas. Por lo tanto, la calidad de la traducción era muy cuestionable.
Sin embargo, con el nuevo modelo neural de traducción la unidad básica de traducción ya no es una palabra, sino solo una parte de una palabra. Por lo tanto, la traducción no se centra en las formas de las palabras, sino en contexto y significado de la oración completa. Por lo tanto, el programa traduce la oración como un todo, de acuerdo con su significado contextual, sin almacenar cientos de posibles versiones de traducción en su memoria.
Por lo tanto, el software traduce la oración completa teniendo en cuenta el contexto y ya no se enfoca solo en palabras individuales. No almacena cientos de versiones de traducción en su memoria. En cambio, opera sobre la semántica del texto y divide las oraciones en segmentos de diccionario.
¿Cómo traduce Google usando una red neuronal?
Hoy usa Google Translate unos 32.000 fragmentos de este tipo. Con la ayuda de decodificadores individuales, determina inicialmente el significado de cada parte del texto. Luego calcula el número máximo posible de significados y posibles traducciones. Finalmente, combina los segmentos traducidos con reglas gramaticales. Según los desarrolladores, este enfoque permite garantizar una alta velocidad y precisión de traducción sin consumir una potencia informática excesiva. Sin embargo, dado que cada idioma tiene sus propias reglas (semánticas y gramaticales), Google Translate también necesita módulos y diccionarios especiales para cada idioma, que se implementan en algoritmos separados.
interlingua
Inteligencia artificial utilizada por Google Translate como lenguaje intermedio, se llama Interlingua. Este lenguaje informático universal es, por supuesto, completamente inadecuado para la comunicación humana. La inteligencia artificial se utiliza en la traducción, donde se utiliza como un lenguaje intermedio con el que también puede traducir hacia y desde idiomas para los que no fue creado.
La ventaja de la red neuronal es que puede operar con una mayor cantidad de pares de idiomas, incluso con aquellos que no se incluyeron en el proceso de aprendizaje original. Por ejemplo, si el sistema ha sido entrenado para traducir los pares de idiomas inglés-japonés e inglés-coreano, también puede traducir fácilmente el par de idiomas japonés-coreano sin usar el inglés como idioma intermedio.
El método de traducción implementado por Google, que los desarrolladores llamaron traducción de tiro cero, es más sofisticado y se basa en un lenguaje artificial intermedio para la traducción. Este campo de investigación se está desarrollando muy rápidamente y pronto estos sistemas de traducción se convertirán en la principal herramienta de traducción. es un sistema autodidacta - mejora sus conocimientos por sí mismo y también puede traducir correctamente argot y palabras de argot, neologismos y otras palabras que no están incluidas en los diccionarios generales.
Pares de idiomas
El sistema GNMT ha mejorado mucho la traducción de los pares de idiomas más utilizados: español-inglés y francés-inglés. La corrección de las traducciones aumentó hasta 85%.
En 2017, Google realizó una encuesta entre los usuarios habituales del traductor. Se les pidió que evaluaran tres opciones de traducción: estadística automática, neuronal y humana. Los resultados fueron impresionantes: las traducciones realizadas por la red neuronal fueron casi perfectas en algunos pares de idiomas.
Es obvio que la calidad de las traducciones en los pares de idiomas inglés-español y francés-inglés es casi la misma que la de las traducciones humanas. Este hecho no es sorprendente, ya que estos pares de idiomas se utilizaron para el aprendizaje profundo de los algoritmos de Google Translate. La situación es diferente para otros pares de idiomas. Sin embargo, si la traducción neuronal funciona de manera comparable entre idiomas estructuralmente similares, entonces la traducción por computadora será mucho peor para los pares de idiomas donde los sistemas de idiomas son radicalmente diferentes.
¿Cuáles son las desventajas de Google Translate?
Es cierto que Google Translate es muy práctico, y por su accesibilidad y rapidez de funcionamiento, es de gran ayuda en la traducción del día a día. Sin embargo, todavía le falta algo esencial: comprensión. La traducción informática nunca se centra en la comprensión. Los desarrolladores del programa intentaron mejorar el método de descifrado, o en otras palabras, intentaron que la máquina de traducción lo manejara con sus capacidades analíticas. Sin embargo, tenían que encontrar equilibrio entre la precisión y la velocidad de la traducción.
efecto eliza
Para cualquier máquina, dispositivo informático o software, las palabras importan. Sin embargo, las máquinas aún no pueden comprender el significado profundo de las palabras.
Años 1960 Hicieron Eliza, un dispositivo mecánico que manipulaba una serie de respuestas, dando la impresión de que en realidad estaba generando frases inteligentes. A partir de entonces, la cuestión de si las máquinas pueden pensar como los humanos se ha denominado Efecto Eliza.
El Efecto Eliza ha influido en los investigadores de IA y los desarrolladores de software durante décadas. La mayoría de los usuarios de Google Translate creen que este programa, al menos a veces, es capaz de comprender el significado de las palabras. Sin embargo, eso no es verdad - Google Translate no entiende el idioma, pero a veces logra hacer oraciones que suenan bastante bien. A veces incluso logra traducir uno o dos párrafos a la perfección, y casi creemos que el programa realmente entiende el idioma. Sin embargo, no debemos olvidar que Google Translate no es capaz de pensar como un humano y solo puede procesar textos de una manera específica. Un programa de computadora no tiene memoria, imaginación ni comprensión de los significados ocultos de las palabras, por lo que no hay razón para no creer que las computadoras algún día podrán pensar como humanos.
Sin embargo, se espera que sean capaces de realizar excelentes traducciones entre diferentes idiomas. Es muy probable que algún día lo hagan. capaz de traducir chistes, cuentos, poesía y ensayos. Después de todo, la tecnología está evolucionando a la velocidad de la luz.
Más información:
traducir.google.com