fbpx

Como o Google Tradutor se tornou ótimo: um tradutor que em breve traduzirá melhor que os humanos

O Google Tradutor (GT) é definitivamente o melhor e mais usado software de tradução do mundo. Ele suporta até 103 idiomas, 10.000 pares de idiomas e processa até 500 milhões de traduções todos os dias. Os especialistas prevêem que o sistema neural do GT em breve será capaz de processar arquivos de áudio e vídeo, além de textos.

Google Tradutor desde 2016, utiliza o Neural Machine Translation System (GNMT). Um sistema baseado em uma rede neural artificial é melhorou significativamente a qualidade da tradução. Três anos se passaram desde então, e agora podemos avaliar sua eficácia. A qualidade das traduções melhorou muito e o que ainda precisa ser mudado para que ela melhore?

Como funciona o algoritmo do Google Tradutor?

Google Tradutor são desenvolvido em 2006 e inicialmente trabalhou com ajuda métodos estatísticos de tradução automática. Isso significa que ele armazenou bilhões e bilhões de palavras em seu programa. Ao traduzir, ele simplesmente escolheu os equivalentes mais apropriados ou populares de ambos os idiomas e os escreveu. Google usado na criação do tradutor Documentos das Nações Unidas (inglês, árabe, francês, chinês, russo e espanhol) e assim produziu um corpus de seis línguas mundiais com aproximadamente 20 bilhões de palavras. Esse processo era lento, impreciso e consumia muito poder de computação.

Hoje, o Google Tradutor usa o chamado método de aprendizado profundo (Deep Learning Method), em que uma grande rede neural artificial é especialmente importante.

Antes de o Google começar a usar redes neurais, a tradução era palavra por palavra. O sistema traduziu facilmente cada palavra separadamente, seguindo as regras gramaticais básicas. Portanto, a qualidade da tradução era muito questionável.

Com o novo modelo neural de tradução, no entanto a unidade básica de tradução não é mais uma palavra, mas apenas uma parte de uma palavra. Assim, a tradução não é focada em formas de palavras, mas em contexto e significado de toda a frase. O programa, portanto, traduz a frase como um todo, de acordo com seu significado contextual, sem armazenar centenas de possíveis versões de tradução em sua memória.

O software, portanto, traduz a frase inteira levando em consideração o contexto e não mais se concentra apenas em palavras individuais. Ele não armazena centenas de versões de tradução em sua memória. Em vez disso, ele opera na semântica do texto e divide as sentenças em segmentos de dicionário.

Como o Google traduz usando uma rede neural?

Hoje ele usa o Google Tradutor cerca de 32.000 desses fragmentos. Com a ajuda de decodificadores individuais, inicialmente determina o significado de cada parte do texto. Em seguida, calcula o número máximo possível de significados e traduções possíveis. Por fim, combina os segmentos traduzidos com as regras gramaticais. De acordo com os desenvolvedores, essa abordagem torna possível garantir alta velocidade e precisão de tradução sem consumir poder computacional excessivo. No entanto, como cada idioma possui suas próprias regras (semânticas e gramaticais), o Google Tradutor também precisa de módulos e dicionários especiais para cada idioma, que são implementados em algoritmos separados.

Interlíngua

Inteligência artificial usada pelo Google Tradutor como linguagem intermediária, chama-se Interlíngua. Essa linguagem de computador universal é, obviamente, completamente inadequada para a comunicação humana. A inteligência artificial é usada na tradução, onde é usada como uma linguagem intermediária com a qual ele também pode traduzir de e para idiomas para os quais não foi criado.

A vantagem da rede neural é que ela pode operar com um número maior de pares de idiomas, mesmo com aqueles que não foram incluídos no processo de aprendizagem original. Por exemplo, se o sistema foi treinado para traduzir os pares de idiomas inglês-japonês e inglês-coreano, ele também pode traduzir facilmente o par de idiomas japonês-coreano sem usar o inglês como idioma intermediário.

O método de tradução implementado pelo Google, chamado pelos desenvolvedores de tradução zero-shot, é mais sofisticado e conta com uma linguagem artificial intermediária para tradução. Este campo de pesquisa está se desenvolvendo muito rapidamente e, em breve, esses sistemas de tradução se tornarão a principal ferramenta de tradução. é um sistema autodidata - melhora seus conhecimentos e também pode traduzir corretamente gírias e gírias, neologismos e outras palavras que não estão incluídas nos dicionários gerais.

Google Tradutor
Google Tradutor

Pares de idiomas

O sistema GNMT melhorou muito a tradução dos pares de idiomas mais usados: espanhol-inglês e francês-inglês. A exatidão das traduções aumentou para até 85%.

Em 2017, o Google realizou uma pesquisa entre usuários regulares do tradutor. Eles foram solicitados a avaliar três opções de tradução: estatística de máquina, neural e humana. Os resultados foram impressionantes – as traduções feitas pela rede neural foram quase perfeitas em alguns pares de idiomas.

É óbvio que a qualidade das traduções nos pares de idiomas inglês-espanhol e francês-inglês é quase a mesma das traduções humanas. Este fato não é surpreendente, uma vez que esses pares de idiomas foram usados para aprendizado profundo dos algoritmos do Google Tradutor. A situação é diferente para outros pares de idiomas. No entanto, se a tradução neural funcionar comparativamente entre idiomas estruturalmente semelhantes, a tradução por computador será muito pior para pares de idiomas em que os sistemas de idiomas são radicalmente diferentes.

Quais são as desvantagens do Google Tradutor?

É verdade que o Google Tradutor é muito prático e, devido à sua acessibilidade e rapidez de operação, ajuda nas traduções do dia a dia. No entanto, ainda falta algo essencial – entendimento. A tradução por computador nunca é focada na compreensão. Os desenvolvedores do programa tentaram melhorar o método de descriptografia ou, em outras palavras, tentaram fazer com que a máquina de tradução o manuseasse com suas habilidades analíticas. No entanto, eles tiveram que encontrar equilíbrio entre precisão e velocidade de tradução.

Google Tradutor
Google Tradutor

efeito Eliza

Para qualquer máquina, dispositivo de computação ou software, as palavras são importantes. No entanto, as máquinas ainda não conseguem entender o significado profundo das palavras.

Anos 1960 eles fizeram Eliza, um dispositivo mecânico que manipulava uma série de respostas, dando a impressão de que na verdade estava gerando frases inteligentes. A partir de então, a questão de saber se as máquinas podem pensar como os humanos foi nomeada Efeito Eliza.

O Efeito Eliza influenciou pesquisadores de IA e desenvolvedores de software por décadas. A maioria dos usuários do Google Tradutor acredita que este programa, pelo menos às vezes, é capaz de entender o significado das palavras. No entanto, isso não é verdade - O Google Tradutor não entende o idioma, mas às vezes consegue fazer frases que soam muito bem. Às vezes até consegue traduzir um ou dois parágrafos perfeitamente, e quase acreditamos que o programa realmente entende o idioma. No entanto, não devemos esquecer que o Google Tradutor não é capaz de pensar como um humano e só pode processar textos de uma maneira específica. Um programa de computador não tem memória, imaginação e compreensão dos significados ocultos das palavras, portanto, não há razão para não acreditar que um dia os computadores serão capazes de pensar como os humanos.

No entanto, espera-se que eles sejam capazes de excelentes traduções entre diferentes idiomas. É muito provável que um dia eles capaz de traduzir piadas, contos, poesias e ensaios. Afinal, a tecnologia está evoluindo na velocidade da luz.

Mais Informações

Mais Informações:
translate.google.com

Com você desde 2004

A partir do ano 2004 pesquisamos tendências urbanas e informamos diariamente nossa comunidade de seguidores sobre as últimas novidades em estilo de vida, viagens, estilo e produtos que inspiram com paixão. A partir de 2023, oferecemos conteúdo nos principais idiomas globais.