Google 翻訳 (GT) は間違いなく世界で最高で最も使用されている翻訳ソフトウェアです。最大 103 の言語、10,000 の言語ペアをサポートし、毎日 5 億件もの翻訳を処理します。専門家らは、GTのニューラルシステムが間もなくテキストだけでなくオーディオファイルやビデオファイルも処理できるようになるだろうと予測している。
Google翻訳 2016 年以来、ニューラル機械翻訳システム (GNMT) を使用しています。人工ニューラルネットワークに基づくシステムは、 翻訳品質が大幅に向上しました。 あれから 3 年が経過し、その有効性を評価できるようになりました。翻訳の品質は本当に向上しましたか? 改善するためにはまだ何を変更する必要がありますか?
Google 翻訳のアルゴリズムはどのように機能するのでしょうか?
Google翻訳は、 2006年に開発 最初は助けを借りて作業していました 機械翻訳の統計的手法。 つまり、彼は何十億もの単語をプログラムに保存したことになります。翻訳する際、彼は単に両方の言語の最も適切な、または一般的な同等の言語を選択して書き出しました。翻訳者の作成に Google を使用 国連文書 (英語、アラビア語、フランス語、中国語、ロシア語、スペイン語)このようにして、約 200 億語を含む世界 6 つの言語のコーパスが作成されました。このプロセスは遅く、不正確で、多くの計算能力を消費しました。
現在、Google 翻訳はいわゆる ディープラーニング手法 (深層学習法)、大規模な人工ニューラル ネットワークが特に重要です。
Google がニューラル ネットワークを使用し始める前は、翻訳は一語一語で行われていました。このシステムは、基本的な文法規則に従いながら、各単語を個別に簡単に翻訳しました。したがって、翻訳の品質には非常に疑問がありました。
しかし、新しいニューラル翻訳モデルでは、 基本的な翻訳単位はもはや単語ではなく、単語の一部にすぎません。 したがって、翻訳は語形に焦点を当てているのではなく、 文全体の文脈と意味。 したがって、プログラムは、メモリに何百もの可能な翻訳バージョンを保存せずに、文脈上の意味に従って文全体を翻訳します。
したがって、ソフトウェアは、個々の単語だけに焦点を当てるのではなく、文脈を考慮して文全体を翻訳します。何百もの翻訳バージョンをメモリに保存することはありません。代わりに、テキストの意味論に基づいて機能し、文を辞書セグメントに分割します。
Google はニューラル ネットワークを使用してどのように翻訳しているのでしょうか?
現在、彼は Google 翻訳を使用しています そのような断片は約 32,000 個あります。 個々のデコーダーの助けを借りて、最初にテキストの各部分の意味を判断します。次に、意味と可能な翻訳の最大可能数を計算します。最後に、翻訳された分節を文法規則と結合します。開発者によると、このアプローチは 高い翻訳速度と精度を確保できる 過度のコンピューティングパワーを消費することなく。ただし、各言語には独自のルール (意味的および文法的) があるため、Google 翻訳には、個別のアルゴリズムで実装される各言語の特別なモジュールと辞書も必要です。
インターリングア
Google 翻訳で使用される人工知能 中間言語、インターリングアと呼ばれます。もちろん、この世界共通のコンピューター言語は、人間のコミュニケーションにはまったく適していません。人工知能は翻訳に使用され、翻訳の中間言語として使用されます。 また、作成されていない言語との間で翻訳することもできます。
ニューラル ネットワークの利点は、元の学習プロセスに含まれていない言語ペアであっても、より多くの言語ペアで動作できることです。たとえば、システムが英語-日本語および英語-韓国語の言語ペアを翻訳するようにトレーニングされている場合、英語を中間言語として使用せずに、日本語-韓国語の言語ペアも簡単に翻訳できます。
開発者である Google が実装した翻訳方法はゼロショット翻訳と呼ばれるもので、より洗練されており、翻訳には中間人工言語に依存しています。 この研究分野は急速に発展しており、すぐにこれらの翻訳システムが主要な翻訳ツールになるでしょう。 システムです 独学 - 自分自身の知識を向上させ、一般的な辞書に含まれていない俗語や俗語、新造語、その他の単語も正しく翻訳できます。
言語ペア
GNMT システムは、最も一般的に使用される言語ペアであるスペイン語-英語、およびフランス語-英語の翻訳を大幅に改善しました。 翻訳の正確性が 85% まで向上しました.
2017 年、Google は翻訳機の定期ユーザーを対象に調査を実施しました。彼らは 3 つの翻訳オプションを評価するよう求められました。機械統計、神経、そして人間。結果は印象的でした – ニューラル ネットワークによって行われた翻訳は、一部の言語ペアではほぼ完璧でした。
英語-スペイン語、フランス語-英語の言語ペアの翻訳の品質が人間による翻訳の品質とほぼ同じであることは明らかです。これらの言語ペアは Google 翻訳アルゴリズムの深層学習に使用されているため、この事実は驚くべきことではありません。他の言語ペアでは状況が異なります。ただし、構造的に類似した言語間でニューラル翻訳が同等に機能する場合、言語システムが根本的に異なる言語ペアでは、コンピューター翻訳ははるかに悪くなるでしょう。
Google翻訳のデメリットは何ですか?
確かに、Google 翻訳は非常に実用的であり、そのアクセシビリティと高速な操作により、日常の翻訳に役立ちます。ただし、まだ重要な点が欠けています – 理解。コンピュータ翻訳は決して理解を重視するものではありません。プログラムの開発者は、解読方法の改良、つまり翻訳機の解析能力で解読できるようにしようとしました。しかし、彼らは見つけなければなりませんでした 翻訳の精度と速度のバランスを保ちます。
イライザ効果
どのようなマシン、コンピューティング デバイス、またはソフトウェアにとっても、言葉は重要です。しかし、機械はまだ言葉の深い意味を理解することはできません。
年 1960 彼らは、一連の応答を操作する機械装置である Eliza を作成し、実際に知的なフレーズを生成しているかのような印象を与えました。それ以来、機械は人間と同じように考えることができるかどうかという問題が命名されるようになりました。 エリザ効果。
イライザ効果は、何十年にもわたって AI 研究者やソフトウェア開発者に影響を与えてきました。 Google 翻訳のほとんどのユーザーは、このプログラムが少なくとも場合によっては単語の意味を理解できると信じています。しかし、これは真実ではありません - Google 翻訳は言語を理解できませんが、それでもかなり良い響きの文章を作成できることがあります。 場合によっては、1 つまたは 2 つの段落を完璧に翻訳することさえでき、プログラムが実際に言語を理解していると信じてしまうほどです。ただし、Google 翻訳は人間のように考えることができず、特定の方法でしかテキストを処理できないことを忘れてはなりません。コンピューター プログラムには記憶力も想像力もなく、言葉の隠された意味を理解することもできません。したがって、コンピューターがいつか人間と同じように考えることができるようになる、と信じない理由はありません。
ただし、異なる言語間で優れた翻訳ができることが期待されています。いつかそうなる可能性が非常に高い ジョーク、短編小説、詩、エッセイを翻訳できる。 結局のところ、テクノロジーは光の速さで進化しています。
詳しくは:
翻訳.google.com