fbpx

Jak wielki stał się Tłumacz Google: tłumacz, który wkrótce będzie tłumaczył lepiej niż ludzie

Tłumacz Google (GT) to zdecydowanie najlepsze i najczęściej używane oprogramowanie do tłumaczeń na świecie. Obsługuje aż 103 języki, 10 000 par językowych i przetwarza aż 500 milionów tłumaczeń dziennie. Eksperci przewidują, że system neuronowy GT wkrótce będzie mógł oprócz tekstu przetwarzać pliki audio i wideo.

tłumacz Google od 2016 roku posługuje się systemem neuronowego tłumaczenia maszynowego (GNMT). Jest to system oparty na sztucznej sieci neuronowej znacznie poprawiła jakość tłumaczenia. Od tego czasu minęły trzy lata i teraz możemy ocenić jego skuteczność. Czy jakość tłumaczeń rzeczywiście się poprawiła i co jeszcze należy zmienić, aby była lepsza?

Jak w ogóle działa algorytm Tłumacza Google?

Tłumacz Google jest opracowany w 2006 roku i początkowo pracował z pomocą statystyczne metody tłumaczenia maszynowego. Oznacza to, że w swoim programie zapisał miliardy słów. Tłumacząc, po prostu wybierał najbardziej odpowiednie lub popularne odpowiedniki obu języków i je spisywał. Google użył przy tworzeniu tłumacza Dokumenty Organizacji Narodów Zjednoczonych (angielski, arabski, francuski, chiński, rosyjski i hiszpański), tworząc w ten sposób korpus sześciu języków świata zawierający około 20 miliardów słów. Proces ten był powolny, niedokładny i zużywał dużo mocy obliczeniowej.

Dziś Tłumacz Google korzysta z tzw metoda głębokiego uczenia się (Metoda Głębokiego Uczenia), w której szczególnie istotna jest duża sztuczna sieć neuronowa.

Zanim Google zaczął korzystać z sieci neuronowych, tłumaczenie odbywało się słowo po słowie. System z łatwością przetłumaczył każde słowo osobno, przestrzegając podstawowych zasad gramatycznych. Dlatego jakość tłumaczenia była bardzo wątpliwa.

Jednak dzięki nowemu, neuronowemu modelowi tłumaczenia podstawową jednostką tłumaczeniową nie jest już słowo, a jedynie część słowa. Zatem tłumaczenie nie koncentruje się na formach wyrazowych, ale na kontekst i znaczenie całego zdania. Program tłumaczy zatem zdanie jako całość, zgodnie z jego kontekstowym znaczeniem, bez zapisywania w swojej pamięci setek możliwych wersji tłumaczeń.

Oprogramowanie tłumaczy zatem całe zdanie, biorąc pod uwagę kontekst i nie skupia się już tylko na pojedynczych słowach. Nie przechowuje w swojej pamięci setek wersji tłumaczeń. Zamiast tego operuje na semantyce tekstu i dzieli zdania na segmenty słownikowe.

Jak Google tłumaczy za pomocą sieci neuronowej?

Dziś korzysta z Tłumacza Google około 32 000 takich fragmentów. Za pomocą indywidualnych dekoderów wstępnie określa znaczenie każdej części tekstu. Następnie oblicza maksymalną możliwą liczbę znaczeń i możliwych tłumaczeń. Na koniec łączy przetłumaczone segmenty z regułami gramatycznymi. Według twórców, takie podejście pozwala zapewnić dużą szybkość i dokładność tłumaczenia bez zużywania nadmiernej mocy obliczeniowej. Ponieważ jednak każdy język rządzi się swoimi prawami (semantycznymi i gramatycznymi), Tłumacz Google potrzebuje także specjalnych modułów i słowników dla każdego języka, które są zaimplementowane w osobnych algorytmach.

Interlingua

Sztuczna inteligencja wykorzystywana przez Tłumacza Google jako język pośredni, nazywa się Interlingua. Ten uniwersalny język komputerowy jest oczywiście całkowicie nieodpowiedni do komunikacji międzyludzkiej. Sztuczna inteligencja jest wykorzystywana w tłumaczeniu, gdzie jest używana jako język pośredni może także tłumaczyć na i z języków, dla których nie został stworzony.

Zaletą sieci neuronowej jest to, że może ona współpracować z większą liczbą par językowych, nawet z tymi, które nie były uwzględnione w pierwotnym procesie nauki. Na przykład, jeśli system został przeszkolony do tłumaczenia par językowych angielski-japoński i angielski-koreański, może również z łatwością przetłumaczyć parę językową japoński-koreański bez używania angielskiego jako języka pośredniego.

Metoda tłumaczenia wdrożona przez Google, twórcy zwana tłumaczeniem zerowym, jest bardziej wyrafinowana i opiera się na pośrednim sztucznym języku do tłumaczenia. Ta dziedzina badań rozwija się bardzo szybko i wkrótce te systemy tłumaczeniowe staną się podstawowym narzędziem tłumaczeniowym. To jest system samouk - samodzielnie doskonali swoją wiedzę, a także potrafi poprawnie przetłumaczyć slang i wyrazy slangowe, neologizmy i inne wyrazy, których nie ma w słownikach ogólnych.

tłumacz Google
tłumacz Google

Pary językowe

System GNMT znacznie usprawnił tłumaczenie najczęściej używanych par językowych: hiszpański-angielski i francuski-angielski. Poprawność tłumaczeń wzrosła aż do 85%.

W 2017 roku Google przeprowadził ankietę wśród stałych użytkowników tłumacza. Poproszono ich o ocenę trzech opcji tłumaczenia: statystycznego maszynowego, neuronowego i ludzkiego. Wyniki były imponujące – tłumaczenia wykonane przez sieć neuronową były niemal doskonałe w niektórych parach językowych.

Jest oczywiste, że jakość tłumaczeń w parach językowych angielsko-hiszpański i francusko-angielski jest prawie taka sama jak tłumaczeń ludzkich. Fakt ten nie jest zaskakujący, ponieważ te pary językowe zostały wykorzystane do głębokiego uczenia się algorytmów Tłumacza Google. Inaczej jest w przypadku innych par językowych. Jeśli jednak tłumaczenie neuronowe działa porównywalnie między językami o podobnej strukturze, wówczas tłumaczenie komputerowe będzie znacznie gorsze w przypadku par językowych, w których systemy językowe są radykalnie różne.

Jakie są wady Tłumacza Google?

To prawda, że Tłumacz Google jest bardzo praktyczny, a dzięki swojej dostępności i szybkości działania pomaga w codziennym tłumaczeniu. Wciąż jednak brakuje mu czegoś istotnego – zrozumienie. Tłumaczenie komputerowe nigdy nie koncentruje się na zrozumieniu. Twórcy programu starali się ulepszyć metodę deszyfrowania, czyli innymi słowy, starali się, aby maszyna tłumacząca poradziła sobie z nią swoimi możliwościami analitycznymi. Musieli jednak znaleźć równowaga między dokładnością tłumaczenia a szybkością.

tłumacz Google
tłumacz Google

Efekt Elizy

W przypadku każdej maszyny, urządzenia komputerowego lub oprogramowania słowa mają znaczenie. Jednak maszyny nie są jeszcze w stanie zrozumieć głębokiego znaczenia słów.

Lata 1960 stworzyli Elizę, mechaniczne urządzenie, które manipuluje serią odpowiedzi, sprawiając wrażenie, że faktycznie generuje inteligentne frazy. Odtąd zaczęto zadawać pytanie, czy maszyny mogą myśleć jak ludzie Efekt Elizy.

Efekt Elizy od dziesięcioleci wpływa na badaczy sztucznej inteligencji i twórców oprogramowania. Większość użytkowników Tłumacza Google wierzy, że ten program przynajmniej czasami jest w stanie zrozumieć znaczenie słów. To jednak nieprawda – Tłumacz Google nie rozumie tego języka, ale czasami udaje mu się stworzyć zdania, które brzmią całkiem nieźle. Czasami nawet udaje mu się idealnie przetłumaczyć akapit lub dwa i prawie wierzymy, że program rzeczywiście rozumie ten język. Nie możemy jednak zapominać, że Tłumacz Google nie jest w stanie myśleć jak człowiek i może jedynie przetwarzać teksty w określony sposób. Program komputerowy nie ma pamięci, wyobraźni i zrozumienia ukrytego znaczenia słów, więc nie ma powodu nie wierzyć, że pewnego dnia komputery będą mogły myśleć jak ludzie.

Oczekuje się jednak, że będą zdolni do doskonałych tłumaczeń między różnymi językami. Jest bardzo prawdopodobne, że pewnego dnia to zrobią potrafi tłumaczyć dowcipy, opowiadania, poezję i eseje. W końcu technologia rozwija się z prędkością światła.

Więcej informacji

Więcej informacji:
tłumacz.google.com

Z Wami od 2004 roku

od roku 2004 badamy miejskie trendy i codziennie informujemy naszą społeczność obserwujących o najnowszych stylach życia, podróżach, stylu i produktach, które inspirują pasją. Od 2023 roku oferujemy treści w głównych językach świata.