Tłumacz Google: Usługa przekładu maszynowego

Tłumacz Google (ang. Google Translate) – darmowy serwis internetowy Google umożliwiający tłumaczenie tekstu, plików, stron internetowych, mowy i zdjęć na różne języki.

Tłumacz Google
Ilustracja
Zdjęcie serwisu (2018)
Typ strony

serwis tłumaczeniowy

Komercyjna

nie

Data powstania

2006 (od 2001 dostępny przez Language Tools)

Autor

Google

Właściciel

Google

Rejestracja

opcjonalna

Wersje językowe

133 języki

Strona internetowa

Historia

W 2001 w wyszukiwarce Google wprowadzono funkcję tłumaczenia znalezionych stron internetowych dla anglojęzycznych użytkowników. Do wyszukiwarki dodano także podstronę Language Tools (narzędzia językowe), na której można było tłumaczyć podaną przez siebie stronę i tekst. W 2006 te dwa narzędzia zyskały własną subdomenę, tuż po implementacji pierwszej pary języków korzystających ze statystycznego tłumaczenia maszynowego (angielski-arabski)[potrzebny przypis]. Rok 2006 podawany jest jako data uruchomienia Tłumacza Google. 8 maja 2008 dodano język polski i możliwość tłumaczenia między dwoma dowolnymi językami z list[potrzebny przypis]. W 2013 z serwisu korzystało codziennie 200 milionów osób. W 2016 ponad 500 milionów osób korzystało z serwisu – tłumacząc ponad 100 miliardów słów dziennie. W marcu 2017 język polski zaczął opierać się na systemie GNMT, który ulepszył jakość tłumaczeń[potrzebny przypis].

Funkcje

Tłumacz Google pozwala na tłumaczenie tekstu wieloma metodami. Wśród nich są:

  • tłumaczenie tekstu – tłumaczy tekst wprowadzony za pomocą klawiatury (fizycznej lub wirtualnej, w tym przez pismo odręczne) bądź głosowo.
  • tłumaczenie dokumentów – wersja na komputer pozwala tłumaczyć pliki.
  • tłumaczenie stron – Tłumacz Google pozwala na tłumaczenie stron internetowych.
  • tłumaczenie zdjęć – tłumaczy tekst wykryty w obrazie z aparatu lub zapisanym zdjęciu. Funkcja dostępna wyłącznie w aplikacji mobilnej.
  • „dotknij, aby przetłumaczyć” – tłumaczenie wybranego tekstu z innych aplikacji. Funkcja dostępna wyłącznie w aplikacji mobilnej.
  • konwersacja – pozwala na tłumaczenie dwujęzycznego dialogu. Funkcja dostępna wyłącznie w aplikacji mobilnej.
  • transkrypcja – zamiana mowy na tekst. Funkcja dostępna wyłącznie w aplikacji mobilnej.

Serwis natychmiastowo tłumaczy wyrażenia podczas wpisywania i potrafi wykryć ich język. Wpisując wyraz lub wyrażenie translator działa niczym słownik, oferując kilka propozycji[potrzebny przypis]. Po zalogowaniu się na konto Google, serwis pozwala na zapisanie tłumaczeń na później i przegląd historii.

W przypadku języków, które nie posługują się pismem łacińskim dostępna jest automatyczna transliteracja. Do tego dostępne są edytory wprowadzania znaków (IME) dla większości tych języków[potrzebny przypis].

Otrzymane tłumaczenia można odsłuchać dzięki syntezie mowy – większość należy do WaveNet[kto?] od Google (głosy brzmiące naturalnie), a reszta – do eSpeak (głosy brzmiące syntetycznie). Głosy różnią się w zależności od geolokalizacji: angielski głos będzie miał akcent brytyjski w Europie, Afryce i Azji Południowej, australijski w Australii i Nowej Zelandii, indyjski w Indiach, nigeryjski w Nigerii, a amerykański w reszcie świata. Podobnie z hiszpańskim (amerykański na kontynencie, kastylijski poza nim), portugalskim (akcent europejski tylko w Portugalii, poza nią – brazylijski) i francuskim (akcent Quebecu tylko w Kanadzie, poza nią – europejski)[potrzebny przypis].

Tłumacz Google jest dostępny jako wtyczka w niektórych przeglądarkach, a w Chrome jest zintegrowana domyślnie.

Tłumacz Google: Historia, Funkcje, Metody tłumaczenia 
Akcenty głosu angielskiego w zależności od lokacji:

     brytyjski

     amerykański

     australijski

     indyjski

     nigeryjski

Dostępne języki

Języki dostępne w Tłumaczu Google (czas w UTC+0:00, dane na 6 lutego 2022)
kod język data dodania[potrzebny przypis] narzędzia wprowadzania[potrzebny przypis] pismo odręczne syntezator mowy[potrzebny przypis] tłumaczenie mowy transkrypcja aparat
en angielski do 2001
  • klawiatura angielska
  • klawiatura angielska (Dvoraka)
tak tak (WaveNet, 5 dialektów) tak tak tak
fr francuski do 2001
  • klawiatura francuska
  • klawiatura amerykańska (międzynarodowa)
tak tak (WaveNet, 2 dialekty) tak tak tak
es hiszpański do 2001
  • klawiatura hiszpańska
  • klawiatura amerykańska (międzynarodowa)
tak tak (WaveNet, 2 dialekty) tak tak tak
de niemiecki do 2001
  • klawiatura niemiecka
  • klawiatura niemiecka (szwajcarska)
  • klawiatura amerykańska (międzynarodowa)
tak tak (WaveNet) tak tak tak
pt portugalski do 2001
  • klawiatura portugalska (portugalska)
  • klawiatura portugalska (brazylijska)
  • klawiatura amerykańska (międzynarodowa)
tak tak (WaveNet, 2 dialekty) tak tak tak
it włoski do 2001
  • klawiatura włoska
  • klawiatura amerykańska (międzynarodowa)
tak tak (WaveNet) tak tak tak
zh-CN chiński (uproszczony) 18–19 listopada 2004
  • IME chińskie Pinyin (uproszczone)
  • IME chińskie Wubi
  • IME chińskie Zhuyin
  • IME chińskie Cangjie
  • IME chińskie Pinyin (tradycyjne)
  • IME kantońskie
tak tak (WaveNet) tak tak tak
ja japoński 18–19 listopada 2004
  • IME japońskie
tak tak (WaveNet) tak nie tak
ko koreański 18–19 listopada 2004
  • klawiatura koreańska
tak tak (WaveNet) tak nie tak
ar arabski 26 kwietnia 2006
  • klawiatura arabska
  • IME arabskie
tak tak (WaveNet) tak nie tak
ru rosyjski 5–6 grudnia 2006, ~0:00
  • klawiatura rosyjska
  • IME rosyjskie
tak tak (WaveNet) tak tak tak
zh-TW chiński (tradycyjny) 2 lutego 2007, ~9:10 - - tak (WaveNet) - tak -
el grecki 11 listopada 2007, ~14:30
  • klawiatura grecka
  • IME greckie
tak tak (WaveNet) tak nie tak
nl niderlandzki 11 listopada 2007, ~14:30
  • klawiatura niderlandzka
  • klawiatura amerykańska (międzynarodowa)
tak tak (WaveNet) tak nie tak
hi hindi 30 kwietnia 2008, ~19:00
  • klawiatura hindi (fonetyczna)
  • klawiatura hindi (Inscript)
  • IME hindi
tak tak (WaveNet) tak tak tak
bg bułgarski 8 maja 2008
  • klawiatura bułgarska
  • klawiatura bułgarska (fonetyczna)
  • IME bułgarskie
tak tak (WaveNet) tak nie tak
hr chorwacki 8 maja 2008
  • klawiatura chorwacka
tak tak (eSpeak) tak nie tak
cs czeski 8 maja 2008
  • klawiatura czeska
  • klawiatura czeska (QWERTZ)
tak tak (WaveNet) tak nie tak
da duński 8 maja 2008
  • klawiatura duńska
tak tak (WaveNet) tak nie tak
fi fiński 8 maja 2008
  • klawiatura fińska
tak tak (WaveNet) tak nie tak
no norweski 8 maja 2008
  • klawiatura norweska
tak tak (WaveNet) tak nie tak
pl polski 8 maja 2008
  • klawiatura polska
tak tak (WaveNet) tak nie tak
ro rumuński 8 maja 2008
  • klawiatura rumuńska
  • klawiatura rumuńska (SR13392, pierwsza)
  • klawiatura rumuńska (SR13392, druga)
tak tak (WaveNet) tak nie tak
sv szwedzki 8 maja 2008
  • klawiatura szwedzka
tak tak (WaveNet) tak nie tak
tl filipiński 24–25 września 2008
  • klawiatura łacińska Afryki
tak tak (WaveNet) tak nie tak
iw hebrajski 24–25 września 2008
  • klawiatura hebrajska
  • IME hebrajskie
tak tak (WaveNet) tak nie tak (nie w czasie rzeczywistym)
id indonezyjski 24–25 września 2008
  • klawiatura łacińska Afryki
tak tak (WaveNet) tak nie tak
ca kataloński 24–25 września 2008
  • klawiatura katalońska
tak tak (WaveNet) tak nie tak
lt litewski 24–25 września 2008
  • klawiatura litewska
tak nie tak nie tak
lv łotewski 24–25 września 2008
  • klawiatura łotewska
tak tak (WaveNet) tak nie tak
sr serbski 24–25 września 2008
  • klawiatura serbska (cyrylica)
  • klawiatura serbska (łacińska)
  • IME serbskie
tak tak (WaveNet) tak nie tak
sk słowacki 24–25 września 2008
  • klawiatura słowacka
  • klawiatura słowacka (QWERTY)
tak tak (WaveNet) tak nie tak
sl słoweński 24–25 września 2008
  • klawiatura słoweńska
tak nie tak nie tak
uk ukraiński 24–25 września 2008
  • klawiatura ukraińska
  • IME ukraińskie
tak tak (WaveNet) tak nie tak
vi wietnamski 24–25 września 2008
  • klawiatura wietnamska (TELEX)
  • klawiatura wietnamska (VIQR)
  • klawiatura wietnamska (TCVN 6064)
  • klawiatura wietnamska (VNI)
  • IME wietnamskie
tak tak (WaveNet) tak nie tak
sq albański 30–31 stycznia 2009
  • klawiatura albańska
tak tak (eSpeak) tak nie tak
et estoński 30–31 stycznia 2009
  • klawiatura estońska
tak tak (WaveNet) tak nie tak
ga galicyjski 30–31 stycznia 2009
  • klawiatura galicyjska
tak nie tak nie tak
mt maltański 30–31 stycznia 2009
  • klawiatura maltańska
tak nie nie nie tak (tylko w czasie rzeczywistym)
th tajski 30–31 stycznia 2009
  • klawiatura tajska
  • klawiatura tajska (Pattajoti)
  • klawiatura tajska (TIS)
  • IME tajskie
tak tak (WaveNet) tak tak tak
tr turecki 30–31 stycznia 2009
  • klawiatura turecka (QWERTY)
  • klawiatura turecka (FGĞIOD)
tak tak (WaveNet) tak nie tak
hu węgierski 30–31 stycznia 2009
  • klawiatura węgierska
tak tak (WaveNet) tak nie tak
fa perski 18 czerwca 2009
  • klawiatura perska
  • IME perskie
tak nie tak nie tak
af afrikaans 23–25 sierpnia 2009
  • klawiatura łacińska Afryki
tak tak (WaveNet) tak nie tak
be białoruski 23–25 sierpnia 2009
  • klawiatura białoruska
  • IME białoruskie
tak nie nie nie tak
ga irlandzki 23–25 sierpnia 2009
  • klawiatura łacińska Afryki
tak nie nie nie tak
is islandzki 23–25 sierpnia 2009
  • klawiatura islandzka
tak tak (WaveNet) tak nie tak
yi jidysz 23–25 sierpnia 2009
  • klawiatura jidysz
nie nie nie nie nie
mk macedoński 23–25 sierpnia 2009
  • klawiatura macedońska
tak nie tak nie tak
ms malajski 23–25 sierpnia 2009
  • klawiatura łacińska Afryki
tak tak (WaveNet) tak nie tak
sw suahili 23–25 sierpnia 2009
  • klawiatura łacińska Afryki
tak tak (eSpeak) tak nie tak
cy walijski 23–25 sierpnia 2009
  • klawiatura łacińska Afryki
tak nie nie nie tak
ht kreolski (Haiti) 28–29 stycznia 2010
  • klawiatura francuska
tak nie nie nie tak
az azerski 13 maja 2010 tak nie tak nie tak
eu baskijski 13 maja 2010
  • klawiatura baskijska
tak nie tak nie tak
ka gruziński 13 maja 2010
  • klawiatura gruzińska
  • klawiatura gruzińska (maszynistki)
tak nie tak nie nie
hy ormiański 13 maja 2010
  • klawiatura ormiańska (zachodnia)
  • klawiatura ormiańska (wschodnia)
tak nie tak nie nie
ur urdu 13 maja 2010
  • klawiatura urdu
  • IME urdu
tak tak (WaveNet) tak nie tak
la łaciński 29–30 września 2010 tak tak (WaveNet, identyczny z włoskim) nie nie tak
bn bengalski 19–20 czerwca 2011
  • klawiatura bengalska
  • klawiatura bengalska (Inscript)
  • IME bengalskie
tak tak (WaveNet) tak nie tak
gu gudżarati 19–20 czerwca 2011
  • klawiatura gudżarati
  • klawiatura gudżarati (Inscript)
  • IME gudżarati
tak tak (WaveNet) tak nie tak (nie w czasie rzeczywistym)
kn kannada 19–20 czerwca 2011
  • klawiatura kannada
  • klawiatura kannada (Inscript)
  • IME kannada
tak tak (WaveNet) tak nie tak (nie w czasie rzeczywistym)
ta tamilski 19–20 czerwca 2011
  • klawiatura tamilska
  • klawiatura tamilska (Inscript)
  • klawiatura tamilska (maszynistki)
  • klawiatura tamilska (ITRANS)
  • klawiatura tamilska (Tamil99)
  • IME tamilskie
tak tak (WaveNet) tak nie tak
te telugu 19–20 czerwca 2011
  • klawiatura telugu
  • klawiatura telugu (Inscript)
  • IME telugu
tak tak (WaveNet) tak nie tak
eo esperanto 22 lutego 2012, ~21:30 tak nie nie nie tak
lo laotański 12–13 września 2012
  • klawiatura laotańska
tak nie tak nie nie
km khmerski 19 kwietnia 2013, ~1:00
  • klawiatura khmerska (NiDA)
tak tak (WaveNet) tak nie nie
bs bośniacki 8 maja 2013, ~2:00
  • klawiatura bośniacka
tak tak (eSpeak) nie nie tak
ceb cebuański 8 maja 2013, ~2:00 tak nie nie nie tak
hmn hmong 8 maja 2013, ~2:00 tak nie nie nie tak (tylko w czasie rzeczywistym)
jw jawajski 8 maja 2013, ~2:00
  • klawiatura łacińska Afryki
tylko w aplikacji tak (WaveNet) tak nie tak
mr marathi 8 maja 2013, ~2:00
  • klawiatura hindi (fonetyczna)
  • IME marathi
tak tak (WaveNet) tak nie tak
ha hausa 9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
nie nie nie nie tak
ig igbo 9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
nie nie nie nie tak
yo joruba 9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
nie nie nie nie tak
mi maori 9 grudnia 2013, ~23:00
  • klawiatura maori
tak nie nie nie tak
mn mongolski 9 grudnia 2013, ~23:00
  • klawiatura mongolska
tak nie tak nie tak
ne nepalski 9 grudnia 2013, ~23:00
  • klawiatura nepalska
  • klawiatura nepalska (Inscript)
  • IME nepalskie
tak tak (WaveNet) tak nie tak
pa pendżabski 9 grudnia 2013, ~23:00
  • klawiatura pendżabska
  • klawiatura pendżabska (Inscript)
  • IME pendżabskie
tak tylko w aplikacji (WaveNet) tak nie tak (nie w czasie rzeczywistym)
so somalijski 9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
tak nie nie nie tak (tylko w czasie rzeczywistym)
zu zulu 9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
tak nie tak nie tak
my birmański 11 grudnia 2014
  • klawiatura birmańska
  • klawiatura birmańska (smart)
tak tak (WaveNet) tak nie nie
ny cziczewa 11 grudnia 2014
  • klawiatura łacińska Afryki
tak nie nie nie tak
kk kazachski 11 grudnia 2014
  • klawiatura kazachska
tak nie tak nie tak
ml malajalam 11 grudnia 2014
  • klawiatura malajalam
  • klawiatura malajalam (Inscript)
  • IME malajalam
tak tak (WaveNet) tak nie tak (nie w czasie rzeczywistym)
mg malgaski 11 grudnia 2014
  • klawiatura łacińska Afryki
tak nie nie nie tak
st sotho 11 grudnia 2014
  • klawiatura łacińska Afryki
nie nie nie nie tak
su sundajski 11 grudnia 2014
  • klawiatura łacińska Afryki
tak tak (WaveNet) tak nie tak
si syngaleski 11 grudnia 2014
  • klawiatura syngaleska
  • IME syngaleskie
tak tak (WaveNet) tak nie nie
tg tadżycki 11 grudnia 2014
  • klawiatura tadżycka
tak nie nie nie tak
uz uzbecki 11 grudnia 2014
  • klawiatura uzbecka (łacińska)
  • klawiatura uzbecka (cyrylica)
  • klawiatura uzbecka (cyrylica, maszynistki)
tak nie tak nie tak
am amharski 17 lutego 2016, ~16:30
  • klawiatura amharska
  • IME amharskie
tak nie tak nie nie
fy fryzyjski 17 lutego 2016, ~16:30 tak nie nie nie tak
haw hawajski 17 lutego 2016, ~16:30 tak nie nie nie tak
ky kirgiski 17 lutego 2016, ~16:30
  • klawiatura kirgiska
tak nie nie nie tak (tylko w czasie rzeczywistym)
co korsykański 17 lutego 2016, ~16:30 tak nie nie nie tak
ku kurdyjski 17 lutego 2016, ~16:30
  • klawiatura kurdyjska
tak nie nie nie tak (tylko w czasie rzeczywistym)
lb luksemburski 17 lutego 2016, ~16:30
  • klawiatura francuska
  • klawiatura amerykańska (międzynarodowa)
tak nie nie nie tak (tylko w czasie rzeczywistym)
ps paszto 17 lutego 2016, ~16:30
  • klawiatura paszto
nie nie nie nie tak
sm samoański 17 lutego 2016, ~16:30 tak nie nie nie tak
sn shona 17 lutego 2016, ~16:30
  • klawiatura łacińska Afryki
tak nie nie nie tak
sd sindhi 17 lutego 2016, ~16:30
  • klawiatura sindhi
nie nie nie nie tak (tylko w czasie rzeczywistym)
gd szkocki gaelicki 17 lutego 2016, ~16:30 tak nie nie nie tak
xh xhosa 17 lutego 2016, ~16:30
  • klawiatura łacińska Afryki
tak nie nie nie tak
or orija 27 lutego 2020, ~17:30
  • klawiatura orija
  • klawiatura orija (Inscript)
  • IME orija
nie nie nie nie tak (nie w czasie rzeczywistym)
rw ruanda-rundi 27 lutego 2020, ~17:30
  • klawiatura łacińska Afryki
nie nie nie nie tak
tt tatarski 27 lutego 2020, ~17:30
  • klawiatura tatarska
nie nie nie nie tak
tk turkmeński 27 lutego 2020, ~17:30
  • klawiatura łacińska Afryki
nie nie nie nie tak
ug ujgurski 27 lutego 2020, ~17:30
  • klawiatura ujgurska
nie nie nie nie tak (tylko w czasie rzeczywistym)
as asamski 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura bengalska
tak nie nie brak danych brak danych
ay ajmara 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
bm bambara 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
bho Bhodźpuri 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura hindi (fonetyczna)
nie nie nie brak danych brak danych
dv Divehi 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
doi dogri 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura hindi (fonetyczna)
nie nie nie brak danych brak danych
ee ewe 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
gn guarani 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
ilo Ilokano 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
qu keczua 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
gom Konkani 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura hindi (fonetyczna)
nie nie nie brak danych brak danych
kri krio 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
ckb kurdyjski (sorani) 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura kurdyjska (arabska, oparta na klawiaturze arabskiej)
  • klawiatura kurdyjska (arabska, oryginalna)
nie nie nie brak danych brak danych
ln lingala 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
lg luganda 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
mai maithili 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura hindi (fonetyczna)
nie nie nie brak danych brak danych
mni-Mtei meiteilon (manipuri) 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura manipuri (meitei mayek)
nie nie nie brak danych brak danych
lus mizo 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
om oromo 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
sa sanskryt 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura sanskrycka
  • klawiatura sanskrycka (Inscript)
  • IME sanskryckie
nie nie nie brak danych brak danych
nso Sepedi 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
ti tigrinia 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) tak nie nie brak danych brak danych
ts Tsonga 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych
ak twi 11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie) nie nie nie brak danych brak danych

Aplikacja mobilna

Tłumacz Google
Tłumacz Google: Historia, Funkcje, Metody tłumaczenia 
Tłumacz Google: Historia, Funkcje, Metody tłumaczenia 
Przykładowe tłumaczenie z czeskiego (2021)
Autor Google
Pierwsze wydanie styczeń 2010 (Android)

8 lutego 2011 (iOS)

System operacyjny Android, iOS
Rodzaj serwis tłumaczeniowy
Strona internetowa

Aplikację mobilną wydano najpierw na system Android w styczniu 2010, a 8 lutego 2011 na iOS. Oprócz tego, istniała wcześniejsza aplikacja HTML dla urządzeń z iOS, powstała w sierpniu 2008. Poza podstawowymi funkcjami, aplikacja pozwala na użytkowanie w trybie offline, tłumaczenie napisów z aparatu oraz plików graficznych (dzięki Word Lens), wykonywanie tłumaczeń w innych aplikacjach, oraz tłumaczenie ludzkiej mowy na żywo w trybie konwersacji lub w trybie transkrypcji[potrzebny przypis].

API

Google nadal oferuje API serwisu, pomimo tego, że 26 maja 2011 ogłosiło zakończenie jego funkcjonowania, z datą końcową 1 grudnia. Ze względu na dużą popularność API do tego nie doszło, ale od tego momentu API stało się płatne.

Społeczność

Google pozwala wolontariuszom ulepszać tłumaczenia (crowdsourcing) przez aplikację Google Crowdsource, lub opcję „Społeczność” na stronie internetowej. Użytkownicy mogą tłumaczyć podane zdania, oceniać istniejące tłumaczenia, a w przypadku języków  BETA , testować wczesną wersję translatora. Badania pokazują, że nawyki użytkowników pozwalają niwelować błędne tłumaczenia nawet w 40% przypadków[brak potwierdzenia w źródle]. Oprócz obecnie dostępnych języków, można wybrać też[potrzebny przypis]:

Pozostałe języki dostępne w Społeczności Tłumacza Google (dane na 12 maja 2022)
kod język
ace aceh
ady adygejski
aa afar  BETA 
ahr ahirani
alt ałtajski południowy
an aragoński
av awarski
bfy bagheli
bxg bangala
ba baszkirski
bbc batak toba
bci baule
bal beludżi
bew betawi
brx bodo  BETA 
br bretoński
kjh chakaski
ctg chatgaya
toi chitonga
kmz chorasański turkmeński
sr-ME czarnogórski
ce czeczeński
chr czirokeski
cv czuwaski
hne ćhattisgarhi
dcc dakhini
luo dholuo
dyu diula
dz dzongkha
bin edo
efi efik
ish esan
fon fon
ff Fulfulde  BETA 
gag gagauski
gbm garhwali
bgc haryanvi
hil hiligaynon
iu inuktitut
iso isoko
sah jakucki
kl kalaallisut
kam kamba
yue kantoński
kr kanuri
krc karaczajsko-bałkarski
kaa karakałpacki
qxq kaszkajski
ks kaszmirski
quc kicze
ki kikuju
trp kokborok
swc kongijski suahili
kum kumycki
lkt lakota
lu Luba
lua luba
mad madurski
mag magahi
meo malajski kedah
mfa malajski pattani
mni manipuri  BETA 
rwr marwari
yua maya  BETA 
mzn mazanderański
min minangkabau
mos mossi
nv nawaho
nr ndebele południowy
new newarski  BETA 
oc oksytański
pam pampango
pcm pidgin nigeryjski
se północnolapoński
raj radżastani
rkt rangpuri
rm retoromański
rhg rohingya
sck sadri
slr salarski
sg sango
sat santali  BETA 
skr saraiki  BETA 
ser serrano
sjp surdźapuri
scn sycylijski
syl sylheti
cjs szorski
ber tamazight  BETA 
sty tatarski syberyjski
tiv tiw
tpi tok pisin
tn tswana
tsc tswa
tyv tuwiński
bo tybetański  BETA 
urh urhobo
uum urum
vah Varhadi-Nagpuri
ve venda
wo wolof
zza zazaki
za zhuang
sgs żmudzki

Oprócz tego, (co najmniej) 3 języki są niedostępne w menu: balijski (kod: ban), kreolski seszelski (kod: crs) i rundi (kod: rn)[potrzebny przypis].

Metody tłumaczenia

Od listopada 2016, Google korzysta z GNMT, a wcześniej – z mechanizmu statycznego tłumaczenia maszynowego i SYSTRAN[potrzebny przypis].

GNMT

Google Neural Machine Translation (GNMT) opracowano w celu zwiększenia płynności i dokładności serwisu. System ten wykorzystuje dużą, sztuczną sieć neuronową (dokładniej sieć długiej pamięci krótkoterminowej) zdolną do deep learningu. Dzięki wykorzystaniu metody tłumaczenia maszynowego opartą na próbkach (EBMT), w której system „uczy się z milionów przykładów”, GNMT pozwala poprawić jakość tłumaczeń. Według badaczy Google technika ta umożliwia przekładanie „całych zdań naraz, a nie kawałek po kawałku. Zwraca uwagę na szerszy kontekst, aby znaleźć najbardziej odpowiednie tłumaczenia, które następnie przestawia i dostosowuje tak, aby przypominały ludzką mowę z poprawną gramatyką”. Zamierzona przez GNMT architektura została zaimplementowana dla wszystkich języków obsługiwanych przez serwis. Dzięki kompleksowej strukturze, „system z czasem uczy się tworzyć lepsze, bardziej naturalne tłumaczenia”. Sieć GNMT jest zdolna do międzyjęzykowego tłumaczenia maszynowego, która koduje „semantykę zdania, niż zapamiętując frazę do tłumaczenia”, a system nie wymyślił własnego języka uniwersalnego, ale korzysta z „podobieństw znalezionych między wieloma językami”. GNMT zostało wypuszczone dla polskiego w marcu 2017.

GNMT umożliwia tłumaczenie bezpośrednio z jednego języka na inny (L1 → L2), co jest poprawą względem wcześniejszych wersji, które najpierw tłumaczyły na język angielski, a dopiero potem na język docelowy (L1 → EN → L2). Jest to możliwe dzięki „tłumaczeniu zero-shot”, które dotyczy par języków, których system nie oferował bezpośrednio (np. z japońskiego na koreański)[potrzebny przypis].

Statystyczne tłumaczenia maszynowe i SYSTRAN

Przed październikiem 2007 tłumaczenia między językami innymi niż arabski, chiński i rosyjski działały w oparciu o SYSTRAN – silnik oprogramowania, który był stosowany np. w Babel Fish. Od tego czasu, do implementacji GNMT Tłumacz Google używał zastrzeżonej technologii wewnętrznej opartej na statystycznym tłumaczeniu maszynowym.

System ten nie stosował się do zasad gramatycznych – jego algorytmy były oparte na analizie statystycznej, a nie na tradycyjnej analizie opartej na regułach gramatyki. Oryginalny twórca systemu, Franz Josef Och, skrytykował skuteczność algorytmów opartych na regułach, w zamian popierając metody statystyczne. Oryginalne wersje serwisu wykorzystywały metodę zwaną statystycznym tłumaczeniem maszynowym, opartą na badaniach Ocha, zwycięzcy konkursu DARPA na tłumaczenie maszynowe w 2003 roku. Och był szefem grupy tłumaczeń maszynowych Google, aż do momentu dołączenia do Human Longevity, Inc. w lipcu 2014.

Według Ocha solidna podstawa do stworzenia użytecznego systemu statystycznego dla nowej pary języków od podstaw powinna składać się z dwujęzycznego korpusu tekstowego (lub kolekcji równoległej) o objętości ponad 150–200 milionów słów i dwóch jednojęzycznych korpusów, z których każdy powinien zawierać ponad miliarda słów. Modele statystyczne z tych danych byłyby następnie wykorzystywane do tłumaczenia między językami. Do zebrania tak ogromnej ilości danych językowych Google wykorzystał dokumenty i transkrypty od Organizacji Narodów Zjednoczonych i Parlamentu Europejskiego. ONZ zazwyczaj publikuje dokumenty w sześciu oficjalnych językach, co ułatwiło zebranie ogromnego korpusu[potrzebny przypis].

Tłumacz Google nie tłumaczył bezpośrednio z jednego języka na inny (L1 → L2). W zamian, w większości przypadków treści były tłumaczone najpierw na angielski, a dopiero potem na język docelowy (L1 → EN → L2)[potrzebny przypis].

Przy generowaniu tłumaczenia Tłumacz Google szukał wzorców w setkach milionów dokumentów, które zostały już przełożone przez ludzkich tłumaczy, aby znaleźć najtrafniejsze odwzorowanie. Wykrywszy je, Tłumacz mógł w przemyślany sposób domyślić się, jak powinno brzmieć poprawne tłumaczenie[potrzebny przypis].

Wykorzystane licencje WordNet

Język WordNet Na licencji
albański Albanet CC BY 3.0/GPL 3
angielski Princeton Wordnet Wordnet
arabski Arabic Wordnet CC BY-SA 3
chiński Chinese Wordnet Wordnet
duński Dannet Wordnet
fiński FinnWordnet Wordnet
francuski WOLF (WOrdnet Libre du Français) CeCILL-C
galicyjski Multilingual Central Repository CC BY-3.0
hebrajski Hebrew Wordnet Wordnet
hiszpański Multilingual Central Repository CC BY-3.0
indonezyjski Wordnet Bahasa MIT
japoński Japanese Wordnet Wordnet
kataloński Multilingual Central Repository CC BY-3.0
kreolski (Haiti) MIT-Haiti Initiative CC-BY 4.0
malajski Wordnet Bahasa MIT
norweski Norwegian Wordnet Wordnet
perski Persian Wordnet wolny użytek
polski plWordnet Wordnet
portugalski OpenWN-PT CC BY-SA-3.0
tajski Thai Wordnet Wordnet
włoski MultiWordnet CC BY-3.0

Dokładność

Tłumacz Google nie jest tak dokładny, jak tłumaczenie ludzkie. Jeżeli tekst jest krótki, poprawnie sformułowany i używa formalnego słownictwa (w szczególności kiedy oba języki mają duże korpusy językowe), wynik jest podobny do satysfakcjonującego, lecz w im mniejszym stopniu spełnia te kryteria, tym wynik będzie gorszy. Ludzka ocena wykazała, że tłumaczenia przekazywały zamysł powyżej 50% tylko dla 35 języków z 102. W przypadku par bez angielskiego po którejkolwiek stronie, liczba ta wynosi około 1%. Badania z 2011 pokazały, że Google uzyskał wynik trochę większy niż na zaliczenie egzaminu z angielskiego na UCLA. Pod względem formalności, spójności, długości oraz struktury zdań wyniki Tłumacza są podobne względem tłumaczeń ludzkich. Podczas badań Google z 2018, użytkownicy języków mieli ocenić tłumaczenia w skali od 0 do 6 – średnia wyniosła 5,43.

Jakość tłumaczeń różni się między językami ze względu na powszechność języków i źródeł na ich temat. Wiele języków azjatyckich i afrykańskich (z wyjątkami np. afrikaans i chińskiego) wypada gorzej w porównaniu z tymi europejskimi, a tych rdzennych z Oceanii i Ameryk nie ma prawie wcale[potrzebny przypis].

Działając jako słownik, Tłumacz często popełniał błędy względem słów polisemicznych – 100 najpopularniejszych słów w korpusie słownika Oxford ma średnio 15 znaczeń, a większość znanych wyrazów ma ich co najmniej 2. Ponieważ translator opierał się na tłumaczeniu statystycznym, a tłumaczenia korzystały z angielskiego jako bazy, w niektórych przypadkach oznaczało to błędne tłumaczenia. Jeżeli w bazie nie ma wyrazu, serwis jest w stanie wymyślić dla niego tłumaczenie.

Ograniczenia

Tłumacz Google, jak inne serwisy tłumaczeniowe, posiada ograniczenia. Serwis ogranicza liczbę znaków (5000), które mogą być jednorazowo przetłumaczone, lecz można to obejść tłumacząc tekst w pliku. O ile serwis pozwala użytkownikowi zrozumieć tekst, często tłumaczy słowo-do-słowa, co czyni tłumaczenia niedokładnymi. Pod względem gramatycznym, serwis zmaga się z rozróżnianiem aspektu dokonanego i niedokonanego w językach romańskich, co przyczynia się do błędów, których by nie napotkał ludzki tłumacz. Translator borykał się także z trybem łączącym oraz francuskim tu i vous (w angielskim oba tłumaczy się jako you). Tłumacz ma problemy z rozumieniem polisemii i związków frazeologicznych.

Odbiór i wykorzystanie w praktyce

Tuż po wystartowaniu serwisu, wygrał on międzynarodowy turniej w tłumaczeniu maszynowym z angielskiego na chiński i arabski.

Wykorzystanie w sądzie

W 2017 Tłumacz Google został użyty podczas rozprawy sądowej w Teesside Magistrates’ Court, ponieważ nie można było zarezerwować tłumacza dla oskarżonego mówiącego po chińsku.

Uwagi

Zobacz też

Przypisy

Tags:

Tłumacz Google HistoriaTłumacz Google FunkcjeTłumacz Google Metody tłumaczeniaTłumacz Google Wykorzystane licencje WordNetTłumacz Google DokładnośćTłumacz Google OgraniczeniaTłumacz Google Odbiór i wykorzystanie w praktyceTłumacz Google UwagiTłumacz Google Zobacz teżTłumacz Google PrzypisyTłumacz GoogleGoogleJęzyk angielskiStrona internetowaTłumaczenie (przekład)

🔥 Trending searches on Wiki Polski:

LuksemburgCesarstwo BizantyńskieIrlandiaAlfabet greckiŻołnierze wyklęciConcordeBitwa pod WiedniemZakładSchutzstaffelBocian białyAngliaBielsko-BiałaPaweł SzałamachaDiana (1940)MeksykBelgiaRzeszówPaństwa członkowskie Unii EuropejskiejRafał RomanowskiBrennan JohnsonIrena OpdykeZimna wojnaKirgistanKorea PołudniowaReprezentacja Holandii w piłce nożnej mężczyznZbigniew BoniekDubajRzymChrzest PolskiAleksander KwaśniewskiKazimierz DeynaVioleta ParraSzkocjaReprezentanci Polski w piłce nożnej mężczyznKrakówZamach z 11 września 2001 rokuMistrzostwa Europy w Piłce Nożnej 2024 (eliminacje)IslamJoseph Ignace GuillotinDzień MatkiBen Davies (walijski piłkarz)Mistrzostwa Świata w Piłce Nożnej 2030PortugaliaZendayaChatGPTSzczecinMistrzostwa Europy w Piłce Nożnej 2008Robert MazurekSan MarinoPalestyna (państwo)AlfabetHaitiJerzy VBuddyzmBolesław I ChrobryAlbaniaMjanmaZbigniew Bogucki (polityk)ChromosomIzraelSkandynawiaAaron RamseyAudi A3II wojna światowaAndrzej DudaHymn WaliiGeneral Dynamics F-16 Fighting FalconKowelİstanbul BaşakşehirJoanna DarkMetamfetaminaOrder Virtuti MilitariPolska Zjednoczona Partia RobotniczaKeanu ReevesMongoliaMike TysonReprezentacja Islandii w piłce nożnej mężczyznDanny Ward (walijski piłkarz)🡆 More