Konec učení cizích jazyků? Počítač za každého překládá v reálném čase

  • 36
Chcete si popovídat se Španělem, ale španělštinu neovládáte? Microsoft představil testovací verzi futuristické funkce pro videohovory Skype. Počítač vám v reálném čase přeloží slova a věty a vy můžete mluvit téměř bez přerušení.

Microsoft po měsících napínání uvolnil testovací překladač přirozené řeči v reálném čase. Skype Translator Preview je k dispozici pro Windows 8 a předběžnou verzi Windows 10 a a zatím nabízí:

  • překlad textové komunikace pro 50 jazyků (včetně češtiny a většiny hlavních evropských jazyků)
  • překlad řeči pro čtyři jazyky: angličtinu, španělštinu, italštinu a čínštinu

Výběr jazyka překladu pro psaný a pro mluvený projev. U každé osoby (včetně sebe) můžete vybrat, kterým jazykem mluví a kterým píše. Vybrat rozdílné jazyky pro psaný a mluvený projev dává smysl ve chvíli, kdy váš mateřský jazyk není podporován v překladu mluveného slova.

Vyzkoušeli jsme překládanou konverzaci s dobrovolníky: Carlosem ze Španělska a Skye z USA. Překlad probíhá simultánně a jeho používání chce trpělivost i cvik. Naši figuranti jej při natáčení vyzkoušeli poprvé, takže si napřed museli zvykat na to, že musejí mluvit poněkud stručněji a s přestávkami - podobně, jako kdyby spolu měli živého simultánního překladatele. Jen nedorozumění jsou u počítačového překladatele poněkud jiného charakteru, než u překladatele lidského.

Jednoduchou konverzaci překládá bez problému

Ve chvíli, kdy si vyměňovali krátké věty a fráze, probíhal překládaný hovor bez problémů. Sem tam nějaká neobratná věta, ale celkově velmi srozumitelný dialog, který by stačil dejme tomu k základnímu obchodnímu jednání nebo neformální výměně zdvořilostí.

Syntetický hlas překládal ze španělštiny do angličtiny a podle Carlose velmi dobře: „Směrem do angličtiny byl překlad přesný. Opačným směrem trochu selhával.“ Příkladem špatného překladu (přesněji špatně rozpoznaného mluveného slova) bylo třeba sladké pečivo „scones“, které počítač přepsal jako kameny („stones“).

Také komplikovanější souvětí nebo věty pronesené rychle za sebou někdy dopadly trochu komicky. Přesto se dá překladač už nyní v testovacím režimu použít pro překonání jazykové bariéry. Protože zároveň pořizuje přepis celé konverzace, dají se případně dohledat vzniklá nedorozumění. Ještě lepší by bylo, kdyby se pod videem ukazovaly titulky.

Ve srovnání s Googlem je Skype rychlejší, ale umí méně

Zatím se objevují bubliny s textem jen těm, kdo mají nový Skype Translate Preview. Majitelé běžného Skypu jsou místo toho pozváni ke skupinovému hovoru, kdy třetí „účastník“, překladatel Skype, do hovoru vstupuje. To je celkem logický způsob, jak překlad alespoň částečně zpřístupnit co nejvíce lidem, protože novou verzi tak potřebuje jen jeden z účastníků.

Strojové rozpoznávání mluvené řeči

Náš rozhovor o strojovém rozpoznávání a překladu z roku 2011 s Mikem Cohenem, který na stojovém rozpoznávání řeči pracoval ve společnostech Nuance a Google.

Google už nějakou dobu nabízí podobný překlad v mobilní aplikaci (a více než 10 let na webu). V našem subjektivním srovnání vyšel Google lépe, co se týče rozpoznávání řeči v hlučnějším prostředí. Zdálo se nám, že má méně chyb a nebyl tak náchylný na ruch z okolí. To může být i důsledek toho, že Google svoje rozpoznávání ladí na základě velkého množství vzorků od všech, kdo rozpoznávání řeči (například hledání hlasem) používají. Google také zvládá rozpoznávání řeči v mnohem více jazycích, ale Microsoft slibuje, že svoji nabídku brzy rozšíří.

Jak funguje překlad v mobilní aplikaci Google Translate:

Překlad spojený s aplikací Skype má ovšem velký potenciál. Skype je nejpoužívanější platforma pro mezinárodní hovory, a právě tam se tedy simultánní překlad hodí nejvíce. Na senzaci, kterou sliboval Microsoft v roce 2012, je však nová verze krátká.

Můžete si vybrat, zda za vás bude hovořit Bob nebo Jane.

Tehdy totiž Rick Rashid, výzkumník Microsoftu, ukázal překlad z americké angličtiny do čínštiny. Zajímavé bylo především to, že tehdy se na druhé straně linul čínský jazyk strojově napodobeným hlasem Rashida. Tato funkce, tedy strojová syntéza konkrétního hlasu, zatím veřejnosti dostupná není. Možná ještě není hotová, ale možná působí až příliš děsivě.