Rozhovor mezi německým a americkým zaměstnancem Microsoftu byl ve Skypu v reálném čase překládán. | foto: Microsoft, re/code

Přes Skype se domluvíte i s cizincem. Tlumočit bude počítač

  • 9
Microsoft na konferenci Code předvedl pokrok ve vývoji svého hlasového překladače. Rozhovor viceprezidenta firmy pro Skype a Lync s německou pobočkou měl sice do dokonalosti daleko, ale Microsoft se ještě tento rok chystá uvést pro Windows 8 první betaverzi.

Univerzální tlumočník jako ze StarTreku sice ještě Microsoft nepředvedl, ale to, co ukázal na konferenci Code a později popsal na blogu firmy, vypadalo poměrně zajímavě.

Šéf Microsoftu Satya Nadella na konferenci Code, kde představil překládání hovorů ve Skypu v reálném čase.

Testovací verze automatického tlumočníka pro Skype, totiž zvládala poměrně dobře rozpoznat, co mluvčí v jednom jazyce říká, poté to s určitým úspěchem přeložit do jiného jazyka a pomocí hlasového výstupu výsledek přečíst osobě na druhé straně Skypu.

Byť bylo mnohé "ztraceno v překladu", ve výsledku byla prezentace velice působivá. Rozhovor mezi viceprezidentem Microsoftu pro Skype a Lync Gurdeepem Pallem a Dianou Heinrichsovou z německé pobočky firmy byl veden v angličtině a němčině s tím, že jej Skype překládal do příslušné řeči.

Výsledek byl, jak řekl podle agentury ČTK jeden německy hovořící divák z publika, zábavný, ale ne dost dobrý pro obchodní jednání.

Dlouhý vývoj

Bylo to vůbec poprvé, co firma prezentovala schopnosti svého automatického tlumočníka ve Spojených státech. Už v roce 2012 se s ním však mohli seznámit v Číně. Tehdy Rick Rashid z vývojové divize Microsoft Research mluvil na publikum anglicky, ale to slyšelo jeho hlas v čínštině. Každou z osmi vět, kterou Rashid pronesl, tehdy diváci ocenili aplausem. A to přesto, že výsledky nebyly dokonalé. Špatně mohlo být klidně i každé čtvrté nebo páté slovo, jak je v některých chvílích vidět i na přepisu videa, který běží na plátně nad Rashidem.

Byla to podle našich informací první takto veřejná prezentace systému, který však firma vyvíjí již řadu let, pokud nepočítáme skromnější prezentaci na konferenci TechFest 2012. Tehdy se tlumočník představil jako součást programu Monolingual TTS, jehož hlavní předností je simulace mluvčího.

Osobní virtuální překladatel od Microsoftu zvládne vedle překladu i simulovat hlavu a mimíku mluvčího

 Ten je navržen tak, aby se z překladače nelinul univerzální hlas, ale napodobený hlas toho, jehož slova mají být překládána. K tomu systém zvládá trojrozměrnou simulaci hlavy mluvčího, která přesně pohybuje rty.

Ale zpět k samotnému tlumočníkovi. Základ softwaru pod "hlasovým modulem" tvoří statistický model rozpoznávání řeči, založený na překladači Microsoftu Translator, který využívá software pro rozpoznávání řeči na bázi neuronovou síť. Skype Translator má v současné době podporovat více než 40 jazyků. Jednou z klíčových věcí, na které Microsoft ještě stále pracuje, je analytické využití obrovského množství rozhovorů, které denně přes Skype proběhnou, aby mohl dosáhnout lepších překladů. Měsíčně přes Skype proběhnou dvě miliardy minut hlasové konverzace.

"Investovali jsme do technologií rozpoznávání řeči, automatických překladů a strojového učení více než deset let a teď se ukazují jako důležité složky v této éře velice osobních počítačů," píše na blogu Gurdeep Pall.

Filozofie firmy je přitom podobná jako u Google Translate a konečně i hlasových asistentů typu Siri. Je tedy založena na analýze miliard výrazů a vět. Silové řešení pomocí rozboru mnoha údajů se osvědčilo lépe než jiné přístupy a dnes se používá nejvíce. Podobně funguje i převod hlasu na řeč v českém Newton Dictate.

Betavrze ještě letos

Microsoft chce aplikaci v betaverzi uvést ještě před koncem roku 2014. Začne jen s hrstkou jazyků a bude nejdříve k dispozici jen pro Windows 8. Firma podle serveru ReCode doufá, že bude rychle přidávat další jazyky, stejně jako podporu pro další typy počítačů a mobilních zařízení.

"Jak jste mohli pochopit z mého rozhovoru s Dianou, je zatím pro uvedení této technologie příliš brzy.  Ale vize startrekovského univerzálního překladače už není vzdálena několik galaxií. Skype Translator otevírá nové možnosti pro smysluplnou komunikaci ve vzdělávání, diplomacii, vícejazyčných rodinách a v podnikání, které dosud nepřicházely v úvahu," uzavírá Gurdeep na oficiálním blogu.