Informační technologieCizí jazykyStrojový překladačLingvistikaMichaelovy experimenty

Překladatel z mobilu

18. 11. 2011

Světový obchod a poměrně snadné cestování a komunikace všude po světě rozvíjejí naše jazykové schopnosti. Pomocí magnetické rezonance budeme sledovat činnost mozku člověka při přemýšlení v cizím jazyce a uvidíme, jaká centra se aktivují. V Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy v Praze zase uvidíme, že strojový překlad není vůbec jednoduchá úloha. A nakonec zjistíme, jak se bude moci Michaelova anglická maminka domlouvat s jeho českou tchýní, přestože ani jedna nevládne cizími jazyky.

Michael: Tento muž, první československý prezident …

Tereza: … Tomáš Garrigue Masaryk, …

Michael: … nám zanechal mnoho zajímavých a hlubokých myšlenek. Řekl také jednu větu, která mi utkvěla v paměti.

Tereza: Kolik řečí umíš, tolikrát jsi člověkem.

Michael: Když jsem přijel do České republiky, díky Masarykovým moudrým slovům jsem si uvědomil, že nechci být jen Angličanem v Praze. Chtěl jsem tuto zemi a mentalitu zdejších lidi pochopit hlouběji. Proto jsem potřeboval získat alespoň obstojnou znalost češtiny.

Tereza: Fountain – kašna. Fountain.

Vědecké výzkumy odhalily, že když se učíte nějaký nový jazyk, neučíte se pouze nová slovíčka nebo gramatiku. Zároveň se zcela podvědomě učíte dívat se na celý svět z úplně nového úhlu.

Michael: Podle této teorie způsob, jak Angličan vidí svět, je částečně určen angličtinou s její schopností jej popsat.

Tereza: A totéž platí pro Čechy a jejich mateřštinu.

Michael: Mezi jazykem, kulturou a poznáním existuje neoddělitelné spojení.

Tereza: A právě toto dnes prozkoumáme.

Filip: Světový obchod a poměrně snadné cestování a komunikace všude po světě rozvíjí jazykové schopnosti. Nedávný výzkum potvrdil, že lidé, ovládající více jazyků, mají navíc také určité duševní schopnosti, například pomíjet nepodstatné informace a soustředit se na ty důležité.

Tereza: A také pracovat na více úkolech současně.

Filip: Starší lidé, ovládající více jazyků, lépe odolávají problémům stárnutí, jako je Alzheimerova nemoc nebo demence.

Tereza: Jak je možné, že pro některé z nás naučit se cizí jazyk je téměř nadlidský úkol, zatímco jiným to jde snadno, hovoří plynně několika jazyky? Zkrátka jak to, že někdo má buňky na jazyky, a jiný ne?

Michael: And how, if multi-lingual, does the human brain… přepíná mezi jazyky?

A jestliže jde o dvojjazyčný mozek, jak se…

Are we able to seamlessly activate one language … a znalosti druhého jazyka zcela pominout?

Jsme schopni souvisle používat jeden jazyk …

Tereza: A na tyto otázky nám odpoví tady.

Michael: Tereza is proficient in English and Czech and Slovakian …

Tereza ovládá angličtinu a češtinu a slovenštinu.

Vlastně jak ovládáš maďarštinu?

Tereza: Maďarsky „něpanimaju“.

Michael: Therefore Tereza is going to be the subject of examination.

Proto bude Tereza zkušebním objektem.

Terinko, bohužel nemohu s tebou. Musím si něco zařídit. Hezké zkoumání ti přeji. A potom, až skončíš, sejdeme se u té restaurace, ano?

Tereza: Ano. Dobře.

Filip: Oddělení magnetické rezonance v pražské Nemocnici Na Homolce. Terezina role pokusného vícejazyčného králíka začíná instruktáží.

Květoslav Vtípil, radiologický asistent, Nemocnice Na Homolce: Jedna důležitá věc je ta, že si to budete myslet pouze v duchu, nesmí tam být žádný pohyb. Ani rty, ani jazykem. Ta slova si musíte myslet pouze v duchu.

Tereza: V duchu jsem začala vybavovat slovíčka z češtiny, slovenštiny a pak z angličtiny.

Filip: Sledování mozkové aktivity při vymýšlení slov v cizím jazyce je čistě experimentální metoda. Průběh a výsledky vyšetření ovlivňuje mnoho jevů uvnitř pacientova mozku.

Květoslav Vtípil, radiologický asistent, Nemocnice Na Homolce: Slyšíte mě dobře?

Tereza: Ano.

Tereza:

Proto výsledky nemůžeme brát na sto procent. Ale přesto – uvidíme.

Filip:

Na jakých principech obraz aktivity řečového centra Terezčina mozku vznikne?

Prof. MUDr. Josef Vymazal, DSc., primář radiodiagnostického oddělení, Nemocnice Na Homolce: Když něco v mozku víc pracuje, tak to spotřebuje víc kyslíku. V tu chvíli, když to více pracuje, tak tam bude více toho, co nemá kyslík a bude to magneticky jiné. Ono to bude magneticky jiné, ale z úplně jiného důvodu. Protože mozek na to okamžitě zareaguje tím, že tam přilije ještě daleko víc okysličené krve. Takže ten okrsek, který je aktivovaným, je méně magneticky nehomogenní, než ten zbytek.

Filip: Pro vybavování českých slov se aktivovala centra Terezina mozku, zobrazená červeně, pro slovenštinu platí modrá, pro angličtinu zelená.

Tereza: Jak vidíte, některá centra se aktivují při jakémkoli jazyce.

Filip: Tato oblast mozku se aktivuje, jen když vymýšlíte slova v cizím jazyce. Pro češtinu se nepoužívají. Myšlení v češtině je snadnější a nemusí proto předchozí oblasti využívat.

Tereza: Tato oblast se neaktivovala při angličtině. Může to znamenat, že se zapojují odlišná centra pro myšlení ve slovanských a neslovanských jazycích.

Tereza: Dnes, naštěstí pro všechny, kteří z jakéhokoli důvodu nevládnou světovými jazyky, máme řešení, a tím je technologie.

Michael: Google právě vytvořil největší překladač na světě, který umožňuje vyhledávat a překládat informace z nejrůznějších světových jazyků.

Tereza: Není sice perfektní, ale umožňuje nám alespoň částečný vhled do jazykově zcela vzdálených světů, který dříve nebyl možný.

Michael: A pozor: It works even on my device, such as my handheld smart telephone. And it works without intervention of human translators. It works on principles of state-of -the-art technology.

Funguje dokonce v takových přístrojích, jako je můj smart phone. A funguje bez zásahu lidských překladatelů. Funguje na principech špičkové technologie.

Michael: Excuse me, I’m a bit lost. Don’t you happen to know where the tube is?

Promiňte, asi jsem se ztratil. Nevíte náhodou, kde je tu metro?

Tereza: Teď to vyzkoušíme. Say it again.

Řekněte to ještě jednou.

Michael: Don’t you happen to know where the tube is?

Tereza: Zpracovává… Áááá,

Překladač: Ne náhodou vědět, kde je trubice?

Tereza: To pravé místo, kde by nám celou záležitost mohli osvětlit, je právě tady. Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy v Praze. A my jdeme za Ondřejem Bojarem.

Tereza: Nás by zajímalo, na jakém principu tyto internetové překladače fungují, protože co si budeme povídat, naše věta „z toho vylézt ne zcela správně“.

RNDr. Ondřej Bojar, Ph.D., Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta UK v Praze: Strojový překlad není úplně jednoduchá úloha. Proto dnes lidé stále zkoušejí mnoho variant. Tu, co vy jste viděli, pravděpodobně pochází ze systému, který překládá takzvaně přímým způsobem, nebo též se říká frázovým překladem. Bere prostě posloupnost anglických slov a z nich vyrábí posloupnost českých. Nesnaží se tu větu nijak rozebrat. On se například naučí, že dokonce se dá přeložit jako „even“. Pak přijde další trénovací věta a on může namalovat tu tečku mezi tím „even“ a „dokonce“. Získáme tedy takovou matici, kde k větě zdrojové a cílové mám tečkami vyznačeno, které slovo odpovídá kterému. Z té matice můžu vyřezat obdélníčky a ty odpovídají jednotlivým takzvaně frázím, tedy těm posloupnostem slov ve zdrojové a cílové řeči. Pak přijde na vstup nová věta, která už není v těch trénovacích datech doslova, a já ji mám za úkol přeložit. Udělám tedy jen to, že tu větu nastříhám všemi možnými způsoby na všechny možné úseky a každý z těch úseků zkusím podle toho slovníku přeložit a získám veliký puzzle dílků, ze kterých mám za úkol sestavit cílovou větu. A tu sestavím tak, že vyberu ty dílky, které za sebe hezky pasují. To je frázový přístup.

Tereza: Laicky řečeno: když si sednu a vezmu si slovník a budu to slovo od slova si překládat, tak mi vyjde úplně to stejné.

RNDr. Ondřej Bojar, Ph.D., Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta UK v Praze: Rozdíl je v tom, že ten náš slovník má slova vytvarovaná, je tady například „moving“ a ne základní tvar „move“, a potom má hesla, která jsou víceslovná. Bez toho to nefunguje. Takhle podrobný slovník by samozřejmě nikdo nechtěl tisknout, protože když představím jenom ta trénovací data, na kterých se náš systém učil, tak tady je asi devět miliónů vět, asi devadesát miliónů slov v angličtině, osmdesát miliónů slov v češtině. Já jsem to počítal, myslím, že je to sedmadvacet metrů knih.

Tereza: Sedmadvacet metrů knih?

RNDr. Ondřej Bojar, Ph.D., Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta UK v Praze: A totéž v druhé řeči. Taková chodba dvacet sedm metrů dlouhá, vlevo angličtina, vpravo čeština.

Michael: A tady je jeden konkrétní příklad, kdy tato technologie je pro mne užitečná. Představte si: mám na návštěvě z Anglie rodiče. Sedíme v restauraci a jídelní lístek je pouze česky. Už to takový problém není.

Tereza: Pěkně to načteme. Máš?

Michael: A mám překlad do angličtiny.

Tereza: Já bych taky nevěděla, mám přeložit například „grilované úhoří špalíčky, podávané na hnízdě z čerstvého špenátu.

Tereza: Co sis dal ty?

Michael: No na, podívej se.

Tereza: Hm…

Michael: Můžeme si objednat?

Filip: Frázový překlad je opírá o texty, přeložené lidmi. Proto dokáže zvládnout i idiomatická spojení. Třeba známé „natáhnout bačkory“.

Tereza: Pokud se toto spojení objeví v delší větě, pak opět přeloží začátek, zopakuje známou frázi a pokračuje dál.

Filip: Když ovšem tuto frázi trochu pozměníme – a třeba tvar minulého času z trénovacích dat systém nezná, nemůže použít celou víceslovnou frázi a musí začít překlad slovo po slovu.

Tereza: A z mrtvoly jsou najednou opravdové bačkory.

Tereza: A je tu ještě jiný báječný důvod. Jste v nějaké restauraci, měli jste výborné jídlo a náhodou jste zapomněli, ve které restauraci sedíte, anebo si prostě jenom tuto informaci chcete uchovat do budoucna. Michaele, servítek s logem restaurace … a fotím.

Tereza: Probíhá analýza. Takhle probíhá analýza. A jakýpak je výsledek? No, restaurace U bílého lva, adresa ta a ta, Praha. Vidíš, to je báječné.

RNDr. Ondřej Bojar, Ph.D., Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta UK v Praze: Když bychom chtěli překlad dělat pořádně, tedy následovat lingvisty, tak vstupní větu napřed rozebereme. A to na úrovni tvaroslovné, čili ke každému slovnému tvaru přidáme všechny možné pády, které tento daný slovní tvar představuje, ke slovesu všechny rody, čísla, časy a podobně. Potom následuje rozbor, který se nazývá větný nebo skladební. My mu říkáme analytický, analytická rovina popisu jazyka. A tady uspořádáme slova do jakéhosi stromečku. To je tok, co se běžně dělá na středních a základních školách, když se lidé učí v češtině gramatiku. My máme pak ještě tu rovinu propracovanější, té říkáme hloubková syntax. Překlad pak probíhá nikoli z věty na větu, ale ze stromu na strom. Vezmu povrchový stromeček vstupní věty, vyrobím z něj ten lepší, hloubkový. Ten hloubkový stromeček přeložím na stejnou strukturu, ale v novém jazyce. A potom tento stromeček zase přes ten povrchový převedu až na povrchovou formu výsledné věty.

Michael: Další užitečnost. Mám maminku a tchýni. Měli dosud vždy problémy domluvit se.

Tereza: Protože maminka je z Anglie, a tchýně je z Česka.

Michael: Musely si pomáhat rukama, já jsem vždy musel překládat. Ale už ne.

Tereza: Názorně předvedeme… Michael miluje moje švestkové knedlíky. Teď to zpracuje. A je to tam.

Hlas automatického překladatele: Michael loves my plum dumplings.

Tereza: Super. Holky si pokecají o vaření.

Michael: A je to pravda, samozřejmě.

Filip: Přes zjevné nevýhody frázového i strukturního překladu ovšem jsou situace, kdy uvítáte třeba jen velmi hrubý překlad.

Tereza: Třeba když se vypravíte až do Číny. A na webu si chcete přečíst recenze o hotelích, kde byste se rádi ubytovali.

RNDr. Ondřej Bojar, Ph.D., Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta UK v Praze: Ty jednoduché systémy strojového překladu mně alespoň orientačně sdělí, že tam asi bude nějaký problém.

Tereza: A tím problémem jsou švábi.

RNDr. Ondřej Bojar, Ph.D., Ústav formální a aplikované lingvistiky, Matematicko-fyzikální fakulta UK v Praze: Tím problémem jsou švábi. A pokud bych neuměl ani anglicky, tak dokonce i v překladu do češtiny se to klíčové slovo dozvím.

Tereza: Tak do tohohle hotelu ne. Zaplať pánbůh aspoň za takový překladač.

Michael: Terezko, pojď.

Tereza: Ano, jdu, jdu.

Michael: Hele, schválně, jestli to pozná.

Tereza: No tak ukaž. No to by mohl, to poznám i já.

Michael: Analyzuje a hele – je tam.

Tereza: Je tam.

Michael: Počkej, ano. Vyhledat na webu St. Vitus cathedral. „Stín katedrál“… jo.

Tereza: Vidíš… To je chytrá věc.

Michael: It’s getting late. I’ve got to go. Excuse me. I’m a bit lost. Don’t you happen to know, where the tube is?

Připozdívá se. Měl bych jít. Promiňte, asi jsem se ztratil. Nevíte náhodou, kde je tu metro?

Tereza: Teď to vyzkoušíme. Say it again.

Řekněte to ještě jednou.

Michael: Don’t you happen to know, where the tube is?

Tereza: Zpracovává …

Překlad na displeji: Ne náhodou vědět, kde je trubice?

Tereza: No tak prosím vás, metro je tudy. Metro je tudy.

Michael: Thanks.

Autoři: Vladimír Kunz, Michael Londesborough

Přejít na obsah dílu