Překladač Googlu začne využívat neuronové sítě

Pavel Houser , 10. listopad 2016 15:30 0 komentářů
Překladač Googlu začne využívat neuronové sítě

Google Translator dosud používal především statistiku – při této metodě se věty trhají na kratší fráze, u nich se najde, jak již byly přeloženy, a jednotlivé úseky se překládají víceméně zvlášť (tzv. Phrase-Based Machine Translation).

I když samozřejmě počítačové překlady vzbuzují dosud tu a tam úsměv, funguje to překvapivě dobře. Google Translator by dosud de facto (především) verzí systému s překladovou pamětí.

Každý přístup má ale své limity, takže nyní Google do systému zahrnuje i neuronové sítě, které se snaží chápat/překládat věty jako celek. Obě metody se kombinují. Testy na veřejně přístupných sadách dat údajně už dávají slušné výsledky, i když vývoj podobných systémů je vlastně věčný.

Neuronová síť (Google Neural Machine Translation, GNMT) má údajně představovat vylepšení hlavně pro překlady mezi jazyky, které jsou si zcela nepodobné, třeba mezi angličtinou a mandarínskou čínštinou. Google publikoval statistiku kvality překladu podle toho, zda byla použita pouze dosavadní statistická metoda, neuronová síť nad ní nebo i lidský přístup.

Zajímavé je, že třeba pro překlady mezi angličtinou a francouzštinou už lidé nedokázali výsledek strojového překladu prakticky vylepšit (což se posuzovalo tak, že kvalitu hodnotili jiní lidé). Přístup založený na neuronových sítích může ale stále dělat některé chyby. Zmiňují se třeba špatné tvary slov (chybné pády/skloňování) ve výstupním jazyce, nepochopení toho, co jsou vlastní jména, chápání textu na úrovni vět může vést i k chybám vzhledem ke kontextu na úrovni odstavce nebo ještě širšího celku.

Zdroj: TechXplore.com, Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation (ArXiv.org)

Poznámky:

Ze zdroje není jasné, zda dostupný Google Translator už neuronovou síť využívá i standardně a pro překlady mezi češtinou. Aktuálně drobný test: Při automatickém překladu původního textu AJ – ČJ se nevyskytl častý problém, popletení/obrácení záporu.

Google v ČR čelí konkurenci Seznamu, takže se předpokládá, že své služby pro nás optimalizuje více než pro jiné země srovnatelné velikosti. Platí to i pro Google Translator? Nebo jsou naopak překlady z/do češtiny negativně ovlivněny tím, že pro češtinu nemáme dostatečnou bázi frází? Či je to od určitého množství už jedno? Jak vypadá kvalita Google Translator pro češtinu ve srovnání třeba s polštinou?


Komentáře


RSS 

Komentujeme

Zákaznické karty čekají změny

Pavel Houser , 17. leden 2017 13:00
Pavel Houser

Jedna z technologií, která se už po léta prakticky nezměnila, i když by mohla? Prý karty zákazníků d...

Více





Kalendář

06. 02.

07. 02.
konference G2B TechEd
15. 02. IDC Predictions 2017
18. 02. WordCamp Praha 2017
RSS 

Zprávičky

Za vznícení mobilů Samsungu mohly baterie, firma odloží Galaxy S8

ČTK , 23. leden 2017 12:00

Za případy vznícení chytrých telefonů Galaxy Note 7 jihokorejské společnosti Samsung Electronics stá...

Více 0 komentářů

Foxconn zvažuje velkou investici do továrny v USA

ČTK , 23. leden 2017 08:29

Tchajwanská společnost Foxconn zvažuje, že investuje přes sedm miliard dolarů (zhruba 177 miliard Kč...

Více 0 komentářů

ČTÚ pohrozil O2 a Vodafonu odebráním licencí na LTE kvůli cenám

ČTK , 22. leden 2017 14:00

Český telekomunikační úřad (ČTÚ) znovu vyzval operátory O2 a Vodafone, aby do měsíce snížili velkoob...

Více 0 komentářů

Starší zprávičky

Menší e-shopy kvůli EET zruší platbu kartou

ČTK , 22. leden 2017 07:00

Řada menších tuzemských e-shopů od března, kdy pro ně začne platit elektronická evidence tržeb (EET...

Více 2 komentářů

Na další rozvoj ekonomického systému bude Praha vypisovat tendry

ČTK , 21. leden 2017 14:00

Na další rozvoj ekonomického systému Ginis bude Praha vypisovat jednotlivé veřejné zakázky. Pražští ...

Více 0 komentářů

Tržby IBM klesaly i ve 4.čtvrtletí loňského roku, akciím se daří

ČTK , 21. leden 2017 07:00

Americká počítačová společnost International Business Machines (IBM) zaznamenala další, již devatená...

Více 0 komentářů

Facebook postaví v Dánsku datové centrum

ČTK , 20. leden 2017 14:00

Americký provozovatel sociální sítě Facebook postaví v dánském městě Odense nové datové centrum, kte...

Více 0 komentářů