• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Překladač Googlu si sám vyvinul univerzální sémantiku

Pavel Houser
14. 2. 2017
| Články

Google na podzim loňského roku oznámil rozšíření svého překladače o technologie strojového učení a neuronových sítí. Poprvé v historii strojových překladů je tak nyní možné překládat i mezi jazyky, jejichž páry nejsou přímo vloženy do systému a ten na ně ani nebyl trénován.
Překladač Googlu existuje už asi 10 let a neustále se rozšiřuje. Nyní podle Googlu podporuje 103 jazyků a každý den se prostřednictvím systému překládá přes 140 miliard slov. Kvalita se do určité míry zlepšuje prostě samospádem, jak přibývá „párových“ dokumentů, přesto však statistický přístup k překladu už začal narážet na své limity. Tak například systém podporující 103 jazyků potřebuje subsystémy pro jejich každý pár, což s sebou nese mj. i náklady na výpočetní výkon a další „počítačové“ prostředky stejně jako nutnost spravovat všechna tato prostředí vedle sebe.

Google proto na podzim loňského roku začal svůj překladač rozšiřovat o nové technologie, především neuronové sítě/strojové učení. Výsledkem byl systém Google Neural Machine Translation (GNMT). Mike Schuster, Melvin Johnson a Nikhil Thorat z Googlu nyní vysvětlují, že pro překlad v tomto systému není třeba neuronovou síť trénovat na všechny dvojice jazyků, ale zvládne i kombinace, které při tréninku do systému vůbec nebyly zadávány; autoři tomu říkají „zero-shot“. Vstupní text se prostě už jen označuje tokenem, který specifikuje, do jakého jazyka se má překládat. Je to údajně vůbec poprvé, co strojové překladače zvládnou něco podobného.

Samozřejmě se tím nemyslí, že by se překlad prováděl přes nějaký jazyk třetí (např. metodou „vše přes angličtinu“), i když… V průběhu učení sítě se totiž v systému vytváří abstraktní vrstva, reprezentace jednotlivých sdělení, kterou můžeme chápat právě jako univerzální jazyk („interlingua“), přes který pak prochází překlad. Tato vrstva má především podobu sémantiky (významu), neomezuje se na analýzu gramatických vztahů ve zpracovávaných textech.

Systém je díky tomu univerzální, přidávání dalších jazyků nevyžaduje žádnou změnu jeho architektury. Příslušnou vnitřní sémantickou reprezentaci si překladač vytváří automaticky, není to tak, že by v Googlu za tímto účelem navrhovali nějaký vlastní přemosťující jazyk typu esperanta. Programátoři Googlu tuto sémantiku v systému dokáží pouze zpětně najít, když zjistí, že odpovídajícím větám v různých jazycích systém postupně přiřazuje stejné či podobné atributy, které jsou mnohem propracovanější, než by odpovídalo pouze párování odpovídajících si frází.
Tyto výsledky jsou samozřejmě zajímavé i z obecnějšího pohledu – mají vztah k otázkám o povaze lidského jazyka, jeho zpracování v mozku (máme také nějaké vnitřní reprezentace nezávislé na konkrétních jazycích?) apod.

Zdroj: Google Blog a další

Rubriky: CloudInternetScienceTechnologieVývoj a HTML

Související příspěvky

Zprávičky

Google, Meta a TikTok čelí v EU stížnosti kvůli podvodným inzerátům

25. 5. 2026
Umělá inteligence: Nástroje vs. platforma, věda vs. kreativita
Zprávičky

Papež v encyklice o AI varoval před dezinformacemi a dopady umělé inteligence

25. 5. 2026
Zprávičky

ECB svolává banky k jednání o rizicích odhalených umělou inteligencí

24. 5. 2026
Články

Chování elektronů v grafenu se podařilo napodobit i ve 3D

21. 5. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Zprávičky

InPost spouští nabídku na převzetí za 7,8 mld. eur, odkup potrvá do července

ČTK
25. 5. 2026

Nabídka na převzetí polské společnosti InPost za 7,8 miliardy eur (189,4 miliardy Kč) potrvá

Google, Meta a TikTok čelí v EU stížnosti kvůli podvodným inzerátům

ČTK
25. 5. 2026

Internetové společnosti Google, Meta Platforms a TikTok čelí v Evropské unii stížnosti ze strany

Umělá inteligence: Nástroje vs. platforma, věda vs. kreativita

Papež v encyklice o AI varoval před dezinformacemi a dopady umělé inteligence

ČTK
25. 5. 2026

Papež Lev XIV. ve své první encyklice Magnifica Humanitas (Skvělé lidství), která se věnuje

ECB svolává banky k jednání o rizicích odhalených umělou inteligencí

ČTK
24. 5. 2026

Evropská centrální banka (ECB) vyzve finanční instituce, aby urychlily práce na zabezpečení svých počítačových

Soud se bude znovu zabývat pokutou 125 milionů korun pro MPSV

ČTK
23. 5. 2026

Pražský městský soud se bude muset znovu zabývat žalobou, kterou se ministerstvo práce a

Čtvrtletní zisk výrobce počítačů Lenovo se více než zdvojnásobil, tržby rekordní

ČTK
22. 5. 2026

Očištěný čistý zisk čínského výrobce počítačů Lenovo se ve fiskálním čtvrtém čtvrtletí více než

SpaceX vynesla další sérii 60 družic sítě Starlink

Muskova SpaceX v prvním čtvrtletí vykázala ztrátu 4,3 miliardy dolarů

ČTK
21. 5. 2026

Americká vesmírná společnost SpaceX miliardáře Elona Muska v prvním čtvrtletí letošního roku hospodařila s

Výrobce čipů AMD investuje na Tchaj-wanu 10 mld. USD do navýšení výroby pro AI

ČTK
21. 5. 2026

Americký výrobce polovodičů AMD (Advanced Micro Devices) plánuje na Tchaj-wanu investovat více než deset

Tiskové zprávy

Synology uvádí PAS7700, active-active NVMe platformu pro kritická podniková prostředí

Průměrná měsíční spotřeba dat na jednu datovou SIM kartu vzrostla na 15,1 GB

HP představuje nové velkoformátové tiskárny pro malé a střední firmy

ViewSonic podpořil Halu roku 2026

Q1 výsledky společnosti T-Mobile

SAP Business One řídí distribuci klimatizací a tepelných čerpadel Midea

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Kvě 26
Celý den

Umelá inteligencia v IT infraštruktúre

Zář 23
Celý den

Cyber Attacks

Zobrazit kalendář

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

Webová analytika

Komodita

Shelf stopper

Komentujeme

itbiz kamil pittner

Znamená pomalost přemýšlivost? A co u AI?

Kamil Pittner
8. 5. 2026

Dodavatelé modelů AI soupeří o to, aby jejich systémy poskytovaly nejen lepší odpovědi, ale také pracovaly...

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.