• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Překladač Googlu si sám vyvinul univerzální sémantiku

Pavel Houser
14. 2. 2017
| Články

Google na podzim loňského roku oznámil rozšíření svého překladače o technologie strojového učení a neuronových sítí. Poprvé v historii strojových překladů je tak nyní možné překládat i mezi jazyky, jejichž páry nejsou přímo vloženy do systému a ten na ně ani nebyl trénován.
Překladač Googlu existuje už asi 10 let a neustále se rozšiřuje. Nyní podle Googlu podporuje 103 jazyků a každý den se prostřednictvím systému překládá přes 140 miliard slov. Kvalita se do určité míry zlepšuje prostě samospádem, jak přibývá „párových“ dokumentů, přesto však statistický přístup k překladu už začal narážet na své limity. Tak například systém podporující 103 jazyků potřebuje subsystémy pro jejich každý pár, což s sebou nese mj. i náklady na výpočetní výkon a další „počítačové“ prostředky stejně jako nutnost spravovat všechna tato prostředí vedle sebe.

Google proto na podzim loňského roku začal svůj překladač rozšiřovat o nové technologie, především neuronové sítě/strojové učení. Výsledkem byl systém Google Neural Machine Translation (GNMT). Mike Schuster, Melvin Johnson a Nikhil Thorat z Googlu nyní vysvětlují, že pro překlad v tomto systému není třeba neuronovou síť trénovat na všechny dvojice jazyků, ale zvládne i kombinace, které při tréninku do systému vůbec nebyly zadávány; autoři tomu říkají „zero-shot“. Vstupní text se prostě už jen označuje tokenem, který specifikuje, do jakého jazyka se má překládat. Je to údajně vůbec poprvé, co strojové překladače zvládnou něco podobného.

Samozřejmě se tím nemyslí, že by se překlad prováděl přes nějaký jazyk třetí (např. metodou „vše přes angličtinu“), i když… V průběhu učení sítě se totiž v systému vytváří abstraktní vrstva, reprezentace jednotlivých sdělení, kterou můžeme chápat právě jako univerzální jazyk („interlingua“), přes který pak prochází překlad. Tato vrstva má především podobu sémantiky (významu), neomezuje se na analýzu gramatických vztahů ve zpracovávaných textech.

Systém je díky tomu univerzální, přidávání dalších jazyků nevyžaduje žádnou změnu jeho architektury. Příslušnou vnitřní sémantickou reprezentaci si překladač vytváří automaticky, není to tak, že by v Googlu za tímto účelem navrhovali nějaký vlastní přemosťující jazyk typu esperanta. Programátoři Googlu tuto sémantiku v systému dokáží pouze zpětně najít, když zjistí, že odpovídajícím větám v různých jazycích systém postupně přiřazuje stejné či podobné atributy, které jsou mnohem propracovanější, než by odpovídalo pouze párování odpovídajících si frází.
Tyto výsledky jsou samozřejmě zajímavé i z obecnějšího pohledu – mají vztah k otázkám o povaze lidského jazyka, jeho zpracování v mozku (máme také nějaké vnitřní reprezentace nezávislé na konkrétních jazycích?) apod.

Zdroj: Google Blog a další

Rubriky: CloudInternetScienceTechnologieVývoj a HTML

Související příspěvky

Zprávičky

Nová digitalizace stavebního řízení se bude vyvíjet v letech 2027 a 2029

12. 3. 2026
Zprávičky

EP přijal pozici k normě o skenování online komunikace kvůli dětské pornografii

12. 3. 2026
Umělá inteligence v IT infrastruktuře
Zprávičky

Agenti AI od Googlu budou pomáhat Pentagonu, zprvu s neutajovanými úkoly

11. 3. 2026
Články

Virtuozzo sjednocuje své cloudové technologie do jedné produktové platformy

11. 3. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Nová digitalizace stavebního řízení se bude vyvíjet v letech 2027 a 2029

ČTK
12. 3. 2026

Nový systém digitalizace stavebního řízení se bude vyvíjet a testovat mezi lety 2027 a

EP přijal pozici k normě o skenování online komunikace kvůli dětské pornografii

ČTK
12. 3. 2026

Evropský parlament dnes schválil svůj postoj k nařízení, které má umožnit platformám dál dobrovolně

Hackeři získali citlivá data ze Slavia pojišťovny, například zdravotní dokumenty

ČTK
11. 3. 2026

Ze systému Slavia pojišťovny uniklo přibližně 150 gigabajtů citlivých dat. Jedná se například o

Finanční správa zrušila tendr na nový daňový informační systém

ČTK
11. 3. 2026

Finanční správa zrušila tendr na dodání nového daňového informačního systému. Důvodem bylo, že v

Umělá inteligence v IT infrastruktuře

Agenti AI od Googlu budou pomáhat Pentagonu, zprvu s neutajovanými úkoly

ČTK
11. 3. 2026

Agenti umělé inteligence (AI) vyvinutí společností Google budou pomáhat s rutinními úkoly třem milionům

Gordic a Cybrela přinášejí komplexní řešení kybernetické bezpečnosti

Sněmovna posunula zákon o digitální ekonomice do dalšího kola projednávání (aktualizováno)

ČTK
10. 3. 2026

Sněmovna dnes propustila do dalšího kola projednávání vládní návrh zákona o digitální ekonomice, který

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů

Meta převezme sociální síť pro umělou inteligenci Moltbook

ČTK
10. 3. 2026

Americká internetová společnost Meta převezme sociální síť pro umělou inteligenci (AI) Moltbook. Informoval o

Británie zatím sociální sítě osobám mladším 16 let nezakáže

ČTK
10. 3. 2026

Británie zatím sociální sítě osobám mladším 16 let nezakáže. Návrh na zavedení zákazu v

Tiskové zprávy

QNAP mění NAS na NDR: ADRA NDR Standalone snižuje bariéry v oblasti vnitřní síťové bezpečnosti

ČSÚ: Digitální dovednosti v Česku jsou nad průměrem EU

Acer EMEA představuje Acer Channel Partner Portal

Epson uvádí na trh plochou tiskárnu SC-V4000 A1+ pro UV tisk

Women in Tech 2026: Program pro podnikatelky v technologiích otevírá přihlášky do pátého ročníku

Acer EMEA slaví 50 let: od hardwaru k diverzifikaci

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Bře 17
Celý den

IT Security Worshop

Dub 15
Celý den

Energy Vision

Kvě 12
Celý den

Cloud Computing Conference

Zobrazit kalendář

Komentujeme

itbiz kamil pittner

Platformové inženýrství: popularita termínu může vést ke zmatení

Kamil Pittner
2. 1. 2026

Podobně jako v případě DevOps se i termín platformové inženýrství stal natolik oblíbeným, až se začal...

Slovník

Index zapomínání

Editor

Share

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.