Doba, kdy bude automaticky přepisována lidská řeč, se díky výkonnějším procesorům přiblížila

26. únor 2010 18:48 0 komentářů

PRAHA, 26. února 2010 – Texty v češtině lze vytvářet už pouze diktováním do mikrofonu. Tuto zprávu přivítali všichni, kdo nemají rádi „datlování“. Alternativa k psaní na klávesnici již bezmála dva roky významně usnadňuje práci všem, kteří vytvářejí delší texty s pomocí NewtonDictate, nejvýkonnějšího systému pro rozpoznávání hlasu a přepis lidské řeči do textové podoby v češtině. Vyvinula ho společnost Newton Technologies společně s týmem vědců na Technické univerzitě v Liberci se záměrem, že své primární zákazníky najde zejména v oblasti soudnictví a advokacie, státní správy, zdravotnictví či médií, což se v praxi potvrzuje.

Teprve současný pokrok v oblasti vývoje procesorů a souvisejícího hardwaru však umožňuje plně využívat potenciál systému a významně zvýšit jeho účinnost. „Mezi přesností 85 a 90 procent sice na papíře není významný rozdíl, ale v praxi je podstatný. Až přesnost na úrovni 90–95 % totiž povyšuje systém NewtonDictate nad schopnosti profesionální zapisovatelky. Následné minimalizování chyb v přepisu mluvené řeči systému poskytuje organizaci významnou úsporu času a tím i prostředků související s převedením pracovní sily na jinou kvalifikovanou práci,“ uvedl Petr Herian, generální ředitel Newton Technologies.

Nové inteligentní procesory Intel Core, které společnost Intel uvedla na trh v lednu 2010, pomáhají zvýšit rychlost celého počítače a tím i hlasového systému NewtonDictate. Zatímco u předchozích konfigurací počítače bylo v nastavení aplikace nezbytné předem definovat, zda bude mluvčím muž nebo žena či rozdělovat slovníky pro jednotlivé obory, s novými procesory z řady Core toto odpadá. „Inteligentní procesory se dokážou přizpůsobit individuálním potřebám uživatelů a zlepšují výkon každodenně využívaných aplikací. Technologie Intel Hyper-Threading a Intel Turbo Boost automaticky zvyšují výkon, aby aplikace vždy běžely tak, jak mají,“ uvedl Evžen Pavlovský, regionální manažer společnosti Intel pro korporátní a veřejný sektor ve střední a východní Evropě. V praxi to znamená, že s novými procesory se u systému NewtonDictate ještě více zkracuje prodleva mezi řečí a jejím zápisem, přičemž není třeba nijak omezovat software. Slovník, který v současnosti obsahuje půl milionu slov a je neustále doplňován, tak může narůst – v případě potřeby – i na dvojnásobek.

Právě propojení s technologií, zejména s výkonem procesoru, považuje Petr Herian za určující faktor pro další rozvoj hlasových technologií. „Systém pro češtinu je v současné době porovnatelný s ostatními jazyky, ale jeho možnosti dále vzrostou s další generací procesorů, které budou schopné poskytnout ještě vyšší výkon,“ říká Petr Herian, který odhaduje, že v ten moment přijde čas pro novou generaci hlasových systémů a technologií, uživatelsky ještě přizpůsobitelnějších, než jsou ty současné. Je to otázka jednoho nebo dvou let, kdy Intel představí vyšší standard, než jsou současné 32nm čipy. Dosažení „svatého grálu“ všech výzkumníků v oblasti rozpoznávání řeči, jímž je spolehlivý přepis hovorové řeči, kterou běžně slyšíme kolem nás, se dá podle Petra Heriana očekávat v horizontu 3–5 let. Dosažení tohoto milníku stojí v cestě například podmínka, že při diktování na mikrofon musí mluvčí v současnosti svůj hlas přece jen stylizovat a zřetelně vyslovovat, aby byl přepis úspěšný. V budoucnu se zvýší šance na potlačení všech rušivých prvků prostředí, akustických a fonetických vlivů či nejednoznačného kontextu. Procesory na této dobrodružné cestě objevů určitě sehrají klíčovou roli.

Nedávné úspěchy v rozvoji systémů na rozpoznávání řeči přímo souvisejí s rozvojem výkonu počítačů. Když v roce 1965 zakladatel společnosti Intel Gordon Moore vyslovil tezi (později proslavenou jako tzv. Mooreův zákon), že množství tranzistorů na jednom čipu se zdvojnásobí přibližně každé dva roky, zřejmě netušil, že i po 45 letech bude jeho teorie platit a zásadně měnit svět, ve kterém žijeme. Úspěšnost systémů, jako je NewtonDictate, a jejich začlenění do běžného života závisí na schopnosti vědců držet stejné tempo inovací jako doposud. Z generace procesorů, kterou Intel představí příští rok, je již nyní zřejmé, že se rozpoznávání řeči velmi brzy stane běžnou věcí a myšlenky typu automatického překládání do cizích jazyků v mluvené řeči již nebudou jen v oblasti sci-fi.

Chronologie významných dat v oboru rozpoznávání řeči a vývoje systému NewtonDictate

březen 1993 Intel Pentium, první procesor pro PC zvládající multimédia, předzvěst dnešních PC.

1994 Na Technické univerzitě v Liberci se dává dohromady tým vědců v oboru rozpoznávání řeči pod vedením profesora Jana Nouzy.

2005 Tým vědců z Liberce představuje první funkční prototyp systému na diktování plynulou řečí v češtině.

2006 Společnost Newton Media zahajuje exkluzivní spolupráci s týmem profesora Nouzy. Zatímco vědci z Liberce poskytují vlastní engine pro přepis řeči, vkladem společnosti Newton Media je hlasový korpus.

květen 2008 Na Právnické fakultě Masarykovy univerzity v Brně je obhájena první diplomová práce nadiktovaná hlasem.

červenec 2006 Intel Core mikroarchitektury – milník ve výkonu a energetické úspornosti.

srpen 2008 České soudy testují rozdílné hlasové systémy, NewtonDictate s oborovým slovníkem uspěje ve výběrovém řízení vyhlášeném Ministerstvem spravedlnosti ČR.

leden 2009 Nasazení 1600 licencí systému NewtonDictate na soudech a státních zastupitelstvích.

leden 2010 Intel představuje novou řadu inteligentních procesorů Intel Core, které jsou schopné zvyšovat výkon celého počítače a současně spořit energii. Spolehlivost NewtonDictate běžícího na hardwaru s těmito procesory se pohybuje nad úrovní 95 %.

2011 Uvedení nové architektury čipů Sandy Bridge, která opět posune hranice výkonu počítačů a umožní ještě plynulejší rozpoznávání řeči.


Komentáře

RSS 

Komentujeme

Umělá inteligence rozpoznává tvář zločince

Pavel Houser , 27. červen 2017 12:30
Pavel Houser

Když dnes člověk prohlásí, že rysy tváře souvisejí se zločinností, bude za šarlatána, který chce kří...

Více






Kalendář

25. 06.

29. 06.
Cisco Live 2017
22. 07.

27. 07.
Black Hat 2017
27. 07.

30. 07.
Defcon 2017
RSS 

Zprávičky

Amazon usnadní službami českým podnikům prodej v zahraničí

ČTK , 28. červen 2017 12:00

České firmy při prodeji v jiných zemích často bojují s bariérami, jako jsou vysoké dopravní náklady ...

Více 0 komentářů

Lenovo představuje nové portfolio datových center

Pavel Houser , 28. červen 2017 10:00

Portfolio produktů ThinkSystem spojuje pod jednotnou značkou servery, úložiště a síťové systémy. ...

Více 0 komentářů

Do systému eReceptů zapojena čtvrtina lékařů a většina lékáren

ČTK , 28. červen 2017 09:00

Od 1. ledna příštího roku bude vydávání elektronických receptů pro všechny lékaře povinné. ...

Více 0 komentářů

Starší zprávičky

Nvidia bude spolupracovat s Volvem a VW na samořízených autech

ČTK , 28. červen 2017 08:00

Volvo hodlá uvést autonomní auta na trh do roku 2021, Audi o rok dříve....

Více 0 komentářů

ČR mezi 10 nejpostiženějšími zeměmi ransomwarového útoku

Pavel Houser , 28. červen 2017 07:00

K aktuálním útokům ransomwarem, který byl zaznamenán nejprve na Ukrajině a v Rusku, začaly vydávat s...

Více 0 komentářů

Hackeři napadli ukrajinské banky a podniky, i ruskou Rosněfť

ČTK , 27. červen 2017 18:27

Ukrajinu dnes zasáhla největší vlna hackerských útoků v historii země, informovalo ukrajinské minist...

Více 0 komentářů

Google dostal od Evropské komise rekordní pokutu 2,4 miliardy eur

ČTK , 27. červen 2017 13:06

Google se musí začít ke konkurenčním srovnávačům cen chovat stejně jako k vlastní službě. ...

Více 1 komentářů