Doba, kdy bude automaticky přepisována lidská řeč, se díky výkonnějším procesorům přiblížila

26. únor 2010 18:48 0 komentářů

PRAHA, 26. února 2010 – Texty v češtině lze vytvářet už pouze diktováním do mikrofonu. Tuto zprávu přivítali všichni, kdo nemají rádi „datlování“. Alternativa k psaní na klávesnici již bezmála dva roky významně usnadňuje práci všem, kteří vytvářejí delší texty s pomocí NewtonDictate, nejvýkonnějšího systému pro rozpoznávání hlasu a přepis lidské řeči do textové podoby v češtině. Vyvinula ho společnost Newton Technologies společně s týmem vědců na Technické univerzitě v Liberci se záměrem, že své primární zákazníky najde zejména v oblasti soudnictví a advokacie, státní správy, zdravotnictví či médií, což se v praxi potvrzuje.

Teprve současný pokrok v oblasti vývoje procesorů a souvisejícího hardwaru však umožňuje plně využívat potenciál systému a významně zvýšit jeho účinnost. „Mezi přesností 85 a 90 procent sice na papíře není významný rozdíl, ale v praxi je podstatný. Až přesnost na úrovni 90–95 % totiž povyšuje systém NewtonDictate nad schopnosti profesionální zapisovatelky. Následné minimalizování chyb v přepisu mluvené řeči systému poskytuje organizaci významnou úsporu času a tím i prostředků související s převedením pracovní sily na jinou kvalifikovanou práci,“ uvedl Petr Herian, generální ředitel Newton Technologies.

Nové inteligentní procesory Intel Core, které společnost Intel uvedla na trh v lednu 2010, pomáhají zvýšit rychlost celého počítače a tím i hlasového systému NewtonDictate. Zatímco u předchozích konfigurací počítače bylo v nastavení aplikace nezbytné předem definovat, zda bude mluvčím muž nebo žena či rozdělovat slovníky pro jednotlivé obory, s novými procesory z řady Core toto odpadá. „Inteligentní procesory se dokážou přizpůsobit individuálním potřebám uživatelů a zlepšují výkon každodenně využívaných aplikací. Technologie Intel Hyper-Threading a Intel Turbo Boost automaticky zvyšují výkon, aby aplikace vždy běžely tak, jak mají,“ uvedl Evžen Pavlovský, regionální manažer společnosti Intel pro korporátní a veřejný sektor ve střední a východní Evropě. V praxi to znamená, že s novými procesory se u systému NewtonDictate ještě více zkracuje prodleva mezi řečí a jejím zápisem, přičemž není třeba nijak omezovat software. Slovník, který v současnosti obsahuje půl milionu slov a je neustále doplňován, tak může narůst – v případě potřeby – i na dvojnásobek.

Právě propojení s technologií, zejména s výkonem procesoru, považuje Petr Herian za určující faktor pro další rozvoj hlasových technologií. „Systém pro češtinu je v současné době porovnatelný s ostatními jazyky, ale jeho možnosti dále vzrostou s další generací procesorů, které budou schopné poskytnout ještě vyšší výkon,“ říká Petr Herian, který odhaduje, že v ten moment přijde čas pro novou generaci hlasových systémů a technologií, uživatelsky ještě přizpůsobitelnějších, než jsou ty současné. Je to otázka jednoho nebo dvou let, kdy Intel představí vyšší standard, než jsou současné 32nm čipy. Dosažení „svatého grálu“ všech výzkumníků v oblasti rozpoznávání řeči, jímž je spolehlivý přepis hovorové řeči, kterou běžně slyšíme kolem nás, se dá podle Petra Heriana očekávat v horizontu 3–5 let. Dosažení tohoto milníku stojí v cestě například podmínka, že při diktování na mikrofon musí mluvčí v současnosti svůj hlas přece jen stylizovat a zřetelně vyslovovat, aby byl přepis úspěšný. V budoucnu se zvýší šance na potlačení všech rušivých prvků prostředí, akustických a fonetických vlivů či nejednoznačného kontextu. Procesory na této dobrodružné cestě objevů určitě sehrají klíčovou roli.

Nedávné úspěchy v rozvoji systémů na rozpoznávání řeči přímo souvisejí s rozvojem výkonu počítačů. Když v roce 1965 zakladatel společnosti Intel Gordon Moore vyslovil tezi (později proslavenou jako tzv. Mooreův zákon), že množství tranzistorů na jednom čipu se zdvojnásobí přibližně každé dva roky, zřejmě netušil, že i po 45 letech bude jeho teorie platit a zásadně měnit svět, ve kterém žijeme. Úspěšnost systémů, jako je NewtonDictate, a jejich začlenění do běžného života závisí na schopnosti vědců držet stejné tempo inovací jako doposud. Z generace procesorů, kterou Intel představí příští rok, je již nyní zřejmé, že se rozpoznávání řeči velmi brzy stane běžnou věcí a myšlenky typu automatického překládání do cizích jazyků v mluvené řeči již nebudou jen v oblasti sci-fi.

Chronologie významných dat v oboru rozpoznávání řeči a vývoje systému NewtonDictate

březen 1993 Intel Pentium, první procesor pro PC zvládající multimédia, předzvěst dnešních PC.

1994 Na Technické univerzitě v Liberci se dává dohromady tým vědců v oboru rozpoznávání řeči pod vedením profesora Jana Nouzy.

2005 Tým vědců z Liberce představuje první funkční prototyp systému na diktování plynulou řečí v češtině.

2006 Společnost Newton Media zahajuje exkluzivní spolupráci s týmem profesora Nouzy. Zatímco vědci z Liberce poskytují vlastní engine pro přepis řeči, vkladem společnosti Newton Media je hlasový korpus.

květen 2008 Na Právnické fakultě Masarykovy univerzity v Brně je obhájena první diplomová práce nadiktovaná hlasem.

červenec 2006 Intel Core mikroarchitektury – milník ve výkonu a energetické úspornosti.

srpen 2008 České soudy testují rozdílné hlasové systémy, NewtonDictate s oborovým slovníkem uspěje ve výběrovém řízení vyhlášeném Ministerstvem spravedlnosti ČR.

leden 2009 Nasazení 1600 licencí systému NewtonDictate na soudech a státních zastupitelstvích.

leden 2010 Intel představuje novou řadu inteligentních procesorů Intel Core, které jsou schopné zvyšovat výkon celého počítače a současně spořit energii. Spolehlivost NewtonDictate běžícího na hardwaru s těmito procesory se pohybuje nad úrovní 95 %.

2011 Uvedení nové architektury čipů Sandy Bridge, která opět posune hranice výkonu počítačů a umožní ještě plynulejší rozpoznávání řeči.


Komentáře


RSS 

Komentujeme

Zákaznické karty čekají změny

Pavel Houser , 17. leden 2017 13:00
Pavel Houser

Jedna z technologií, která se už po léta prakticky nezměnila, i když by mohla? Prý karty zákazníků d...

Více





Kalendář

06. 02.

07. 02.
konference G2B TechEd
15. 02. IDC Predictions 2017
22. 02. IT mezi paragrafy
RSS 

Zprávičky

Toshiba prý zvažuje o osamostatnění své polovodičové divize

ČTK , 19. leden 2017 11:00

Japonská společnost Toshiba Corp. zvažuje oddělení svých aktivit v oblasti výroby polovodičů do samo...

Více 0 komentářů

Sněmovna uzákoní pravidla pro informační systémy veřejné správy

ČTK , 19. leden 2017 07:00

Sněmovna zřejmě uzákoní pravidla pro to, jaké funkční vlastnosti mají mít informační systémy ve veře...

Více 0 komentářů

ÚOOÚ za nevyžádaná obchodní sdělení uložil i půlmilionovou pokutu

ČTK , 18. leden 2017 14:00

Úřad pro ochranu osobních údajů (ÚOOÚ) v souvislosti s nevyžádanými obchodními sděleními udělil loni...

Více 0 komentářů

Starší zprávičky

O2 spustila volání přes rychlé mobilní sítě LTE

ČTK , 18. leden 2017 12:00

Operátor O2 spustil službu volání v rychlé mobilní síti LTE. Největšími výhodami VoLTE jsou velmi kr...

Více 2 komentářů

Průměrná rychlost mobilního internetu loni stoupla na 23,8 Mbit/s

ČTK , 18. leden 2017 07:00

Průměrná rychlost mobilního internetu v Česku se v loňském roce zvýšila o 39 procent na 23,8 Mbit/s....

Více 0 komentářů

Telefónica má zaplatit 1,7 miliardy Kč Tykačovým firmám

ČTK , 17. leden 2017 15:00

Španělská telekomunikační společnost Telefónica má zaplatit firmám podnikatele Pavla Tykače 1,7 mili...

Více 0 komentářů

Embarcadero oznamuje podporu Desktop Bridge v produktu RAD Studio

ITBiz.cz , 17. leden 2017 12:00

Společnost Embarcadero Technologies (divize společnosti Idera), vedoucí dodavatel softwarových řešen...

Více 0 komentářů