Doba, kdy bude automaticky přepisována lidská řeč, se díky výkonnějším procesorům přiblížila

26. únor 2010 18:48 0 komentářů

PRAHA, 26. února 2010 – Texty v češtině lze vytvářet už pouze diktováním do mikrofonu. Tuto zprávu přivítali všichni, kdo nemají rádi „datlování“. Alternativa k psaní na klávesnici již bezmála dva roky významně usnadňuje práci všem, kteří vytvářejí delší texty s pomocí NewtonDictate, nejvýkonnějšího systému pro rozpoznávání hlasu a přepis lidské řeči do textové podoby v češtině. Vyvinula ho společnost Newton Technologies společně s týmem vědců na Technické univerzitě v Liberci se záměrem, že své primární zákazníky najde zejména v oblasti soudnictví a advokacie, státní správy, zdravotnictví či médií, což se v praxi potvrzuje.

Teprve současný pokrok v oblasti vývoje procesorů a souvisejícího hardwaru však umožňuje plně využívat potenciál systému a významně zvýšit jeho účinnost. „Mezi přesností 85 a 90 procent sice na papíře není významný rozdíl, ale v praxi je podstatný. Až přesnost na úrovni 90–95 % totiž povyšuje systém NewtonDictate nad schopnosti profesionální zapisovatelky. Následné minimalizování chyb v přepisu mluvené řeči systému poskytuje organizaci významnou úsporu času a tím i prostředků související s převedením pracovní sily na jinou kvalifikovanou práci,“ uvedl Petr Herian, generální ředitel Newton Technologies.

Nové inteligentní procesory Intel Core, které společnost Intel uvedla na trh v lednu 2010, pomáhají zvýšit rychlost celého počítače a tím i hlasového systému NewtonDictate. Zatímco u předchozích konfigurací počítače bylo v nastavení aplikace nezbytné předem definovat, zda bude mluvčím muž nebo žena či rozdělovat slovníky pro jednotlivé obory, s novými procesory z řady Core toto odpadá. „Inteligentní procesory se dokážou přizpůsobit individuálním potřebám uživatelů a zlepšují výkon každodenně využívaných aplikací. Technologie Intel Hyper-Threading a Intel Turbo Boost automaticky zvyšují výkon, aby aplikace vždy běžely tak, jak mají,“ uvedl Evžen Pavlovský, regionální manažer společnosti Intel pro korporátní a veřejný sektor ve střední a východní Evropě. V praxi to znamená, že s novými procesory se u systému NewtonDictate ještě více zkracuje prodleva mezi řečí a jejím zápisem, přičemž není třeba nijak omezovat software. Slovník, který v současnosti obsahuje půl milionu slov a je neustále doplňován, tak může narůst – v případě potřeby – i na dvojnásobek.

Právě propojení s technologií, zejména s výkonem procesoru, považuje Petr Herian za určující faktor pro další rozvoj hlasových technologií. „Systém pro češtinu je v současné době porovnatelný s ostatními jazyky, ale jeho možnosti dále vzrostou s další generací procesorů, které budou schopné poskytnout ještě vyšší výkon,“ říká Petr Herian, který odhaduje, že v ten moment přijde čas pro novou generaci hlasových systémů a technologií, uživatelsky ještě přizpůsobitelnějších, než jsou ty současné. Je to otázka jednoho nebo dvou let, kdy Intel představí vyšší standard, než jsou současné 32nm čipy. Dosažení „svatého grálu“ všech výzkumníků v oblasti rozpoznávání řeči, jímž je spolehlivý přepis hovorové řeči, kterou běžně slyšíme kolem nás, se dá podle Petra Heriana očekávat v horizontu 3–5 let. Dosažení tohoto milníku stojí v cestě například podmínka, že při diktování na mikrofon musí mluvčí v současnosti svůj hlas přece jen stylizovat a zřetelně vyslovovat, aby byl přepis úspěšný. V budoucnu se zvýší šance na potlačení všech rušivých prvků prostředí, akustických a fonetických vlivů či nejednoznačného kontextu. Procesory na této dobrodružné cestě objevů určitě sehrají klíčovou roli.

Nedávné úspěchy v rozvoji systémů na rozpoznávání řeči přímo souvisejí s rozvojem výkonu počítačů. Když v roce 1965 zakladatel společnosti Intel Gordon Moore vyslovil tezi (později proslavenou jako tzv. Mooreův zákon), že množství tranzistorů na jednom čipu se zdvojnásobí přibližně každé dva roky, zřejmě netušil, že i po 45 letech bude jeho teorie platit a zásadně měnit svět, ve kterém žijeme. Úspěšnost systémů, jako je NewtonDictate, a jejich začlenění do běžného života závisí na schopnosti vědců držet stejné tempo inovací jako doposud. Z generace procesorů, kterou Intel představí příští rok, je již nyní zřejmé, že se rozpoznávání řeči velmi brzy stane běžnou věcí a myšlenky typu automatického překládání do cizích jazyků v mluvené řeči již nebudou jen v oblasti sci-fi.

Chronologie významných dat v oboru rozpoznávání řeči a vývoje systému NewtonDictate

březen 1993 Intel Pentium, první procesor pro PC zvládající multimédia, předzvěst dnešních PC.

1994 Na Technické univerzitě v Liberci se dává dohromady tým vědců v oboru rozpoznávání řeči pod vedením profesora Jana Nouzy.

2005 Tým vědců z Liberce představuje první funkční prototyp systému na diktování plynulou řečí v češtině.

2006 Společnost Newton Media zahajuje exkluzivní spolupráci s týmem profesora Nouzy. Zatímco vědci z Liberce poskytují vlastní engine pro přepis řeči, vkladem společnosti Newton Media je hlasový korpus.

květen 2008 Na Právnické fakultě Masarykovy univerzity v Brně je obhájena první diplomová práce nadiktovaná hlasem.

červenec 2006 Intel Core mikroarchitektury – milník ve výkonu a energetické úspornosti.

srpen 2008 České soudy testují rozdílné hlasové systémy, NewtonDictate s oborovým slovníkem uspěje ve výběrovém řízení vyhlášeném Ministerstvem spravedlnosti ČR.

leden 2009 Nasazení 1600 licencí systému NewtonDictate na soudech a státních zastupitelstvích.

leden 2010 Intel představuje novou řadu inteligentních procesorů Intel Core, které jsou schopné zvyšovat výkon celého počítače a současně spořit energii. Spolehlivost NewtonDictate běžícího na hardwaru s těmito procesory se pohybuje nad úrovní 95 %.

2011 Uvedení nové architektury čipů Sandy Bridge, která opět posune hranice výkonu počítačů a umožní ještě plynulejší rozpoznávání řeči.


Komentáře

RSS 

Komentujeme

Agilita a devops, přepracování a vyhoření

Pavel Houser , 12. červenec 2018 12:30
Pavel Houser

Michael Cote na The Register upozorňuje na častý problém: nové „agilní“ metody vývoje, všechny příst...

Více







RSS 

Zprávičky

50 let Intelu

ČTK , 16. červenec 2018 09:06

Intel nejprve produkoval paměti typu RAM, ale na počátku sedmdesátých let se firma rozhodla rozšířit...

Více 0 komentářů

USA zrušily zákaz dodávek amerického zboží čínské ZTE

ČTK , 14. červenec 2018 08:00

Firma již v rámci urovnání sporu s americkou vládou souhlasila, že zaplatí pokutu miliardy dolarů....

Více 0 komentářů

Trh PC ve 2. čtvrtletí rostl, tvrdí Gartner i IDC

ČTK , 13. červenec 2018 16:35

Růst odbytu táhla zejména poptávka firemního segmentu podpořená operačním systémem Windows 10....

Více 0 komentářů

Kalendář

04. 08.

09. 08.
Black Hat USA 2018
09. 08.

12. 08.
DEF CON 26
06. 09.

07. 09.
Humusoft Technical Computing Camp 2018

Starší zprávičky

Polovina kryptoměnových firem zanikne během čtyř měsíců od ICO

ČTK , 13. červenec 2018 10:09

Nejlepší strategií je prý mince v primární nabídce koupit a hned první den obchodů na otevřeném trhu...

Více 0 komentářů

Americká vláda se odvolává proti fúzi AT&T a Time Warner

ČTK , 13. červenec 2018 10:07

Ministerstvo se odvolalo proti červnovému rozhodnutí soudu, který spojení posvětil přes dřívější nám...

Více 0 komentářů

Německý soud: Rodiče mají mít přístup k facebooku mrtvé dcery

ČTK , 13. červenec 2018 09:00

Facebook nechtěl obsah účtu dívky otevřít, protože i její přátelé údajně spoléhali na to, že jejich ...

Více 1 komentářů

Broadcom koupí za 18,9 miliard dolarů CA Technologies

ČTK , 12. červenec 2018 13:01

Akvizice jsou důležité pro expanzi Broadcomu. Výběr firmy CA je však pro analytiky překvapením....

Více 0 komentářů