Doba, kdy bude automaticky přepisována lidská řeč, se díky výkonnějším procesorům přiblížila

26. únor 2010 18:48 0 komentářů

PRAHA, 26. února 2010 – Texty v češtině lze vytvářet už pouze diktováním do mikrofonu. Tuto zprávu přivítali všichni, kdo nemají rádi „datlování“. Alternativa k psaní na klávesnici již bezmála dva roky významně usnadňuje práci všem, kteří vytvářejí delší texty s pomocí NewtonDictate, nejvýkonnějšího systému pro rozpoznávání hlasu a přepis lidské řeči do textové podoby v češtině. Vyvinula ho společnost Newton Technologies společně s týmem vědců na Technické univerzitě v Liberci se záměrem, že své primární zákazníky najde zejména v oblasti soudnictví a advokacie, státní správy, zdravotnictví či médií, což se v praxi potvrzuje.

Teprve současný pokrok v oblasti vývoje procesorů a souvisejícího hardwaru však umožňuje plně využívat potenciál systému a významně zvýšit jeho účinnost. „Mezi přesností 85 a 90 procent sice na papíře není významný rozdíl, ale v praxi je podstatný. Až přesnost na úrovni 90–95 % totiž povyšuje systém NewtonDictate nad schopnosti profesionální zapisovatelky. Následné minimalizování chyb v přepisu mluvené řeči systému poskytuje organizaci významnou úsporu času a tím i prostředků související s převedením pracovní sily na jinou kvalifikovanou práci,“ uvedl Petr Herian, generální ředitel Newton Technologies.

Nové inteligentní procesory Intel Core, které společnost Intel uvedla na trh v lednu 2010, pomáhají zvýšit rychlost celého počítače a tím i hlasového systému NewtonDictate. Zatímco u předchozích konfigurací počítače bylo v nastavení aplikace nezbytné předem definovat, zda bude mluvčím muž nebo žena či rozdělovat slovníky pro jednotlivé obory, s novými procesory z řady Core toto odpadá. „Inteligentní procesory se dokážou přizpůsobit individuálním potřebám uživatelů a zlepšují výkon každodenně využívaných aplikací. Technologie Intel Hyper-Threading a Intel Turbo Boost automaticky zvyšují výkon, aby aplikace vždy běžely tak, jak mají,“ uvedl Evžen Pavlovský, regionální manažer společnosti Intel pro korporátní a veřejný sektor ve střední a východní Evropě. V praxi to znamená, že s novými procesory se u systému NewtonDictate ještě více zkracuje prodleva mezi řečí a jejím zápisem, přičemž není třeba nijak omezovat software. Slovník, který v současnosti obsahuje půl milionu slov a je neustále doplňován, tak může narůst – v případě potřeby – i na dvojnásobek.

Právě propojení s technologií, zejména s výkonem procesoru, považuje Petr Herian za určující faktor pro další rozvoj hlasových technologií. „Systém pro češtinu je v současné době porovnatelný s ostatními jazyky, ale jeho možnosti dále vzrostou s další generací procesorů, které budou schopné poskytnout ještě vyšší výkon,“ říká Petr Herian, který odhaduje, že v ten moment přijde čas pro novou generaci hlasových systémů a technologií, uživatelsky ještě přizpůsobitelnějších, než jsou ty současné. Je to otázka jednoho nebo dvou let, kdy Intel představí vyšší standard, než jsou současné 32nm čipy. Dosažení „svatého grálu“ všech výzkumníků v oblasti rozpoznávání řeči, jímž je spolehlivý přepis hovorové řeči, kterou běžně slyšíme kolem nás, se dá podle Petra Heriana očekávat v horizontu 3–5 let. Dosažení tohoto milníku stojí v cestě například podmínka, že při diktování na mikrofon musí mluvčí v současnosti svůj hlas přece jen stylizovat a zřetelně vyslovovat, aby byl přepis úspěšný. V budoucnu se zvýší šance na potlačení všech rušivých prvků prostředí, akustických a fonetických vlivů či nejednoznačného kontextu. Procesory na této dobrodružné cestě objevů určitě sehrají klíčovou roli.

Nedávné úspěchy v rozvoji systémů na rozpoznávání řeči přímo souvisejí s rozvojem výkonu počítačů. Když v roce 1965 zakladatel společnosti Intel Gordon Moore vyslovil tezi (později proslavenou jako tzv. Mooreův zákon), že množství tranzistorů na jednom čipu se zdvojnásobí přibližně každé dva roky, zřejmě netušil, že i po 45 letech bude jeho teorie platit a zásadně měnit svět, ve kterém žijeme. Úspěšnost systémů, jako je NewtonDictate, a jejich začlenění do běžného života závisí na schopnosti vědců držet stejné tempo inovací jako doposud. Z generace procesorů, kterou Intel představí příští rok, je již nyní zřejmé, že se rozpoznávání řeči velmi brzy stane běžnou věcí a myšlenky typu automatického překládání do cizích jazyků v mluvené řeči již nebudou jen v oblasti sci-fi.

Chronologie významných dat v oboru rozpoznávání řeči a vývoje systému NewtonDictate

březen 1993 Intel Pentium, první procesor pro PC zvládající multimédia, předzvěst dnešních PC.

1994 Na Technické univerzitě v Liberci se dává dohromady tým vědců v oboru rozpoznávání řeči pod vedením profesora Jana Nouzy.

2005 Tým vědců z Liberce představuje první funkční prototyp systému na diktování plynulou řečí v češtině.

2006 Společnost Newton Media zahajuje exkluzivní spolupráci s týmem profesora Nouzy. Zatímco vědci z Liberce poskytují vlastní engine pro přepis řeči, vkladem společnosti Newton Media je hlasový korpus.

květen 2008 Na Právnické fakultě Masarykovy univerzity v Brně je obhájena první diplomová práce nadiktovaná hlasem.

červenec 2006 Intel Core mikroarchitektury – milník ve výkonu a energetické úspornosti.

srpen 2008 České soudy testují rozdílné hlasové systémy, NewtonDictate s oborovým slovníkem uspěje ve výběrovém řízení vyhlášeném Ministerstvem spravedlnosti ČR.

leden 2009 Nasazení 1600 licencí systému NewtonDictate na soudech a státních zastupitelstvích.

leden 2010 Intel představuje novou řadu inteligentních procesorů Intel Core, které jsou schopné zvyšovat výkon celého počítače a současně spořit energii. Spolehlivost NewtonDictate běžícího na hardwaru s těmito procesory se pohybuje nad úrovní 95 %.

2011 Uvedení nové architektury čipů Sandy Bridge, která opět posune hranice výkonu počítačů a umožní ještě plynulejší rozpoznávání řeči.


Komentáře


RSS 

Komentujeme

Chatbot mluví za mrtvého – od nápadu k realizaci

Pavel Houser , 30. listopad 2016 13:00
Pavel Houser

Na webu The Verge popsala Casey Newton příběh dvou přátel (Eugenia Kuyda a Roman Mazurenko). Peripet...

Více





Kalendář

RSS 

Zprávičky

Tchajwanský Foxconn jedná o rozšíření svých aktivit v USA

ČTK , 07. prosinec 2016 15:00

Tchajwanská společnost Foxconn jedná o rozšíření svých aktivit ve Spojených státech. Oznámila to dne...

Více 0 komentářů

Nejvyšší soud USA se postavil na stranu Samsungu proti Applu

ČTK , 07. prosinec 2016 12:30

Americký nejvyšší soud se v mnohaletém patentovém sporu mezi výrobci chytrých telefonů Apple a Samsu...

Více 0 komentářů

Evropská komise Microsoftu schválila převzetí sítě LinkedIn

ČTK , 07. prosinec 2016 10:30

Evropská komise schválila americké softwarové společnosti Microsoft záměr koupit za 26 miliard dolar...

Více 0 komentářů

Starší zprávičky

Porozumění větám, konkurence pro Turingův test

Pavel Houser , 06. prosinec 2016 18:00

Konverzační roboti mají stále problémy pochopit věty, kde smysl nelze vyvodit ze samotné gramatické ...

Více 0 komentářů

Americká GoDaddy koupí evropský webhosting Host Europe

ČTK , 06. prosinec 2016 16:00

Americký registrátor internetových domén GoDaddy, který je ve svém oboru největší na světě, se dohod...

Více 0 komentářů

Ruská Centrální banka oznámila masivní útok hackerů

ČTK , 06. prosinec 2016 11:00

Do systému ruské Centrální banky se letos dostali hackeři a s pomocí zfalšovaných hesel se pokusili ...

Více 0 komentářů

CETIN vydal dluhopisy za 25 miliard Kč

ČTK , 05. prosinec 2016 18:00

Česká telekomunikační infrastruktura (CETIN) upsala dluhopisy v eurech a korunách v celkovém objemu ...

Více 1 komentářů