• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Rozpoznávání obrazu – nenápadný příchod nové killer aplikace?

Pavel Houser
25. 11. 2014
| Články

Výzkumníci v Googlu a na Stanfordově univerzitě nezávisle na sobě oznámili, že jejich software dokáže se slušnou pravděpodobností rozpoznávat digitální fotografie a přiřadit jim význam – respektive je „oštítkovat/otagovat“ automaticky vygenerovanými textovými popisky. Použitou technologií byly v obou případech neuronové sítě, takže metody lze vlastně zařadit do oblasti umělé inteligence. Pojďme se podívat, jak zdánlivě nijak revoluční technologie může proměnit byznys.

Naučit software rozpoznávat obraz se lidé samozřejmě pokouší už dlouho, nyní mají být ale konečně výsledkem prakticky a skoro univerzálně použitelné aplikace. Článek ze Stanfordu je hodně technický a plný vzorečků, přidržíme se tedy toho, co na svém blogu uvádí Google. Tyto materiály jsou naopak pochopitelné i bez toho, aby člověk věděl, jaký je rozdíl mezi konvoluční a rekurentní neuronovou sítí.

Google tvrdí, že jeho software dokáže rozpoznávat i komplexní scény, kde jsou přítomny různé předměty i různí lidé provádějící různé činnosti – nejde tedy o žádné omezené a jednoúčelové OCR ani o vtípek, kdy telefon vyfotí úlohu v sudoku a rovnou najde řešení. Aplikace vyprodukuje popis asi ve stylu „jeden člověk jí pizzu, druhý má v rukou míč“, Google sám jako výsledek svého algoritmu uvádí i příklad „A group of people shopping at an outdoor market. There are many vegetables at the fruit stand.“ Z toho je patrné, že jde vlastně o kombinaci počítačového vidění, na které je ještě nabalena docela složitá práce s přirozeným jazykem. Popisy se mohou generovat v různých jazycích, takže technologie souvisí i s nástroji pro automatizovaný překlad.

Jak přeměnit nestrukturovaná data na strukturovaná

Šéfredaktor ZDNet a TechRepublic Larry Dignan je ve svém komentáři přesvědčen, že se zdaleka nejedná jen o hračku, která dejme tomu zefektivní vyhledávání (kde je přínos nasnadě, třeba nejprve pouze stahování alternativních popisků obrázků či videa při pomalém mobilním připojení apod. – a to i když se na otagování vykašle autor obsahu). I když se technologie bude ještě odlaďovat a některé její aplikace bude teprve třeba vymyslet, jiné přijdou rychle.

Takhle rozpoznávání obrazu funguje výzkumníkům ze Stanfordu (Andrey Karpathy, Li Fei-Fei). Zdroj: Stanford University

Takhle rozpoznávání obrazu funguje výzkumníkům ze Stanfordu (Andrey Karpathy, Li Fei-Fei). Zdroj: Stanford University

Konkrétně se má podle Dignana jednat třeba o big data. Všude je dnes plno videodat, software může nyní z nestrukturovaného chaosu udělat data strukturovaná. Když rozpoznávání předmětů spojíme s rozpoznáváním tváře, může divák náhle vznášet dotazy ve stylu „přehrajte mi všechny záběry, kde xy dal gól“ eventuálně třeba až „všechny šlehačkové bitvy z éry němého filmu“. Dnes se pod pojmem média/video on demand myslí úroveň jednotlivých pořadů, takhle si uživatel bude moci sestavit vlastní mix mnohem speciálnější.

Chytré kamery pro bezpečnost i prodej

Další přímo se nabízející aplikací je propojení se všudypřítomnými bezpečnostními kamerami. Když to opět spojíte s rozlišováním jednotlivých tváří, lze třeba v reálném čase a automaticky získat ze systému upozornění, že do budovy vešel někdo, kdo sem obvykle nechodí (přišel poprvé). Systém by mohl ihned poznat, že někdo vytáhl zbraň. Měli by se snad operátoři bezpečnostních kamer bát o práci? Kamery jsou dnes natolik všude, že nad jejich daty, kdyby byly nějak propojené, by už dnes nemuselo být problém např. hned zjistit, kam se vám zaběhl pes.

Nejde přitom jen o bezpečnost, ale také o prodej, marketing a zjišťování zákaznických preferencí. Software by hned dokázal říkat, co lidé obcházejí, co si berou do ruky, ale nakonec nedají do košíku. Když je někde na displeji upozornění na slevu, ale nikdo se tím směrem nevydává, podobu upozornění lze ihned změnit. Provozovatel restaurace by třeba dokázal nějak využít informaci, zda hosté zeleninovou oblohu spíše jedí k jídlu a nebo ji konzumují až nakonec. Na váze v supermarketu nebudete muset mačkat, jakou zeleninu vážíte, systém to pozná sám (taková chytrá váha už ovšem byla avizována před pár lety). Automatizovaná pokladna si sama poradí i s pečivem a dalším zbožím bez čárového kódu. Výhodou všech těchto aplikací navíc je, že získáte nějak přínosná data i tehdy, nebude-li rozpoznávání fungovat úplně spolehlivě, půjde je tedy asi nasazovat dostatečně rychle.

Bílé hole a roboti

Přesné vidění by se mohlo hodit ve zdravotnictví, software by automaticky vyhodnocoval různé snímky (to už zase jde asi i dnes), kamera ve sprše by vás upozornila, že piha na zádech se jí nějak nezdá (to bude ještě nějaký čas asi trvat). „Otagování“ celého světa by výrazně mohlo zvýšit objem informací, které jsou přístupné nevidomým. Chytrá bílá hůl by majitele upozorňovala na překážky i blížící se vozidla – tohle je třeba ale druh aplikace, která bude možná teprve s vysokou, prakticky 100% spolehlivostí technologie.

Zapomínat nejde na robotiku. Pokud robot, respektive jeho software dokáže rozpoznat, co předmět přesně je, bude s ním také spíše schopen adekvátně manipulovat. Se sklenicí piva se dělá něco jiného než s jablkem. Pečovatelský robot v domácnosti by měl určitě odlišovat svého majitele a nábytek. I když zde jde jen o první krok – roboti jsou dosud po pravdě řečeno docela nešikovní a kromě chytrých očí by potřebovali také šikovnější prsty. Málo se ví třeba o tom, že dosud žádný robot nedokáže pořádně ani hrát šachy. Totiž nikoliv jen manipulovat se symboly/daty, ale s reálnými fyzickými figurkami (rozpoznat je od sebe, rozpoznat tahy soupeře a mít dostatečně jemné prsty, aby robot táhl figurkou a nezbořil přitom celou pozici).
Určitě se najde i nějaké vojenské využití, třeba rozpoznávání techniky vlastní od nepřátelské, obecně vývoj stále autonomněji pracujících zbraňových systémů.

Kdo dřív přijde…

Jistěže se v souvislosti s novou technologií ozvou kritici, kteří budou poukazovat třeba na možnosti účinnějšího sledování a tedy dalšího narušení soukromí, to ale není tak podstatné. Je spíše čas položit si otázku, jak lze technologii využít ve vlastním podnikání, eventuálně jak přímo na ní postavit vlastní a dosud nemožný obchodní model. Kdo přijde první… Představte si třeba, co by se všechno dalo podniknout kombinací rozpoznávání obrazu a Apple Siri.

Konkrétní rozdělení automatického rozpoznávání podle úspěšnosti, jak ji hodnotí lidé: bez chyby, s menšími nepřesnostmi, na obrázku je něco podobného a ještě zůstává i kategorie „úplně špatně“. Google hodlá na základě těchto hodnocení technologii dále vylepšovat pomocí strojového učení.

Zdroj: Google

Rubriky: TechnologieTelekomunikace

Související příspěvky

Zprávičky

BIS: Čínská investice do pozemní družice v ČR byla bezpečnostním rizikem

18. 7. 2025
Ransomwarový útok stojí české oběti 8,25 milionu korun
Články

Kyberútočníci používají umělou inteligenci k vylepšení a urychlení útoků

17. 7. 2025
Zprávičky

Pentagon bude využívat chatbota Grok, s firmou xAI má smlouvu za 200 milionů dolarů

16. 7. 2025
Výdaje na zabezpečení v Evropě i letos porostou
Zprávičky

Oracle investuje tři miliardy dolarů do datových centrech v Německu a Nizozemsku

16. 7. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Množství zašifrovaných dat klesá, ransomware však zůstává vážnou hrozbou

Pavel Houser
18. 7. 2025

Mezi hlavní technické příčiny úspěšných ransomwarových útoků stále patří zneužité zranitelnosti (32 %), následované

Kryptoměny a jejich ekonomika

Američtí zákonodárci přijali první významný národní zákon o kryptoměnách

ČTK
18. 7. 2025

Američtí zákonodárci přijali první významný národní zákon o kryptoměnách. Návrh zákona zavádí regulační režim

Vedoucí činitelé Mety se dohodli na urovnání žaloby požadující 8 miliard dolarů

ČTK
18. 7. 2025

Výkonný ředitel americké internetové společnosti Meta Platforms Mark Zuckerberg a další současní i bývalí

BIS: Čínská investice do pozemní družice v ČR byla bezpečnostním rizikem

ČTK
18. 7. 2025

Řadu bezpečnostních rizik zaznamenala loni Bezpečnostní informační služba (BIS) při posuzování pozemní družicové stanice

Flexibilní elektronika naráží na polovodiče typu n

Zisk TSMC díky poptávce po čipech pro AI vzrostl o 61 % na rekord

ČTK
17. 7. 2025

Tchajwanské společnosti Taiwan Semiconductor Manufacturing Co. (TSMC), hlavnímu světovému výrobci pokročilých čipů pro umělou

Musk vyloučil spojení automobilky Tesla se společností xAI

ČTK
17. 7. 2025

Americký miliardář Elon Musk vyloučil spojení výrobce elektromobilů Tesla se svou společností xAI, která

Čtvrtletní zisk Googlu klesl, tržby nesplnily očekávání

IDC: Globální odbyt smartphonů ve druhém čtvrtletí vzrostl o procento

ČTK
17. 7. 2025

Celosvětový odbyt chytrých telefonů se v letošním druhém čtvrtletí meziročně zvýšil o procento na

Evropské agentury Europol a Eurojust rozbily proruskou hackerskou skupinu

ČTK
16. 7. 2025

Evropské agentury Europol a Eurojust rozbily v rámci operace Eastwood proruskou hackerskou skupinu s

Tiskové zprávy

ÚOHS: Pokuta 200 000 Kč pro Ministerstvo pro místní rozvoj

Ministerstvo pro místní rozvoj nabízí odměny za odhalení bezpečnostních děr ve svých IT systémech

O2 production sází na Panasonic Kairos

AI pomoc pro přetížené týmy ve finančním sektoru

HP představuje digitální tiskový stroj HP Indigo 6K+

GFI Archiver integruje AI CoPilot pro výkonnější správu e-mailových archivů

Zpráva dne

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Redakce
15. 5. 2025

Kupte Windows 11 CDkey od Goodoffer24.com a můžete růst s tímto OS jak při...

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Slovník

Embosovaná platební karta

2,5G

SPIR

Nejpopulárnější články

Žádný obsah není dostupný

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.