Když obrázek není tím, čím se zdá být

Pavel Houser , 10. listopad 2018 06:30 0 komentářů

Problematika falešných zpráva je dnes módní záležitostí. Následující výzkum se zaměřuje na jeden speciální aspekt tohoto problému, multimediální obsah.

Klasickými metodami dokážeme maximálně určit, zda je určitá fotografie, video nebo audio soubor upravená/umělé vytvořená apod. I zde přitom zůstává otázka, jak spolehlivé je takové rozpoznání, zvlášť když třeba neuronové sítě se mohou nejen učit falešný obsah odhalovat, ale i vytvářet.

Vědci z University of California v Davisu se ale soustředili na jiný problém. Mnohdy se stane, že určitý multimediální soubor se rozšíří po sociálních sítích apod. platformách, ale je připojen k jinému obsahu než původně. Sám o sobě je sice autentický, ale fotografii jednoho letadla např. přidáte k informaci o havárii jiného apod. Video původně patřící k letadlu US Airways 1549 (nouzové přistání letadla na řece Hudson v roce 2009) se tak dostalo k vymyšleným zprávám o Malaysia Airlines 370 (letadlo, které záhadně zmizelo v roce 2014 během letu z Kuala Lumpur do Pekingu); to se dalo odhalit snadno, protože v obou případech šlo o velmi dobře zpravodajsky pokryté události. Někdy nemusí jít ani o úmysl klamat, ale prostě o přidání podobného ilustračního obrázku z nějaké databáze, o záměrnou hříčku v podobě odkazu k jiné události apod.

Nová studie zatím publikovaná na serveru arXiv (práce, které neprošly odbornou oponenturou), sleduje vazbu mezi multimediálním obsahem a doprovodným textem a přitom porovnává různé platformy, např. Facebook, Google (zde zejména hledání Google Images), Baidu a Twitter. Protože obsah na nich je v různých jazycích, proces zahrnuje i překlady, respektive extrakci informací. Hlavní použitou metodou je nikoliv překvapivě strojové učení. Při vlastní práci se postupuje tak, že v příslušné tabulce jednotlivých zdrojů se vytvoří abstraktní, na jazyce nezávislý vyextrahovaný „význam“ a mezi všemi platformami se pak tato data porovnávají mezi sebou.

Samozřejmě dochází pouze k porovnávání různých platforem a kontrole toho, zda se text provázející multimediální obsah přibližně shoduje. Systém nedokáže detekovat problém, pokud je příslušná informace obdobná na všech zdrojích (s tím si ovšem těžko může poradit i člověk); určí ale, kde došlo ke zkreslení významu a jaký kontext multimédií je zřejmě správný (převládající, starší/původní apod.). Cílem je nejen zjistit, že nějaká informace je fáma, ale i identifikovat, jak se vynořila, tj. kde jako poprvé byl např. obrázek použit přiřazený k jiné události.

Zdroj: TechXplore.com


Komentáře

RSS 

Komentujeme

Rok androidů a elektrických oveček

Pavel Houser , 16. leden 2019 12:00
Pavel Houser

Co si o roce 2019 mysleli P. K. Dick, R. Scott a I. Asimov a nakolik jim jejich prognózy vyšly?...

Více

Kalendář

25. 01.

27. 01.
DevConf.cz 2019
29. 01. Reshoper 2019
19. 03.

22. 03.
Amper 2019







RSS 

Zprávičky

Huawei podle zakladatele během pěti let zdvojnásobí tržby

ČTK , 22. leden 2019 09:00

Podle zakladatele společnosti Huawei firma své nynější potíže předvídala již před deseti lety....

Více 0 komentářů

Francie vyměřila Googlu pokutu 50 milionů eur

ČTK , 22. leden 2019 08:00

Google si prý nedokázal zajistit adekvátní souhlas uživatelů pro zpracování jejich dat za účelem per...

Více 0 komentářů

Ruský úřad vede správní řízení s Facebookem a Twitterem

ČTK , 21. leden 2019 15:52

Ruské zákony vyžadují, aby údaje o ruských uživatelích byly uchovávány v Rusku....

Více 0 komentářů

Starší zprávičky

Ministerstvo práce selhalo při IT zakázkách, tvrdí NKÚ

ČTK , 21. leden 2019 10:50

Resort podle NKÚ porušil rozpočtovou kázeň za půl miliardy korun....

Více 0 komentářů

V USA zvažují rekordní pokutu pro Facebook

ČTK , 20. leden 2019 08:00

Americké dozorčí orgány zvažují, že uloží internetové společnosti Facebook rekordní pokutu za nedost...

Více 0 komentářů

Země EU se neshodly na podobě směrnice o digitálním copyrightu

ČTK , 19. leden 2019 09:00

Proti sobě stojí ekonomické zájmy velkých internetových firem a mediálních domů, padají ostrá slova ...

Více 0 komentářů

Databáze s 21 miliony hesly

ČTK , 19. leden 2019 08:00

Australan upozornil na dosud patrně největší únik e-mailů a hesel....

Více 0 komentářů