• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Nová technologie zjišťující autora textu se dá použít i k personalizaci

Pavel Houser
31. 1. 2023
| Tiskové zprávy

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci (FF UP) vyvinuli unikátní technologii, která umožňuje automatické profilování osob. Zcela nová technologie najde využití v uzpůsobování internetového obsahu, v reklamě, v personalistice i při komunikaci s ohroženými skupinami lidí. Pomůže také psychologům, vyšetřovatelům i při procesech vedoucích k rozvoji bezpečnosti státu. Po několikaletém výzkumu a vypracování potřebných rešerší je nová technologie evidována na patentovém úřadu v USA.

Už řadu let se odborníci z katedry obecné lingvistiky FF UP věnují vlastnostem textu, které jsou založeny na frekvencích. Princip frekvenčních analýz je dlouhodobě ověřenou metodou, využívanou například při detekci autorství. Zatímco klasická lingvistika se v tomto smyslu zabývá jevy s vyšší frekvencí, olomoučtí lingvisté Dan Faltýnek, Martina Benešová, Ondřej Kučera a Vladimír Matlach, členové katedry obecné lingvistiky a katedry asijských studií, si po několikaletém bádání povšimli, že ještě lepší výsledky lze získat i s využitím méně častých jevů. Při analýze pracovali například s texty spisovatelů, jako je Jack Kerouac nebo Joanne K. Rowlingová, zkoumali písemné projevy politiků Karla Marxe, Silvia Berlusconiho nebo Václava Havla, texty masových vrahů, k nimž patří třeba Elliot Roger nebo Theodore Kaczynski, nebo také vzorky textů podnikatele a filantropa Elona Muska.

„S kolegy jsme zjistili, že podle nízko frekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka. Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na sentiment (postoj řečníka k určitému tématu – pozn. red.) otiskem autora,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Tento objev je převratný, neboť dosavadní metody takto vysokou jistotu autorství nepřinášely. Olomouckým vědcům dnes díky nové technologii stačí poměrně krátký vzorek, zhruba dvě stě až pět set slov, aby mohli dokázat nějaké procento autorství. Pokud obdrží zhruba tisíc pět set slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti.

Nová technologie, která je nyní v procesu patentového řízení, dokáže extrahovat profil lidí. To, jaká slova člověk opakuje, může například poukázat na jeho psychický stav nebo sociální oblast. Technologii tak lze využít v personalistice, v online psychoterapii, v soudních kauzách nebo při komunikaci s ohroženými skupinami. Své místo najde také při tvorbě personalizované reklamy či v boji proti extrémismu, terorismu a dezinformacím díky možnosti identifikovat inkriminované osoby. To vše zahrnuje oblast tak zvané umělé inteligence, v tomto případě tedy způsob zpracování digitálního textu.

„Možností, kde se naše technologie dá zužitkovat, je opravdu hodně. Lze ji využít i na obranu proti personalizaci, tedy k tomu, aby již řečeným způsobem k ovlivňování chování osob na internetu naopak nedocházelo. V rámci programu Open Calls for Security Research (OPSEC) jsme byli čtyřmi ze čtyř posudků ohodnoceni jako projekt doporučený k rozvoji bezpečnosti státu. Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Martina Benešová.

Unikátní technologie vědců z katedry obecné lingvistiky a katedry asijských studií FF UP je konkurencí technologiím Adobe i Google.

„Od počátku našich výzkumů, kdy jsme pracovali pouze s tužkou a papírem, jsme se vypracovali k automatizovanějším postupům. Díky grantu Vědeckotechnického parku Univerzity Palackého v Olomouci jsme mohli zaplatit náklady související s podáním patentu. Při vývoji samém jsme spolupracovali i se studenty, kolegy a interními i externími subjekty. K uvedenému výsledku by rozhodně nemohlo dojít bez spolupráce s Inovačním centrem Olomouckého kraje, které nám pomohlo s návrhem technologické inkubace. Patentový zástupce již vypracoval rešerše, které dokázaly, že je naše technologie skutečně nová,“ doplnil Ondřej Kučera z FF UP.

Olomoucká technologie s názvem „System and method for adapting text-based data structures to text samples“ je v tuto chvíli již pod patentovou ochranou. Díky několikaleté intenzivní práci vědci z FF UP disponují třemi softwary šitými na míru uvedené technologii, jejichž činnost by rádi propojili. Téma, jemuž se na katedře obecné lingvistiky a katedře asijských studií FF UP věnují, však nabízí další možnosti bádání a už nyní přemýšlí o dalších patentových možnostech. Všechny uvedené technologické kroky bude výzkumný tým předávat studentům v novém profesně zaměřeném bakalářském studijním programu Jazykovědný analytik na FF UP.

tisková zpráva Univerzity Palackého v Olomouci
Rubriky: České ITScience

Související příspěvky

Zprávičky

Web pražské integrované dopravy napadli neznámí útočníci útokem DDoS

24. 3. 2023
Zprávičky

CETIN loni zvýšil zisk o 12 % na 2,88 miliardy Kč

24. 3. 2023
Vláda projedná novelu, která zpřesní pravomoci NÚKIB
Zprávičky

Zákon o dezinformacích posuzují experti, Rakušan ještě zváží jeho předložení

24. 3. 2023
Masivní výpadek na polské železnici způsobila softwarová chyba (aktualizováno)
Zprávičky

Konsorcium tří českých firem vybuduje komunikační síť na slovenské železnici

23. 3. 2023

Zprávičky

Web pražské integrované dopravy napadli neznámí útočníci útokem DDoS

ČTK
24. 3. 2023

Internetové stránky pražské integrované dopravy (PID) dnes ráno napadli neznámí útočníci. Web zablokovali útokem

CETIN loni zvýšil zisk o 12 % na 2,88 miliardy Kč

ČTK
24. 3. 2023

Největší tuzemský provozovatel telekomunikační infrastruktury CETIN loni zvýšil čistý zisk o téměř 12 procent

Kryptoměny a jejich ekonomika

V USA obvinili exšéfa kryptoměnové společnosti Terrraform Labs z podvodů

ČTK
24. 3. 2023

Američtí vyšetřovatelé obvinili někdejšího šéfa kryptoměnové společnosti Terrraform Labs To Kwona z několika podvodů.

Vláda projedná novelu, která zpřesní pravomoci NÚKIB

Zákon o dezinformacích posuzují experti, Rakušan ještě zváží jeho předložení

Pavel Houser
24. 3. 2023

Ministerstvo vnitra připravilo návrh zákona pro boj s dezinformacemi, nyní ho posuzují odborníci, resort

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

Vedení Toshiby přijalo návrh na převzetí konsorciem v čele s firmou JIP

ČTK
23. 3. 2023

Vedení japonského průmyslového konglomerátu Toshiba přijalo návrh na převzetí podniku od konsorcia firem v

Masivní výpadek na polské železnici způsobila softwarová chyba (aktualizováno)

Konsorcium tří českých firem vybuduje komunikační síť na slovenské železnici

ČTK
23. 3. 2023

Konsorcium tří českých firem pod vedením pražské společnosti Kontron Transportation získalo na Slovensku zakázku

Pětice motorů technologických inovací v příští dekádě

Google zpřístupnil veřejnosti chatbota Bard, chce konkurovat Microsoftu

ČTK
22. 3. 2023

Americká internetová společnost Google v úterý zpřístupnila veřejnosti konverzačního robota Bard. Konkurovat bude službě

Hrozby pro Android: Adware zůstává v Česku úspěšný

Pavel Houser
21. 3. 2023

Pravidelná statistika kybernetických hrozeb v únoru opět potvrdila převahu adwaru na platformě Android v

Tiskové zprávy

Nejnovější řada notebooků Lenovo Legion Slim

MiR uvádí nový cloudový software pro optimalizaci řízení robotických flotil

Změní generativní umělá inteligence pravidla hry?

SAP představuje nový balíček řešení pro střední firmy

ČSÚ: Více než polovina velkých průmyslových podniků využívá 3D tisk

CyberSecurity Podcast: Vše o nové evropské směrnici NIS 2

Zpráva dne

Březnový prodej – doživotní licence na Windows 10 za Goodoffer24 € 12 a Office za € 23!

Březnový prodej – doživotní licence na Windows 10 za Goodoffer24 € 12 a Office za € 23!

Redakce
3. 3. 2023

Ať už hledáte levnější cestu jak postavit nový počítač, nebo jen chcete upgradovat stárnoucí...

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Komentujeme

Chvála černých skřínek

Programování s pomocí umělé inteligence a open source licence

Pavel Houser
15. 3. 2023

S tím, jak se rozšiřuje využití umělé inteligence přímo při tvorbě softwaru, se intenzivněji začínají diskutovat...

Nadcházející akce

  1. Hannover Messe 2023

    17. dubna - 21. dubna

Zobrazit všechny Akce

Slovník

Dezinflace

Infiltration marketing

L-Band

Nejpopulárnější články

OKI na veletrhu EmbaxPrint zaujala potiskem etiket

OKI na veletrhu EmbaxPrint zaujala potiskem etiket

Tomáš Jirásko
1. 3. 2023

Kvalitních IT specialistů je nedostatek a práce na dálku jim může přinést až o 25 % víc peněz

Redakce
3. 3. 2023

Umělá inteligence: Nástroje vs. platforma, věda vs. kreativita

ChatGPT uspěl v testu teorie mysli

Pavel Houser
21. 2. 2023

Celosvětové výdaje na IT v letošním roce podle Gartneru vzrostou o 2,4 %

Redakce
23. 2. 2023

Mýty kolem digitalizace firmy (1): Digitalizace je jen IT projekt a adopce je ztráta času

Mýty kolem digitalizace firmy (1): Digitalizace je jen IT projekt a adopce je ztráta času

itbiz
2. 3. 2023

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Rozhovory Science Security techn Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT česk

Píšeme jinde

RSS ScienceMag RSS

  • Asteroid 2023 DZ2 proletí o víkendu kolem Země
  • Fyzici objevili dosud neznámé efekty u kvantových detektorů světla
  • Hra Bridg-It a důkaz sporem

RSS AbcLinuxu RSS

  • Mercurial 6.4
  • Byly rozdány Ceny Velkého bratra (Big Brother Awards) za rok 2022
  • Online vzdělávací platforma Ada Computer Science

Newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.