• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Nová technologie zjišťující autora textu se dá použít i k personalizaci

Pavel Houser
31. 1. 2023
| Tiskové zprávy

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci (FF UP) vyvinuli unikátní technologii, která umožňuje automatické profilování osob. Zcela nová technologie najde využití v uzpůsobování internetového obsahu, v reklamě, v personalistice i při komunikaci s ohroženými skupinami lidí. Pomůže také psychologům, vyšetřovatelům i při procesech vedoucích k rozvoji bezpečnosti státu. Po několikaletém výzkumu a vypracování potřebných rešerší je nová technologie evidována na patentovém úřadu v USA.

Už řadu let se odborníci z katedry obecné lingvistiky FF UP věnují vlastnostem textu, které jsou založeny na frekvencích. Princip frekvenčních analýz je dlouhodobě ověřenou metodou, využívanou například při detekci autorství. Zatímco klasická lingvistika se v tomto smyslu zabývá jevy s vyšší frekvencí, olomoučtí lingvisté Dan Faltýnek, Martina Benešová, Ondřej Kučera a Vladimír Matlach, členové katedry obecné lingvistiky a katedry asijských studií, si po několikaletém bádání povšimli, že ještě lepší výsledky lze získat i s využitím méně častých jevů. Při analýze pracovali například s texty spisovatelů, jako je Jack Kerouac nebo Joanne K. Rowlingová, zkoumali písemné projevy politiků Karla Marxe, Silvia Berlusconiho nebo Václava Havla, texty masových vrahů, k nimž patří třeba Elliot Roger nebo Theodore Kaczynski, nebo také vzorky textů podnikatele a filantropa Elona Muska.

„S kolegy jsme zjistili, že podle nízko frekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka. Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na sentiment (postoj řečníka k určitému tématu – pozn. red.) otiskem autora,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Tento objev je převratný, neboť dosavadní metody takto vysokou jistotu autorství nepřinášely. Olomouckým vědcům dnes díky nové technologii stačí poměrně krátký vzorek, zhruba dvě stě až pět set slov, aby mohli dokázat nějaké procento autorství. Pokud obdrží zhruba tisíc pět set slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti.

Nová technologie, která je nyní v procesu patentového řízení, dokáže extrahovat profil lidí. To, jaká slova člověk opakuje, může například poukázat na jeho psychický stav nebo sociální oblast. Technologii tak lze využít v personalistice, v online psychoterapii, v soudních kauzách nebo při komunikaci s ohroženými skupinami. Své místo najde také při tvorbě personalizované reklamy či v boji proti extrémismu, terorismu a dezinformacím díky možnosti identifikovat inkriminované osoby. To vše zahrnuje oblast tak zvané umělé inteligence, v tomto případě tedy způsob zpracování digitálního textu.

„Možností, kde se naše technologie dá zužitkovat, je opravdu hodně. Lze ji využít i na obranu proti personalizaci, tedy k tomu, aby již řečeným způsobem k ovlivňování chování osob na internetu naopak nedocházelo. V rámci programu Open Calls for Security Research (OPSEC) jsme byli čtyřmi ze čtyř posudků ohodnoceni jako projekt doporučený k rozvoji bezpečnosti státu. Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Martina Benešová.

Unikátní technologie vědců z katedry obecné lingvistiky a katedry asijských studií FF UP je konkurencí technologiím Adobe i Google.

„Od počátku našich výzkumů, kdy jsme pracovali pouze s tužkou a papírem, jsme se vypracovali k automatizovanějším postupům. Díky grantu Vědeckotechnického parku Univerzity Palackého v Olomouci jsme mohli zaplatit náklady související s podáním patentu. Při vývoji samém jsme spolupracovali i se studenty, kolegy a interními i externími subjekty. K uvedenému výsledku by rozhodně nemohlo dojít bez spolupráce s Inovačním centrem Olomouckého kraje, které nám pomohlo s návrhem technologické inkubace. Patentový zástupce již vypracoval rešerše, které dokázaly, že je naše technologie skutečně nová,“ doplnil Ondřej Kučera z FF UP.

Olomoucká technologie s názvem „System and method for adapting text-based data structures to text samples“ je v tuto chvíli již pod patentovou ochranou. Díky několikaleté intenzivní práci vědci z FF UP disponují třemi softwary šitými na míru uvedené technologii, jejichž činnost by rádi propojili. Téma, jemuž se na katedře obecné lingvistiky a katedře asijských studií FF UP věnují, však nabízí další možnosti bádání a už nyní přemýšlí o dalších patentových možnostech. Všechny uvedené technologické kroky bude výzkumný tým předávat studentům v novém profesně zaměřeném bakalářském studijním programu Jazykovědný analytik na FF UP.

tisková zpráva Univerzity Palackého v Olomouci
Rubriky: České ITScience

Související příspěvky

Zprávičky

Česko začalo jednat s Polskem o společné přihlášce do projektu AI Gigafactory

28. 11. 2025
NKÚ kontroloval bezpečnostní výzkum financovaný Ministerstvem vnitra
Zprávičky

Kriminalistický ústav bude využívat robotické zařízení pro zkoumání předmětů

28. 11. 2025
Zprávičky

ČR si letos v žebříčku zemí podle digitálního prostředí polepšila na 24. místo

27. 11. 2025
Centra služeb míří do ČR kvůli lidem a poloze
Zprávičky

Průzkum Acronis: téměř 50 % českých organizací si nemůže dovolit ztratit data za více než 4 hodiny

27. 11. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Česko začalo jednat s Polskem o společné přihlášce do projektu AI Gigafactory

ČTK
28. 11. 2025

Česko začalo jednat s Polskem o společné přihlášce do projektu evropské AI Gigafactory. Součástí

Komise: Služby Apple Ads a Apple Maps by měly v EU podléhat přísnějším pravidlům

ČTK
28. 11. 2025

Služby Apple Ads a Apple Maps americké technologické společnosti Apple jsou v prostředí internetu

NKÚ kontroloval bezpečnostní výzkum financovaný Ministerstvem vnitra

Kriminalistický ústav bude využívat robotické zařízení pro zkoumání předmětů

ČTK
28. 11. 2025

Kriminalistický ústav bude od příštího roku využívat nové robotické zařízení Erbium, které umožní bezpečně

Čínské firmy trénují modely AI v cizině, aby měly přístup k čipům od Nvidie

ČTK
28. 11. 2025

Čínské technologické společnosti trénují modely umělé inteligence (AI) v zahraničí. Daří se jim tak

Riziko prolamování šifrované komunikace: Státy EU se shodly na návrhu proti dětské pornografii, Česko hlasovalo proti (aktualizace)

ČTK
27. 11. 2025

Zástupci členských států EU se včera shodli na návrhu, který má bojovat proti šíření

ČR si letos v žebříčku zemí podle digitálního prostředí polepšila na 24. místo

ČTK
27. 11. 2025

Česká republika si v celosvětovém hodnocení kvality digitálního prostředí letos polepšila o tři příčky

Counterpoint: Apple se letos vrátí do čela světového trhu s chytrými telefony

ČTK
27. 11. 2025

Americká technologická společnost Apple se v letošním roce poprvé za více než deset let

Centra služeb míří do ČR kvůli lidem a poloze

Průzkum Acronis: téměř 50 % českých organizací si nemůže dovolit ztratit data za více než 4 hodiny

Pavel Houser
27. 11. 2025

17 % respondentů vyžaduje od systémů obnovy po havárii, aby garantovaly zálohu starou maximálně

Tiskové zprávy

Huawei uvedla na trh nové konvergované systémy úložišť OceanStor Dorado

Společnost Hewlett Packard Enterprise ocenila v Česku Partnery roku 2025

Spisová služba GINIS společnosti Gordic získala jako první atest

Zyxel Networks představuje první průmyslový WiFi 7 přístupový bod pro rychlejší přechod na průmysl 4.0

Nové skenery Canon imageFORMULA: Maximální výkon na minimálním prostoru

Když cloud nestačí: proč se firmám vyplatí trvalé licence Microsoft

Zpráva dne

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Redakce
15. 10. 2025

Halloween je tady a s ním i strašidelné ceny za software! Tak neváhejte a...

Komentujeme

Chvála černých skřínek

Neocloudy – nové slovo, prudký růst?

Pavel Houser
24. 11. 2025

Opět se vše točí kolem GPU a AI. Poskytovatelé cloudových služeb nového typu („neoclouds“) mají v...

Slovník

AKA

BSPlayer

SOS – Share of Spend

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.