• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Autora programu lze určit nejen ze zdrojového kódu

ITBiz.cz
24. 4. 2018
| Články

Zdrojový kód každého autora je specifický málem jako literární styl, nicméně moderní nástroje prý umožňují identifikovat tyto vlastnosti celkem spolehlivě i ve zkompilovaném kódu. Může to být využitelné např. při pátrání po tvůrcích malwaru nebo v jiných forenzních aplikacích; mnoho programátorů může však současně mít pocit ohrožení soukromí.
Výzkumníci z Princeton University, Drexel University, Braunschweig University of Technology a společností Sophos a Shiftleft ukázali ve studii publikované na preprintovém serveru ArXiv, jak lze nástroje zkoumající styl nasadit i na binární soubory. Stačí pomocí strojového učení dostatečně vytrénovat program na obdobných známých vzorcích a pak binární soubor dekompilovat do kódu podobného jazyku C (jistě by šlo provést i jinak). Vlastní použitý proces je několikastupňový, přes assembler až po tvorbu abstraktního syntaktického stromu, a využívá více nástrojů (Radare2, ndisasm, Hex-Rays) – ti si autoři výzkumu sami nevyvíjeli, takže zde je další prostor pro zvýšení účinnosti, vytvořením speciálních nástrojů šitých na míru.

Při kompilování se celá řada atributů původního zdrojového kódu samozřejmě ztratí, např. i v důsledku optimalizace. Komentáře, mnohá metadata nebo i názvy proměnných a funkcí se již dekomplilací obnovit nedají, ale i tak zbude dost individuálních rysů – alespoň pro současné programy umělé inteligence. Jaká je úspěšnost přiřazení autora? Výzkumníci zkusili své neuronové sítě na dvou typech vzorků, z Google Code Jam a veřejných repozitářů na GitHubu.

U Google Code Jam dostal algoritmus strojového učení na začátek 8 programů každého účastníka. Mezi 100 programátory pak šlo autora určit s úspěšností 96 %, mezi 600 poklesla na 83 %. Zajímavé je, že úspěšnost identifikace stoupala s pokročilostí programátora – čím jsou lepší, tím mají víc vlastní styl (přitom by se dalo čekat, že naopak snadněji by šlo odhalit programátory podle toho, že používají neefektivní, suboptimální řešení, špatně lze věc udělat více způsoby než správně; možná by se to dalo porovnávat třeba s identifikací děl malířů, šachistů apod. v závislosti na jejich kvalitě).

U GitHubu byla úspěšnost menší, asi 65 % při 50 programátorech. To podle autorů výzkumu vyplývá hlavně z toho, že kód mnohdy obsahuje části, jejichž autorem byl někdo jiný než vlastník repozitáře.

Další otázkou je, co se stane, pokud autoři programu budou kromě komplikace mít snahu záměrně své dílo anonymizovat, tedy např. odstranit operace o symbolech, měnit operace za jejich sémantické ekvivalenty nebo dokonce přidávat nepotřebné příkazy (tedy používat různé techniky obfuskace, ty jsou ovšem ve stávající podobě určeny pro znečitelnění zdrojového kódu). Samozřejmě záleží na tom, jaké konkrétní nástroje se k tomu použijí, ale podle autorů výzkumu se tím přiřazení autorství neznemožní, i když úspěšnost identifikace programátora přirozeně poklesne.

Techniky znáhodňování kódu používají na různé úrovni už dávno tvůrci malwaru, nemusí jim to ale být nic platné (pokud ovšem není kód dílem velké skupiny, která navíc využívá ještě jiné části kódu). Také lze tímto způsobem třeba odhalovat autorství programů, které se z řady důvodů nelíbí v některých státech – obcházejí cenzuru, firewally, nabízejí šifrování apod. Mohou takto prostě vycházet najevo různé věci, bez ohledu na to, na čí straně budou v konkrétních případech naše sympatie.

Co doporučit vývojářům, kteří si chtějí zachovat anonymitu? Podle autorů výzkumu je nejjednodušší v první řadě nepoužívat veřejné přístupné repozitáře kódů. Pro každý uvolněný kód lze vytvořit jinou identitu – neuronová síť nejprve potřebuje určitý vzorek, aby se „naučila“ styl konkrétního člověka, s hromadou autorů jediného programu si asi pořádně poradit nedokáže. The Register cituje Ailyn Calyskan z Princetonu, která navíc rozebírá účinnost různých speciálních technik na proces detekce (např. náhodně vždy použít různých obfuskačních nástrojů apod.). Nakonec některé věci stejně náhodné nejsou, malware třeba komunikuje s určitými řídicími servery, odesílá určitá data – to už ale není předmětem vlastní práce.

Rubriky: ByznysČeské ITCloudEkomerceInternetOperační systémyPodnikový softwarePrávoScienceSecurityTechnologieVývoj a HTML

Související příspěvky

Zprávičky

Vláda vybrala 55 strategických projektů v rámci digitalizace agend (aktualizováno)

25. 5. 2026
Zprávičky

InPost spouští nabídku na převzetí za 7,8 mld. eur, odkup potrvá do července

25. 5. 2026
Zprávičky

Google, Meta a TikTok čelí v EU stížnosti kvůli podvodným inzerátům

25. 5. 2026
Umělá inteligence: Nástroje vs. platforma, věda vs. kreativita
Zprávičky

Papež v encyklice o AI varoval před dezinformacemi a dopady umělé inteligence

25. 5. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Zprávičky

Vláda vybrala 55 strategických projektů v rámci digitalizace agend (aktualizováno)

ČTK
25. 5. 2026

Vláda vybrala 55 strategických projektů v digitalizaci, ke každému určila odpovědného manažera. Vychází přitom

InPost spouští nabídku na převzetí za 7,8 mld. eur, odkup potrvá do července

ČTK
25. 5. 2026

Nabídka na převzetí polské společnosti InPost za 7,8 miliardy eur (189,4 miliardy Kč) potrvá

Google, Meta a TikTok čelí v EU stížnosti kvůli podvodným inzerátům

ČTK
25. 5. 2026

Internetové společnosti Google, Meta Platforms a TikTok čelí v Evropské unii stížnosti ze strany

Umělá inteligence: Nástroje vs. platforma, věda vs. kreativita

Papež v encyklice o AI varoval před dezinformacemi a dopady umělé inteligence

ČTK
25. 5. 2026

Papež Lev XIV. ve své první encyklice Magnifica Humanitas (Skvělé lidství), která se věnuje

ECB svolává banky k jednání o rizicích odhalených umělou inteligencí

ČTK
24. 5. 2026

Evropská centrální banka (ECB) vyzve finanční instituce, aby urychlily práce na zabezpečení svých počítačových

Soud se bude znovu zabývat pokutou 125 milionů korun pro MPSV

ČTK
23. 5. 2026

Pražský městský soud se bude muset znovu zabývat žalobou, kterou se ministerstvo práce a

Čtvrtletní zisk výrobce počítačů Lenovo se více než zdvojnásobil, tržby rekordní

ČTK
22. 5. 2026

Očištěný čistý zisk čínského výrobce počítačů Lenovo se ve fiskálním čtvrtém čtvrtletí více než

SpaceX vynesla další sérii 60 družic sítě Starlink

Muskova SpaceX v prvním čtvrtletí vykázala ztrátu 4,3 miliardy dolarů

ČTK
21. 5. 2026

Americká vesmírná společnost SpaceX miliardáře Elona Muska v prvním čtvrtletí letošního roku hospodařila s

Tiskové zprávy

eDoklady mají milion uživatelů

Synology uvádí PAS7700, active-active NVMe platformu pro kritická podniková prostředí

Průměrná měsíční spotřeba dat na jednu datovou SIM kartu vzrostla na 15,1 GB

HP představuje nové velkoformátové tiskárny pro malé a střední firmy

ViewSonic podpořil Halu roku 2026

Q1 výsledky společnosti T-Mobile

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Kvě 26
Celý den

Umelá inteligencia v IT infraštruktúre

Zář 23
Celý den

Cyber Attacks

Zobrazit kalendář

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

WAP

Recruitment specialist

Alfanumerická část klávesnice

Komentujeme

itbiz kamil pittner

Znamená pomalost přemýšlivost? A co u AI?

Kamil Pittner
8. 5. 2026

Dodavatelé modelů AI soupeří o to, aby jejich systémy poskytovaly nejen lepší odpovědi, ale také pracovaly...

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.