Umělá inteligence a psaní románů

Pavel Houser , 18. prosinec 2014 07:00 0 komentářů
Umělá inteligence a psaní románů

Inteligenci či lidskost ztotožňujeme především s jazykem. Není asi náhodou, že Turingův test byl zformulován jako konverzační hra, od programu „psychoterapeutického“ Eliza jsou populární všemožné chatboty a jednou z nejcennějších technologií Applu je Siri. Používat jazyk ale znamená nejen konverzovat. Jak se dnešní programy dokáží vypořádat s jinou jazykovou dovedností, totiž vytvořit literární dílo?

O některých současných počinech a technikách si můžeme udělat představu ze soutěže NaNoGenMo (National Novel Generation Month), kde se představují programy určené pro psaní románů, respektive související experimenty s textem. Akci založil vývojář Darius Kazemi a letos se konala teprve podruhé.

Dlužno říci, že podle všeho se loni i letos programátoři pokoušeli spíše bavit než vytvářet texty považované za dílo člověka (respektive jiného člověka než surrealisty atd.). Mnohé programy vycházely z projektu Gutenberg nebo se jinak snažily se o zpracování a přeskládávání již existujících textů. Pro spisovatele i kohokoliv jiného by použití obrovského rezervoáru obsahu v projektu Gutenberg bylo zajímavé minimálně tím, že není zatížen autorskými právy.

Pojďme teď k jednotlivým projektům. Například Nick Montfort, básník a specialista na nová média z MITu, si vystačil s pouhými 165 řádky kódu v Pythonu. Výsledný příběh je trhaný a v podstatě se – nikoliv překvapivě – nedá číst. Smysl dává tak na úrovni jedné náhodně otevřené stránky.

To je vůbec problém i dalších počítačově generovaných textů. Mají-li mít alespoň nějakou úroveň, většinou jde o kratší příběhy. Ještě lepší výsledky získáme, nacházíme-li se v nějakém zúženém kusu jazyka/reality. Podobně jako se velmi osvědčují automatizované prostředky pro tvorbu či překlad technické dokumentace, společnost Narrative Science má nástroje, které dokáží zpracovávat informace o finančních trzích (respektive firemní reporty) a sportu a z nich vytvářet články podle předdefinovaných vzorů.

Výsledné texty sice stále nejsou bezchybné, ale vznikají prakticky okamžitě – a navíc v nich na rozdíl od zpracování člověkem nevznikají chyby věcné, třeba překlepy v číslech. Novináři by se mohli bát o práci, k k čemuž ovšem stejně mají tisíce jiných důvodů i bez umělé inteligence.

Jak dopadne Pýcha a předsudek?

Na rozdíl od seriózně míněných a současně komerčně ambiciózních projektů se na NaNoGenMo účastníci snaží sebe i své okolí zatím skutečně spíše jen pobavit. Sám Kazemi třeba vytvořil program Teens Wander Around a House, tj. několik agentů, kteří při setkání v příslušném chatroomu vytvářeli dialogy podle konverzací odchycených na Twitteru. Jeden z programů se např. zmínil o večeři, druhý to rozpoznal jako klíčové slovo a zareagoval na to třeba poznámkou o tom, že večeře je jeho oblíbené jídlo dne. Konverzace byly sice rámcově konzistentní, ale nepřekvapivě jako celek opět nedávaly moc smysl.

Michelle Fullwoodová z MITu vytvořila program Twide and Twejudice. Jedná se o Pýchu a předsudek, ovšem v textu tohoto klasického díla je každé slovo nahrazeno takovým, o němž program na základě analýzy příspěvků z Twitteru usoudí, že jde o synonymum, respektive že se toto slovo používá ve stejném/podobném kontextu. Z nějakého důvodu autorka takto v původním textu přepisuje pouze dialogy. Výsledek je ovšem stejně surealisticky absurdní, text občas získá vzhledem k originálu i přímo opačný význam.

Některé projekty NaNoGenMo jsou opravdu jen kombinatorikou, Liza Dalyová třeba vytvořila vlastní verzi známého Vojnichova rukopisu, když náhodně proházela jeho „slova“ a doplnila je starými botanickými a alchymistickými zobrazeními/symboly, které si program našel v rámci databáze Internet Archive. Podobně program Definition Book zase s textem pracuje tak, že první polovinu „románu“ tvoří první poloviny vět, druhou jejich druhé poloviny.

Temný komiks i mňoukání

Greg Borenstein předvedl program Generated Detective. Ten v rámci detektivek v projektu Gutenberg hledá věty obsahující vedle sebe slova jako question, murderer, witness, killer či weapon. Poté tyto sentence hledá na Flickeru, vezme příslušný obrázek a použije ho jako políčko komiksu.

Výsledný žánr se prý podobá chmurným noirovým příběhům, jsou snové, absurdní a dýchá z nich chlad nelidského mezihvězdného prostoru. Zatím mají texty podobu popisků, ještě by to chtělo dokázat na obrázku nějak rozpoznávat obličeje a přidávat do nich „bubliny“ (i když to možná není třeba, vždyť v některých zemích má komiks tradici v podobě popisků, ne „bublin“). Generated Detective bude rozšířen i o další žánry, romantické příběhy, sci-fi a horor.

S projektem Gutenberg pracuje i program Gutenstory, který na zadanou frázi (vazbu) vyhledá všechny věty, které ji používají, a pokusí se je spojit. Opět je to jen hračka, nebo by se to snad dalo chápat jako jakási „rešerše“ k příslušnému výrazu. Zřejmě nejkurióznějším dílem této akce je program 50 000 Meows od Huga van Kemadeho, který vezme román a slova přeloží do kočičí řeči, tedy převede na sérii mňoukání, která si však mají nějak zachovat svou gramatickou roli (co se tímhle vlastně myslí?).

Reálné použití

Dá se předpokládat, že kdyby někdo měl funkčnější program na tvorbu literárních textů, asi se s ním nebude chlubit, ale použije ho. Dá se předpokládat, že takový program spisovatele zatím nenahradí, ale při asistované tvorbě výrazně zvýší jeho produktivitu. Myslím, že – i když to budou třeba popírat – by podobné programy ve skutečnosti uvítal prakticky každý spisovatel, který se literaturou živí. Samozřejmě by automaticky generovaný text musel byl výrazně zeditován, nicméně asi by to bylo rychlejší, než ho vytvářet od začátku.

A je tu ještě jedna věc. Každý spisovatel má podobně jako čtenář oblíbenější a méně oblíbené typy scén/vyprávění, kterým se třeba i snaží podvědomě vyhýbat; někoho obtěžuje psát milostné scény, jiného popisy krajiny. Na textu je to pak většinou poznat, že se autor pouze nutil, protože „čtenář si to žádá“. Ne snad, že by programy vytvářející tyto „nechtěné“ pasáže zvládly kdovíjaká veledíla, to ovšem nezvládne obvykle ani samotný autor, pociťuje-li odpor.

Nebo snad (trochu paranoidní myšlenka na závěr) už zvlášť plodní autoři podobné prostředky používají? Či snad je pro ně v případě potřeby jednodušší a levnější spoléhat na spoluautory a díla svým jménem spíše zastřešovat?


Komentáře

RSS 

Komentujeme

Další na řadě je bezpečnost

Richard Jan Voigts , 09. říjen 2017 00:00
Richard Jan Voigts

Co všechno lze automatizovat pomocí strojového učení? Larry Ellison, technologický ředitel společnos...

Více







Kalendář

19. 10.

22. 10.
For Games 2017
24. 10. VeeamON Forum 2017
25. 10.

26. 10.
Profesia days 2017
RSS 

Zprávičky

Firma vypsala odměnu za odhalení digitálního podpisu slovenského ministra

ČTK , 21. říjen 2017 08:00

Problém se týká čipů německého výrobce Infineon Technologies, které Slovensko používá v občanských p...

Více 0 komentářů

Electro World v účetním roce zmírnil ztrátu na 92 milionů Kč

ČTK , 20. říjen 2017 12:00

Firma se soustředila na zlepšení prodejní a distribuční sítě a rozšíření sortimentu....

Více 0 komentářů

Dohoda o ochraně dat mezi EU a USA prošla první kontrolou

ČTK , 20. říjen 2017 08:00

Cílem dohody je chránit osobní údaje osob v EU předávané společnostem v USA. ...

Více 0 komentářů

Starší zprávičky

Operátoři: Metro by mohlo být signálem pokryté do konce roku 2018

ČTK , 20. říjen 2017 08:00

Operátoři mají enormní zájem na pokrytí pražského metra, a to na vlastní náklady....

Více 0 komentářů

Firmu Moravia IT koupil britský konkurent RWS Holding

ČTK , 19. říjen 2017 21:26

Mezi zákazníky firmy specializující se na lokalizaci a testování softwaru patří např. Microsoft, IBM...

Více 0 komentářů

Státní ústav pro kontrolu léčiv hájí elektronické recepty

ČTK , 19. říjen 2017 10:00

V ČR se vydá 60-70 milionů papírových receptů ročně. Podle ministerstva je elektronizace zdravotnict...

Více 0 komentářů

Ransomware Locky v září masivně útočil ve světě i v ČR

Pavel Houser , 19. říjen 2017 09:30

Locky se neobjevil v Top 10 škodlivých kódů od listopadu 2016....

Více 0 komentářů