Umělá inteligence a psaní románů

Pavel Houser , 18. prosinec 2014 07:00 0 komentářů
Umělá inteligence a psaní románů

Inteligenci či lidskost ztotožňujeme především s jazykem. Není asi náhodou, že Turingův test byl zformulován jako konverzační hra, od programu „psychoterapeutického“ Eliza jsou populární všemožné chatboty a jednou z nejcennějších technologií Applu je Siri. Používat jazyk ale znamená nejen konverzovat. Jak se dnešní programy dokáží vypořádat s jinou jazykovou dovedností, totiž vytvořit literární dílo?

O některých současných počinech a technikách si můžeme udělat představu ze soutěže NaNoGenMo (National Novel Generation Month), kde se představují programy určené pro psaní románů, respektive související experimenty s textem. Akci založil vývojář Darius Kazemi a letos se konala teprve podruhé.

Dlužno říci, že podle všeho se loni i letos programátoři pokoušeli spíše bavit než vytvářet texty považované za dílo člověka (respektive jiného člověka než surrealisty atd.). Mnohé programy vycházely z projektu Gutenberg nebo se jinak snažily se o zpracování a přeskládávání již existujících textů. Pro spisovatele i kohokoliv jiného by použití obrovského rezervoáru obsahu v projektu Gutenberg bylo zajímavé minimálně tím, že není zatížen autorskými právy.

Pojďme teď k jednotlivým projektům. Například Nick Montfort, básník a specialista na nová média z MITu, si vystačil s pouhými 165 řádky kódu v Pythonu. Výsledný příběh je trhaný a v podstatě se – nikoliv překvapivě – nedá číst. Smysl dává tak na úrovni jedné náhodně otevřené stránky.

To je vůbec problém i dalších počítačově generovaných textů. Mají-li mít alespoň nějakou úroveň, většinou jde o kratší příběhy. Ještě lepší výsledky získáme, nacházíme-li se v nějakém zúženém kusu jazyka/reality. Podobně jako se velmi osvědčují automatizované prostředky pro tvorbu či překlad technické dokumentace, společnost Narrative Science má nástroje, které dokáží zpracovávat informace o finančních trzích (respektive firemní reporty) a sportu a z nich vytvářet články podle předdefinovaných vzorů.

Výsledné texty sice stále nejsou bezchybné, ale vznikají prakticky okamžitě – a navíc v nich na rozdíl od zpracování člověkem nevznikají chyby věcné, třeba překlepy v číslech. Novináři by se mohli bát o práci, k k čemuž ovšem stejně mají tisíce jiných důvodů i bez umělé inteligence.

Jak dopadne Pýcha a předsudek?

Na rozdíl od seriózně míněných a současně komerčně ambiciózních projektů se na NaNoGenMo účastníci snaží sebe i své okolí zatím skutečně spíše jen pobavit. Sám Kazemi třeba vytvořil program Teens Wander Around a House, tj. několik agentů, kteří při setkání v příslušném chatroomu vytvářeli dialogy podle konverzací odchycených na Twitteru. Jeden z programů se např. zmínil o večeři, druhý to rozpoznal jako klíčové slovo a zareagoval na to třeba poznámkou o tom, že večeře je jeho oblíbené jídlo dne. Konverzace byly sice rámcově konzistentní, ale nepřekvapivě jako celek opět nedávaly moc smysl.

Michelle Fullwoodová z MITu vytvořila program Twide and Twejudice. Jedná se o Pýchu a předsudek, ovšem v textu tohoto klasického díla je každé slovo nahrazeno takovým, o němž program na základě analýzy příspěvků z Twitteru usoudí, že jde o synonymum, respektive že se toto slovo používá ve stejném/podobném kontextu. Z nějakého důvodu autorka takto v původním textu přepisuje pouze dialogy. Výsledek je ovšem stejně surealisticky absurdní, text občas získá vzhledem k originálu i přímo opačný význam.

Některé projekty NaNoGenMo jsou opravdu jen kombinatorikou, Liza Dalyová třeba vytvořila vlastní verzi známého Vojnichova rukopisu, když náhodně proházela jeho „slova“ a doplnila je starými botanickými a alchymistickými zobrazeními/symboly, které si program našel v rámci databáze Internet Archive. Podobně program Definition Book zase s textem pracuje tak, že první polovinu „románu“ tvoří první poloviny vět, druhou jejich druhé poloviny.

Temný komiks i mňoukání

Greg Borenstein předvedl program Generated Detective. Ten v rámci detektivek v projektu Gutenberg hledá věty obsahující vedle sebe slova jako question, murderer, witness, killer či weapon. Poté tyto sentence hledá na Flickeru, vezme příslušný obrázek a použije ho jako políčko komiksu.

Výsledný žánr se prý podobá chmurným noirovým příběhům, jsou snové, absurdní a dýchá z nich chlad nelidského mezihvězdného prostoru. Zatím mají texty podobu popisků, ještě by to chtělo dokázat na obrázku nějak rozpoznávat obličeje a přidávat do nich „bubliny“ (i když to možná není třeba, vždyť v některých zemích má komiks tradici v podobě popisků, ne „bublin“). Generated Detective bude rozšířen i o další žánry, romantické příběhy, sci-fi a horor.

S projektem Gutenberg pracuje i program Gutenstory, který na zadanou frázi (vazbu) vyhledá všechny věty, které ji používají, a pokusí se je spojit. Opět je to jen hračka, nebo by se to snad dalo chápat jako jakási „rešerše“ k příslušnému výrazu. Zřejmě nejkurióznějším dílem této akce je program 50 000 Meows od Huga van Kemadeho, který vezme román a slova přeloží do kočičí řeči, tedy převede na sérii mňoukání, která si však mají nějak zachovat svou gramatickou roli (co se tímhle vlastně myslí?).

Reálné použití

Dá se předpokládat, že kdyby někdo měl funkčnější program na tvorbu literárních textů, asi se s ním nebude chlubit, ale použije ho. Dá se předpokládat, že takový program spisovatele zatím nenahradí, ale při asistované tvorbě výrazně zvýší jeho produktivitu. Myslím, že – i když to budou třeba popírat – by podobné programy ve skutečnosti uvítal prakticky každý spisovatel, který se literaturou živí. Samozřejmě by automaticky generovaný text musel byl výrazně zeditován, nicméně asi by to bylo rychlejší, než ho vytvářet od začátku.

A je tu ještě jedna věc. Každý spisovatel má podobně jako čtenář oblíbenější a méně oblíbené typy scén/vyprávění, kterým se třeba i snaží podvědomě vyhýbat; někoho obtěžuje psát milostné scény, jiného popisy krajiny. Na textu je to pak většinou poznat, že se autor pouze nutil, protože „čtenář si to žádá“. Ne snad, že by programy vytvářející tyto „nechtěné“ pasáže zvládly kdovíjaká veledíla, to ovšem nezvládne obvykle ani samotný autor, pociťuje-li odpor.

Nebo snad (trochu paranoidní myšlenka na závěr) už zvlášť plodní autoři podobné prostředky používají? Či snad je pro ně v případě potřeby jednodušší a levnější spoléhat na spoluautory a díla svým jménem spíše zastřešovat?


Komentáře

RSS 

Komentujeme

Intel Inside aneb všichni jsme načipováni

Petr Zavoral , 10. prosinec 2017 18:20
Petr Zavoral

V Havlově hře Audience přesvědčuje Sládek Ferdinanda Vaňka, aby donášel sám na sebe. Z pohledu letoš...

Více







Kalendář

09. 01.

13. 01.
CES 2018
18. 01.

19. 01.
itSMF 2018
29. 01.

30. 01.
G2BTechEd
RSS 

Zprávičky

Western Digital zruší arbitráž proti Toshibě

ČTK , 11. prosinec 2017 08:00

Japonská společnost Toshiba a americká firma Western Digital se v zásadě dohodly na urovnání sporu o...

Více 0 komentářů

Spotify a Tencent se propojují

ČTK , 10. prosinec 2017 08:00

Přední světová služba pro streamování hudby Spotify a čínská konkurenční firma Tencent Music Enterta...

Více 0 komentářů

Bezpečnostní politika firem brání plně využít potenciál IoT

Pavel Houser , 09. prosinec 2017 08:00

Tři čtvrtiny účastníků průzkumu EY Global Information Security Survey 2017 pokládají za nejpravděpod...

Více 4 komentářů

Starší zprávičky

Globální výdaje na bezpečnost IT porostou v příštím roce o 8 % na 96 miliard dolarů

Pavel Houser , 08. prosinec 2017 10:57

Nejrychleji porostou řešení SIEM, testování IT bezpečnosti a její outsourcing. ...

Více 1 komentářů

Soud EU: Luxusní značky mohou zakázat internetový prodej zboží

ČTK , 08. prosinec 2017 10:00

Oponenti poukazují na to, že omezení prodejů jde proti hospodářské soutěži....

Více 1 komentářů

Agentura pro satelitní systém Galileo přinesla ČR miliardu korun

ČTK , 08. prosinec 2017 08:00

V současné době je na oběžné dráze 18 satelitů, vypuštění dalších čtyř je naplánováno na 12. prosine...

Více 0 komentářů

Cena bitcoinu se vyhoupla přes 15 000 dolarů (aktualizace)

ČTK , 07. prosinec 2017 13:55

Ceně pomáhá očekávané spuštění obchodování s bitcoinovými termínovými kontrakty....

Více 1 komentářů