Umělá inteligence a psaní románů

Pavel Houser
9 roky Před

Inteligenci či lidskost ztotožňujeme především s jazykem. Není asi náhodou, že Turingův test byl zformulován jako konverzační hra, od programu „psychoterapeutického“ Eliza jsou populární všemožné chatboty a jednou z nejcennějších technologií Applu je Siri. Používat jazyk ale znamená nejen konverzovat. Jak se dnešní programy dokáží vypořádat s jinou jazykovou dovedností, totiž vytvořit literární dílo?
O některých současných počinech a technikách si můžeme udělat představu ze soutěže NaNoGenMo (National Novel Generation Month), kde se představují programy určené pro psaní románů, respektive související experimenty s textem. Akci založil vývojář Darius Kazemi a letos se konala teprve podruhé.

Dlužno říci, že podle všeho se loni i letos programátoři pokoušeli spíše bavit než vytvářet texty považované za dílo člověka (respektive jiného člověka než surrealisty atd.). Mnohé programy vycházely z projektu Gutenberg nebo se jinak snažily se o zpracování a přeskládávání již existujících textů. Pro spisovatele i kohokoliv jiného by použití obrovského rezervoáru obsahu v projektu Gutenberg bylo zajímavé minimálně tím, že není zatížen autorskými právy.

Pojďme teď k jednotlivým projektům. Například Nick Montfort, básník a specialista na nová média z MITu, si vystačil s pouhými 165 řádky kódu v Pythonu. Výsledný příběh je trhaný a v podstatě se – nikoliv překvapivě – nedá číst. Smysl dává tak na úrovni jedné náhodně otevřené stránky.

To je vůbec problém i dalších počítačově generovaných textů. Mají-li mít alespoň nějakou úroveň, většinou jde o kratší příběhy. Ještě lepší výsledky získáme, nacházíme-li se v nějakém zúženém kusu jazyka/reality. Podobně jako se velmi osvědčují automatizované prostředky pro tvorbu či překlad technické dokumentace, společnost Narrative Science má nástroje, které dokáží zpracovávat informace o finančních trzích (respektive firemní reporty) a sportu a z nich vytvářet články podle předdefinovaných vzorů.

Výsledné texty sice stále nejsou bezchybné, ale vznikají prakticky okamžitě – a navíc v nich na rozdíl od zpracování člověkem nevznikají chyby věcné, třeba překlepy v číslech. Novináři by se mohli bát o práci, k k čemuž ovšem stejně mají tisíce jiných důvodů i bez umělé inteligence.

Jak dopadne Pýcha a předsudek?

Na rozdíl od seriózně míněných a současně komerčně ambiciózních projektů se na NaNoGenMo účastníci snaží sebe i své okolí zatím skutečně spíše jen pobavit. Sám Kazemi třeba vytvořil program Teens Wander Around a House, tj. několik agentů, kteří při setkání v příslušném chatroomu vytvářeli dialogy podle konverzací odchycených na Twitteru. Jeden z programů se např. zmínil o večeři, druhý to rozpoznal jako klíčové slovo a zareagoval na to třeba poznámkou o tom, že večeře je jeho oblíbené jídlo dne. Konverzace byly sice rámcově konzistentní, ale nepřekvapivě jako celek opět nedávaly moc smysl.

Michelle Fullwoodová z MITu vytvořila program Twide and Twejudice. Jedná se o Pýchu a předsudek, ovšem v textu tohoto klasického díla je každé slovo nahrazeno takovým, o němž program na základě analýzy příspěvků z Twitteru usoudí, že jde o synonymum, respektive že se toto slovo používá ve stejném/podobném kontextu. Z nějakého důvodu autorka takto v původním textu přepisuje pouze dialogy. Výsledek je ovšem stejně surealisticky absurdní, text občas získá vzhledem k originálu i přímo opačný význam.

Některé projekty NaNoGenMo jsou opravdu jen kombinatorikou, Liza Dalyová třeba vytvořila vlastní verzi známého Vojnichova rukopisu, když náhodně proházela jeho „slova“ a doplnila je starými botanickými a alchymistickými zobrazeními/symboly, které si program našel v rámci databáze Internet Archive. Podobně program Definition Book zase s textem pracuje tak, že první polovinu „románu“ tvoří první poloviny vět, druhou jejich druhé poloviny.

Temný komiks i mňoukání

Greg Borenstein předvedl program Generated Detective. Ten v rámci detektivek v projektu Gutenberg hledá věty obsahující vedle sebe slova jako question, murderer, witness, killer či weapon. Poté tyto sentence hledá na Flickeru, vezme příslušný obrázek a použije ho jako políčko komiksu.

Výsledný žánr se prý podobá chmurným noirovým příběhům, jsou snové, absurdní a dýchá z nich chlad nelidského mezihvězdného prostoru. Zatím mají texty podobu popisků, ještě by to chtělo dokázat na obrázku nějak rozpoznávat obličeje a přidávat do nich „bubliny“ (i když to možná není třeba, vždyť v některých zemích má komiks tradici v podobě popisků, ne „bublin“). Generated Detective bude rozšířen i o další žánry, romantické příběhy, sci-fi a horor.

S projektem Gutenberg pracuje i program Gutenstory, který na zadanou frázi (vazbu) vyhledá všechny věty, které ji používají, a pokusí se je spojit. Opět je to jen hračka, nebo by se to snad dalo chápat jako jakási „rešerše“ k příslušnému výrazu. Zřejmě nejkurióznějším dílem této akce je program 50 000 Meows od Huga van Kemadeho, který vezme román a slova přeloží do kočičí řeči, tedy převede na sérii mňoukání, která si však mají nějak zachovat svou gramatickou roli (co se tímhle vlastně myslí?).

Reálné použití

Dá se předpokládat, že kdyby někdo měl funkčnější program na tvorbu literárních textů, asi se s ním nebude chlubit, ale použije ho. Dá se předpokládat, že takový program spisovatele zatím nenahradí, ale při asistované tvorbě výrazně zvýší jeho produktivitu. Myslím, že – i když to budou třeba popírat – by podobné programy ve skutečnosti uvítal prakticky každý spisovatel, který se literaturou živí. Samozřejmě by automaticky generovaný text musel byl výrazně zeditován, nicméně asi by to bylo rychlejší, než ho vytvářet od začátku.

A je tu ještě jedna věc. Každý spisovatel má podobně jako čtenář oblíbenější a méně oblíbené typy scén/vyprávění, kterým se třeba i snaží podvědomě vyhýbat; někoho obtěžuje psát milostné scény, jiného popisy krajiny. Na textu je to pak většinou poznat, že se autor pouze nutil, protože „čtenář si to žádá“. Ne snad, že by programy vytvářející tyto „nechtěné“ pasáže zvládly kdovíjaká veledíla, to ovšem nezvládne obvykle ani samotný autor, pociťuje-li odpor.

Nebo snad (trochu paranoidní myšlenka na závěr) už zvlášť plodní autoři podobné prostředky používají? Či snad je pro ně v případě potřeby jednodušší a levnější spoléhat na spoluautory a díla svým jménem spíše zastřešovat?

Categories: Články
Tags: Internet Podnikový software Právo Technologie Vývoj a HTML

Jak dopadne Pýcha a předsudek?

Temný komiks i mňoukání

Reálné použití

Související obsah

Čínská firma ByteDance navzdory tlaku z USA nehodlá prodat dceřinou firmu TikTok

V USA vracejí síťovou neutralitu, která má zaručit otevřený internet

Majitel Googlu výrazně zvýšil čtvrtletní zisk, poprvé vyplatí dividendu

Microsoft zvýšil čtvrtletní zisk o pětinu, tržby překonaly očekávání