margin-top: 125px; border: 1px solid gray; } -->

Umělá inteligence a psaní románů

Pavel Houser , 18. prosinec 2014 07:00 0 komentářů
Umělá inteligence a psaní románů

Inteligenci či lidskost ztotožňujeme především s jazykem. Není asi náhodou, že Turingův test byl zformulován jako konverzační hra, od programu „psychoterapeutického“ Eliza jsou populární všemožné chatboty a jednou z nejcennějších technologií Applu je Siri. Používat jazyk ale znamená nejen konverzovat. Jak se dnešní programy dokáží vypořádat s jinou jazykovou dovedností, totiž vytvořit literární dílo?

O některých současných počinech a technikách si můžeme udělat představu ze soutěže NaNoGenMo (National Novel Generation Month), kde se představují programy určené pro psaní románů, respektive související experimenty s textem. Akci založil vývojář Darius Kazemi a letos se konala teprve podruhé.

Dlužno říci, že podle všeho se loni i letos programátoři pokoušeli spíše bavit než vytvářet texty považované za dílo člověka (respektive jiného člověka než surrealisty atd.). Mnohé programy vycházely z projektu Gutenberg nebo se jinak snažily se o zpracování a přeskládávání již existujících textů. Pro spisovatele i kohokoliv jiného by použití obrovského rezervoáru obsahu v projektu Gutenberg bylo zajímavé minimálně tím, že není zatížen autorskými právy.

Pojďme teď k jednotlivým projektům. Například Nick Montfort, básník a specialista na nová média z MITu, si vystačil s pouhými 165 řádky kódu v Pythonu. Výsledný příběh je trhaný a v podstatě se – nikoliv překvapivě – nedá číst. Smysl dává tak na úrovni jedné náhodně otevřené stránky.

To je vůbec problém i dalších počítačově generovaných textů. Mají-li mít alespoň nějakou úroveň, většinou jde o kratší příběhy. Ještě lepší výsledky získáme, nacházíme-li se v nějakém zúženém kusu jazyka/reality. Podobně jako se velmi osvědčují automatizované prostředky pro tvorbu či překlad technické dokumentace, společnost Narrative Science má nástroje, které dokáží zpracovávat informace o finančních trzích (respektive firemní reporty) a sportu a z nich vytvářet články podle předdefinovaných vzorů.

Výsledné texty sice stále nejsou bezchybné, ale vznikají prakticky okamžitě – a navíc v nich na rozdíl od zpracování člověkem nevznikají chyby věcné, třeba překlepy v číslech. Novináři by se mohli bát o práci, k k čemuž ovšem stejně mají tisíce jiných důvodů i bez umělé inteligence.

Jak dopadne Pýcha a předsudek?

Na rozdíl od seriózně míněných a současně komerčně ambiciózních projektů se na NaNoGenMo účastníci snaží sebe i své okolí zatím skutečně spíše jen pobavit. Sám Kazemi třeba vytvořil program Teens Wander Around a House, tj. několik agentů, kteří při setkání v příslušném chatroomu vytvářeli dialogy podle konverzací odchycených na Twitteru. Jeden z programů se např. zmínil o večeři, druhý to rozpoznal jako klíčové slovo a zareagoval na to třeba poznámkou o tom, že večeře je jeho oblíbené jídlo dne. Konverzace byly sice rámcově konzistentní, ale nepřekvapivě jako celek opět nedávaly moc smysl.

Michelle Fullwoodová z MITu vytvořila program Twide and Twejudice. Jedná se o Pýchu a předsudek, ovšem v textu tohoto klasického díla je každé slovo nahrazeno takovým, o němž program na základě analýzy příspěvků z Twitteru usoudí, že jde o synonymum, respektive že se toto slovo používá ve stejném/podobném kontextu. Z nějakého důvodu autorka takto v původním textu přepisuje pouze dialogy. Výsledek je ovšem stejně surealisticky absurdní, text občas získá vzhledem k originálu i přímo opačný význam.

Některé projekty NaNoGenMo jsou opravdu jen kombinatorikou, Liza Dalyová třeba vytvořila vlastní verzi známého Vojnichova rukopisu, když náhodně proházela jeho „slova“ a doplnila je starými botanickými a alchymistickými zobrazeními/symboly, které si program našel v rámci databáze Internet Archive. Podobně program Definition Book zase s textem pracuje tak, že první polovinu „románu“ tvoří první poloviny vět, druhou jejich druhé poloviny.

Temný komiks i mňoukání

Greg Borenstein předvedl program Generated Detective. Ten v rámci detektivek v projektu Gutenberg hledá věty obsahující vedle sebe slova jako question, murderer, witness, killer či weapon. Poté tyto sentence hledá na Flickeru, vezme příslušný obrázek a použije ho jako políčko komiksu.

Výsledný žánr se prý podobá chmurným noirovým příběhům, jsou snové, absurdní a dýchá z nich chlad nelidského mezihvězdného prostoru. Zatím mají texty podobu popisků, ještě by to chtělo dokázat na obrázku nějak rozpoznávat obličeje a přidávat do nich „bubliny“ (i když to možná není třeba, vždyť v některých zemích má komiks tradici v podobě popisků, ne „bublin“). Generated Detective bude rozšířen i o další žánry, romantické příběhy, sci-fi a horor.

S projektem Gutenberg pracuje i program Gutenstory, který na zadanou frázi (vazbu) vyhledá všechny věty, které ji používají, a pokusí se je spojit. Opět je to jen hračka, nebo by se to snad dalo chápat jako jakási „rešerše“ k příslušnému výrazu. Zřejmě nejkurióznějším dílem této akce je program 50 000 Meows od Huga van Kemadeho, který vezme román a slova přeloží do kočičí řeči, tedy převede na sérii mňoukání, která si však mají nějak zachovat svou gramatickou roli (co se tímhle vlastně myslí?).

Reálné použití

Dá se předpokládat, že kdyby někdo měl funkčnější program na tvorbu literárních textů, asi se s ním nebude chlubit, ale použije ho. Dá se předpokládat, že takový program spisovatele zatím nenahradí, ale při asistované tvorbě výrazně zvýší jeho produktivitu. Myslím, že – i když to budou třeba popírat – by podobné programy ve skutečnosti uvítal prakticky každý spisovatel, který se literaturou živí. Samozřejmě by automaticky generovaný text musel byl výrazně zeditován, nicméně asi by to bylo rychlejší, než ho vytvářet od začátku.

A je tu ještě jedna věc. Každý spisovatel má podobně jako čtenář oblíbenější a méně oblíbené typy scén/vyprávění, kterým se třeba i snaží podvědomě vyhýbat; někoho obtěžuje psát milostné scény, jiného popisy krajiny. Na textu je to pak většinou poznat, že se autor pouze nutil, protože „čtenář si to žádá“. Ne snad, že by programy vytvářející tyto „nechtěné“ pasáže zvládly kdovíjaká veledíla, to ovšem nezvládne obvykle ani samotný autor, pociťuje-li odpor.

Nebo snad (trochu paranoidní myšlenka na závěr) už zvlášť plodní autoři podobné prostředky používají? Či snad je pro ně v případě potřeby jednodušší a levnější spoléhat na spoluautory a díla svým jménem spíše zastřešovat?


Komentáře

RSS 

Komentujeme

V datových centrech už nejde o Windows?

Pavel Houser , 22. březen 2017 12:47
Pavel Houser

Trevor Pott si na The Register pokládá otázku o budoucnosti serverových Windows na platformě ARM. ...

Více






Kalendář

25. 03. INSPO 2017
31. 03. CRA IoT Hackathon
04. 04. Affiliate konference
RSS 

Zprávičky

Bosch a IBM začaly spolupracovat na IoT pro průmysl

Pavel Houser , 24. březen 2017 13:08

Výrobci aut mohou nyní plánovat a organizovat aktualizaci softwaru u milionů vozů....

Více 0 komentářů

Apple čeká na Novém Zélandu vyšetřování kvůli daním

ČTK , 24. březen 2017 13:00

Americkou společnost Apple čeká na Novém Zélandu vyšetřování, navzdory miliardovému obratu tam totiž...

Více 0 komentářů

Huawei a SUSE spolupracují na platformě pro kritické úlohy

Pavel Houser , 24. březen 2017 11:42

SUSE Linux Enterprise Server jako preferovaný standardní OS pro KunLu umožňuje výměnu procesorů a pa...

Více 0 komentářů

Starší zprávičky

Novela zavádí lepší užití informačních systémů veřejné správy

ČTK , 24. březen 2017 08:00

Zákon má mj. zabránit duplicitě informačních systémů a plýtvání penězi při jejich nákupu....

Více 0 komentářů

Workplace Hub pro optimalizaci systémů i procesů

Pavel Houser , 23. březen 2017 16:09

Konica Minolta v partnerství se společnostmi Microsoft, HPE, Sophos, Canonical a BrainTribe přichází...

Více 0 komentářů

Jen necelá polovina firem pravidelně zkoumá data o zákaznících

ITBiz.cz , 23. březen 2017 14:30

Podle studie společnosti Oracle pouze 44 % firem pravidelně zkoumá data o svých zákaznících s cílem ...

Více 0 komentářů

Google umožní sdílení polohy přes aplikaci Google Maps

ČTK , 23. březen 2017 13:30

Uživatelé populární mapové aplikace Google Maps budou moci od příštího týdne sdílet s ostatními svou...

Více 0 komentářů