margin-top: 125px; border: 1px solid gray; } -->

Umělá inteligence a psaní románů

Pavel Houser , 18. prosinec 2014 07:00 0 komentářů
Umělá inteligence a psaní románů

Inteligenci či lidskost ztotožňujeme především s jazykem. Není asi náhodou, že Turingův test byl zformulován jako konverzační hra, od programu „psychoterapeutického“ Eliza jsou populární všemožné chatboty a jednou z nejcennějších technologií Applu je Siri. Používat jazyk ale znamená nejen konverzovat. Jak se dnešní programy dokáží vypořádat s jinou jazykovou dovedností, totiž vytvořit literární dílo?

O některých současných počinech a technikách si můžeme udělat představu ze soutěže NaNoGenMo (National Novel Generation Month), kde se představují programy určené pro psaní románů, respektive související experimenty s textem. Akci založil vývojář Darius Kazemi a letos se konala teprve podruhé.

Dlužno říci, že podle všeho se loni i letos programátoři pokoušeli spíše bavit než vytvářet texty považované za dílo člověka (respektive jiného člověka než surrealisty atd.). Mnohé programy vycházely z projektu Gutenberg nebo se jinak snažily se o zpracování a přeskládávání již existujících textů. Pro spisovatele i kohokoliv jiného by použití obrovského rezervoáru obsahu v projektu Gutenberg bylo zajímavé minimálně tím, že není zatížen autorskými právy.

Pojďme teď k jednotlivým projektům. Například Nick Montfort, básník a specialista na nová média z MITu, si vystačil s pouhými 165 řádky kódu v Pythonu. Výsledný příběh je trhaný a v podstatě se – nikoliv překvapivě – nedá číst. Smysl dává tak na úrovni jedné náhodně otevřené stránky.

To je vůbec problém i dalších počítačově generovaných textů. Mají-li mít alespoň nějakou úroveň, většinou jde o kratší příběhy. Ještě lepší výsledky získáme, nacházíme-li se v nějakém zúženém kusu jazyka/reality. Podobně jako se velmi osvědčují automatizované prostředky pro tvorbu či překlad technické dokumentace, společnost Narrative Science má nástroje, které dokáží zpracovávat informace o finančních trzích (respektive firemní reporty) a sportu a z nich vytvářet články podle předdefinovaných vzorů.

Výsledné texty sice stále nejsou bezchybné, ale vznikají prakticky okamžitě – a navíc v nich na rozdíl od zpracování člověkem nevznikají chyby věcné, třeba překlepy v číslech. Novináři by se mohli bát o práci, k k čemuž ovšem stejně mají tisíce jiných důvodů i bez umělé inteligence.

Jak dopadne Pýcha a předsudek?

Na rozdíl od seriózně míněných a současně komerčně ambiciózních projektů se na NaNoGenMo účastníci snaží sebe i své okolí zatím skutečně spíše jen pobavit. Sám Kazemi třeba vytvořil program Teens Wander Around a House, tj. několik agentů, kteří při setkání v příslušném chatroomu vytvářeli dialogy podle konverzací odchycených na Twitteru. Jeden z programů se např. zmínil o večeři, druhý to rozpoznal jako klíčové slovo a zareagoval na to třeba poznámkou o tom, že večeře je jeho oblíbené jídlo dne. Konverzace byly sice rámcově konzistentní, ale nepřekvapivě jako celek opět nedávaly moc smysl.

Michelle Fullwoodová z MITu vytvořila program Twide and Twejudice. Jedná se o Pýchu a předsudek, ovšem v textu tohoto klasického díla je každé slovo nahrazeno takovým, o němž program na základě analýzy příspěvků z Twitteru usoudí, že jde o synonymum, respektive že se toto slovo používá ve stejném/podobném kontextu. Z nějakého důvodu autorka takto v původním textu přepisuje pouze dialogy. Výsledek je ovšem stejně surealisticky absurdní, text občas získá vzhledem k originálu i přímo opačný význam.

Některé projekty NaNoGenMo jsou opravdu jen kombinatorikou, Liza Dalyová třeba vytvořila vlastní verzi známého Vojnichova rukopisu, když náhodně proházela jeho „slova“ a doplnila je starými botanickými a alchymistickými zobrazeními/symboly, které si program našel v rámci databáze Internet Archive. Podobně program Definition Book zase s textem pracuje tak, že první polovinu „románu“ tvoří první poloviny vět, druhou jejich druhé poloviny.

Temný komiks i mňoukání

Greg Borenstein předvedl program Generated Detective. Ten v rámci detektivek v projektu Gutenberg hledá věty obsahující vedle sebe slova jako question, murderer, witness, killer či weapon. Poté tyto sentence hledá na Flickeru, vezme příslušný obrázek a použije ho jako políčko komiksu.

Výsledný žánr se prý podobá chmurným noirovým příběhům, jsou snové, absurdní a dýchá z nich chlad nelidského mezihvězdného prostoru. Zatím mají texty podobu popisků, ještě by to chtělo dokázat na obrázku nějak rozpoznávat obličeje a přidávat do nich „bubliny“ (i když to možná není třeba, vždyť v některých zemích má komiks tradici v podobě popisků, ne „bublin“). Generated Detective bude rozšířen i o další žánry, romantické příběhy, sci-fi a horor.

S projektem Gutenberg pracuje i program Gutenstory, který na zadanou frázi (vazbu) vyhledá všechny věty, které ji používají, a pokusí se je spojit. Opět je to jen hračka, nebo by se to snad dalo chápat jako jakási „rešerše“ k příslušnému výrazu. Zřejmě nejkurióznějším dílem této akce je program 50 000 Meows od Huga van Kemadeho, který vezme román a slova přeloží do kočičí řeči, tedy převede na sérii mňoukání, která si však mají nějak zachovat svou gramatickou roli (co se tímhle vlastně myslí?).

Reálné použití

Dá se předpokládat, že kdyby někdo měl funkčnější program na tvorbu literárních textů, asi se s ním nebude chlubit, ale použije ho. Dá se předpokládat, že takový program spisovatele zatím nenahradí, ale při asistované tvorbě výrazně zvýší jeho produktivitu. Myslím, že – i když to budou třeba popírat – by podobné programy ve skutečnosti uvítal prakticky každý spisovatel, který se literaturou živí. Samozřejmě by automaticky generovaný text musel byl výrazně zeditován, nicméně asi by to bylo rychlejší, než ho vytvářet od začátku.

A je tu ještě jedna věc. Každý spisovatel má podobně jako čtenář oblíbenější a méně oblíbené typy scén/vyprávění, kterým se třeba i snaží podvědomě vyhýbat; někoho obtěžuje psát milostné scény, jiného popisy krajiny. Na textu je to pak většinou poznat, že se autor pouze nutil, protože „čtenář si to žádá“. Ne snad, že by programy vytvářející tyto „nechtěné“ pasáže zvládly kdovíjaká veledíla, to ovšem nezvládne obvykle ani samotný autor, pociťuje-li odpor.

Nebo snad (trochu paranoidní myšlenka na závěr) už zvlášť plodní autoři podobné prostředky používají? Či snad je pro ně v případě potřeby jednodušší a levnější spoléhat na spoluautory a díla svým jménem spíše zastřešovat?


Komentáře


RSS 

Komentujeme

Sinclair, Jobs a Watson

Richard Jan Voigts , 31. prosinec 2016 08:00
Richard Jan Voigts

ZX Spectrum byla hračka, kterou nám dal před l...

Více





Kalendář

06. 02.

07. 02.
konference G2B TechEd
15. 02. IDC Predictions 2017
22. 02. IT mezi paragrafy
RSS 

Zprávičky

Reuters: Hlavní příčinou potíží telefonů Galaxy Note 7 je baterie

ČTK , 16. leden 2017 14:00

Hlavní příčinou samovzněcování některých chytrých telefonů Galaxy Note 7 byla baterie. Podle zdroje ...

Více 0 komentářů

Facebook v Německu spustí systém pro ověřování pravdivosti zpráv

ČTK , 16. leden 2017 07:00

Internetová sociální síť Facebook v příštích týdnech zavede v Německu systém pro ověřování pravdivos...

Více 0 komentářů

Yahoo Japan zvažuje třídenní víkend, chce zaměstnance motivovat

ČTK , 15. leden 2017 15:00

Japonská internetová společnost Yahoo Japan zvažuje, že by do roku 2020 zavedla třídenní víkend. Chc...

Více 0 komentářů

Starší zprávičky

Uber se dohodl s Google na využití jeho map

ČTK , 15. leden 2017 12:32

Internetová firma Google nově propojila své mapy s poskytovatelem přeprav Uber. S novou aktualizací ...

Více 1 komentářů

Fakulta elektrotechnická ČVUT v Praze představí zájemcům o studium moderní techniku i její historii

ITBiz.cz , 14. leden 2017 16:30

Fakulta elektrotechnická ČVUT v Praze pořádá v pátek 20. ledna od 8.30 hodin první letošní Den otevř...

Více 0 komentářů

Čína chce zakázat elektrošoky pro mládež závislou na internetu

ČTK , 14. leden 2017 13:35

Čínská vláda chce zákonem zakázat používání elektrošoků a dalších fyzických trestů v táborech pro zá...

Více 5 komentářů

Za internetový prodej ohrožených brouků soud udělil podmínku

ČTK , 13. leden 2017 15:00

Český soud poprvé potrestal prodejce, který na internetu nabízel ohrožené druhy hmyzu. Jedenatřiceti...

Více 0 komentářů