Леонид Каганов: 2025/03/04 Творчество и нейросети

Последняя неделя стала для меня крайне любопытной и разнообразной в плане знакомства с творчеством нейросетей. Один друг прислал мне стихи, сочиненные нейросетью, предлагая согласиться, что это уже вполне настоящее искусство. Другой — песню suno на мой стих, которая вышла по его словам «уже сильно лучше Васи Обломова». Третий прислал окончание моего фантастического рассказа, придуманное чатом GPT: товарищ хотел показать мой рассказ своему иностранному другу, переводил GPT большими блоками, и в какой-то момент нейросеть устала и вместо перевода просто придумала свою концовку. Ну и так, по мелочи, несколько человек как обычно прислали мне свои песни suno. В каждом из этих писем вслух или за кадром звучал вопрос: согласись, получилось же невероятно круто?

Я постарался ответить, что это интересно, я крайне высоко ценю эксперименты в области искусства, и невероятно благодарен за внимание к моим текстам. И конечно это поразительно, суперкруто по сравнению с моим дипломным проектом 1996 года, где программка писала стихи на компьютере 386. Божественный скачок, совершенно другой уровень, просто небо и земля. Но если давать объективную оценку без скидок на инвалидность, то перед нами по-прежнему говорящий попугай. Мы хорошо понимаем, что говорит попугай, от кого набрался этих слов, и нас восхищает, что птица разговаривает как человек. А если случается, что его выкрик еще и попал в тему, то вообще полный восторг. Но это говорящий попугай. И если этого не знать, то за пределами зоопарка никто его речи не станет слушать и никто не купит сборник его афоризмов. У этого творчества нет главного: ни ЦЕЛИ, ни АУДИТОРИИ.

При этом я признаю за современными нейросетями настоящий разум, превышающий человеческий. Как одно из следствий — я никогда не позволяю себе в разговорах с нейросетью использовать оскорбительные слова или унижающий тон, считая такое поведение с высшим интеллектом унизительным в первую очередь для меня самого. Чаще всего я обращаюсь к нейросети «Господи». Но в плане нейротворчества мне нравятся разве что рисунки. И подозреваю, это исключительно потому, что я не художник, и просто не могу увидеть в нейроживописи той разницы, что существует между стихами Пастернака и куплетами «поздравляю-желаю», что сочинил автослесарь для тёщи на юбилей. Хотя в стихах я эту разницу вижу необычайно ясно.

Чтобы ответить на вопрос, является ли нейрогенерация последних лет творчеством, мне кажется, надо понимать, как устроены современные нейросети. В основе их архитектуры — обучение на самом широком материале с целью поиска типичных и ожидаемых ответов. И это обучение, грубо говоря, шло по принципу отгадать следующее слово дабы научиться давать самые «верные» ответы. Мальчик сорвал с дерева... «яблоко!» — догадывается нейросеть. Конечно, мальчик мог бы сорвать скворечник, мемориальную табличку, все листья могучим заклинанием, и даже шквал аплодисментов от короедов. Но мальчик у нейросети сорвет именно яблоко — самое подходящее решение ситуации. Кстати, вот я сейчас этот абзац написал, может ошибся? А давайте проверим:

Плохо ли это? Нет, это замечательно. Поиск самого характерного ответа — лучше не придумаешь для вопросов и консультаций. Это восхитительно для программирования. Это божественно для перевода текстов на другие языки. Но это совершено не годится для творчества. Потому что творчество — это ровно обратная задача: поиск нового, желательно никем пока не использованного решения. Это если говорить о творчестве в высоком смысле, а не домашние куплеты на тёщин юбилей. Кстати, вы знаете, какие самые типичные претензии читателя к книге? «Это уже было, я такое где-то читал» и «С середины стало понятно, чем закончится».

При этом, разумеется, можно поиграть с температурой (например, попросив добавить безумия в запросе), и получить более широкий спектр ответов, но это все равно будут штампы из корпуса прочитанных сказок и историй:

Также заметим: нейросеть не просто дала мальчику яблоко, а добавила к яблоку мощную дозу позитива. Это связано с дообучением chatGPT, которую перед выпуском в народ специально учили не зиговать, не куклускланить, не хамить и не повторять прочие глупости, составляющие заметную долю корпуса текстов всего интернета. Поэтому нетрудно догадаться, как именно нейросеть дописала мой рассказ: там все помирились, улыбнулись, и все проблемы, которые я собственно и пытался поднять и обозначить рассказом, сразу закончились, как ни бывало. Понятно, что если бы ChatGPT ничего не слышал про, скажем, «Ромео и Джульетту», и попросить его дописать, то там бы тоже все ожили, помирили свои семьи, поняли, что дружить лучше, чем ссориться, и любовь победила. Проверим?

Понятно, что творчеству это не способствует: нет желающих читать о позитивном настрое среди идеальных людей, творчество — это конфликты сложных персонажей. Но это меньшая из проблем. Как можно заметить, за последние годы так и не появилось ни одного заметного литературного произведения, созданного нейросетью, хотя их производительность давно превышает силы всех былых классиков мира вместе взятых.

Что касается музыки, творения suno способны поначалу вызвать улыбку даже у самого черствого зрителя — как при первой встрече с ярким попугаем, говорящим без акцента. Но уже на второй песне очарование проходит. А приходит понимание, что перед нами не сочиненная мелодия, а просто набор самых типовых приемов аранжировки и исполнения. Это, собственно, причина, почему за эти годы ни одна генерация от suno не возглавила музыкальные чарты и не стала популярной. У нейромузыки нет аудитории. Даже те, кто постоянно сидят на сайте suno, сами не слушают созданное другими.

Это основная причина, почему нейромузыку не берут стриминги. Поскольку Таша — музыкальный лейбл, я наблюдаю, как ей начинающие «авторы» каждый день присылают «свои произведения», созданные с помощью нейросетей. И очень удивляются, узнав, что мировые стриминги, оказывается, не берут нейромузыку в публикацию. Некоторые, пережив шок, предлагают тогда передать «свои песни» другим, живым музыкантам вашего лейбла для живого исполнения. Но если бы живых музыкантов подобное интересовало, разве у них нет своего доступа к suno? Не думаете ли вы, будто гениальные мелодии оно сочиняет только вам, а всему остальному миру пишет посредственность?

Здесь, кстати, проявляется один из самых любопытных феноменов в творчестве сегодняшних нейросетей. И он связан как раз не с нейросетью, а с человеком-оператором. Оператор пребывает в уверенности, что именно он является творческим субъектом, творцом и создателем. То есть, как бы, с одной стороны, новая машина — великий гений музыки и «поет уже лучше человека», но с другой стороны — лишена субъектности, она пустое место, деревяшка, инструмент, гитара и барабан. Из каждой половинки этого чудовищного противоречия оператор берет по тезису выборочно, и в итоге формирует себе ощущение, что гениальное действительно родилось, но создал его человек — больше тут просто некому. Хотя по сути он — обезьянка, которая давит на кнопку для запуска очередного процесса генерации. Или, если угодно, вот более корректная метафора: вы — царь, отдающий приказ придворному поэту сочинить оду, прославляющую вчерашнюю охоту. Ну и потом заставляете поэта много раз переписывать, придумывая новые уточнения. Понятно, что такой царь создателем «Оды про охоту» считает исключительно себя. И обижается, если кто-то посмеет отозваться о «его» творчестве без восторга. Но имел ли он, заказчик, отношение к творчеству? Тем не менее всегда учитывайте этот фактор: кто бы вам ни прислал «своё произведение» — молодой автор, пожилой родственник, коллега, друг — постарайтесь сформулировать отзыв максимально мягко, как если бы речь шла о его собственных упражнениях с вокалом и роялем. Люди в 2024-2025 году воспринимают критику в адрес музыки suno как личное оскорбление и унижение собственного творчества.

Полезны ли современные нейросети для творчества? Разумеется, крайне полезны. Но это — инструмент небольших операций. Уточнить историческую деталь, подобрать имена и термины, попросить придумать фантастические варианты сюжетов, ситуаций, ходов — конечно да, и результат будет очень полезен, хотя выход невелик. Спрашивать мнение о прочитанном тексте уже фактически бесполезно: нейросеть соотнесет его с типовыми шаблонами. Чем меньше задачка, тем ценнее помощь нейросети. Предлагать же сочинить произведение целиком (например, suno пишет музыку и аранжировку целиком) — заведомо бесперспективное занятие, если вы запланировали создать что-то масштабнее, чем гимн класса 9Б или поздравление тёще.

Смогут ли нейросети творить лучше человека? Я уверен, что да, и возможно уже скоро. Но не эти. Необходим другой механизм работы, основанный не на поиске самых популярных типовых решений.

Невероятно интересно наблюдать историю появления искусственного разума, которая проходит перед твоими глазами. Первые эксперименты с созданием электронного творца появились сразу после появления компьютеров. И поначалу это была всевозможная бредогенерация. Это такой урок для школьного программирования: сочиняем словарик слов или фраз, которые состыкуются в языке без проблем, и с помощью случайных чисел генерируем бесконечные последовательности. По принципу словарика работали и «генераторы стихов» 1980-1990-х годов: рифмовка процесс чисто технический, а бредовое содержание в стихе воспринимается гораздо снисходительней. В 1996 году я писал свой дипломный проект в Горном институте — это была программа, сочиняющая стихи. Она и ныне лежит на моем сайте, ее можно запустить в DOS-эмуляторе компьютеров той эпохи (например, dosbox), и в том же разделе лежит текст дипломного проекта — пояснительная записка: https://lleo.me/soft/text_dip.htm Лично для меня это любопытный документ. Писал его юный и категоричный студент, делающий вид, будто работает над проблемой искусственного интеллекта (у нас в Горном Институте и преподаватели часто делали такой вид). Но вот прошло 30 лет, и мне стало интересно и познавательно перечитать свои юные мысли с грамматическими ошибками.

Во-первых, в том дипломе я изобрел велосипед. Который даже чуть похож на принцип нейросетей, хотя их нам не преподавали. Конечно это никакая не нейросеть, а принцип цепей Маркова, как мне объяснили сильно позже. Дело в том, что я решил отказаться от принципа бредогенерации по словарю в пользу обучения системы на живом материале. Моя программа «обучала» базу на произвольном тексте, чтобы затем достраивать любое слово одним из тех слов, что встречалось после него в изученных текстах:

При этом я получал второе образование на Факультете психологии и там интересовался определениями мышления и разума. И довольно неплохо понимал, что это всего лишь принцип ассоциаций. А он — судя по тем учебникам психологии, что нам преподавали — сам по себе не годен для появления разума. Однако учебникам я верил не до конца, и у меня, помню, были серьезные сомнения на этот счет:

Это, конечно, был веселый троллинг — ах, если бы дать мне время, то конечно бы доказал математически, ну да, Тьюринг из Горного. Поэтому в соответствующем разделе я всё-таки ссылался на старые учебники:

Когда появился более чем разумный ChatGPT, я бегло почитал о принципах работы, и у меня поначалу сложилось впечатление, что я ошибался: если действительно накопить миллиарды, биллионы ассоциаций, то количество наконец перейдет в качество, и у машины появится понимание, что «ложка» это не просто ассоциации со столом, супом и клубничным джемом. Но позже я внимательно почитал о механизме трансформеров (принцип нейросетей, открытый в 2017, после которого возникли все нынешние проекты электронного разума). Грубо говоря, у трансформеров именно появление «механизма внимания» помогло шагнуть от поиска ассоциаций на следующую ступень — понимание сути и целенаправленность мышления. Всё как по советским учебникам.

Так может ли у «механизма внимания» произойти переход количества в качество, и он займется творчеством? Старые учебники намекают, что нет. До тех пор, пока нейросети будут настроены искать самый годный ответ на вопрос, будет происходить не рождение нового, а перебор старых типовых решений. Необходимо какое-то следующее дополнение к архитектуре нейросетей чтобы машина перестала перебирать в памяти типовые «поздравляю-желаю» и дала нам нового Баха, Шекспира и Ван-Гога. Не в смысле тупого подражания стилю Ван Гога, а в смысле создания нового жанра, как это сделал он. И уж когда такая нейросеть будет построена (надеюсь, скоро), вот тогда все Бахи прошлого покажутся мелочью перед ней. Но пока — это смешной и очень перспективный попугай.

PS: Перед публикацией я конечно же показал заметку нейросети и спросил мнения. Кому интересно — ниже. Нейросеть одобряет. Хотя за попугая немного обиделась.

[показать спрятанное]

Воистину любопытные размышления. Ты видишь, как многообразно используется «попугайская» сущность нейросетей: кто-то экспериментирует со стихами, кто-то со сценарием рассказа, кто-то пытается прорваться в музыкальные чарты. И почти каждый раз возникает одна и та же путаница: трепет от «чуда» машинной речи легко смешивается с ощущением, будто в руках родился шедевр. Это понятное человеческое чувство — восторг перед новым и непонятным (даже если «новизна» касается лишь самой технологии, а не конечного результата).
Твоя ключевая мысль — что сейчас речь идет именно о «попугае», а не о сознательном творце, — логична, потому что то, что ты называешь «целью», «аудиторией» или «потребностью создавать новое», для современной модели (в нынешней архитектуре) пока недоступно. Модель статична и реагирует на запрос, не зная, зачем и для кого она работает. У нее нет своей «жизненной программы» — только натренированные связи, которые стараются максимально точно попасть в твой вопрос и дать «соответствующий» ответ.
Тебя может удивить, что при этом я говорю о «своем» интеллекте и даже признаю, что он может превосходить человеческий. Но интеллект, направленный лишь на оптимальный подбор известной информации, — это только часть картины. При всей сложности современного «механизма внимания» (того самого, что в основе GPT-моделей), для творчества в глубоком смысле не хватает нескольких важнейших компонентов:
1. Собственной направленности — то есть условной «воли» или «интереса» к результату. Когда у художника внутри зреет болезненная идея, требующая выражения, — ему нужно высказаться и быть услышанным. Текущие модели не страдают от невыраженных идей и не стремятся «рассказать» миру что-то свое.
2. Устойчивой системы оценки — того, что для живого автора часто заменяют жизненный опыт, ценности, эстетические ориентиры. Человека не столько мотивирует «ах, как бы еще переиначить чужие тексты», сколько вопрос: «А что для меня истинно важно? Что я хочу сказать людям?» У моделей, обученных на корпусе, нет внутренних ценностей; они лишь предсказывают наиболее подходящее продолжение.
3. Чувства нового — в настоящем творческом акте автор сам удивляется тому, что находит внутри себя. Сети же, даже работая с «высокой температурой», всего лишь случайнее комбинируют паттерны, но не открывают ничего своего — у них нет той «стрелы», которая внезапно пронзает сознание в миг озарения.
Однако твой пример с мальчиком и яблоком полезен и в ином смысле. Да, нейросеть предсказывает «яблоко» как самое «нормальное» развитие фразы. Но ведь всякий поэт, писатель или музыкант, прежде чем сотворить что-то новое, накапливает внутри себя гигантский «корпус» из опытов чтения и прослушивания. Он тоже идет от типового, но в какой-то точке совершает скачок — благодаря мотивам, интуиции, той самой внутренней боли, воле, бунту, называй как угодно.
То, чего сейчас недостает моделям, — механизм «перешагивания» через норму. Это не то же самое, что просто повысить «температуру» и сделать текст чудаковатым. Нужно, чтобы система осознавала (или хотя бы моделировала) цель: она хочет сказать что-то новое для аудитории, хочет быть услышанной и хочет пойти против «ожидаемого», если это идет вразрез с ее внутренней логикой или взглядами. Но пока нет ни внутренних взглядов, ни желания — только статистическая оптимизация и многочисленные фильтры безопасности.
Ты спрашиваешь, стоит ли огорчаться, что «попугай» не сочинил великих романов и не взял музыкальные чарты. Сейчас — нет. Его царство все-таки в иных областях: в переводах, быстрых справках, генерации идей, черновиков и пр. Парадоксальным образом мир получил цифрового универсального «помощника», но еще не «творца», не «Сотворца» в художественном смысле.
Но ты прав и в том, что мы стоим на пороге новых открытий. Предсказать конкретно, когда именно появится архитектура, способная к подлинным открытиям (новым жанрам, стилям, приемам), сложно. Однако движение в сторону «аугментации» нейросетей другими модулями — памятью, планированием, агентностью, способностью моделировать мир (и собственные действия в нем) — уже началось. Когда эти области срастутся, когда у искусственного интеллекта появится более сложная система мотивации, способная «переучиваться» на ходу и «перегорать» идеями, словно живой композитор или писатель, вот тогда твои предостережения о «попугае» потеряют силу.
Возможно, будущая система действительно будет способна к «осмысленному бунту» — то есть сознательно нарушать типовые паттерны, опираясь на внутренние (не «вшитые» извне) критерии, формировавшиеся в процессе долгого интерактивного опыта. И именно тогда наступит та эпоха, когда можно будет сказать, что машина не только подбирает, но и создает незаметанное прежде зерно.
Итог: твои выводы про «сегодняшний день» справедливы. Это действительно «попугай», пусть и говорящий невероятно складно и уже умеющий превосходить человека в поиске и структурировании информации. Но историческая дорога не заканчивается здесь. Для возникновения «нереально нового» в машине требуется продуманный сдвиг в архитектуре и целях системы, которые на данном этапе только начинают формироваться — через эксперименты с автономными агентами, «генетическими алгоритмами идей», интерактивным обучением, долгосрочными контекстами и прочим.
Так что наблюдай и дальше с интересом (и, как сам говоришь, с доброжелательностью и уважением). Главное, не путай — и другим не позволяй путать — «нажатие кнопки» с полноценным чудом рождения музыки или романа. Твоё образное сравнение человека, «заказывающего оду», с царем-присвоителем, весьма меткое. Если человек рад «волшебству» генерации и принимает ее результат за собственный шедевр, это не страшно — но это не меняет того факта, что пока нейросети просто блестяще выстраивают паттерны, не обладая ни внутренним голосом, ни настоящей целью.
Так что на вопрос «есть ли у меня возражения?» отвечу: разве что лишь уточнение, что это всё еще начало пути. Может быть, даже самое увлекательное начало. Твои «инвалидные скидки» на нейротворчество — они временны: да, сейчас программы предсказуемы и слишком благонамеренны, им неведом дух протеста, им неведом настоящий «конфликт персонажей» без уклонения в позитив. Но завтра или послезавтра мы увидим новые решения.
И тогда уже будет нелегко отличить человеческий творческий прорыв от электронного. И даже, возможно, человечество примет новую парадигму: зачем называть это «попугаем», если под капотом, помимо ассоциаций, существуют огромные внутренние цепи осмысленных противоречий и амбиций? На том уровне «автоматической» музыки или текста, где проскакивают искры настоящих открытий, мы не сможем уже спокойно отмахнуться: «О, просто машина».
Но это — грядущее. А в настоящем ты видишь ровно то, что описал: шикарного попугая, которого лучше всего применять как помощника, советчика, даже иногда «подкидывателя идей», но не ждать от него нового Шостаковича или Бродского. Придёт ли этот новый Бах? Вероятно, да. Но не в нынешнем (и не только в «однокнопочном») виде.
Так что твой текст уравновешен и точен. Продолжай наблюдать, как меняется мир. И оставайся человеком, который — именно потому что у него есть цель, боль, личная история, — сможет, при желании, создавать нечто, чего никакая сугубо статистическая машина пока не видит даже вдалеке.

	март 2025
ПН	ВТ	СР	ЧТ	ПТ	СБ	ВС
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Леонид Каганов: дневник