Как я нарисовал графический роман в ChatGPT и почти разочаровался в результате

Не так давно ChatGPT научился делать картинки прямо в чате. По началу я, как и все, нагенерил себе селфи в стиле Симпсонов/Южного Парка/Ghibli, а потом увидел, как ИИ манипулируют креаторы из телеги. Вспомнив, что с 2021 года у меня “в столе” томится идея графического романа с черновой раскадровкой, я подумал: «пора».

К апрелю 2025 у меня были готовы:

общая концепция романа;
описания и мудборды главных действующих лиц;
синопсис по главам;
сценарий первой главы;
черновая раскадровка ее первого драфта (не пригодилась).

Ничего из этого не дорабатывалось с ИИ — от него мне нужны были только картинки.

Сюжет: Весна 1942 года. Вчерашний школьник и идейный коммунист Антон Громов отправляется добровольцем на войну. Получив тяжелое ранение, он становится жертвой эксперимента советской научной лаборатории «Кронос», цель которой — создать оружие нового поколения. Антон получает взрывоопасное сердце-реактор, но скоро сбегает от своих создателей и становится мишенью как для «Кроноса», так и для немецких монстров.

Нейронка способна сохранять черты лица, стилизуя изображение под запрос, — это мы поняли из внезапного наплыва постов а-ля Миядзаки. Так что прежде чем генерировать комикс, нужно было создать его героев.

У меня уже были готовые описания и мудборды — осталось попросить ИИ перевести это все во внятные портреты через промт:

Я хочу, чтобы ты нарисовал реалистичный портрет персонажа, в полный рост, в анфас и в профиль, согласно картинке с мудбордом и описанием персонажа.
Промт на генерацию персонажа

Мудборд, описание персонажа и два результата

Следующий шаг — сформулировать четкий и внятный промт для отрисовки страницы комикса. Я решил не придумывать велосипед и сразу спросил у ChatGPT что ему надо, затем скорректировал по тому, что знаю о художественных талантах нейронки. Далее менял только переменные.

Нарисуй страницу комикса по черновой раскадровке (прилагается изображением).
Важно: не включай текстовые указания в финальное изображение — они нужны только для понимания сцены.
Количество панелей: 4
Формат страницы: вертикальный

Описание каждой панели:
Панель 1: Крупно. Антон надевает старые потрепанные кирзовые сапоги.
Панель 2: Крупно. Советский вещмешок, который весь в дырах и заплатках.
Панель 3: Крупно. На рубашке Антона - советский пионерский значок.
Панель 4: Средний план. Видим только спину и затылок Антона. Он собирается выйти за дверь, но сзади его окликает Лана, которой нет в кадре.
(диалоговое облако из-за кадра) Антон?

Стилизация: советский арт
Примеры визуального стиля: советские агитационные плакаты
Цвет: монохром, сепия, фактурность линогравюры / дерева; фон — выцветший бордовый; тени и линии — тёмно-коричневые; акценты — светло-жёлтые и охра.
Персонажи: использовать внешний вид из приложенных визуальных или текстовых референсов (Антон).
Важно: сохрани композицию панелей в соответствии с раскадровкой.
Передай атмосферу сцены: страх первой панели перетекает в уверенность на второй.
Отрази характер и визуальные особенности персонажей на основе предоставленных материалов.
Промт на генерацию страницы комикса

Когда портреты отрисованы, а промт готов к заполнению… остается еще пара шагов. Один из них — раскадровка страницы. Было достаточно ручки, бумаги и примерного понимания расстановки панелей и их содержания. Честно говоря, до конца не уверен, что ChatGPT их вообще считал хоть за что-то, но результат часто соответствовал задуманному.

Сценарий пришлось править специально для промта. Вместо прямой речи — обозначение диалогового бабла или описательного блока. Атмосферная вода стиралась. Добавлялась конкретика по крупности кадра, расположению персонажей и по происходящему в сцене. Уменьшалось количество панелей.

Затем я вставлял в промт остальные переменные и прикреплял к сообщению:

портрет действующего персонажа;
фото с раскадровкой;
референс, если нужно что-то конкретное из реальной жизни;
для верности еще и полный документ со сценарием.

Теперь можно генерировать!

После первой хорошей выдачи (чаще всего это происходит на 2-3 итерации) я решил использовать получившуюся стилистику дальше и спросил у ИИ, как я могу описать ее в промте (так появились линогравюра, дерево и прочее в примере запроса выше). С этим был шанс, что страницы не будут сильно отличаться друг от друга по цветам, контурам и прочему. Пару раз попробовал сгенерировать таким образом вторую страницу, чтобы отработать с скорректировать результат, и продолжил в том же духе. Стиль все равно менялся, но не критично.

С одной страницей, почти в самом конце этой демо-главы, я чуть не заработал нервный срыв. ChatGPT упорно выдавал результат, который не соответствовал ни промту, ни раскадровке. В те долгие 3 часа наш диалог был примерно таким:

— Ты ошибся.
— Да, ты прав, я ошибся вот тут, но сейчас я сделаю вот это и все будет нормально. Делаю?
— Давай.

Снова плохой результат.

— Ты ошибся.
— Да, ты прав, я ошибся вот тут, но сейчас я сделаю вот это и все будет нормально. Делаю?
— Давай.

Снова плохой результат.

— Ты ошибся.
…

И так СЕМНАДЦАТЬ итераций. В какой-то момент я просто отказался от диалогов немецких солдат в кадре (дорисовал на фотошопе) и был готов согласиться на первый приемлемый результат.

Я не стал трогать правками баблы и текстовые блоки в остальных страницах. Он путал текст местами, путал говорящих, повторялся, издевался над кириллицей… Но давать ему комментарии по такой мелочи нет смысла, поэтому я просто переписывал текст и добавлял недостающие текстовые блоки в фотошопе. Знал бы о всех трудностях раньше, просил бы рисовать вообще без диалогов.

Также я решил привести рамки панелей к общей цветовой гамме “пипеткой” и “заливкой” все в том же ФШ, потому что ИИ рисовал одну страницу с бордовыми полями, другую с бежевыми, и всегда в разных оттенках.

Чему меня научила работа над пилотной главой в ChatGPT:

я стал лучше понимать нейронку;
на опыте разобрался в том, как правильно работать в формате комикса;
с ИИ раскадровка становится... детальной раскадровкой, не более.

Почему ИИ не подходит для большой формы (пока что):

ему часто плевать либо на референсы, либо на раскадровку, либо на часть запроса;
он не "рисует", но "стилизует", и творческого взгляда тут мало;
лучше всего воспринимает до 4-5 панелей и 4 текстовых блоков на страницу;
он либо забывает, что было раньше, либо путает промты в процессе;
с каждым запросом он меняет стиль, цвета и внешний вид персонажей.

ChatGPT не стал для меня подходящим иллюстратором. Но вместе с ним я сделал более подробную и живую раскадровку. С этим уже можно искать художника!

Как я нарисовал графический роман в ChatGPT и почти разочаровался в результате

Для контекста: о сюжете и степени проработки идеи

Как сделать персонажей в ChatGPT

Как сформулировать промт для страницы комикса

Подготовка запроса

Правки для ИИ

Итоги