Как я нарисовал графический роман в ChatGPT и почти разочаровался в результате
Не так давно ChatGPT научился делать картинки прямо в чате. По началу я, как и все, нагенерил себе селфи в стиле Симпсонов/Южного Парка/Ghibli, а потом увидел, как ИИ манипулируют креаторы из телеги. Вспомнив, что с 2021 года у меня “в столе” томится идея графического романа с черновой раскадровкой, я подумал: «пора».
Для контекста: о сюжете и степени проработки идеи
К апрелю 2025 у меня были готовы:
- общая концепция романа;
- описания и мудборды главных действующих лиц;
- синопсис по главам;
- сценарий первой главы;
- черновая раскадровка ее первого драфта (не пригодилась).
Ничего из этого не дорабатывалось с ИИ — от него мне нужны были только картинки.
Сюжет: Весна 1942 года. Вчерашний школьник и идейный коммунист Антон Громов отправляется добровольцем на войну. Получив тяжелое ранение, он становится жертвой эксперимента советской научной лаборатории «Кронос», цель которой — создать оружие нового поколения. Антон получает взрывоопасное сердце-реактор, но скоро сбегает от своих создателей и становится мишенью как для «Кроноса», так и для немецких монстров.
Как сделать персонажей в ChatGPT
Нейронка способна сохранять черты лица, стилизуя изображение под запрос, — это мы поняли из внезапного наплыва постов а-ля Миядзаки. Так что прежде чем генерировать комикс, нужно было создать его героев.
У меня уже были готовые описания и мудборды — осталось попросить ИИ перевести это все во внятные портреты через промт:
Я хочу, чтобы ты нарисовал реалистичный портрет персонажа, в полный рост, в анфас и в профиль, согласно картинке с мудбордом и описанием персонажа.
Как сформулировать промт для страницы комикса
Следующий шаг — сформулировать четкий и внятный промт для отрисовки страницы комикса. Я решил не придумывать велосипед и сразу спросил у ChatGPT что ему надо, затем скорректировал по тому, что знаю о художественных талантах нейронки. Далее менял только переменные.
Нарисуй страницу комикса по черновой раскадровке (прилагается изображением).
Важно: не включай текстовые указания в финальное изображение — они нужны только для понимания сцены.
Количество панелей: 4
Формат страницы: вертикальный
Описание каждой панели:
Панель 1: Крупно. Антон надевает старые потрепанные кирзовые сапоги.
Панель 2: Крупно. Советский вещмешок, который весь в дырах и заплатках.
Панель 3: Крупно. На рубашке Антона - советский пионерский значок.
Панель 4: Средний план. Видим только спину и затылок Антона. Он собирается выйти за дверь, но сзади его окликает Лана, которой нет в кадре.
(диалоговое облако из-за кадра) Антон?
Стилизация: советский арт
Примеры визуального стиля: советские агитационные плакаты
Цвет: монохром, сепия, фактурность линогравюры / дерева; фон — выцветший бордовый; тени и линии — тёмно-коричневые; акценты — светло-жёлтые и охра.
Персонажи: использовать внешний вид из приложенных визуальных или текстовых референсов (Антон).
Важно: сохрани композицию панелей в соответствии с раскадровкой.
Передай атмосферу сцены: страх первой панели перетекает в уверенность на второй.
Отрази характер и визуальные особенности персонажей на основе предоставленных материалов.
Подготовка запроса
Когда портреты отрисованы, а промт готов к заполнению… остается еще пара шагов. Один из них — раскадровка страницы. Было достаточно ручки, бумаги и примерного понимания расстановки панелей и их содержания. Честно говоря, до конца не уверен, что ChatGPT их вообще считал хоть за что-то, но результат часто соответствовал задуманному.
Сценарий пришлось править специально для промта. Вместо прямой речи — обозначение диалогового бабла или описательного блока. Атмосферная вода стиралась. Добавлялась конкретика по крупности кадра, расположению персонажей и по происходящему в сцене. Уменьшалось количество панелей.
Затем я вставлял в промт остальные переменные и прикреплял к сообщению:
- портрет действующего персонажа;
- фото с раскадровкой;
- референс, если нужно что-то конкретное из реальной жизни;
- для верности еще и полный документ со сценарием.
Теперь можно генерировать!
Правки для ИИ
После первой хорошей выдачи (чаще всего это происходит на 2-3 итерации) я решил использовать получившуюся стилистику дальше и спросил у ИИ, как я могу описать ее в промте (так появились линогравюра, дерево и прочее в примере запроса выше). С этим был шанс, что страницы не будут сильно отличаться друг от друга по цветам, контурам и прочему. Пару раз попробовал сгенерировать таким образом вторую страницу, чтобы отработать с скорректировать результат, и продолжил в том же духе. Стиль все равно менялся, но не критично.
С одной страницей, почти в самом конце этой демо-главы, я чуть не заработал нервный срыв. ChatGPT упорно выдавал результат, который не соответствовал ни промту, ни раскадровке. В те долгие 3 часа наш диалог был примерно таким:
— Ты ошибся.
— Да, ты прав, я ошибся вот тут, но сейчас я сделаю вот это и все будет нормально. Делаю?
— Давай.
Снова плохой результат.
— Ты ошибся.
— Да, ты прав, я ошибся вот тут, но сейчас я сделаю вот это и все будет нормально. Делаю?
— Давай.
Снова плохой результат.
— Ты ошибся.
…
И так СЕМНАДЦАТЬ итераций. В какой-то момент я просто отказался от диалогов немецких солдат в кадре (дорисовал на фотошопе) и был готов согласиться на первый приемлемый результат.
Я не стал трогать правками баблы и текстовые блоки в остальных страницах. Он путал текст местами, путал говорящих, повторялся, издевался над кириллицей… Но давать ему комментарии по такой мелочи нет смысла, поэтому я просто переписывал текст и добавлял недостающие текстовые блоки в фотошопе. Знал бы о всех трудностях раньше, просил бы рисовать вообще без диалогов.
Также я решил привести рамки панелей к общей цветовой гамме “пипеткой” и “заливкой” все в том же ФШ, потому что ИИ рисовал одну страницу с бордовыми полями, другую с бежевыми, и всегда в разных оттенках.
Итоги
Чему меня научила работа над пилотной главой в ChatGPT:
- я стал лучше понимать нейронку;
- на опыте разобрался в том, как правильно работать в формате комикса;
- с ИИ раскадровка становится... детальной раскадровкой, не более.
Почему ИИ не подходит для большой формы (пока что):
- ему часто плевать либо на референсы, либо на раскадровку, либо на часть запроса;
- он не "рисует", но "стилизует", и творческого взгляда тут мало;
- лучше всего воспринимает до 4-5 панелей и 4 текстовых блоков на страницу;
- он либо забывает, что было раньше, либо путает промты в процессе;
- с каждым запросом он меняет стиль, цвета и внешний вид персонажей.
ChatGPT не стал для меня подходящим иллюстратором. Но вместе с ним я сделал более подробную и живую раскадровку. С этим уже можно искать художника!