Original size 1140x1600

Обучение генеративной модели под стиль Масяни

PROTECT STATUS: not protected
24

Идея

Проект направлен на обучение нейросети, обладающей способностью понимать и воспроизводить визуальные стили, характерные для определённых иллюстраторов.

Для своего проекта я выбрала не обычный мультик, а именно Масяню. Масяня — это обычная, особо не блещущая талантами и красотой девица, живущая той же обычной жизнью, что и мы все, собравшиеся в этой стране, да и не только в ней. Я не находила практически артов вместе с этим персонажем, да и заметила то, что многие забыли про этот мультик. Своим проектом я хотела еще раз напомнить всем об этом забытом шедевре, который откликается в наших сердцах за обыденность и простоту, за отсутствие незыблемых мечтаний о прекрасной жизни.

Как я уже сказала, в интернете очень мало артов с Масяней и я хотела бы посмотреть, как нейросеть видит ее и сможет ли повторить этот уникальный стиль.

Исходные изображения

Тут я прикрепила исходные картинки, которыми я обучала свою модель

big
Original size 1280x256

Стиль Масяни довольно простой, понятные формы, нет должной анатомии и 2д формат теней, посмотрим как ее повторит нейросеть.

Код

Здесь я показываю как я строила свой код

big
Original size 1329x739

Подключаю необходимые модули, настраиваю рабочую директорию и пути к данным.

Original size 1648x523
Original size 835x296

Чтобы работать с моделями и наборами данных на Hugging Face, я использовала функцию notebook_login (). Благодаря ей я смогла войти в систему Hugging Face Hub с помощью сгенерированного API-ключа и получила доступ ко всем нужным ресурсам для обучения.

Original size 983x642

Эта команда запускает процесс, где я дообучаю модель, чтобы она генерировала картинки в нужном мне стиле, а именно в стиле масляных красок. Сначала подгружается базовая модель с нужными ресурсами, а затем ей показывают набор примеров картинок с описаниями, чтобы она научилась создавать новые работы в стиле Масяни.

И далее выложила модель

Полученные фотографии

Первая фотография получилась хорошо, соблюден стиль Масяни, частично создана ее одежда, почему-то цвета перемешались, но в остальном вышло отлично.

Второе изображение получилось хуже, возможно из-за второго персонажа, в целом неплохо, но появилось множество лишних деталей и нарушена немного стилистика Масяни.

Original size 1024x1024

Эта Масяна неплохая, но опять же старые проблемы возникли с соблюдением анатомии данного персонажа

Неплохие кадры, видно, что нейросети тяжело дается создание персонажей, которые имеют уникальный стиль, но вышло хорошо, есть недочеты, но основная суть персонажей сохранена, даже появился фон, который соответствует стилистике мультика.

Вывод

Итак, обучение нейросетей для генерации изображений достигло значительных успехов и продолжает развиваться. Современные модели, такие как DALL-E 2, Stable Diffusion и Midjourney, способны генерировать высококачественные, детализированные изображения по текстовому описанию. Во-многом ей предстоит еще учиться, так как на некоторых этапах возникают проблемы и несоответствие промтам, но я верю, что у нее большое будущее.

EXISTING_LINK_0_1761439396392_k0fw4×24w

Обучение генеративной модели под стиль Масяни
24
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more