Исходный размер 1140x1600

Обучение генеративной нейросети под стиль «Марина» работ И. К. Айвазовкского

Концепция

Цель проекта — дообучение нейросети Stable Diffusion и генерация серии изображений в стиле живописного направления «Марина», а конкретнее — на основе работ И. К. Айвазовского. В результате должны получиться морские композиции с похожей манерой исполнения и полупрозрачной цветовой гаммой.

Исходные изображения — датасет из 98 работ художника, морские пейзажи разных настроений и композиционного строения.

И. К. Айвазовский, «Солнечный день», 1884 г.

И. К. Айвазовский, «Буря», 1886 г.

И. К. Айвазовский, «Радуга», 1873 г.

И. К. Айвазовский, «Этюд воздуха над морем», 1835 г.

Стартовый архив

Первый архив картин состоит из элементов разного размера и расположения.

Исходный размер 3500x2000

Оригинальные картины И. К. Айвазовского.

Для приведения всех изображений в один формат 512×512 пикс. был написан дополнительный код. Для избегания лимита операций Google collab код воспроизведен в отдельной среде.

Принцип работы кода строится по алгоритму:

  1. Импорт библиотек
  2. Определение путей для Input и Output
  3. Обрезка по центру квадрата (через функцию crop_center_square (img))
  4. Обработка изображений: — Проверка расширения файла (работаем только с .jpg, .jpeg, .png). — Открытие изображение и преобразование в формат RGB. -Автоматическая коррекция ориентации изображения на основе данных EXIF (если они присутствуют), чтобы устранить возможные проблемы с ориентацией (например, когда фото сделано вертикально). — Изменение размера изображения до 512×512 пикселей с использованием метода LANCZOS (качественное уменьшение). — Сохранение в папку Output
Исходный размер 5118x1018

Картины И. К. Айвазовского после обработки.

Итоговая серия изображений

После обучения нейросеть сгенерировала несколько изображений по промптам: от короткого, простого предложения до сложного, детального запроса с описанием цвета, настроения и абстрактного погодного ощущения в пейзаже.

Все изображения созданы на основе изначального формата, 512×512.

Исходный размер 1024x1024

«Aiwasowski style, light blue sea and 2 ships».

Исходный размер 1024x1024

«Aiwasowski style, dark blue sea and 1 ship».

Экспериментальные промпты о штормовом море отличаются только парой слов — временем суток и силой непогоды. Вот почему результаты получились схожие:

Исходный размер 3717x1234

Промпты: «Aiwasowski style, strong storm in the sea», «Aiwasowski style, strong storm in the night sea», «Aiwasowski style, night. Catastrophic storm in the dark blue sea sea».

Исходный размер 1024x1024

Еще более краткий промпт: «Aiwasowski style, night. Catastrophy in the sea».

Далее — более детальные, сюжетные промпты по типу «Утро. Одинокий корабль далеко в море.»

Исходный размер 1024x1024

«Aiwasowski style, morning. The lonely ship far away in the sea».

Промпт: «Романтичный вечер. Корабль уходит тихую ночь.». Для тишины и романтики нейросеть добавила сиреневые и розовые оттенки.

Исходный размер 1024x1024

«Aiwasowski style, romantic evening. The ship is running out in the quiet night».

Более сложный результат на развернутый запрос: «Огни в море теплы, небо наполнено глубокими синими цветами. Корабль уплывает в тихую темноту.»

Исходный размер 1024x1024

«Aiwasowski style, romantic evening. Lights in the sea are warm, the sky is in deep blue colors. The ship is running out in the quiet dark».

Промпт про утро с указанием цветов:

Исходный размер 1024x1024

«Aiwasowski style, quiet morning. The ships are living the port in yellowish and bluish semi-transparent colors».

Развернутые запросы с описаниями облаков и их состояния, некоторых дополнительных деталей пейзажа:

Исходный размер 1024x1024

«Aiwasowski style, late morning. The sea is slightly storming, all the sheaps are beside the coast».

Исходный размер 1024x1024

«Aiwasowski style, dark night. The sea is storming heavily, lightnings break in the water, dark black clouds are hanging over the ground».

Исходный размер 1024x1024

Результат 13.

В итоге, в серии наблюдается схожая тенденция: изображения генерируются по аналогичному композиционному плану. Большая часть облаков и волн (форма волны) похожи, а корабли следуют одной перспективе, наклону и оформлению конструкции.

Различия проявляются в цветовой гамме и контрастности — в зависимости от запроса изображение содержит либо вариацию одного цвета, либо плавный/резкий микс из нескольких.

Среда выполнения

Код написан в Google Collab и сохранен в формате IPYNB, для обучения использована модель Stable Diffusion. Изображения в стартовом датасете взяты из публичных архивов творчества И. К. Айвазовского.

Пояснительные комментарии к процессу обучения добавлены в исходном коде. Ссылка на файл: https://drive.google.com/file/d/1JAlg3ZzLRwD3S-WgZovwThuAjmLwKkpg/view?usp=sharing

Дополнительные источники

В качестве вспомогательного инструмента использован Chat GPT-4o. Он объяснил некоторые куски кода и их функции, а также перевел часть пояснительных комментариев на русский язык.

Обучение генеративной нейросети под стиль «Марина» работ И. К. Айвазовкского
Проект создан 10.04.2025
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше