Original size 2480x3500

Обучение генеративной модели Stable Diffusion стилю детских рисунков

PROTECT STATUS: not protected
8

Концепция

Идеей моего проекта является обучение генеративной нейросети Stable Diffusion, которая будет способна понимать и самостоятельно воспроизводить уникальные изображения, основанные на стиле детских рисунков.

В данном проекте я решила взять за основу именно детские рисунки, так как мне было интересно как нейросеть сможет повторить настолько интуитивный и наивный стиль рисования.

Исходные изображения

Для обучения генеративной нейросети на просторах интернета я собрала датасет, который состоял из 23 детских рисунков.

Original size 2835x1417

Код

Наш код реализует обучение генеративной нейросети, ориентируясь на стилистику детских рисунков.

Original size 1303x634
Original size 1330x364

Подключаем созданную нами папку «kids_art» и выводим тренировочные изображения.

Original size 1320x665

Далее мы просим нейросеть создать промпты на наши изображения.

Original size 1316x387
Original size 1304x743

На этом этапе происходит обучение генеративной модели на собранном наборе изображений.

Серия итоговых изображений

Original size 1024x1024

На мой взгляд нейросеть вполне удачно справилась с генерацией изображений в стиле детских рисунков. Ей удалось передать неопытность и наивность. А также она справилась с передачей карандашной техники, штриховки и неоднотонного покрытия в некоторых областях.

Original size 1024x1024

В некоторых рисунках вместо карандашной техники нейросеть решила использовать акварель, что отражается в полутонах и делает изображение более сложным и контрастным.

0

Также интересно наблюдать за тем, как нейросеть справилась с рукописными вставками. Она достаточно умело повторила чернильные корявые надписи, напоминающие почерк ребенка.

Original size 1024x1024

Еще одним вариантом интересной генерации стала данная фотография. Здесь помимо детских рисунков мы можем заметить общую семейную фотографию, где человечки служат графикой и становятся частью рамки, частью дизайна самой фотографии.

Заключение

На мой взгляд, нейросеть действительно удачно справилась с поставленной задачей. Во всех изображениях прослеживается стилистика детских рисунков, карандашная или акварельная техника, узнаваемые формы и даже повторение рукописного шрифта. Цели, поставленные мной при создании этого проекта, были достигнуты.

Обучение генеративной модели Stable Diffusion стилю детских рисунков
8
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more