
Описание
Для поиска датасета был выбран сайт kaggle.com. Меня заинтересовала тема качества вина, потому что недавно меня порадовала новость о том, что число острых отравлений вином в России за девять лет упало на 40% и я захотела узнать, что в принципе влияет на качество алкоголя, который мы употребляем.
Описание к датасету говорит о том, что набор данных относится к красным сортам португальского вина «Винью Верде» и описывает количество различных химических веществ, присутствующих в вине, и их влияние на его качество.
Визуал

#CF7380, #410000, #FFE7BC

#4C2C1E, #003101
Для проекта было выбрано 5 цветов — 3 основных и 2 дополнительных. Основные цвета — бордовый, светло-бежевый, розовый — отсылают к самых популярным видам вин. Дополнительные — изумрудный и тёмно-коричневый — цвета ёмкостей, в которых вино обычно хранится, перевозится или выдерживается (ассоциация со стеклянными бутылками и деревянными бочками).
Шрифт Georgia подходит для брендинга вина благодаря своему классическому и изысканному стилю, который ассоциируется с традициями, качеством и утонченностью. Он обладает высокой читаемостью и элегантными засечками, что придаёт ощущение аристократичности и доверия. Georgia легко воспринимается как на этикетках, так и в цифровых материалах, что делает её универсальным решением. Такой шрифт подчёркивает историчность и авторитет продукта, особенно если вино позиционируется как ремесленное или качественно выдержанное.
Диаграммы
Для визуализации мною было использовано четыре вида диаграмм:
Диаграмма рассеяния — показывает зависимость между двумя признаками — сульфатами и остаточным сахаром в вине.
Линейная диаграмма — так же как и диаграмма рассеяния показывает зависимость между двумя величинами. Я построила её между плотностью и крепостью напитка
Круговая диаграмма — используется для выражения количественного соотношения одного признака. У меня — это общая оценка качества вина
Гистограмма — график, хорошо подходящий для отображения частоты какого-либо признака, в моём случае — для распределения значений pH
Диаграмма рассеяния показывает распределение всех вин в датасете по уровню сульфатов и остаточного сахара. Мы видим, что подавляющее большинство вин содержат от 1 до 4 граммов остаточного сахара, при этом уровень сульфатов от 0.5 до 1.
Линейная диаграмма показывает, что есть незначительная тенденция уменьшения плотности вина при увеличении крепости напитка.
Видно, что с ростом содержания алкоголя плотность в целом снижается, хотя есть и выбросы. Это соответствует физическим законам: этанол легче воды, и при увеличении его доли общая плотность раствора уменьшается. Однако шум в данных может указывать на влияние других компонентов вина (сахаров, кислот и т. д.).
На круговой диаграмме видно, что большинство вин (40% и 42%) получили общую оценку 5 и 6 соответственно
Гистограмма показывает, что в основном все вина имеют кислотность от 3 до 3.6 по шкале pH.
Такая среда типична для вин (умеренно кислая среда). Это важно, так как pH влияет на вкус, микробиологическую стабильность и способность к хранению.
Описание применения генеративной модели
Для генерирования обложки проекта я использовала Recraft. Подобрала фото бутылок вин, на которых стоит основываться при создании изображения, описала цвета своего проекта.
Промт: Create an image with a creative composition of bottles of wine — red, white and pink. Use these colors: 410000, CF7380, FFE7BC.
Kaggle — поиск датасета
Google Colab — создание кода
Итог
В результате выполнения я получила 4 диаграммы, которые отображают влияние основных характеристик вина на его общую оценку качества.
Они могут быть полезны любителям вина для лучшего понимания формирования качества напитка и для помощи в совершении правильного выбора. Опираясь на них, виноделы, технологи и исследователи могут анализировать вино на основе химических свойств. Так специалисты смогут лучше понимать физико-химические свойства продукта и управлять его качеством для потребителя.