
введение
Для проекта я выбрала данные о зависимости здоровья от сна, представленные на сайте kaggle.com.
Мне интересно было работать именно с этим датасетом, ведь анализ и визуализация этих данных играет важную роль в понимании влияния сна на здоровье. Особенно это актуально сегодня, когда среди молодёжи всё чаще наблюдается смещение режима сна, ухудшение его качества и пренебрежение достаточным его количеством. Растёт уровень стресса, снижается физическая активность, учащаются сердечно-сосудистые и психоэмоциональные заболевания, часто связанные с нарушением сна. Наглядная визуализация этих данных — мощный инструмент для привлечения внимания к проблеме и призыва взять на контроль собственный сон и здоровье. Она может быть использована в СМИ, на плакатах, в образовательных проектах и инфографике, чтобы показать молодым людям, насколько важно осознанно относиться к своему режиму сна.
1. импорт библиотек

pandas — для работы с таблицами данных matplotlib — для построения графиков seaborn — для удобной визуализации статистики
2. настройка корректного выведения таблиц

Округляем числовые значения, если нужно, добавляем индекс как отдельный столбец для удобства вывода, для каждого столбца, формируем строку заголовка с выравниванием по ширине столбцов, выводим заголовок, разделитель, строку таблицы.
3. считывание файла
Загружаем данные из CSV-файла: читаем CSV в DataFrame, удаляем пробелы в названиях столбцов.
Обрабатываем пропуски и задаём типы данных: заменяем пропуски в расстройствах сна на 'None’, переводим пол и расстройство сна в категориальный тип.
4. палитра
На Pinterest было найдено изображение-референс палитры, передающее тему проекта. Лаванда и мята — ароматы трав, которые часто используют, чтобы настроиться на спокойный сон; темно-синий — цвет неба в полночь.
Следующим шагов в коде определяем цветовую палитру для графиков и устанавливаем стиль графиков seaborn с тёмной сеткой.
5. график 1: зависимость типа расстройства сна от возраста и пола
Выводим сначала таблицу с нужными данными для удобства и контроля процесса дальнейшей визуализации.
Для этой зависимости был выбран тип графика «ящик с усами», потому что этот тип визуализации позволяет наглядно сравнить распределения возраста между разными группами, он показывает медиану, квартили, диапазон значений и выбросы, что важно для анализа вариаций внутри каждой группы, такой график хорошо подходит для категориальных сравнений.
Создаём фигуру размером 8×6 дюймов, строим boxplot возраста по полу с разделением по расстройствам, задаём заголовок графика с цветом, автоматически подгоняем расположение элементов, показываем.
6. график 2: зависимость типа расстройства сна от уровня стресса
Для визуализации зависимости типа расстройства сна от среднего уровня стресса для мужчин и женщин использована гистограмма, потому что этот тип графика отлично подходит для отображения различий между дискретными категориями — в данном случае между типами расстройств сна и полом. Она позволяет легко сравнивать средние значения по каждой группе. Высота столбцов наглядно показывает разницу в среднем уровне стресса между мужчинами и женщинами при разных типах расстройств сна.
Строим столбчатую диаграмму по среднему стрессу, подписываем оси, добавляем заголовок, подгоняем макет, показываем.
7. график 3: зависимость типа расстройства сна от рода деятельности
Столбчатая диаграмма стала оптимальным решением для визуализации зависимости типа расстройства сна от рода деятельности. Род деятельности и тип расстройства сна — это качественные (категориальные) переменные. Столбчатая диаграмма идеально подходит для отображения количества случаев в каждой комбинации категорий, позволяя чётко представить, какие профессии чаще связаны с теми или иными расстройствами сна. Длина столбцов позволяет легко сравнивать, как часто определённые расстройства встречаются среди людей разных профессий. Такой график, как и диаграмма, интуитивно понятен широкой аудитории, что делает его подходящим, например, для визуализаций в СМИ.
8. график 4: зависимость типа расстройства сна от физической активности
Диаграмма рассеяния была выбрана для визуализации типа расстройства сна от уровня физической активности и типа расстройства сна от качества и продолжительности сна потому что это наиболее подходящий тип графика для визуализации взаимосвязей, где участвуют две количественные переменные и одна категориальная. Этот тип показывает форму распределения и плотность данных, чего не делают столбчатые графики, Позволяет анализировать корреляции между двумя числовыми признаками.
9. график 5: зависимость типа расстройства сна от его качества и продолжительности
ресурсы и генеративные модели