Original size 1140x1600

health and sleep

PROTECT STATUS: not protected
3

введение

Для проекта я выбрала данные о зависимости здоровья от сна, представленные на сайте kaggle.com. 


Мне интересно было работать именно с этим датасетом, ведь анализ и визуализация этих данных играет важную роль в понимании влияния сна на здоровье. Особенно это актуально сегодня, когда среди молодёжи всё чаще наблюдается смещение режима сна, ухудшение его качества и пренебрежение достаточным его количеством. Растёт уровень стресса, снижается физическая активность, учащаются сердечно-сосудистые и психоэмоциональные заболевания, часто связанные с нарушением сна. Наглядная визуализация этих данных — мощный инструмент для привлечения внимания к проблеме и призыва взять на контроль собственный сон и здоровье. Она может быть использована в СМИ, на плакатах, в образовательных проектах и инфографике, чтобы показать молодым людям, насколько важно осознанно относиться к своему режиму сна.

1. импорт библиотек

big
Original size 1029x69

pandas — для работы с таблицами данных matplotlib — для построения графиков seaborn — для удобной визуализации статистики

2. настройка корректного выведения таблиц

big
Original size 1031x461

Округляем числовые значения, если нужно, добавляем индекс как отдельный столбец для удобства вывода, для каждого столбца, формируем строку заголовка с выравниванием по ширине столбцов, выводим заголовок, разделитель, строку таблицы.

3. считывание файла

Original size 4124x532

Загружаем данные из CSV-файла: читаем CSV в DataFrame, удаляем пробелы в названиях столбцов.

Обрабатываем пропуски и задаём типы данных: заменяем пропуски в расстройствах сна на 'None’, переводим пол и расстройство сна в категориальный тип.

4. палитра

На Pinterest было найдено изображение-референс палитры, передающее тему проекта. Лаванда и мята — ароматы трав, которые часто используют, чтобы настроиться на спокойный сон; темно-синий — цвет неба в полночь.

Следующим шагов в коде определяем цветовую палитру для графиков и устанавливаем стиль графиков seaborn с тёмной сеткой.

Original size 3840x758
Original size 4128x1252

5. график 1: зависимость типа расстройства сна от возраста и пола

Original size 1032x223
Original size 664x204

Выводим сначала таблицу с нужными данными для удобства и контроля процесса дальнейшей визуализации.

Для этой зависимости был выбран тип графика «ящик с усами», потому что этот тип визуализации позволяет наглядно сравнить распределения возраста между разными группами, он показывает медиану, квартили, диапазон значений и выбросы, что важно для анализа вариаций внутри каждой группы, такой график хорошо подходит для категориальных сравнений.

Создаём фигуру размером 8×6 дюймов, строим boxplot возраста по полу с разделением по расстройствам, задаём заголовок графика с цветом, автоматически подгоняем расположение элементов, показываем.

Original size 800x600

6. график 2: зависимость типа расстройства сна от уровня стресса

Original size 1032x246
Original size 485x114

Для визуализации зависимости типа расстройства сна от среднего уровня стресса для мужчин и женщин использована гистограмма, потому что этот тип графика отлично подходит для отображения различий между дискретными категориями — в данном случае между типами расстройств сна и полом. Она позволяет легко сравнивать средние значения по каждой группе. Высота столбцов наглядно показывает разницу в среднем уровне стресса между мужчинами и женщинами при разных типах расстройств сна.

Строим столбчатую диаграмму по среднему стрессу, подписываем оси, добавляем заголовок, подгоняем макет, показываем.

Original size 800x600

7. график 3: зависимость типа расстройства сна от рода деятельности

Original size 1031x245
Original size 433x316

Столбчатая диаграмма стала оптимальным решением для визуализации зависимости типа расстройства сна от рода деятельности. Род деятельности и тип расстройства сна — это качественные (категориальные) переменные. Столбчатая диаграмма идеально подходит для отображения количества случаев в каждой комбинации категорий, позволяя чётко представить, какие профессии чаще связаны с теми или иными расстройствами сна. Длина столбцов позволяет легко сравнивать, как часто определённые расстройства встречаются среди людей разных профессий. Такой график, как и диаграмма, интуитивно понятен широкой аудитории, что делает его подходящим, например, для визуализаций в СМИ.

Original size 1000x1000

8. график 4: зависимость типа расстройства сна от физической активности

Original size 1030x330
Original size 528x138

Диаграмма рассеяния была выбрана для визуализации типа расстройства сна от уровня физической активности и типа расстройства сна от качества и продолжительности сна потому что это наиболее подходящий тип графика для визуализации взаимосвязей, где участвуют две количественные переменные и одна категориальная. Этот тип показывает форму распределения и плотность данных, чего не делают столбчатые графики, Позволяет анализировать корреляции между двумя числовыми признаками.

Original size 800x600

9. график 5: зависимость типа расстройства сна от его качества и продолжительности

Original size 1031x328
Original size 523x141
Original size 800x600

ресурсы и генеративные модели

  1. СhatGPT и Perplexity для исправления неизвестных ошибок в коде.
  2. Sora для генерации обложи.
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more