Исходный размер 1316x2008

«Как люди слушают музыку: анализ Spotify-треков»

PROTECT STATUS: not protected

Для анализа был выбран открытый датасет Spotify Tracks Dataset с платформы Kaggle. Он содержит информацию о тысячах музыкальных треков, включая их популярность и аудио-характеристики.

Почему эти данные интересны?

Музыка — одна из самых важных форм массовой культуры. Spotify ежедневно формирует музыкальные предпочтения миллионов людей, поэтому анализ этих данных позволяет понять, какие характеристики звука влияют на популярность треков.

Какие графики будут использованы и почему

• Гистограммы — для распределений • Линейные графики — для изменений со временем • Столбчатые диаграммы — для сравнения жанров • Scatter plot — для поиска взаимосвязей

Концепция

«Какие музыкальные характеристики делают трек популярным — и как менялось звучание музыки со временем?»

Этапы работы с данными

  1. Загрузка данных

import pandas as pd

df = pd.read_csv («spotify_tracks.csv») df.head ()

  1. Очистка данных

df = df.dropna () df = df[df['popularity'] > 0]

Что делали: • удалили пропущенные значения • исключили треки с нулевой популярностью

  1. Описательная статистика

df.describe ()

Использовано: • среднее • медиана • стандартное отклонение • квартили

Визуализация

0

График 1 — Распределение популярности треков (гистограмма)

Идея: большинство треков не становятся популярными

import matplotlib.pyplot as plt

plt.hist (df['popularity'], bins=30) plt.title («Распределение популярности треков») plt.xlabel («Популярность») plt.ylabel («Количество треков») plt.show () Вывод: популярность распределена неравномерно

График 2 — Изменение energy по годам (линейный)

energy_by_year = df.groupby ('year')['energy'].mean ()

plt.plot (energy_by_year) plt.title («Средний уровень энергии треков по годам») plt.xlabel («Год») plt.ylabel («Energy») plt.show ()

Вывод: современная музыка стала более энергичной

График 3 — Популярность по жанрам (столбчатая)

genre_popularity = df.groupby ('genre')['popularity'].mean ().sort_values (ascending=False).head (10)

plt.barh (genre_popularity.index, genre_popularity.values) plt.title («Самые популярные жанры») plt.xlabel («Средняя популярность») plt.show ()

Вывод: поп и хип-хоп лидируют

График 4 — Связь danceability и popularity (scatter plot)

plt.scatter (df['danceability'], df['popularity'], alpha=0.3) plt.title («Связь танцевальности и популярности») plt.xlabel («Danceability») plt.ylabel («Popularity») plt.show ()

Вывод: умеренная положительная корреляция

Стилизация

Стиль: • Ограниченная палитра (например: тёмно-синий + молочный) • Один шрифт (Montserrat / Inter / IBM Plex) • Светлый или тёмный фон — везде одинаковый

Пример:

plt.rcParams['font.family'] = 'Inter' plt.rcParams['axes.facecolor'] = '#F6F4EF' plt.rcParams['figure.facecolor'] = '#F6F4EF' plt.rcParams['text.color'] = '#1C1C1C'

Статистические методы

В проекте использовались:

• Описательная статистика • Группировка данных (groupby) • Среднее значение • Корреляционный анализ • Визуальный анализ распределений

«Как люди слушают музыку: анализ Spotify-треков»
Проект создан 05.02.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше