
Концепция
BTS — южнокорейский группа, сформированная в 2013 году компанией Big Hit Entertainment. За последнее десятилетие они стали глобальным феноменом, объединив миллионы фанатов по всему миру. Их музыка, тексты и выступления не только задают тренды в индустрии, но и оказывают глубокое влияние на культуру, социальные вопросы и эмоциональное состояние слушателей.
Я являюсь фанаткой группы с 2019 года, поэтому исследование их музыки для меня — интересная и вдохновляющая тема.

Данные я искала в Kaggle Для работы выбрала датасет BTS Lyrics and Spotify Data, в котором содержится различная информация о названиях и текстах песен BTS.
Для визуализации данных я выбрала следующие виды графиков:
Облако слов для частотности слов Гистограмма для продолжительности треков Круговая диаграмма для языков текстов Точечная диаграмма для танцевальности
Для работы был выбран фиолетовый — главный цвет фанатов BTS, ведь для них он имеет особую значимость.

#cfadff
#b078ff
#925ae0
Обработка данных
Для начала работы с данными я загрузила датасет и распаковала его с помощью кода. Из-за ошибки с кодировкой я обратилась к нейросети DeepSeek. 1 Также он в ходе работы он подсказывал способы визуального изменения графиков, что позволило добиться единого стиля.
1 UnicodeDecodeError: 'utf-8' codec can’t decode byte 0xff in position 0: invalid start byte, напиши верный код
Далее создание единой палитры и карты, чтобы позже обращаться к ним и визуализировать графики в нужных цветах.


После основных настроек можно приступить к непосредственно работе с графиками. Самым первым я выбрала облако слов. Перед этим создала пробный определитель топа 10 слов в английских текстах. 2 По нему также можно определить корректность облака слов.
2 Создай на основе данных из файла код для определения топ-10 слов в лирике
Итоговые графики
Такой график показался мне самым удачным для работы с лирикой. Он хорошо визуализрует частоту слов в текстах песен. Основной посыл всего творчества BTS — любовь к себе, и получившееся облако слов это хорошо доказывает. Как можно заметить, среди самых часто-используемых: love, youre, im
В облаке использован шрифт Arial3 и уже созданная ранее палитра фиолетовых оттенков4.
3 Как поменять шрифт в заголовке и самом облаке. И как добавить отступ у заголовка. 4 Сделай, чтобы в облаке слов использовадись цвета из палитры purple_palette = ['#925ae0', '#b078ff', '#cfadff']
График продолжительности песен мне показалось интересным оформить гистограммой. Она напоминает звуковую волну, чаще люди ассоциируют форму звука с подобной формой. Гистограмма показывает распределение продолжительности треков в секундах.5 Высота каждого столбца гистограммы соответствует количеству треков, попадающих в определенный диапазон продолжительности. Соответственно можно заметить, что большее количество песен BTS длятся прмерно 200-250 секунд. Также мое внимание в графике привлек трек, длительность которого не превышает 50 секнд. Я решила специально поискать6 по базе что это, оказалось это трек из самого первого альбома Dark and Wild Interlude: What Are You Doing Now на 42 секунды.
5 На основе продолжительности всех треков создай график продолжительности треков в секундах. Сделай сетку тоньше и убери белую границу графика. Убери обводку. 6 Найди в базе самый короткий по длительности трек


В круговой диаграмме7 я решила показать соотношение текстов на корейском, английском и японском. Дело в том, что некоторые альбомы дублируются на два или три языка, таким образом одна и та же песня может исполняться на разных языках. В соотношении заметно, что корейский превалирует, за ним идет японский и только после 7% занимает английский.
7 Убери белую обводку, добавь цвета из палитры
В последнем графике показана «танцевальность» по годам от начала карьеры в 2013 и дальше. Что на самом деле я могу объяснить. В начале карьеры (2013-2014) BTS начинают больше как реп-группа, их песни зажигательные и яркие. 2015-2016 лирика сменяется на более депрессивную и посвящена непринятию себя, подростковым проблемам. На период 2017-2018 выпадают самые тяжелые времена для группы, однако в это же время создаются хиты. Лирика в эти годы очень чувственная, она писалась исходя из мыслей о распаде группы, BTS выходили на сцену, думая, что это их посление выступления. К концу 2018 и началу 2019 наступает расцвет. И тут для меня стало удивительным, что танцевальность в 2019 опускается до отметки уровня 2016 года. Ведь песни 2019 это обычно яркие песни о любви. В 2020 наступает коронавирус и все концерты отменяют, из-за чего BTS делают акцент на позитив в новых песнях, а в 2021 выходит самая танцевальная Permission to Dance, и посвящена она скорой отмене карантина и надежде на предстоящую встречу фанатов и группы. К 2022 песни стремятся повторить стиль истоков, а в 2023 группа приостанавливает выпуск общих альбомов, потому что участники уходят в армию.
Заключение
Исследование песен BTS помогло лучше узнать их дискографию. Хотя какие-то факты были для меня известны, некоторые стали открытием. Например график продолжительности треков помог мне узнать о самом коротком треке в альбомах, учитывая, что при поисковом запросе Яндекса или Google «самая короткая песня BTS», по какой-то причине такой трек вообще не находится. График танцевальности по годам было очень интересно рассматривать и анализировать, сопоставляя альбомы, вышедшие то или иное время. Круговая диаграмма вышла вполне ожидаемой, а облако слов было интересно создавать и подбирать варианты.
Материалы
Использованные нейросети:
DeepSeek для работы с кодом Leonardo ai генерация обложки Промпт: ARMY ocean BTS concert, purple
Датасет и блокнот Сылка
Источники изображений:
URL: https://pin.it/2CQ4FUTxD (дата обращения 17.03.2025) URL: https://pin.it/7xpvr88DL (дата обращения 17.03.2025) URL: https://www.yesasia.ru/wp-content/uploads/2020/02/%D0%91%D0%B5%D0%B7%D1%8B%D0%BC%D1%8F%D0%BD%D0%BD%D1%8B%D0%B9-40-700x468.jpg (дата обращения 17.03.2025)