
Почему именно эти данные
Для анализа я выбрал набор данных vgsales.csv, содержащий информацию о продажах видеоигр с 1980 по 2020 годы. Этот датасет включает более 16,500 записей с подробной информацией о продажах игр по регионам, платформам, жанрам и издателям.
Мне интересно это потому что я сам являюсь геймдизайнером и мне интересны результаты этот исследования.
Почему эти данные?
Индустрия видеоигр представляет особый интерес для анализа по нескольким причинам:
- Это быстрорастущая глобальная индустрия с выручкой, превышающей киноиндустрию - История видеоигр охватывает несколько десятилетий, что позволяет отследить эволюцию предпочтений игроков и технологических платформ - Данные демонстрируют явные региональные различия в популярности жанров (например, ролевые игры значительно популярнее в Японии) - Рынок видеоигр сегментирован географически, что позволяет сравнивать предпочтения игроков из разных регионов мира
Выбор типов визуализации
Для наглядного представления различных аспектов данных я использовал разнообразные типы графиков:
Линейный график с маркерами для отображения эволюции популярности жанров по десятилетиям — позволяет наглядно показать тренды и смену лидирующих позиций
Короткий вывод: индустрия видеоигр демонстрирует кардинальное изменение предпочтений игроков за 40 лет. Если в 1980-х доминировали платформеры (32.5%), то к 2010-м они потеряли популярность (4.8%), уступив лидерство экшн-играм (26.7%) и шутерам (18.4%). Это отражает как технологическую эволюцию игровых платформ, так и изменение демографии игроков.

Пример кода
Тепловая карта для визуализации регионального распределения продаж по жанрам — эффективно демонстрирует процентные соотношения и позволяет выявить паттерны
Короткий вывод: авторы видеоигр придерживаются часто полярных политик в разработке. Одни стараются создавать игры, ориентированные на глобальный рынок (спортивные и гоночные симуляторы), вторые фокусируются на региональных предпочтениях — например, ролевые игры имеют несоразмерно высокую долю продаж в Японии (38%), в то время как шутеры наиболее популярны в Северной Америке (56.2%).
Пример кода
Пузырьковая диаграмма для топ-10 издателей — размер пузырьков наглядно отражает масштаб продаж
Короткий вывод: Nintendo доминирует на рынке с огромным отрывом (1786.6 млн), что объясняется их уникальной стратегией создания эксклюзивных франшиз и вертикальной интеграцией (разработка как аппаратного, так и программного обеспечения). Electronic Arts (1110.3 млн) и Activision (727.5 млн) занимают второе и третье места соответственно.
Столбчатая диаграмма для средних продаж на игру по жанрам — оптимальна для сравнения дискретных категорий
Короткий вывод: платформеры (0.94 млн) и шутеры (0.79 млн) имеют наивысшие средние продажи на игру, что делает их наиболее прибыльными жанрами для разработчиков. При этом приключенческие игры (0.19 млн) и стратегии (0.26 млн), несмотря на свою многочисленность, демонстрируют наименьшую коммерческую эффективность.
Полярная (радарная) диаграмма для общих продаж по жанрам — дает необычное визуальное представление многомерных данных
Короткий вывод: Action (1751.2 млн), Sports (1330.9 млн) и Shooter (1037.4 млн) являются тремя наиболее продаваемыми жанрами в абсолютных показателях. Это объясняется их широкой аудиторией и кроссплатформенным характером, что позволяет охватывать максимальное количество игроков.
Линейный график с заливкой для динамики продаж по годам — четко отображает циклический характер продаж и позволяет выделить пиковые периоды
Короткий вывод: мировые продажи видеоигр демонстрируют циклический характер, связанный с выпуском новых поколений консолей. Пики в 2007 (611.1 млн) и 2009 (667.3 млн) годах соответствуют периоду расцвета консолей седьмого поколения (PS3, Xbox 360, Wii). Заметен резкий спад после 2010 года, что может быть связано с ростом мобильного и цифрового сегментов рынка, которые не полностью отражены в данных, а также ограниченностью самой базы данных.
Для работы с данными я использовал Python и библиотеки pandas для анализа и matplotlib/seaborn для визуализации:
После базовой очистки я выполнил агрегацию и анализ данных для различных визуализаций, на примере кода тепловой диаграммы:
Нейронки?
Дальше процесс был монотонным.
Я написал начальную часть кода, но из-за желания сделать красиво и подробно я обращался к Claude 3.7 Sonnet от компании Anthropic. Чат-бот помог мне с написанием кода для обработки данных и созданием графиков. Основными промтами взаимодействия с Claude были: — «Помоги проанализировать данные о продажах видеоигр и найти интересные закономерности» — «Напиши код для создания тепловой карты распределения жанров по регионам» — «Предложи способы стилизации графиков для более наглядного представления данных»
Чат-бот был моим ласковым сеньором, который помог мне, юному джуну, увидеть прекрасные возможности питона для визуализации данных.
Стиль
Я стремился создать единый визуальный стиль для всех графиков с акцентом на читаемость и информативность. Для этого использовала:
- Контрастные цвета для лучшего восприятия данных - Четкие подписи значений и названий осей - Информативные заголовки и пояснения к графикам - Единообразное оформление всех элементов
Вывод
Анализ данных, произведенный в данном проекте направлен на выявление ключевых тенденций глобального рынка видеоигр в прошлом.
С помощью материала данной работы можно ознакомиться с историей развития жанров, популярнейшими издателями, узнать среднюю эффективность по жанрам (что поможет начинающему разработчику игр сделать первые шаги в мир разработки видеоигр), а также посмотреть на статистику региональных предпочтений.
Информация, собранная здесь, может оказаться полезной и продвинутому в индустрии видеоигр человеку, чтобы понимать прошлые ожидания аудитории и соотнести их с нынешними ожиданиями.
Материалы:
Kaggle: https://www.kaggle.com/datasets/gregorut/videogamesales
Google Colab: https://colab.research.google.com/