
Введение
Для данного проекта я выбрал данные по продажам игр Nintendo. Данные были взяты с Kaggle, известного ресурса для анализа данных. Файл содержит информацию о различных играх, включая название, платформу, дату выпуска, оценки критиков и пользователей, разработчиков и жанры.
Мне было интересно проанализировать именно эти данные, поскольку Nintendo является одной из самых знаковых компаний в игровой индустрии, и ее игры имеют значительное влияние на культуру и индустрию видеоигр. Анализ этих данных может дать ценные инсайты о тенденциях в игровых предпочтениях и популярности различных жанров.
Гистограммы Для визуализации распределения оценок от критиков и пользователей.
Гистограмма Для отображения распределения игр по годам.
Столбчатая диаграмма Для отображения топ-10 жанров игр.
Этапы работы
import pandas as pd file_path = 'NintendoGames.csv' data = pd.read_csv (file_path)
print («Первые несколько строк данных:») print (data.head ())
print («\nОсновные статистики данных:») print (data.describe (include='all'))
print («\nПропущенные значения в данных:») print (data.isnull ().sum ())
import matplotlib.pyplot as plt import seaborn as sns
sns.set (style='whitegrid') plt.figure (figsize=(14, 7)) sns.histplot (data=data, x='meta_score', kde=True, bins=30, color='skyblue', label='Meta Score') sns.histplot (data=data, x='user_score', kde=True, bins=30, color='salmon', label='User Score') plt.title ('Распределение оценок от критиков и пользователей') plt.xlabel ('Оценка') plt.ylabel ('Количество игр') plt.legend () plt.show ()
data['year'] = pd.to_datetime (data['date'], errors='coerce').dt.year plt.figure (figsize=(14, 7)) sns.histplot (data=data, x='year', bins=30, kde=True) plt.title ('Распределение игр по годам') plt.xlabel ('Год') plt.ylabel ('Количество игр') plt.show ()
genres = genres.explode () top_10_genres = genres.value_counts ().head (10) plt.figure (figsize=(14, 7)) sns.barplot (x=top_10_genres.index, y=top_10_genres.values, palette='viridis') plt.title ('Топ-10 жанров игр Nintendo') plt.xlabel ('Жанр') plt.ylabel ('Количество игр') plt.xticks (rotation=45) plt.show ()
Для стилизации графиков был выбран стиль «whitegrid» из библиотеки Seaborn. Этот стиль позволяет создать чистые и четкие графики, которые легко воспринимаются визуально. Также были использованы цветовые палитры, такие как «skyblue» и «salmon» для гистограмм, и «viridis» для столбчатой диаграммы, чтобы сделать графики более привлекательными и информативными.
Итоговые графики
Распределение оценок от критиков и пользователей
Распределение игр по годам
Топ-10 жанров игр Nintendo
Заключение
Проанализировав данные о продажах игр Nintendo, мы можем сделать несколько выводов о тенденциях в оценках игр, популярности жанров и динамике выпуска игр по годам. Эти инсайты могут быть полезны для разработчиков игр, издателей и исследователей игровой индустрии.