Original size 2388x3334

Анализ датасета из kaggle National Olympic Committee 2022

PROTECT STATUS: not protected
11

Концепция

Выбор данного датасета неслучаен. У меня прошлое профессионального спортсмена и я всегда мечтала стать участником Олимпиады. Меня всегда интересовало какая страна лидирует по количеству полученных медалей, как высчитывают итоговый рейтинг, ведь так много стран-участников и типов соревнований — летняя, зимняя олимпиада, разные виды спорта. Мне предстоит проанализировать и выяснить, кто же самый «богатый» медалями.

Типы созданных графиков

1.Bar chart с интерактивными элементами (библиотека plotly.express) 2.Correlation Matrix для прослеживания корреляции признаков даты 3.Bar chart со стилизованными колонками (группировка признаков, такой график наиболее релевантен) 4.Круговая интерактивная диаграмма (библиотека plotly.express)

Этапы работы

1.Выбор данных, которые интересно проанализировать, предобработка данных 2.Анализ данных 3.Визуализация Оформление графиков: В оформлении графиков я использовала различные принты вдохновленные временем года Олимпиады и библиотеку с интерактивными элементами, что удобно в анализе визуализации

Описание датасета

Этот набор данных предоставляет всесторонний обзор медалей, выигранных каждым Национальным олимпийским комитетом (НОК) во время Олимпийских игр 2022 года. Он содержит подробную информацию о количестве золотых, серебряных и бронзовых медалей, присужденных каждой участвующей стране, предлагая ценные исторические данные об успехах различных наций.

Сделаю общую предобработку (импорт библиотек, поверхностный анализ и тд)

big
Original size 1669x218
Original size 1650x710
Original size 1666x479
Original size 1647x373

Пропущенных значений нет, посмотрю на средние значения по категориям.

Original size 1664x472

Посмотрю на ее визуализацию, попрошу ChatGPT стилизовать график.

Original size 1679x1004

Интересно посмотреть на корреляцию разных по старшинству медалей, для этого я выберу построение хитмэпа корреляции.

Original size 1665x266
Original size 1683x1051

Тут я группирую данные о стране и об общем количестве медалей за зимнюю Олимпиаду и за летнюю, я попросила ChatGpt «написать код для графика и стилизовать написанную мною строку группировки в зимнюю атмосферу»(промт)

Original size 1667x652
Original size 1177x1031
Original size 1667x206
Original size 1664x656
Original size 1219x1028

Теперь посмотрим на общее процентное распределение медалей на обеих Олимпиадах по всем странам, я взяла за основу пай чарт, сама написала код, но попросила ChatGpt визуализировать ее интерактивной и вместительной «сделай этот график более красивым, вместительным и понятным для чтения»(промт)

Original size 1668x520
Original size 1618x797
Original size 1623x755

Анализ данных Национальных олимпийских комитетов (НОК) для Олимпийских игр 2022 года позволяет выделить несколько ключевых выводов:

  1. Участие и результаты: Существует положительная корреляция между количеством участий и общим количеством медалей, выигранных как на летних, так и на зимних Олимпийских играх. НОК, которые участвуют более часто, обычно выигрывают больше медалей.

  2. Неравенства в распределении медалей: Распределение медалей сильно смещено, с несколькими НОК, доминирующими в количестве медалей. Это указывает на значительные различия в результативности среди различных НОК.

  3. Летние против зимних игр: Участие в Летних олимпийских играх более распространено по сравнению с Зимними. Это может быть связано с различными факторами, включая доступность видов спорта и климатические условия.

Анализ датасета из kaggle National Olympic Committee 2022
11
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more