Original size 1668x2224

Феррари, возьмите меня работать стратегом. Анализ данных F1 за 2022 год

PROTECT STATUS: not protected
9

Для исследования я использовала датасет с kaggle.com о всех чемпионатах Формулы 1 с 1950 г. по 2024 г.

Эти данные скореее нашли меня, чем я их, попавшись мне первыми в списке на Kaggle. Новый сезон формулы как раз начался, поэтому было решено, что это именно то, что необходимо проанализировать.

big
Original size 1894x700

Последний сезон F1 который мне удалось посмотреть целиком, вникая во все «внутрепаддоковые» нюансы, был сезон 2022. Он был невероятно насыщен самыми разными шутками, в основном по вине стратегов команды Ferrari, которые не уставали принимать очень странные решения, тем самым вызывая у фанатов нескончаемый смех сквозь слезы

Я решила взять данные о различных результатах команды Феррари в 2022 сезоне и посмотреть, действительно ли стратеги испортили все

Визуальное решение

Для создания всего лонгрида используется в основном черный красный и белый цвета — цвета формулы 1

Для создания графиков используются официальные цвета Ferrari — желтый черный красный

В графиках где появляются данные о RedBull столбцы репрезентующие эти данные — синего цвета — одного из официальных цветов команды

big
Original size 2532x542
big
Original size 1254x482

Сортировка данных

Чтобы начать анализ, нужно было отсеять все лишние данные довольно большого датасета, выбрав только 2022 год и данные по результатам Шарля Леклера, первого гонщика Феррари (у которого, как многие считают, стратеги отняли чемпионский титул)

каждой команде, каждому гонщику и каждой гонке внутри датасета присвоен свой номер, поэтому начинаем с того, что выясняем ID команды

Original size 2098x802

по такой же схеме выясняем ID Леклера и всех гонок за 2022 год

Итак: ID Ferrari — 6 ID Леклера — 844 ID гонок 2022 — 1074-1096

Анализ очков за сезон

Первое что нужно выяснить — как изменялось количество очков выигранных на каждой гонке на протяжении сезона.

Создадим фильтр с помощью вычисленных ID и выведем очки на экран

Original size 2102x374

Чтобы наиболее наглядно показать динамику полученных очков, наиболее подходит линейный график.

Создаем его с помощью библиотеки matplotlib с помощь функции color выбираем цвет для линии графика. С помощью команд plt.title, plt.xlabel, plt.ylabel создаем название и подписи. Через команду plt.gca, plt.gcf меняем фоны на черный. Все надписи через параметр color красим в белый цвет.

(Такое же изменение цветовых параметров будет применятся почти ко всем графикам)

Original size 2050x580
Original size 1178x600

На графике заметно, что несмотря на нестабильность результатов, количество выигранных очков все же уменьшается от начала сезона к его середине, и о середины к концу сезона стабилизируется в диапазоне от 10 до 20 очков.

Анализ стартовой решетки и финиша

Теперь проанализируем как в течение сезона Леклер терял или набирал позиции с момента старта.

Здесь помимо изменений описанных еще в первом графике добавляется желтый цвет через параметры RGB и через параметр pad подписи отодвигаются от графика

Original size 1356x790
Original size 1364x744

На диаграмме видно, что, чаще всего, Шарль стартовал в первой тройке. Соответственно на квалификации он проезжал круг с неплохой скоростью и какой-то другой фактор заставлял его терять позиции на гонке.

Приведу график с квалификациями каждого уикэнда сезона, но стоит отметить, что по этим данным нельзя делать никаких выводов, так как трасса в каждой локации разной протяженности и разной конфигурации, соответственно требуется разное время чтобы их проехать

Original size 1448x800
Original size 2118x978

Других факторов которые могут влиять на потерю темпа в гонке множество, один из главных это шины, но к сожалению, нет данных о шинной стратегии команд в датасете нет, проанализировать их не возможно.

Но мы можем посмотреть на темп машины Феррари на квалификации и на самом быстром круге на гонке, чтобы сравнить насколько сильно она теряет скорость на длинной дистанции

Анализ самого быстрого круга гонки и лучшей квалификации

Внутри датасета есть несколько папок, в том числе и отдельный файл с данными по квалификации, поэтому в код внедряется новый датасет и из него выносятся данные по самой удачной квалификации.

Original size 1550x460

Из датасета с данными по гонкам и выбирается данные по самому быстрому кругу

создаем график с двумя показателями, синхронизирующими через номер гонки

здесь помимо классических для моих графиков изменений добавляется изменение размера шрифта через fontsize, и смещение легенды через bbox_to_anchor

Original size 1552x862
Original size 1524x946

Анализ темпа в сравнении с темпом RedBull

Теперь сравним гоночный темп машин RedBull и Ferrari, чтобы наглядно показать что, все же, у конкурентов в том сезоне темп был выше. Для примера возьмем машину Макса Ферстаппена, выигравшего чемпионат 2022.

Для построения такой диаграммы создается новый фильтр, чтобы добавить нового гонщика

Original size 2082x194
Original size 1988x994
Original size 1590x918

На диаграмме видно, что темп Ферстаппена все же на порядок выше чем темп Ferrari. Следовательно, можно предположить, что все же не только стратегия команды повлияла на потерю позиций, которую мы видим на втором графике.

Сделаем вывод

Из всех приведенных данных нельзя сделать однозначный вывод, что именно привело к провалу хорошо начавшегося сезона для Шарля Леклера в 2022 году. Несмотря на то что темп RedBull все же оказался на порядок быстрее, из построенных графиков все же видно, что судя по удачным квалификациям, у Ferrari были все шансы получить результат в разы лучше чем тот что мы видим.

Но, в конце концов, я пока не стратег Ferrari и я не могу проанализировать ситуацию так блистательно как они.

Original size 1594x732

Ссылки

Использованные ресурсы

AdobeColor: для генерации цветовой палитры на основе изображения, и для ее последующего редактирования

Сhat GPT: для рекомендаций по улучшению кода, для изучения новых функций в python и библиотеки pandas, в частности

Феррари, возьмите меня работать стратегом. Анализ данных F1 за 2022 год
9
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more