
Для исследования я использовала датасет с kaggle.com о всех чемпионатах Формулы 1 с 1950 г. по 2024 г.
Эти данные скореее нашли меня, чем я их, попавшись мне первыми в списке на Kaggle. Новый сезон формулы как раз начался, поэтому было решено, что это именно то, что необходимо проанализировать.

Последний сезон F1 который мне удалось посмотреть целиком, вникая во все «внутрепаддоковые» нюансы, был сезон 2022. Он был невероятно насыщен самыми разными шутками, в основном по вине стратегов команды Ferrari, которые не уставали принимать очень странные решения, тем самым вызывая у фанатов нескончаемый смех сквозь слезы
Я решила взять данные о различных результатах команды Феррари в 2022 сезоне и посмотреть, действительно ли стратеги испортили все
Визуальное решение
Для создания всего лонгрида используется в основном черный красный и белый цвета — цвета формулы 1
Для создания графиков используются официальные цвета Ferrari — желтый черный красный
В графиках где появляются данные о RedBull столбцы репрезентующие эти данные — синего цвета — одного из официальных цветов команды


Сортировка данных
Чтобы начать анализ, нужно было отсеять все лишние данные довольно большого датасета, выбрав только 2022 год и данные по результатам Шарля Леклера, первого гонщика Феррари (у которого, как многие считают, стратеги отняли чемпионский титул)
каждой команде, каждому гонщику и каждой гонке внутри датасета присвоен свой номер, поэтому начинаем с того, что выясняем ID команды
по такой же схеме выясняем ID Леклера и всех гонок за 2022 год
Итак: ID Ferrari — 6 ID Леклера — 844 ID гонок 2022 — 1074-1096
Анализ очков за сезон
Первое что нужно выяснить — как изменялось количество очков выигранных на каждой гонке на протяжении сезона.
Создадим фильтр с помощью вычисленных ID и выведем очки на экран
Чтобы наиболее наглядно показать динамику полученных очков, наиболее подходит линейный график.
Создаем его с помощью библиотеки matplotlib с помощь функции color выбираем цвет для линии графика. С помощью команд plt.title, plt.xlabel, plt.ylabel создаем название и подписи. Через команду plt.gca, plt.gcf меняем фоны на черный. Все надписи через параметр color красим в белый цвет.
(Такое же изменение цветовых параметров будет применятся почти ко всем графикам)
На графике заметно, что несмотря на нестабильность результатов, количество выигранных очков все же уменьшается от начала сезона к его середине, и о середины к концу сезона стабилизируется в диапазоне от 10 до 20 очков.
Анализ стартовой решетки и финиша
Теперь проанализируем как в течение сезона Леклер терял или набирал позиции с момента старта.
Здесь помимо изменений описанных еще в первом графике добавляется желтый цвет через параметры RGB и через параметр pad подписи отодвигаются от графика
На диаграмме видно, что, чаще всего, Шарль стартовал в первой тройке. Соответственно на квалификации он проезжал круг с неплохой скоростью и какой-то другой фактор заставлял его терять позиции на гонке.
Приведу график с квалификациями каждого уикэнда сезона, но стоит отметить, что по этим данным нельзя делать никаких выводов, так как трасса в каждой локации разной протяженности и разной конфигурации, соответственно требуется разное время чтобы их проехать
Других факторов которые могут влиять на потерю темпа в гонке множество, один из главных это шины, но к сожалению, нет данных о шинной стратегии команд в датасете нет, проанализировать их не возможно.
Но мы можем посмотреть на темп машины Феррари на квалификации и на самом быстром круге на гонке, чтобы сравнить насколько сильно она теряет скорость на длинной дистанции
Анализ самого быстрого круга гонки и лучшей квалификации
Внутри датасета есть несколько папок, в том числе и отдельный файл с данными по квалификации, поэтому в код внедряется новый датасет и из него выносятся данные по самой удачной квалификации.
Из датасета с данными по гонкам и выбирается данные по самому быстрому кругу
создаем график с двумя показателями, синхронизирующими через номер гонки
здесь помимо классических для моих графиков изменений добавляется изменение размера шрифта через fontsize, и смещение легенды через bbox_to_anchor
Анализ темпа в сравнении с темпом RedBull
Теперь сравним гоночный темп машин RedBull и Ferrari, чтобы наглядно показать что, все же, у конкурентов в том сезоне темп был выше. Для примера возьмем машину Макса Ферстаппена, выигравшего чемпионат 2022.
Для построения такой диаграммы создается новый фильтр, чтобы добавить нового гонщика
На диаграмме видно, что темп Ферстаппена все же на порядок выше чем темп Ferrari. Следовательно, можно предположить, что все же не только стратегия команды повлияла на потерю позиций, которую мы видим на втором графике.
Сделаем вывод
Из всех приведенных данных нельзя сделать однозначный вывод, что именно привело к провалу хорошо начавшегося сезона для Шарля Леклера в 2022 году. Несмотря на то что темп RedBull все же оказался на порядок быстрее, из построенных графиков все же видно, что судя по удачным квалификациям, у Ferrari были все шансы получить результат в разы лучше чем тот что мы видим.
Но, в конце концов, я пока не стратег Ferrari и я не могу проанализировать ситуацию так блистательно как они.
Ссылки
Использованные ресурсы
AdobeColor: для генерации цветовой палитры на основе изображения, и для ее последующего редактирования
Сhat GPT: для рекомендаций по улучшению кода, для изучения новых функций в python и библиотеки pandas, в частности