
В проекте проанализирован датасет о победителях и номинантах премии Оскар в номинации «Лучший фильм», чтобы узнать, какие характеристики картины наиболее вероятно пророчат победу фильма на премии.
Датасет был найден на сайте kaggle.com.
Типы визуализации:
Мудборд

Мудборд
Внешний вид графиков вдохновлен свечением прожектора, использующегося для показа фильмов. В графиках используются черный, желтый, красный, оранжевый и голубой цвета, отсылающие к тематике кино, а также прозрачность, отсылающая к теме рассеяния света от прожектора. (Цвета: DEAE68, E7CDA2, B94A51, 8EB8C9)
Обработка данных
В коде использованы библиотеки pandas для работы с данными из csv-файла, а также matplotlib.pyplot для визуализации данных, matplotlib.colors для работы с цветами графиков, rcParams для настройки шрифтов в визуализации данных.

1. Доля самых популярных жанров среди номинантов и победителей
Для анализа и визуализации доли самых популярных жанров среди номинантов и победителей премии была выбрана линейная диаграмма для лучшего отображения динамики 4 самых популярных жанров фильмов.
Линейная диаграмма показывает изменения популярности 4 самых популярных жанров фильмов, номинированных на премию Оскар. Анализируя диаграмму, можно увидеть, что до 1970-х годов наиболее популярным жанром являлся Классический, после чего, резко ставший самым популярным, жанр Драма сохранил актуальность вплоть до 2020 года.
2. Сравнение жанров с числом побед
Далее была проанализирована зависимость жанра фильма от количества побед на премии. Для этого в качестве типа визуализации выбрана столбчатая диаграмма, чтобы наглядно отразить разницу.
На данной диаграмме визуализирована зависимость жанра фильма от количества побед на премии. Можно сделать вывод, что жанр Драма является самым частым победителем премии, насчитывая более 70 побед, в то время как фильмы жанров Хоррор и Арт-хаус не насчитывают даже 10 побед.
3. Распределение рейтингов IMDB победителей и номинантов премии
Для визуализации распределения рейтингов IMDB победителей и номинантов премии в качестве типа визуализации была выбрана гистограмма для наиболее наглядного сравнения оценок.
Анализируя гистограмму можно сделать вывод, что у большинства фильмов-победителей рейтинг IMDB составляет от 7.5 до 8.5, в то время как фильмы оцененные в интервале от 6.0 до 7.0 почти не имеют шанса на победу в номинации «Лучший фильм».
4. Анализ расхождений между мнением критиков и зрителей
Для анализа расхождения оценок критиков и зрителей в качестве типа визуализации выбрана диаграмма рассеяния для более наглядной визуализации отличия мнений.
Важным является фактор расхождения мнения зрителей и критиков. На диаграмме можно заметить, что зрители более придирчивы к оценке фильма и зачастую ставят фильмам оценки от 70 до 100 баллов, в то время как критики чаще ставят оценку от 80 до 100 баллов и реже ставят оценку ниже 80 номинированным фильмам.
Заключение
Таким образом, проанализировав датасет, можно сделать вывод, что наиболее вероятным победителем премии Оскар в номинации «Лучшая картина» окажется фильм жанра Драма с оценкой от 8.0 до 8.5 от зрителей и критиков на сервисах IMDB и Tomatometer.
Описание применения генеративной модели
Для работы в Recraft.AI были сгенерированы изображения для создания обложки и мудборда, чтобы проиллюстрировать тему и выбрать цветовую палитру для исследования.
Использованные промпты: black and white illustration, Oscar statuette, blurry lights background, grainy effect, cinema theme
bright illustration, cinema theme, blurry lights and movie screen background, grainy effect, warm colors, film projector
Ссылка на модель: https://www.recraft.ai
Список источников
1. Выгрузка данных с kaggle.com от 2020 года (URL: https://www.kaggle.com/datasets/martinmraz07/oscar-movies/data) Просмотрено: 15.05.2025