Original size 2480x3500

Анализ фильмов на Netflix

PROTECT STATUS: not protected
6

Для генерации обложки использовалась нейросеть

Leonardo. AI: версия Phoenix 0.9, Prompt Enhance: Auto, Style: Pro film photography, Contrast: Low. Запрос: collage of popular movies.

Вступление

Платформа Netflix является одной из самых прибыльных на рынке индустрии фильмов. $8,3 млрд составляет выручка за 2016 год. Netflix «не любит» делиться своими успехами и статистикой, но по последним данным за первую половину 2023 года зрители провели 100 млрд часов своей жизни за использованием стримингового сервиса, а это около 11, 5 млн лет человеческой жизни.

Меня заинтересовал контент, потребляемый настолько продолжительное время. Что же удерживает внимание зрителей? Есть ли логическое объяснение, связанное с анализом статистики?

Чтобы начать цепочку зависимости, я воспользовалась следующим сайтом с базами данных: Kaggle.com

Палитра

Референсом служил действующий логотип Netflix.

big
Original size 1040x500

Финальные цвета напоминают мне о старых стильных афишах в кинотеатрах.

big
Original size 1040x500

Для создания палитры графиков применялся сайт Color. Adobe.com.

График № 1

Столбчатая диаграмма

Я скачала базу данных с сайта Kaggle, открыла ее в Excel и проверила запись на ошибки онлайн через сайт onlinetools.com. Далее убедилась в том, что ничего не мешает работе и приступила к кодированию.

В качестве универсальной платформы со встроенным Python и возможностью сразу же отобразить получившийся график я использовала Google Colab. Платформа удобна также и тем, что имеет встроенный AI, который подчеркивает места ошибок в коде и предлагает исправления.

Original size 2000x1000

Код столбчатой диаграммы

Original size 2000x1000

Количество Анимации и Фильмов на Netflix

Количество фильмов в выборке из восьми тысяч проектов Netflix значительно превышает мультфильмы. Значит, аудитория платформы больше сосредоточена на имитации реального мира, что говорит о возрасте потребителя. Они в большинстве своем не являются детьми.

График № 2

Круговая диаграмма

В ходе написания кода для круговой диаграммы я столкнулась с тем, что Python не смог проанализировать более чем восемь тысяч строк данных.

Тогда неразрешимую ошибку я ввела в нейросеть Deepseek.com. Она предложила сократить объем данных, предположив, что Python перегружен символами.

В итоге осталось тридцать строк, которые успешно прошли проверку языком программирования.

Original size 2000x1000

Файл Excel

На экране видны точки, которые закрывают пробелы в базе данных для того, чтобы Python мог безошибочно оперировать данными.

Original size 2000x1000

Код круговой диаграммы

Пришлось переформатировать исходный файл несколько раз, сократив количество символов, поэтому, начиная со второго графика, название файла на слайдах уже другое.

Original size 2000x1000

Распределение рейтингов (возрастных ограничений)

Рейтинг TV-MA занимает лидирующую позицию в списке из тридцати телешоу, захватывая 48,3% инфополя. Значит, Netflix рассчитывает на взрослую или около взрослую аудиторию.

Второе и третье места почетно занимают подростковые рейтинги TV-14, то есть строго под присмотром взрослых, во избежание казусов и неправильной трактовки происходящего, а также PG-13 — ограничение, которое может говорить о наличии романтической линии в произведении.

График № 3

Географическая диаграмма

Original size 2000x1000

Код географической диаграммы

Original size 2000x1000

Количество фильмов/ сериалов по странам

Netflix был придуман в США, поэтому и количество фильмов, выкладываемых на платформу этой страной больше всего.

График № 4

Линейная диаграмма

Original size 2000x1000

Код линейной диаграммы

Original size 2000x1000

Количество фильмов и мультфильмов по годам выпуска

Диаграмма хорошо отображает ковидные времена: в 2020 году родители остались один на один с воспитанием детей, так как сады и школы закрылись на карантин.

У многих взрослых не было возможности проводить достаточно времени с чадами, потому что работа перешла на онлайн-режим. Таким образом, в выборке из тридцати побеждают именно мультфильмы с разрывом в четырнадцать штук.

Вывод

Работа в Google Colab увлекательна, AI в нем упростил мне поиск ошибок, а Deepseek вовремя подсказал как сделать датасет читаемым для Python.

При написании кода важно и нужно пользоваться дополнительными материалами, сайтами для проверки, гайдами на разных платформах и иногда оптимизировать процесс через нейросети.

Внимание зрителей на платформе удерживается количеством выпускаемого контента. Тяжело не найти понравившийся фильм среди восьми тысяч. Основными зрителями являются взрослые, которые после 2020 года перешли во многом на удаленную работу, проводя все больше времени в статичном положении.

Источники

1. AI Deepseek.com [Эл. ресурс]. URL: https://chat.deepseek.com / (дата обращения 23.03. 2025) 2. AI Leonardo.AI[Эл. ресурс]. URL: https://app.leonardo.ai/image-generation / (дата обращения 23.03. 2025) 3. База данных Kaggle.com [Эл. ресурс]. URL: https://www.kaggle.com/datasets/shivamb/netflix-shows / (дата обращения 23.03. 2025) 4. Color. Adobe.com. [Эл. ресурс]. URL: https://color.adobe.com/ru/create/color-wheel (дата обращения 23.03. 2025) 5. Google Colab [Эл. ресурс]. URL: https://colab.google/ дата обращения 23.03. 2025)

Анализ фильмов на Netflix
6
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more