
Вводная часть
Для анализа данных я взяла датасет с сайта kaggle, где собрана информация о продаже автомобилей на аукционах в Северной Америке.
Почему именно эти данные? Во-первых, я часто посещаю сайты, где проводятся аукционы по продажам машин. Чаще всего, это сайты аукционов, которые проводятся в определенной стране, чаще всего европейской. Поэтому, мне было интересно изучить новый для меня рынок, понять какие там тренды и цены. Во-вторых, я искала датасет с понятными показателями, по которым можно сделать разные графики, что у меня и получилось.
Виды графиков У меня получилось 5 графиков: 1-2. Столбчатая диаграмма 3. Диаграмма оценки плотности ядра 4. Круговая диаграмма 5. Точечный график
Оформление графиков Шрифт, который я выбрала для своих графиков, — TT Norms Pro в начертании Regular. Цветовая палитра представлена ниже.

Цветовая палитра

Шрифт
Итоговые графики
Сначала я узнала среднюю сумму машины у каждого бренда в датасете. Затем отобразила анализ на графике, так как значения очень разняться, поделила их на два графика — на первом большие значения, на втором меньшие. Я использовала столбчатую диаграмму для наглядного просмотра разницы брендов в цене.


Графики 1-2

Графики 1-2
Потом я узнала в каком году была большая цена на машины, используя для этого распределение переменной. По графику видно, что основную площадь занимает 2018 год, из-за чего можно сказать что в этот год купили больше всего машин.
График 3
График 3
С помощью третьей диаграммы я выявила в какой стране больше всего покупали машину из этой выборки. Для этого хорошо подошла круговая диаграмма с отображением процентов.
График 4
График 4
Теперь я узнала в какой год чаще покупали какой бренд и его стоимость. Для этого использован точечный график. К сожалению, в выборке данные в основном за 2010 < год, из-за чего график выглядит не явно, однако можно сказать, что преимущественно лидирует несколько брендов — Toyota, GMC и Nissan.
График 5
График 5
Ссылка на блокнот