
ОПИСАНИЕ

При выборе темы для своего проекта я решила обратиться к открытым данным о преступности на территории России за период с 2003 по 2020 годы. В датасете можно найти детальную информацию по 16 категориям произошедших преступлений с делением на месяцы. Такая организация данных дает возможность не только наглядно оценить общую динамику криминальной активности, но и изучить взаимосвязи между различными видами преступлений, а также проанализировать их сезонные изменения и долгосрочные тренды.
Почему эта тема?
Мне стало интересно изучить тему криминальной статистики, потому что сбор таких данных представляет собой важный объект интереса для разных сфер социальной жизни. Ведение и анализ криминальных тенденций помогает формировать эффективную политику, которая обеспечивает безопасность внутри общества. Криминальная статистика, полезна и помогает в сфере экономики, анализ взаимосвязей между множеством типов преступлений выявляет скрытые социально-экономические факторы. Я специально взяла достаточно длительные отрезов времени, длиной в 17 лет, чтобы более детально отследить влияние системных изменений в обществе и государстве на уровне законопрестпуности. А так же ведение такой статистики облегчает ведение работы правоохранительным органам, их планирование с учетом территориальных и сезонных особенностей.

Визуализация
Типы диаграмм я подбирала основываясь на удобстве визуализации данных для каждой категории, чтобы легче и информативнее отобразить динамику и показатели статистики:
1. Линейный график динамики преступности: показывает многолетние тренды общей и тяжкой преступности, позволяя оценить эффективность государственной политики. 2. Столбчатая диаграмма категорий преступлений: показывает соотношение различных видов криминала и выявляет самые распространенные угрозы. 3. Тепловая карта корреляций: визуализирует взаимосвязи между различными типами преступлений, помогая понять их причинно-следственные связи. 4. Круговая диаграмма тяжких преступлений: иллюстрирует распределение категорий преступлений, которые относятся к наиболее опасным. 5. Сезонный анализ преступности: отражает влияние времени года на уровень криминальной активности. 6. График индекса безопасности: показывает общую динамику безопасности в стране на протяжении всего исследуемого периода.
ЭТАПЫ РАБОТЫ
Перед тем как преступить к работе, я составила план из 3 последовательных этапов:
1 этап — загрузка данных и первичный анализ 2 этап — преобразование и дополнение данных 3 этап — создание визуализации
«Загрузка данных и первичный анализ» включает в себя: — загрузка библиотек таких, как: pandas, matplotlib.pyplot, numpy, seaborn, files из google colab — реализация загрузки данных через Google Colab с помощью функции files.upload () — статистический анализ распределения преступлений по её видам и временным промежуткам — выявление сложных случаев, экстремальных значений, которые требуют более тщательного анализа
«Преобразование и дополнение данных» включает в себя: — создание дополнительное раздела классификации по сезонности преступлений — методика расчета интегрального индекса ключевых показателей категории тяжких преступлений — данные для корреляционного анализа между различными видами криминала
«Создание визуализации» включает в себя: — создание единого стиля для всех графиков — оптимизация данных для удобства прочтения и восприятия — подписание и дополнительные комментарии к каждому графику для быстрого прочтения графиков
база данных
Нейросети
В процессе работы, я обращалась за помощью к ChatGPT (https://chat.openai.com), который помогал мне в оптимизации создания алгоритмов обработки данных, в выявление ошибок в коде, помогал формировать предположения о причинах криминальных тенденций и их закономерностей, разработка логики создания производных показателей, включая индекс безопасности, подбор оптимальных типов графики. При работе с нейросетью я использовала прописывала промты опираясь на технические задачи и перебор всех идей. Пример: «Оптимизируй код для расчета корреляционной матрицы между категориями преступлений» «Предложи наиболее информативный тип визуализации для анализа сезонности преступности» «Помоги разработать формулу расчета интегрального индекса безопасности на основе нормализованных показателей»
Цветовая палитра
Для единого стиля графиков, я выбрала цветовую палитру из 6 сочетающихся между собой оттенков, которые помогают раскрывать дополнительно каждый график
colors = [»#5D6D7E», «#85C1E9», «#76D7C4», «#F7DC6F», «#E59866», «#BB8FCE»] main_color = «#5D6D7E» accent_color = «#76D7C4» highlight_color = «#F7DC6F»
Динамика перступности 2003 — 2020
1. Первый линейный график «Динамика преступности по месяцам» показывает нисходящую динамику как общей, так и экстремальной преступности за 17 лет. Пик преступности приходиться на промежуток между 2005–2006 годом. Можно заметить, что к 2020 году тенденция общих преступлений снижается примерно в 2 раза, а тяжких доходит до сокращения в 3 раза. Так же наблюдаются заметные колебания криминальных случаев в определенные месяцы года.
Долгосрочное снижение активности демонстрирует надежность государственной политики в сфере безопасности. Пик снижения совпадает с реформами правоохранительной системы. Однако цикличность сезонных преступлений свидетельствует о том, что криминальность все равно сохраняется.
Среднее количество преступлений по категориям
2. На данном графике по «Среднему количеству преступлений по категориям» можно заметить, что в среди преступлений доминирует такой вид, как кража, которая в среднем составляет 92 тыс. случаев ежемесячно. Далее по снисходящей располагаются преступления связанные с запрещенными веществами (примерно 17,6 тыс случаев / месяц) и мошенничество (15,3 тыс случаев / в месяц).
Можно также заметить, что тяжкие преступления (насилие, убийство) составляют относительно небольшой процент от общей массы. Однако значительная доля преступлений связанных с имуществом и наркотиками указывает на необходимость усиления работ в этом направлении
Тепловая карта корреляций
3. Третья таблица «Корреляция между различными видами преступлений» демонстрирует с помощью цветовых оттенков их индикаторы показателей указаны в отдельном столбце с права. Положительный показатель корреляции между количеством преступлений и кражами (0,95), с тяжкими случаями сильную взаимосвязь видно с убийствами (0,93). Положительная корреляция также видна у мошенничества и наркопреступлений (0,34)
По таблице видно, что в стране превалируют кражи, которые фактически и составляют общую картину. Наркотические преступления и мошеннические действия формируют отдельную группу, с чем возможно связан специфический фактор влияющий на эти категории.
Распределение тяжких преступлений по критериям
4. Благодаря круговой диаграмме наглядно видны наиболее часто встречающиеся виды преступлений, которые относятся к тяжким. 60% от общей диаграммы занимают преступления связанные с тяжким причинением вреда здоровью, после чего идут убийства (26,6%). Менее распространенные случаи, это терроризм (3,6%) и изнасилование (1,1%)
Среди социум наиболее частыми преступлениями тяжкого характера выявлены случаи, которые связаны со здоровьем, из чего можно сделать вывод, что перевести центр внимания на профилактику такой зоны, как бытовое насилие, которое часто приводит к причинению вреда здоровью.
Сезонность различных видов преступлений
5. Диаграмма, помогает проанализировать в какие сезоны тенденция на совершение преступлений увеличивается в течение года. Можно увидеть, что весна является периодом, в котором частота совершения преступлений достигает своего пика (более 230 тысяч). Во всех случаях доминируют преступления связанные с наркотиками и мошенничеством, однако в зимний период даже общее число преступлений меньше, чем в другие сезонны.
Определение сезонности, помогает распределить качественно работу правоохранительных органов, и например, в весенний период быть более бдительными и увеличивать меры безопасности в определенной сфере. Например, летний период характеризуется большим количеством краж, что может быть связано с туристическим период.
Индекс безопасности и его визуализация по месяцам
6. «Индекс безопасности по месяцам» показывает стабильный рост индекса безопасности с 20-30% в 2003 году до 70-77% к 2020 году. Период, когда рост достигает своего пика по скорости выпадет на период с 2009 по 2016 года и второй раз 2016-2018. Ускоренный рост и относительная стабилизация наблюдаются в периоды с (2009-2011, 2016-2018), однако сезонные колебания наблюдаются на протяжение всего времени. Также можно заметить, что в последнее годы наблюдаются В последние годы наблюдается высокая неустойчивость при сохранении общего восходящего тренда
За 17 лет уровень безопасности на территории России значительно вырос, что подтверждается комплексным индексом. Сезонные колебания даже при прогрессивном росте безопасности указывает на необходимость сезонной профилактики.
Вывод
Благодаря возможности провести анализ по криминальной статистике на территории РФ, можно сделает выводы, что за период протяженностью в 17 лет значительно выросла безопасность в стране и снизилась тяжкая преступность, что свидетельствует о эффективности предпринимаемых мер государством. Выявлена четкая сезонность преступности, которая прослеживалась и прослеживается на протяжении всего времени, с пиками на весенний период. Разработанный индекс безопасности указывает на то, что уровень показателей вышел на устойчивый рост общественной безопасности к 2020 года на 70% с момента изучения.
Ссылки на материалы
Датасет