
(1) Описание
Существование внеземных форм жизни — давний вопрос, интересующий человечество и приобретающий все большую актуальность в условиях современного научно-технического прогресса.
Проект посвящен анализу данных о наблюдениях неопознанных летающих объектов (НЛО) за период с 1949 по 2014 год с целью выявления закономерностей в восприятии аномальных явлений очевидцами.
Данные взяты с сайта kaggle.com и содержат более 80 000 сведений, включающих информацию о городе, штате, времени, описании и продолжительности каждого наблюдения.
(2) Работа с данными

1. Импорт библиотек 2. Стилевые данные 3. Открытие файла
Стилистические решения были обусловлены созданием эффекта наблюдения за летающими объектами с радаров, а зелено-лиловые цвета чаще всего ассоциируются с «инопланетным».

#401B89, #93F581, #9C8DF5
После импорта данных я сосредоточусь на следующих задачах:
1. Проследить динамику свидетельств об НЛО с течением времени. 2. Определить, в каких регионах чаще всего фиксировали наблюдение. 3. Выявить преимущественно используемый образ для описания увиденных аномальных явлений респондентами.
Для наглядного отображения данных, я буду использовать: - Диаграмму рассеяния - Диаграмму облака слов - Столбчатую диаграмму - Круговую диаграмму
1. Диаграмма рассеяния, отражающая корреляцию количества свидетельств в зависимости от года.
Вычленив из данных количество упоминаний об НЛО и отсортировав их по годам, можно заметить постепенное увеличение количества фиксаций подобных явлений, из чего можно предположить следующее:
— Действительное увеличение количества атмосферных наблюдаемых явлений (возможно, из-за климатических явлений)
— Распространение информации об НЛО в СМИ создавало у людей фантомные иллюзии и повышало количество свидетельств
— Рост научного интереса к подобным явлениям и распростанение средств коммуникации обеспечивали пополнение количества респондентов.
1. Код для диаграммы рассеяния
После выявление роста наблюдений НЛО я приступила к определению их локализации (*из взятого датасета) по городам.
2. Диаграмма облако слов, визуализирующая частоту наблюдений НЛО по городам
Визуализация через диаграмму облака слов показывает, что превалирующая часть городов из данных находится в США:
Phoenix, Seattle, San Diego, Tinley Park, Los Angeles, Miami, Dallas, Chicago, Houston, San Francisco.
Некоторая частотность наблюдалась и в других странах: London (Великобритания), Toronto (Канада), Johannesburg (ЮАР).
*На диаграмме даже оказался Санкт-Петербург
2. Код для диаграммы облака слов
В какой-то момент я задалась вопросом о том, что частотность свидетельств о наблюдении НЛО не отражает их качества.
Так как датасет содержал показатели о длительности наблюдения, я решила определить в какой местности респонденты дольше фиксировали наблюдаемый феномен.
3. Столбчатая диаграмма, отражающая рейтинг стран по длительности наблюдения за НЛО.
Отфильтровав данные по длительности наблюдения (в датасете измеряются в секундах) и выявив их усредненные значения, я создала столбчатую диаграмму, коррелирующую с местоположением по странам.
Неожиданным открытием стала лидирующая позиция Великобритании (gb), и только после США (us) и Австралия (au). В рейтинг также вошли Канада (ca) и Германия (de).
3. Код для столбчатой диаграммы
В заверешние моего исследования, я решила определить, какие образы и формы респонденты чаще всего используют при описании НЛО, и так ли оправдан канон «летающей тарелки».
4. Круговая диаграмма, показывающая главные описания форм НЛО.
С помощью круговой диаграммы я выявила 10 самых часто используемых слов для описания формы увиденного аномального явления респондентами с отображением в %.
Описания в виде «вспышки» заняло лидирующую позицию — 24,2%. Формы «треугольника» и «круга» также оказались распространенными — по 12%.
Более точные описания, подходящие под определение «летающей тарелки» — «сфера», «диск» и «овал» оказались менее популярны.
4. Код для круговой диаграммы.
(3) Выводы
Проанализировав данные, самыми интересными для меня оказались открытия об активном всплеске увеличения количеств наблюдения НЛО в середине 1990-х годов.
Также данные показали что чаще всего акты наблюдений происходили в США и Англии, что скорее всего обусловленно СМИ и развитой системы репортинга в данных странах. Отдельного внимания заслуживают конкретные города, засвидетельствовавшие больше всего аномалий, что может привести к открытиям по данной тематике при их детальном изучении.
UFO PROJECT