
Я выбрала данные из файла Excel, размещенного на сайте data.world. Этот файл содержит информацию о наблюдениях НЛО, включая такие параметры, как дата и время наблюдения, страна, город, штат, форма НЛО и краткое описание события.
Данные о наблюдениях НЛО имеют особую ценность по нескольким причинам:
1. Исследование феномена НЛО: Анализ этих данных может помочь понять географическое распределение наблюдений НЛО, выявить временные закономерности и определить наиболее часто встречающиеся формы НЛО.
2. Социальный интерес: Наблюдения НЛО вызывают большой интерес у общественности и могут стимулировать обсуждения о существовании внеземной жизни.
3. Безопасность и наука: Изучение таких данных может быть полезно для служб безопасности и научных организаций, которые могут искать объяснения необычных явлений в небе.
Виды графиков
1. Гистограмма: Что: Количество обращений об инцидентах НЛО, сгруппированных по странам. Почему: Гистограмма позволяет легко сравнивать количество обращений по разным странам, так как высота столбцов наглядно показывает различия в численности инцидентов.
2. Точечная диаграмма: Что: Распределение обращений об инцидентах по месяцам за 2016 год. Почему: Точечная диаграмма была выбрана для визуализации изменений числа наблюдений НЛО в течение года. Это позволяет увидеть временные закономерности и пиковые периоды.
3. Круговая диаграмма: Что: Распределение форм НЛО по странам. Почему: Круговая диаграмма позволяет наглядно показать доли различных форм НЛО в каждой стране, что удобно для визуального сравнения.
4. Линейная диаграмма: Что: Количество инцидентов по штатам. Почему: Линейная диаграмма позволяет увидеть распределение инцидентов по штатам, выделяя штаты с наибольшим и наименьшим количеством наблюдений.
Этапы работы
Сначала я определилась какие виды анализов у меня будут. Использовала среду Google Colab для написания кода. Дальше начала писать сам код, использовала библиотеку pandas для анализа данных и matplotlib.pyplot для создания графиков:
import pandas as pd import matplotlib.pyplot as plt
После загружала данные для анализа через:
url = ’https://query.data.world/s/hchezsqi4kggugpqzkdg2hpqdparoh?dws=00000’ df = pd.read_excel (url)
Описание применения генеративной модели
Также я использовала ChatGPT для улучшения структуры. Обложку сделала в Ideogram
Количество обращений по странам
Распределение обращений об инцидентах по месяцам за 2016 год
Распределение форм НЛО по странам
Количество инцидентов по штатам