Original size 842x1191

Анализ данных об усыновлении животных из приютов

PROTECT STATUS: not protected
2

Необходимые данные были взяты на kaggle. Данные о различных животных, их описание (вид, порода, цвет и т. д.), а также столбец с возможностью усыновления с двумя значениями (0 — низкая возможность, 1- высокая)

Описание данных: PetID: Уникальный идентификатор для каждого питомца.
PetType: Тип питомца.
Breed: Порода.
AgeMonths: Возраст в месяцах.
Color: Цвет животного.
Size: Размер.
WeightKg: Вес в килограммах.
Vaccinated: Сведения о вакцинации (0 — Не вакцинирован, 1 — Вакцинирован).
HealthCondition: Состояние здоровья (0 — Здоров, 1 — Медицинский уход).
TimeInShelterDays: Длительность пребывания в приюте.
AdoptionFee: Цена усыновления.
PreviousOwner: Был ли когда-нибудь хозяин (0 — Нет, 1 — Да).
AdoptionLikelihood: Шансы на усыновления (0 — Низкие, 1 — Высокие)

Мне было важно делать проект с упором на его дальнейшее практическое применение. Проблема приютов для животных достаточно остро стоит в современном обществе, и ключевой нюанс этой проблемы заключается в том, что приюты переполнены. В своем проекте я бы хотела сделать упор на то, как я могу помочь приютам увеличить количество усыновлений.

В части предобратотки данных мною были использованный «ящики с усами"(boxplot) для выявления возможных аномалий. В исследовательской части — гистограммы для визуализации того, как той или иной фактор влияет на возможность усыновления.

1 этап обработки данных

Я проверила правильность загрузки датасета путем функции display

#запишем исходные данные в dataframe data = pd.read_csv ('pet_adoption_data.csv', sep=', ') #проверим правильность записи display (data.head ())

big
Original size 2236x630

2 этап обработки данных

На предыдущем этапе заметила, что тип животного порой не совпадает с остальными факторами для него (Dog и Parakeet в одной строке), поэтому была написана функция, назначающая тип животного по его породе. Далее она была применена с помощью apply к датасету

def pet_type (a): if a in ['Labrador', 'Golden Retriever', 'Poodle']: return ('Dog') elif a == 'Parakeet': return ('Bird') else: return ('Cat')

data['PetType'] = data[‘Breed’].apply (pet_type)

Original size 2224x784

3 этап обработки данных

С помощью info проверила типы данных и количество нулевых строк

Original size 1174x796

4 этап обработки

С помощью методов  duplicated и sum проверила датафрейм на явные дубликаты

Original size 590x242

5 этап обработки

С помощью boxplot проверила распределение значений Возраста, Веса и Длительности нахождения животного в приюте

Original size 1242x1172
Original size 1186x1100
Original size 1392x1162

6 этап обработки

Заменим бинарные значения в некоторых столбцах на понятные

Original size 1268x884

Зависимость от типа животного

Original size 1169x861

Больше шансов на усыновления у собак Рассмотрим породы для более точной картины

Зависимость от породы

Original size 1170x771

Статистика благоволит собакам только из-за лабрадоров

Зависимость от возраста

Original size 1170x896

Как видно из распределения, в основном шансов больше у совсем молодых животных Радует то, что с возрастом (после 2 лет) шансы на усыновление практически не снижаются

Зависимость от размера

Original size 1166x862

Животные среднего размер в 3 раза чаще усыновляются

Зависимость от окраса

Original size 1170x848

Цвет не так сильно влияет на шансы усыновления, но коричневый все равно идет впереди

Зависимость от вакцинации

Original size 1169x764

Животных с вакциной забирают намного (в 4 раза) чаще

Необходимость мед. обслуживания

Original size 1170x699

Животных без необходиости в медицинском обслуживании (без проблем со здоровьем) забирают в 4 раза чаще

По ссылке прикреплен блокнот с кодом и датасет:

Анализ данных об усыновлении животных из приютов
2
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more