Original size 1140x1600

Война, мир, любовь

PROTECT STATUS: not protected
10

В этом проекте я проанализирую произведение Льва Николаевича Толстого «Война и мир» и посчитаю сколько раз в тексте упоминаются слова «война», «мир» и «любовь».

big
Original size 1200x510

война

«Война и мир» является основой русской классической литературы. Было интересно посмотреть насколько часто в тексте упоминаются заглавные темы.

Зачем?

1. Позволяет проследить преобладающую тему в каждом томе. 2. Помогает исследователям и студентам анализировать развитие конфликтов, изменение фокуса повествования. 3. Может помочь людям лучше ориентироваться в содержании произведения и понимать его структуру.

big
Original size 1200x510

мир

Вдохновление для оформления проекта я черпала из сериала Сергея Бондарчука «Война и мир» 1965 года. Так же в проекте я использую шрифт стилизованный под печатную машинку, для передачи исторического настроения.

big
Original size 1200x510

любовь

В качестве исходных данных я использовала текст книги в формате txt, который скачала в интернете.

Для графиков я выбрала линейные и круговые диаграммы, так как они оказались наиболее удобными для отображения результатов исследования.

Использование библиотек

В коде использованы библиотека re для работы с регулярными выражениями, pandas для обработки и анализа табличных данных, matplotlib.pyplot для основной визуализации данных, matplotlib.font_manager для работы со шрифтами.

Original size 989x266

Обработка данных

Код открывает файл book.txt, читает его построчно и ищет заголовки томов, частей и глав. Когда код встречает новый заголовок, он сохраняет текст предыдущей главы в список records и переходит к следующему разделу.

Original size 989x266

Код использует регулярные выражения для поиска слов в тексте каждой главы. Ищет слова «война», «мир», «любовь» и их вариации. Считает, сколько раз слово встречается в тексте главы. Записывает результат в таблицу df.

Original size 1166x378

Код собирает всю информацию в DataFrame, чтобы затем её визуализировать. Оставляет нужные колонки: Том, Часть, Глава, количество слов. Создаёт новый столбец Section, чтобы удобнее было строить графики.

Original size 1158x300

Визуализация

0

Круговая диаграмма показывает, что слово война является самым употребляемым в произведении. Это указывает на то что Лев Толстой уделяет больше всего внимание именно этой теме, так как она является наиболее важной в этой книге. Война становится трагедией, на фоне которой развиваются жизни главных героев.

0

С помощью этих графиков можно проследить, что первый и четвертый том являются наиболее отстраненными от основных тем. Второй том больше затрагиввает описание обычной бытовой жизни, отношений между людьми, в нем наибольшее количество раз упоминаются слова «любовь» и «мир». В третьем томе наибольшее количество раз упоминается слово «война», мы можем понять, что именно в нем разворачиваюся самые большие батальные сцены.

0

С помощью общего графика можно проследить общую композицию произведения. Это может помочь людям лучше ориентироваться в романе. Также, например, писатели или сценаристы с помощью этих данных могут лучше понимать, как построено данное произведение.

Война, мир, любовь
10
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more