practice_3_JupiterLab/README.md
Shvetsov Nikolai 0fa78c126f complete
2026-04-26 16:13:29 +03:00

53 lines
2.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Анализ данных FDA Drug Adverse Events
## Описание проекта
В данном проекте выполнен анализ данных о побочных эффектах лекарственных препаратов на основе датасета FDA Drug Adverse Events.
Работа выполнена в Jupyter Notebook в рамках задания по анализу и визуализации данных.
## Цель работы
Цель работы — освоить базовую работу с JupyterLab, библиотеками для анализа данных и визуализации, а также закрепить навыки ведения проекта с использованием Git.
## Используемые библиотеки
В проекте использовались следующие библиотеки:
- pandas
- numpy
- matplotlib
- seaborn
- tqdm
## Что было сделано
В ходе работы были выполнены следующие действия:
1. Загружен датасет из CSV-файла.
2. Проведён первичный анализ данных:
- просмотр первых строк таблицы;
- анализ структуры данных;
- получение статистического описания;
- проверка пропущенных значений.
3. Выполнена группировка данных по отдельным признакам.
4. Создан новый признак `risk_flag` для выделения случаев повышенного риска.
5. Построены графики:
- гистограмма распределения возраста;
- boxplot серьёзности случаев по полу;
- столбчатая диаграмма стран с наибольшим количеством случаев;
- тепловая карта корреляций.
6. Использована библиотека `tqdm` для отображения прогресса обработки данных.
## Структура проекта
```text
project_drugs/
├── data/
│ └── gm_feature_engineered_fda.csv
├── week2_analysis.ipynb
├── README.md
├── requirements.txt
└── .gitignore
ФИНАЛЬНАЯ ВЕРСИЯ