51 lines
2.3 KiB
Markdown
51 lines
2.3 KiB
Markdown
# Анализ данных FDA Drug Adverse Events
|
||
|
||
## Описание проекта
|
||
|
||
В данном проекте выполнен анализ данных о побочных эффектах лекарственных препаратов на основе датасета FDA Drug Adverse Events.
|
||
|
||
Работа выполнена в Jupyter Notebook в рамках задания по анализу и визуализации данных.
|
||
|
||
## Цель работы
|
||
|
||
Цель работы — освоить базовую работу с JupyterLab, библиотеками для анализа данных и визуализации, а также закрепить навыки ведения проекта с использованием Git.
|
||
|
||
## Используемые библиотеки
|
||
|
||
В проекте использовались следующие библиотеки:
|
||
|
||
- pandas
|
||
- numpy
|
||
- matplotlib
|
||
- seaborn
|
||
- tqdm
|
||
|
||
## Что было сделано
|
||
|
||
В ходе работы были выполнены следующие действия:
|
||
|
||
1. Загружен датасет из CSV-файла.
|
||
2. Проведён первичный анализ данных:
|
||
- просмотр первых строк таблицы;
|
||
- анализ структуры данных;
|
||
- получение статистического описания;
|
||
- проверка пропущенных значений.
|
||
3. Выполнена группировка данных по отдельным признакам.
|
||
4. Создан новый признак `risk_flag` для выделения случаев повышенного риска.
|
||
5. Построены графики:
|
||
- гистограмма распределения возраста;
|
||
- boxplot серьёзности случаев по полу;
|
||
- столбчатая диаграмма стран с наибольшим количеством случаев;
|
||
- тепловая карта корреляций.
|
||
6. Использована библиотека `tqdm` для отображения прогресса обработки данных.
|
||
|
||
## Структура проекта
|
||
|
||
```text
|
||
project_drugs/
|
||
├── data/
|
||
│ └── gm_feature_engineered_fda.csv
|
||
├── week2_analysis.ipynb
|
||
├── README.md
|
||
├── requirements.txt
|
||
└── .gitignore |