| .ipynb_checkpoints | ||
| data | ||
| .gitignore | ||
| README.md | ||
| requirements.txt | ||
| week2_analysis.ipynb | ||
Анализ данных FDA Drug Adverse Events
Описание проекта
В данном проекте выполнен анализ данных о побочных эффектах лекарственных препаратов на основе датасета FDA Drug Adverse Events.
Работа выполнена в Jupyter Notebook в рамках задания по анализу и визуализации данных.
Цель работы
Цель работы — освоить базовую работу с JupyterLab, библиотеками для анализа данных и визуализации, а также закрепить навыки ведения проекта с использованием Git.
Используемые библиотеки
В проекте использовались следующие библиотеки:
- pandas
- numpy
- matplotlib
- seaborn
- tqdm
Что было сделано
В ходе работы были выполнены следующие действия:
- Загружен датасет из CSV-файла.
- Проведён первичный анализ данных:
- просмотр первых строк таблицы;
- анализ структуры данных;
- получение статистического описания;
- проверка пропущенных значений.
- Выполнена группировка данных по отдельным признакам.
- Создан новый признак
risk_flagдля выделения случаев повышенного риска. - Построены графики:
- гистограмма распределения возраста;
- boxplot серьёзности случаев по полу;
- столбчатая диаграмма стран с наибольшим количеством случаев;
- тепловая карта корреляций.
- Использована библиотека
tqdmдля отображения прогресса обработки данных.
Структура проекта
project_drugs/
├── data/
│ └── gm_feature_engineered_fda.csv
├── week2_analysis.ipynb
├── README.md
├── requirements.txt
└── .gitignore