skelet gotoviy
This commit is contained in:
commit
f39505656c
0
.gitignore
vendored
Normal file
0
.gitignore
vendored
Normal file
0
.ipynb_checkpoints/README-checkpoint.md
Normal file
0
.ipynb_checkpoints/README-checkpoint.md
Normal file
776
.ipynb_checkpoints/week2_analysis-checkpoint.ipynb
Normal file
776
.ipynb_checkpoints/week2_analysis-checkpoint.ipynb
Normal file
File diff suppressed because one or more lines are too long
51
README.md
Normal file
51
README.md
Normal file
@ -0,0 +1,51 @@
|
||||
# Анализ данных FDA Drug Adverse Events
|
||||
|
||||
## Описание проекта
|
||||
|
||||
В данном проекте выполнен анализ данных о побочных эффектах лекарственных препаратов на основе датасета FDA Drug Adverse Events.
|
||||
|
||||
Работа выполнена в Jupyter Notebook в рамках задания по анализу и визуализации данных.
|
||||
|
||||
## Цель работы
|
||||
|
||||
Цель работы — освоить базовую работу с JupyterLab, библиотеками для анализа данных и визуализации, а также закрепить навыки ведения проекта с использованием Git.
|
||||
|
||||
## Используемые библиотеки
|
||||
|
||||
В проекте использовались следующие библиотеки:
|
||||
|
||||
- pandas
|
||||
- numpy
|
||||
- matplotlib
|
||||
- seaborn
|
||||
- tqdm
|
||||
|
||||
## Что было сделано
|
||||
|
||||
В ходе работы были выполнены следующие действия:
|
||||
|
||||
1. Загружен датасет из CSV-файла.
|
||||
2. Проведён первичный анализ данных:
|
||||
- просмотр первых строк таблицы;
|
||||
- анализ структуры данных;
|
||||
- получение статистического описания;
|
||||
- проверка пропущенных значений.
|
||||
3. Выполнена группировка данных по отдельным признакам.
|
||||
4. Создан новый признак `risk_flag` для выделения случаев повышенного риска.
|
||||
5. Построены графики:
|
||||
- гистограмма распределения возраста;
|
||||
- boxplot серьёзности случаев по полу;
|
||||
- столбчатая диаграмма стран с наибольшим количеством случаев;
|
||||
- тепловая карта корреляций.
|
||||
6. Использована библиотека `tqdm` для отображения прогресса обработки данных.
|
||||
|
||||
## Структура проекта
|
||||
|
||||
```text
|
||||
project_drugs/
|
||||
├── data/
|
||||
│ └── gm_feature_engineered_fda.csv
|
||||
├── week2_analysis.ipynb
|
||||
├── README.md
|
||||
├── requirements.txt
|
||||
└── .gitignore
|
||||
1288
data/gm_feature_engineered_fda.csv
Normal file
1288
data/gm_feature_engineered_fda.csv
Normal file
File diff suppressed because it is too large
Load Diff
BIN
requirements.txt
Normal file
BIN
requirements.txt
Normal file
Binary file not shown.
776
week2_analysis.ipynb
Normal file
776
week2_analysis.ipynb
Normal file
File diff suppressed because one or more lines are too long
Loading…
Reference in New Issue
Block a user