Go to file
Shvetsov Nikolai 0fa78c126f complete
2026-04-26 16:13:29 +03:00
.ipynb_checkpoints skelet gotoviy 2026-04-26 16:03:25 +03:00
data skelet gotoviy 2026-04-26 16:03:25 +03:00
.gitignore skelet gotoviy 2026-04-26 16:03:25 +03:00
README.md complete 2026-04-26 16:13:29 +03:00
requirements.txt skelet gotoviy 2026-04-26 16:03:25 +03:00
week2_analysis.ipynb skelet gotoviy 2026-04-26 16:03:25 +03:00

Анализ данных FDA Drug Adverse Events

Описание проекта

В данном проекте выполнен анализ данных о побочных эффектах лекарственных препаратов на основе датасета FDA Drug Adverse Events.

Работа выполнена в Jupyter Notebook в рамках задания по анализу и визуализации данных.

Цель работы

Цель работы — освоить базовую работу с JupyterLab, библиотеками для анализа данных и визуализации, а также закрепить навыки ведения проекта с использованием Git.

Используемые библиотеки

В проекте использовались следующие библиотеки:

  • pandas
  • numpy
  • matplotlib
  • seaborn
  • tqdm

Что было сделано

В ходе работы были выполнены следующие действия:

  1. Загружен датасет из CSV-файла.
  2. Проведён первичный анализ данных:
    • просмотр первых строк таблицы;
    • анализ структуры данных;
    • получение статистического описания;
    • проверка пропущенных значений.
  3. Выполнена группировка данных по отдельным признакам.
  4. Создан новый признак risk_flag для выделения случаев повышенного риска.
  5. Построены графики:
    • гистограмма распределения возраста;
    • boxplot серьёзности случаев по полу;
    • столбчатая диаграмма стран с наибольшим количеством случаев;
    • тепловая карта корреляций.
  6. Использована библиотека tqdm для отображения прогресса обработки данных.

Структура проекта

project_drugs/
├── data/
│   └── gm_feature_engineered_fda.csv
├── week2_analysis.ipynb
├── README.md
├── requirements.txt
└── .gitignore

ФИНАЛЬНАЯ ВЕРСИЯ