practice_3_JupiterLab/README.md
Shvetsov Nikolai 0fa78c126f complete
2026-04-26 16:13:29 +03:00

2.4 KiB
Raw Permalink Blame History

Анализ данных FDA Drug Adverse Events

Описание проекта

В данном проекте выполнен анализ данных о побочных эффектах лекарственных препаратов на основе датасета FDA Drug Adverse Events.

Работа выполнена в Jupyter Notebook в рамках задания по анализу и визуализации данных.

Цель работы

Цель работы — освоить базовую работу с JupyterLab, библиотеками для анализа данных и визуализации, а также закрепить навыки ведения проекта с использованием Git.

Используемые библиотеки

В проекте использовались следующие библиотеки:

  • pandas
  • numpy
  • matplotlib
  • seaborn
  • tqdm

Что было сделано

В ходе работы были выполнены следующие действия:

  1. Загружен датасет из CSV-файла.
  2. Проведён первичный анализ данных:
    • просмотр первых строк таблицы;
    • анализ структуры данных;
    • получение статистического описания;
    • проверка пропущенных значений.
  3. Выполнена группировка данных по отдельным признакам.
  4. Создан новый признак risk_flag для выделения случаев повышенного риска.
  5. Построены графики:
    • гистограмма распределения возраста;
    • boxplot серьёзности случаев по полу;
    • столбчатая диаграмма стран с наибольшим количеством случаев;
    • тепловая карта корреляций.
  6. Использована библиотека tqdm для отображения прогресса обработки данных.

Структура проекта

project_drugs/
├── data/
│   └── gm_feature_engineered_fda.csv
├── week2_analysis.ipynb
├── README.md
├── requirements.txt
└── .gitignore

ФИНАЛЬНАЯ ВЕРСИЯ