Go to file
Shvetsov Nikolai a1124363af newnew_complete
2026-05-08 01:31:17 +03:00
.ipynb_checkpoints complete 2026-04-28 15:51:00 +03:00
.gitignore complete with README 2026-04-28 15:54:24 +03:00
CalibrationAI.ipynb newnew_complete 2026-05-08 01:31:17 +03:00
README.md new complete 2026-05-08 01:13:44 +03:00
requirements.txt skeletik 2026-04-28 15:29:23 +03:00

Калибровка вероятностей классификаторов

Описание проекта

Проект выполнен в рамках учебной практики по Python и анализу данных.

В работе исследуется калибровка вероятностных предсказаний модели машинного обучения с использованием библиотеки scikit-learn. Выполнено сравнение вероятностей до и после калибровки на синтетическом и внешнем датасетах.

Используемые технологии

  • Python 3.14
  • JupyterLab
  • pandas
  • numpy
  • matplotlib
  • scikit-learn
  • openml

Структура работы

В проекте рассматриваются:

  1. Создание синтетического датасета через make_classification
  2. Обучение модели LogisticRegression
  3. Калибровка вероятностей через CalibratedClassifierCV
  4. Построение calibration curve
  5. Работа с внешним датасетом OpenML

Внешний датасет

В качестве внешнего датасета использован набор данных OpenML с ID 40691.

Для корректной работы calibration curve многоклассовая задача была преобразована в бинарную классификацию.

Результат работы

В ходе выполнения проекта были получены навыки:

  • работы с JupyterLab;
  • предобработки данных;
  • обучения моделей машинного обучения;
  • построения графиков;
  • анализа вероятностных предсказаний модели.

Запуск проекта

Установка зависимостей:

pip install -r requirements.txt