practice4_CalibrationAI/README.md
Shvetsov Nikolai e6fad14cfa new complete
2026-05-08 01:13:44 +03:00

50 lines
2.0 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Калибровка вероятностей классификаторов
## Описание проекта
Проект выполнен в рамках учебной практики по Python и анализу данных.
В работе исследуется калибровка вероятностных предсказаний модели машинного обучения с использованием библиотеки scikit-learn. Выполнено сравнение вероятностей до и после калибровки на синтетическом и внешнем датасетах.
## Используемые технологии
- Python 3.14
- JupyterLab
- pandas
- numpy
- matplotlib
- scikit-learn
- openml
## Структура работы
В проекте рассматриваются:
1. Создание синтетического датасета через `make_classification`
2. Обучение модели `LogisticRegression`
3. Калибровка вероятностей через `CalibratedClassifierCV`
4. Построение calibration curve
5. Работа с внешним датасетом OpenML
## Внешний датасет
В качестве внешнего датасета использован набор данных OpenML с ID 40691.
Для корректной работы calibration curve многоклассовая задача была преобразована в бинарную классификацию.
## Результат работы
В ходе выполнения проекта были получены навыки:
- работы с JupyterLab;
- предобработки данных;
- обучения моделей машинного обучения;
- построения графиков;
- анализа вероятностных предсказаний модели.
## Запуск проекта
Установка зависимостей:
```bash
pip install -r requirements.txt