From 2d37222d55e92af4b48ef4833d850128ae6180de Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=D0=97=D0=B0=D1=81=D1=8B=D0=BF=D0=BA=D0=B8=D0=BD=20=D0=90?= =?UTF-8?q?=D0=BB=D0=B5=D0=BA=D1=81=D0=B0=D0=BD=D0=B4=D1=80?= Date: Sat, 2 May 2026 20:47:00 +0300 Subject: [PATCH] Using a training example --- week4_scikit_learn.ipynb | 98 ++++++++++++++++++++++++++++++++++++++++ 1 file changed, 98 insertions(+) create mode 100644 week4_scikit_learn.ipynb diff --git a/week4_scikit_learn.ipynb b/week4_scikit_learn.ipynb new file mode 100644 index 0000000..2866188 --- /dev/null +++ b/week4_scikit_learn.ipynb @@ -0,0 +1,98 @@ +{ + "cells": [ + { + "metadata": {}, + "cell_type": "markdown", + "source": "# Использование обучающего примера", + "id": "f35a7e78162fe88b" + }, + { + "metadata": { + "collapsed": true, + "ExecuteTime": { + "end_time": "2026-05-02T17:42:08.755269800Z", + "start_time": "2026-05-02T17:42:08.578031400Z" + } + }, + "cell_type": "code", + "source": [ + "from sklearn.datasets import load_iris\n", + "from sklearn.model_selection import train_test_split\n", + "from sklearn.neural_network import MLPClassifier\n", + "from sklearn.metrics import classification_report\n", + "\n", + "# Загрузка и разбиение данных\n", + "X, y = load_iris(return_X_y=True)\n", + "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)\n", + "\n", + "# Модель MLP — многослойный перцептрон\n", + "clf = MLPClassifier(hidden_layer_sizes=(10,), activation='relu', max_iter=500)\n", + "clf.fit(X_train, y_train)\n", + "\n", + "# Отчёт о точности\n", + "print(classification_report(y_test, clf.predict(X_test)))" + ], + "id": "6b3a8f9a35d69b96", + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + " precision recall f1-score support\n", + "\n", + " 0 1.00 1.00 1.00 10\n", + " 1 0.83 1.00 0.91 5\n", + " 2 1.00 0.93 0.97 15\n", + "\n", + " accuracy 0.97 30\n", + " macro avg 0.94 0.98 0.96 30\n", + "weighted avg 0.97 0.97 0.97 30\n", + "\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "C:\\Users\\zasyp\\PycharmProjects\\ScikitLearnLLM\\.venv\\Lib\\site-packages\\sklearn\\neural_network\\_multilayer_perceptron.py:785: ConvergenceWarning: Stochastic Optimizer: Maximum iterations (500) reached and the optimization hasn't converged yet.\n", + " warnings.warn(\n" + ] + } + ], + "execution_count": 27 + }, + { + "metadata": {}, + "cell_type": "markdown", + "source": [ + "## Выводы по результатам отчёта о точности\n", + "\n", + "1. Используется датасет **Iris**, в котором загружено **150** цветков ириса, разделенных на 4 категории\n", + "2. **test_size** равен **0.2**, это значит что **20%** из всех загруженных 150 цветков пойдут на тесты, остальные **80%** идут на обучение. Установив значение на **0.5** кол-во делится пополам на обучение и на тесты.\n", + "3. **max_iter** - кол-во итераций обучения. При **max_iter=100** результаты крайне нестабильные и модель очень часто ошибается. Если установить **max_iter** на **500**, результаты становятся довольно точными, но иногда все равно промахивается. При установке **max_iter** на **2500** результаты оказываются либо всегда 1, либо очень точными (что может говорить о том, что модель переобучилась из-за большого кол-ва итераций)" + ], + "id": "350dd90fedfff2ab" + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 2 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython2", + "version": "2.7.6" + } + }, + "nbformat": 4, + "nbformat_minor": 5 +}