69 lines
2.2 KiB
Plaintext
69 lines
2.2 KiB
Plaintext
{
|
|
"cells": [
|
|
{
|
|
"cell_type": "markdown",
|
|
"id": "88b1e95e",
|
|
"metadata": {},
|
|
"source": [
|
|
"# Задание 4 — Gaussian Mixture Models в scikit-learn\n",
|
|
"\n",
|
|
"## Цель задачи\n",
|
|
"Изучить применение модели Gaussian Mixture Model (GMM) для кластеризации данных.\n",
|
|
"Проверить работу алгоритма на двух типах данных:\n",
|
|
"1. на сгенерированном датасете;\n",
|
|
"2. на внешнем датасете, загруженном из CSV-файла.\n",
|
|
"\n",
|
|
"## Используемый алгоритм\n",
|
|
"Gaussian Mixture Model (GMM) — это вероятностная модель, которая предполагает,\n",
|
|
"что данные являются смесью нескольких гауссовых распределений.\n",
|
|
"\n",
|
|
"## План работы\n",
|
|
"1. Подготовить данные;\n",
|
|
"2. Выполнить предобработку;\n",
|
|
"3. Обучить модель GMM;\n",
|
|
"4. Визуализировать результаты;\n",
|
|
"5. Провести интерпретацию результатов.\n"
|
|
]
|
|
},
|
|
{
|
|
"cell_type": "code",
|
|
"execution_count": 2,
|
|
"id": "b535e17e",
|
|
"metadata": {},
|
|
"outputs": [],
|
|
"source": [
|
|
"import numpy as np\n",
|
|
"import pandas as pd\n",
|
|
"import matplotlib.pyplot as plt\n",
|
|
"\n",
|
|
"from sklearn.datasets import make_blobs\n",
|
|
"from sklearn.mixture import GaussianMixture\n",
|
|
"from sklearn.preprocessing import StandardScaler\n",
|
|
"from sklearn.decomposition import PCA\n",
|
|
"from sklearn.metrics import silhouette_score"
|
|
]
|
|
}
|
|
],
|
|
"metadata": {
|
|
"kernelspec": {
|
|
"display_name": ".venv",
|
|
"language": "python",
|
|
"name": "python3"
|
|
},
|
|
"language_info": {
|
|
"codemirror_mode": {
|
|
"name": "ipython",
|
|
"version": 3
|
|
},
|
|
"file_extension": ".py",
|
|
"mimetype": "text/x-python",
|
|
"name": "python",
|
|
"nbconvert_exporter": "python",
|
|
"pygments_lexer": "ipython3",
|
|
"version": "3.14.3"
|
|
}
|
|
},
|
|
"nbformat": 4,
|
|
"nbformat_minor": 5
|
|
}
|