131 lines
2.8 KiB
Markdown
131 lines
2.8 KiB
Markdown
\# Анализ данных
|
||
|
||
|
||
|
||
\## Описание проекта
|
||
|
||
Проект для изучения JupyterLab, pandas, numpy, matplotlib, seaborn и tqdm.
|
||
|
||
|
||
|
||
\## Выполненные задания
|
||
|
||
|
||
|
||
\### 1. Подготовка окружения
|
||
|
||
\- Создано виртуальное окружение (venv)
|
||
|
||
\- Установлены библиотеки: jupyterlab, numpy, pandas, matplotlib, seaborn, tqdm
|
||
|
||
\- Инициализирован Git
|
||
|
||
\- Добавлены .gitignore и README.md
|
||
|
||
|
||
|
||
\### 2. Работа с JupyterLab
|
||
|
||
\- Создан блокнот pythonptoject6.ipynb
|
||
|
||
\- Использованы Markdown-ячейки для пояснений
|
||
|
||
\- Код разбит на логические блоки
|
||
|
||
|
||
|
||
\### 3. Pandas и NumPy
|
||
|
||
\- Создан DataFrame с данными студентов
|
||
|
||
\- Добавлены вычисляемые столбцы
|
||
|
||
\- Выполнены группировка и фильтрация
|
||
|
||
\- Созданы массивы NumPy, матрица, linspace
|
||
|
||
|
||
|
||
\### 4. Визуализация (matplotlib)
|
||
|
||
\- График синуса и косинуса (изменены цвета, добавлен cos)
|
||
|
||
\- Столбчатая диаграмма баллов студентов
|
||
|
||
\- Диаграмма рассеяния (возраст vs баллы)
|
||
|
||
|
||
|
||
\### 5. Визуализация (seaborn)
|
||
|
||
\- Boxplot по категориям
|
||
|
||
\- Гистограмма с KDE
|
||
|
||
\- Scatterplot с разделением по категориям
|
||
|
||
\- Pairplot и тепловая карта корреляции
|
||
|
||
|
||
|
||
\### 6. Tqdm
|
||
|
||
\- Прогресс-бар для демонстрации обработки данных
|
||
|
||
|
||
|
||
\### 7. Самостоятельное задание
|
||
|
||
\- \*\*Датасет\*\*: Wine Quality (скачан с Kaggle)
|
||
|
||
\- \*\*Размер\*\*: 1599 строк, 12 столбцов
|
||
|
||
\- \*\*Анализ\*\*: df.info(), df.describe()
|
||
|
||
\- \*\*Графики\*\*: histplot (качество вина), scatterplot (алкоголь vs качество), boxplot (алкоголь по оценкам)
|
||
|
||
\- \*\*Тепловая карта\*\*: показана корреляция признаков
|
||
|
||
\- \*\*Tqdm\*\*: использован для демонстрации
|
||
|
||
|
||
|
||
\## Результаты анализа Wine Quality
|
||
|
||
|
||
|
||
| Что влияет на качество | Коэффициент |
|
||
|
||
|-----------------------|-------------|
|
||
|
||
| Алкоголь | +0.48 (хорошо) |
|
||
|
||
| Летучая кислотность | -0.39 (плохо) |
|
||
|
||
|
||
|
||
\*\*Вывод\*\*: Алкоголь сильнее всего влияет на качество вина.
|
||
|
||
|
||
|
||
\## Как запустить
|
||
|
||
|
||
|
||
```bash
|
||
|
||
\# Активировать окружение
|
||
|
||
venv\\Scripts\\activate
|
||
|
||
|
||
|
||
\# Запустить JupyterLab
|
||
|
||
jupyter lab
|
||
|
||
|
||
|
||
\# Открыть pythonproject6.ipynb
|
||
|