| .gitignore | ||
| pythonproject6.ipynb | ||
| README.md | ||
| winequality-red.csv | ||
# Анализ данных
## Описание проекта
Проект для изучения JupyterLab, pandas, numpy, matplotlib, seaborn и tqdm.
## Выполненные задания
### 1. Подготовка окружения
- Создано виртуальное окружение (venv)
- Установлены библиотеки: jupyterlab, numpy, pandas, matplotlib, seaborn, tqdm
- Инициализирован Git
- Добавлены .gitignore и README.md
### 2. Работа с JupyterLab
- Создан блокнот pythonptoject6.ipynb
- Использованы Markdown-ячейки для пояснений
- Код разбит на логические блоки
### 3. Pandas и NumPy
- Создан DataFrame с данными студентов
- Добавлены вычисляемые столбцы
- Выполнены группировка и фильтрация
- Созданы массивы NumPy, матрица, linspace
### 4. Визуализация (matplotlib)
- График синуса и косинуса (изменены цвета, добавлен cos)
- Столбчатая диаграмма баллов студентов
- Диаграмма рассеяния (возраст vs баллы)
### 5. Визуализация (seaborn)
- Boxplot по категориям
- Гистограмма с KDE
- Scatterplot с разделением по категориям
- Pairplot и тепловая карта корреляции
### 6. Tqdm
- Прогресс-бар для демонстрации обработки данных
### 7. Самостоятельное задание
- **Датасет**: Wine Quality (скачан с Kaggle)
- **Размер**: 1599 строк, 12 столбцов
- **Анализ**: df.info(), df.describe()
- **Графики**: histplot (качество вина), scatterplot (алкоголь vs качество), boxplot (алкоголь по оценкам)
- **Тепловая карта**: показана корреляция признаков
- **Tqdm**: использован для демонстрации
## Результаты анализа Wine Quality
| Что влияет на качество | Коэффициент |
|-----------------------|-------------|
| Алкоголь | +0.48 (хорошо) |
| Летучая кислотность | -0.39 (плохо) |
**Вывод**: Алкоголь сильнее всего влияет на качество вина.
## Как запустить
\# Активировать окружение
venv\\Scripts\\activate
\# Запустить JupyterLab
jupyter lab
\# Открыть pythonproject6.ipynb