Jupyter_lab/README.md

2.8 KiB
Raw Permalink Blame History

# Анализ данных

## Описание проекта

Проект для изучения JupyterLab, pandas, numpy, matplotlib, seaborn и tqdm.

## Выполненные задания

### 1. Подготовка окружения

- Создано виртуальное окружение (venv)

- Установлены библиотеки: jupyterlab, numpy, pandas, matplotlib, seaborn, tqdm

- Инициализирован Git

- Добавлены .gitignore и README.md

### 2. Работа с JupyterLab

- Создан блокнот pythonptoject6.ipynb

- Использованы Markdown-ячейки для пояснений

- Код разбит на логические блоки

### 3. Pandas и NumPy

- Создан DataFrame с данными студентов

- Добавлены вычисляемые столбцы

- Выполнены группировка и фильтрация

- Созданы массивы NumPy, матрица, linspace

### 4. Визуализация (matplotlib)

- График синуса и косинуса (изменены цвета, добавлен cos)

- Столбчатая диаграмма баллов студентов

- Диаграмма рассеяния (возраст vs баллы)

### 5. Визуализация (seaborn)

- Boxplot по категориям

- Гистограмма с KDE

- Scatterplot с разделением по категориям

- Pairplot и тепловая карта корреляции

### 6. Tqdm

- Прогресс-бар для демонстрации обработки данных

### 7. Самостоятельное задание

- **Датасет**: Wine Quality (скачан с Kaggle)

- **Размер**: 1599 строк, 12 столбцов

- **Анализ**: df.info(), df.describe()

- **Графики**: histplot (качество вина), scatterplot (алкоголь vs качество), boxplot (алкоголь по оценкам)

- **Тепловая карта**: показана корреляция признаков

- **Tqdm**: использован для демонстрации

## Результаты анализа Wine Quality

| Что влияет на качество | Коэффициент |

|-----------------------|-------------|

| Алкоголь | +0.48 (хорошо) |

| Летучая кислотность | -0.39 (плохо) |

**Вывод**: Алкоголь сильнее всего влияет на качество вина.

## Как запустить


\# Активировать окружение

venv\\Scripts\\activate



\# Запустить JupyterLab

jupyter lab



\# Открыть pythonproject6.ipynb