Добавлено описание процесса работы в README

This commit is contained in:
ChebykinAS 2026-05-08 05:23:41 +03:00
parent f3283007cf
commit ad7a2655f5

View File

@ -0,0 +1,29 @@
# Практическая работа №3: Основы анализа данных и визуализации
## Описание проекта
В данном проекте реализован базовый цикл анализа данных на языке Python. Работа включает в себя настройку рабочего окружения, обработку числовых массивов и визуализацию статистических данных.
## Этапы выполнения
1. **Подготовка окружения**:
- Создано виртуальное окружение `venv`.
- Установлены библиотеки `pandas`, `numpy`, `matplotlib`, `seaborn` и `tqdm`.
- Настроен файл `.gitignore` для исключения системных файлов из репозитория.
2. **Работа с Pandas и Numpy**:
- Выполнена загрузка внешнего набора данных `Teen_Mental_Health_Dataset.csv`.
- Проведен первичный анализ данных (методы `info()`, `describe()`).
- Использованы функции Numpy для математических расчетов.
3. **Визуализация (Seaborn)**:
Построены три вида графиков для выявления закономерностей:
- **Гистограмма (histplot)**: Распределение продолжительности сна подростков.
- **Точечный график (scatterplot)**: Зависимость уровня стресса от времени в соцсетях.
- **Ящик с усами (boxplot)**: Сравнение уровня зависимости на разных платформах.
4. **Прогресс-бар**:
- Интегрирована библиотека `tqdm` для визуализации процесса завершения обработки данных.
## Как запустить
1. Активировать виртуальное окружение.
2. Запустить Jupyter Lab командой `jupyter lab`.
3. Открыть файл `week2_analysis.ipynb` и запустить все ячейки.