practice_3_Z/README.md

29 lines
2.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Практическая работа №3: Основы анализа данных и визуализации
## Описание проекта
В данном проекте реализован базовый цикл анализа данных на языке Python. Работа включает в себя настройку рабочего окружения, обработку числовых массивов и визуализацию статистических данных.
## Этапы выполнения
1. **Подготовка окружения**:
- Создано виртуальное окружение `venv`.
- Установлены библиотеки `pandas`, `numpy`, `matplotlib`, `seaborn` и `tqdm`.
- Настроен файл `.gitignore` для исключения системных файлов из репозитория.
2. **Работа с Pandas и Numpy**:
- Выполнена загрузка внешнего набора данных `Teen_Mental_Health_Dataset.csv`.
- Проведен первичный анализ данных (методы `info()`, `describe()`).
- Использованы функции Numpy для математических расчетов.
3. **Визуализация (Seaborn)**:
Построены три вида графиков для выявления закономерностей:
- **Гистограмма (histplot)**: Распределение продолжительности сна подростков.
- **Точечный график (scatterplot)**: Зависимость уровня стресса от времени в соцсетях.
- **Ящик с усами (boxplot)**: Сравнение уровня зависимости на разных платформах.
4. **Прогресс-бар**:
- Интегрирована библиотека `tqdm` для визуализации процесса завершения обработки данных.
## Как запустить
1. Активировать виртуальное окружение.
2. Запустить Jupyter Lab командой `jupyter lab`.
3. Открыть файл `week2_analysis.ipynb` и запустить все ячейки.