29 lines
2.2 KiB
Markdown
29 lines
2.2 KiB
Markdown
# Практическая работа №3: Основы анализа данных и визуализации
|
||
|
||
## Описание проекта
|
||
В данном проекте реализован базовый цикл анализа данных на языке Python. Работа включает в себя настройку рабочего окружения, обработку числовых массивов и визуализацию статистических данных.
|
||
|
||
## Этапы выполнения
|
||
1. **Подготовка окружения**:
|
||
- Создано виртуальное окружение `venv`.
|
||
- Установлены библиотеки `pandas`, `numpy`, `matplotlib`, `seaborn` и `tqdm`.
|
||
- Настроен файл `.gitignore` для исключения системных файлов из репозитория.
|
||
|
||
2. **Работа с Pandas и Numpy**:
|
||
- Выполнена загрузка внешнего набора данных `Teen_Mental_Health_Dataset.csv`.
|
||
- Проведен первичный анализ данных (методы `info()`, `describe()`).
|
||
- Использованы функции Numpy для математических расчетов.
|
||
|
||
3. **Визуализация (Seaborn)**:
|
||
Построены три вида графиков для выявления закономерностей:
|
||
- **Гистограмма (histplot)**: Распределение продолжительности сна подростков.
|
||
- **Точечный график (scatterplot)**: Зависимость уровня стресса от времени в соцсетях.
|
||
- **Ящик с усами (boxplot)**: Сравнение уровня зависимости на разных платформах.
|
||
|
||
4. **Прогресс-бар**:
|
||
- Интегрирована библиотека `tqdm` для визуализации процесса завершения обработки данных.
|
||
|
||
## Как запустить
|
||
1. Активировать виртуальное окружение.
|
||
2. Запустить Jupyter Lab командой `jupyter lab`.
|
||
3. Открыть файл `week2_analysis.ipynb` и запустить все ячейки. |