Добавлено описание процесса работы в README
This commit is contained in:
parent
f3283007cf
commit
ad7a2655f5
29
README.md
29
README.md
@ -0,0 +1,29 @@
|
|||||||
|
# Практическая работа №3: Основы анализа данных и визуализации
|
||||||
|
|
||||||
|
## Описание проекта
|
||||||
|
В данном проекте реализован базовый цикл анализа данных на языке Python. Работа включает в себя настройку рабочего окружения, обработку числовых массивов и визуализацию статистических данных.
|
||||||
|
|
||||||
|
## Этапы выполнения
|
||||||
|
1. **Подготовка окружения**:
|
||||||
|
- Создано виртуальное окружение `venv`.
|
||||||
|
- Установлены библиотеки `pandas`, `numpy`, `matplotlib`, `seaborn` и `tqdm`.
|
||||||
|
- Настроен файл `.gitignore` для исключения системных файлов из репозитория.
|
||||||
|
|
||||||
|
2. **Работа с Pandas и Numpy**:
|
||||||
|
- Выполнена загрузка внешнего набора данных `Teen_Mental_Health_Dataset.csv`.
|
||||||
|
- Проведен первичный анализ данных (методы `info()`, `describe()`).
|
||||||
|
- Использованы функции Numpy для математических расчетов.
|
||||||
|
|
||||||
|
3. **Визуализация (Seaborn)**:
|
||||||
|
Построены три вида графиков для выявления закономерностей:
|
||||||
|
- **Гистограмма (histplot)**: Распределение продолжительности сна подростков.
|
||||||
|
- **Точечный график (scatterplot)**: Зависимость уровня стресса от времени в соцсетях.
|
||||||
|
- **Ящик с усами (boxplot)**: Сравнение уровня зависимости на разных платформах.
|
||||||
|
|
||||||
|
4. **Прогресс-бар**:
|
||||||
|
- Интегрирована библиотека `tqdm` для визуализации процесса завершения обработки данных.
|
||||||
|
|
||||||
|
## Как запустить
|
||||||
|
1. Активировать виртуальное окружение.
|
||||||
|
2. Запустить Jupyter Lab командой `jupyter lab`.
|
||||||
|
3. Открыть файл `week2_analysis.ipynb` и запустить все ячейки.
|
||||||
Loading…
Reference in New Issue
Block a user