Добавлено описание процесса работы в README
This commit is contained in:
parent
f3283007cf
commit
ad7a2655f5
29
README.md
29
README.md
@ -0,0 +1,29 @@
|
||||
# Практическая работа №3: Основы анализа данных и визуализации
|
||||
|
||||
## Описание проекта
|
||||
В данном проекте реализован базовый цикл анализа данных на языке Python. Работа включает в себя настройку рабочего окружения, обработку числовых массивов и визуализацию статистических данных.
|
||||
|
||||
## Этапы выполнения
|
||||
1. **Подготовка окружения**:
|
||||
- Создано виртуальное окружение `venv`.
|
||||
- Установлены библиотеки `pandas`, `numpy`, `matplotlib`, `seaborn` и `tqdm`.
|
||||
- Настроен файл `.gitignore` для исключения системных файлов из репозитория.
|
||||
|
||||
2. **Работа с Pandas и Numpy**:
|
||||
- Выполнена загрузка внешнего набора данных `Teen_Mental_Health_Dataset.csv`.
|
||||
- Проведен первичный анализ данных (методы `info()`, `describe()`).
|
||||
- Использованы функции Numpy для математических расчетов.
|
||||
|
||||
3. **Визуализация (Seaborn)**:
|
||||
Построены три вида графиков для выявления закономерностей:
|
||||
- **Гистограмма (histplot)**: Распределение продолжительности сна подростков.
|
||||
- **Точечный график (scatterplot)**: Зависимость уровня стресса от времени в соцсетях.
|
||||
- **Ящик с усами (boxplot)**: Сравнение уровня зависимости на разных платформах.
|
||||
|
||||
4. **Прогресс-бар**:
|
||||
- Интегрирована библиотека `tqdm` для визуализации процесса завершения обработки данных.
|
||||
|
||||
## Как запустить
|
||||
1. Активировать виртуальное окружение.
|
||||
2. Запустить Jupyter Lab командой `jupyter lab`.
|
||||
3. Открыть файл `week2_analysis.ipynb` и запустить все ячейки.
|
||||
Loading…
Reference in New Issue
Block a user