diff --git a/README.md b/README.md index e69de29..c0dbed8 100644 --- a/README.md +++ b/README.md @@ -0,0 +1,29 @@ +# Практическая работа №3: Основы анализа данных и визуализации + +## Описание проекта +В данном проекте реализован базовый цикл анализа данных на языке Python. Работа включает в себя настройку рабочего окружения, обработку числовых массивов и визуализацию статистических данных. + +## Этапы выполнения +1. **Подготовка окружения**: + - Создано виртуальное окружение `venv`. + - Установлены библиотеки `pandas`, `numpy`, `matplotlib`, `seaborn` и `tqdm`. + - Настроен файл `.gitignore` для исключения системных файлов из репозитория. + +2. **Работа с Pandas и Numpy**: + - Выполнена загрузка внешнего набора данных `Teen_Mental_Health_Dataset.csv`. + - Проведен первичный анализ данных (методы `info()`, `describe()`). + - Использованы функции Numpy для математических расчетов. + +3. **Визуализация (Seaborn)**: + Построены три вида графиков для выявления закономерностей: + - **Гистограмма (histplot)**: Распределение продолжительности сна подростков. + - **Точечный график (scatterplot)**: Зависимость уровня стресса от времени в соцсетях. + - **Ящик с усами (boxplot)**: Сравнение уровня зависимости на разных платформах. + +4. **Прогресс-бар**: + - Интегрирована библиотека `tqdm` для визуализации процесса завершения обработки данных. + +## Как запустить +1. Активировать виртуальное окружение. +2. Запустить Jupyter Lab командой `jupyter lab`. +3. Открыть файл `week2_analysis.ipynb` и запустить все ячейки. \ No newline at end of file