Третье задание по практике
| .ipynb_checkpoints | ||
| .gitignore | ||
| README.md | ||
| Teen_Mental_Health_Dataset.csv | ||
| week2_analysis.ipynb | ||
Практическая работа №3: Основы анализа данных и визуализации
Описание проекта
В данном проекте реализован базовый цикл анализа данных на языке Python. Работа включает в себя настройку рабочего окружения, обработку числовых массивов и визуализацию статистических данных.
Этапы выполнения
-
Подготовка окружения:
- Создано виртуальное окружение
venv. - Установлены библиотеки
pandas,numpy,matplotlib,seabornиtqdm. - Настроен файл
.gitignoreдля исключения системных файлов из репозитория.
- Создано виртуальное окружение
-
Работа с Pandas и Numpy:
- Выполнена загрузка внешнего набора данных
Teen_Mental_Health_Dataset.csv. - Проведен первичный анализ данных (методы
info(),describe()). - Использованы функции Numpy для математических расчетов.
- Выполнена загрузка внешнего набора данных
-
Визуализация (Seaborn): Построены три вида графиков для выявления закономерностей:
- Гистограмма (histplot): Распределение продолжительности сна подростков.
- Точечный график (scatterplot): Зависимость уровня стресса от времени в соцсетях.
- Ящик с усами (boxplot): Сравнение уровня зависимости на разных платформах.
-
Прогресс-бар:
- Интегрирована библиотека
tqdmдля визуализации процесса завершения обработки данных.
- Интегрирована библиотека
Как запустить
- Активировать виртуальное окружение.
- Запустить Jupyter Lab командой
jupyter lab. - Открыть файл
week2_analysis.ipynbи запустить все ячейки.