Третье задание по практике
Go to file
2026-05-08 05:23:41 +03:00
.ipynb_checkpoints Финальная версия: анализ данных и визуализация завершены 2026-05-08 05:11:46 +03:00
.gitignore Настройка окружения и установка библиотек 2026-05-08 00:08:00 +03:00
README.md Добавлено описание процесса работы в README 2026-05-08 05:23:41 +03:00
Teen_Mental_Health_Dataset.csv Финальная версия: анализ данных и визуализация завершены 2026-05-08 05:11:46 +03:00
week2_analysis.ipynb Финальная версия: анализ данных и визуализация завершены 2026-05-08 05:11:46 +03:00

Практическая работа №3: Основы анализа данных и визуализации

Описание проекта

В данном проекте реализован базовый цикл анализа данных на языке Python. Работа включает в себя настройку рабочего окружения, обработку числовых массивов и визуализацию статистических данных.

Этапы выполнения

  1. Подготовка окружения:

    • Создано виртуальное окружение venv.
    • Установлены библиотеки pandas, numpy, matplotlib, seaborn и tqdm.
    • Настроен файл .gitignore для исключения системных файлов из репозитория.
  2. Работа с Pandas и Numpy:

    • Выполнена загрузка внешнего набора данных Teen_Mental_Health_Dataset.csv.
    • Проведен первичный анализ данных (методы info(), describe()).
    • Использованы функции Numpy для математических расчетов.
  3. Визуализация (Seaborn): Построены три вида графиков для выявления закономерностей:

    • Гистограмма (histplot): Распределение продолжительности сна подростков.
    • Точечный график (scatterplot): Зависимость уровня стресса от времени в соцсетях.
    • Ящик с усами (boxplot): Сравнение уровня зависимости на разных платформах.
  4. Прогресс-бар:

    • Интегрирована библиотека tqdm для визуализации процесса завершения обработки данных.

Как запустить

  1. Активировать виртуальное окружение.
  2. Запустить Jupyter Lab командой jupyter lab.
  3. Открыть файл week2_analysis.ipynb и запустить все ячейки.