practice_3_Z/README.md

2.2 KiB
Raw Blame History

Практическая работа №3: Основы анализа данных и визуализации

Описание проекта

В данном проекте реализован базовый цикл анализа данных на языке Python. Работа включает в себя настройку рабочего окружения, обработку числовых массивов и визуализацию статистических данных.

Этапы выполнения

  1. Подготовка окружения:

    • Создано виртуальное окружение venv.
    • Установлены библиотеки pandas, numpy, matplotlib, seaborn и tqdm.
    • Настроен файл .gitignore для исключения системных файлов из репозитория.
  2. Работа с Pandas и Numpy:

    • Выполнена загрузка внешнего набора данных Teen_Mental_Health_Dataset.csv.
    • Проведен первичный анализ данных (методы info(), describe()).
    • Использованы функции Numpy для математических расчетов.
  3. Визуализация (Seaborn): Построены три вида графиков для выявления закономерностей:

    • Гистограмма (histplot): Распределение продолжительности сна подростков.
    • Точечный график (scatterplot): Зависимость уровня стресса от времени в соцсетях.
    • Ящик с усами (boxplot): Сравнение уровня зависимости на разных платформах.
  4. Прогресс-бар:

    • Интегрирована библиотека tqdm для визуализации процесса завершения обработки данных.

Как запустить

  1. Активировать виртуальное окружение.
  2. Запустить Jupyter Lab командой jupyter lab.
  3. Открыть файл week2_analysis.ipynb и запустить все ячейки.