diff --git a/week2_analysis.ipynb b/week2_analysis.ipynb index 23f3bfa..f230734 100644 --- a/week2_analysis.ipynb +++ b/week2_analysis.ipynb @@ -1,11 +1,9 @@ { "cells": [ { - "cell_type": "code", - "execution_count": 1, + "cell_type": "markdown", "id": "4f28bbe0-aad2-40b7-b15a-ccdb60887538", "metadata": {}, - "outputs": [], "source": [ "# Анализ датасета с изображениями лиц\n", "## Датасет: FINAL_DATASET.csv\n", @@ -425,11 +423,9 @@ ] }, { - "cell_type": "code", - "execution_count": 7, + "cell_type": "markdown", "id": "285ecf3a-f8c7-4307-be9a-f771da48ec8e", "metadata": {}, - "outputs": [], "source": [ "## 1. Анализ распределения label (REAL / FAKE)" ] @@ -482,11 +478,9 @@ ] }, { - "cell_type": "code", - "execution_count": 9, + "cell_type": "markdown", "id": "b8017d03-fe3b-484b-bdb9-39a4d89561b6", "metadata": {}, - "outputs": [], "source": [ "## 2. Распределение по age_group" ] @@ -528,11 +522,9 @@ ] }, { - "cell_type": "code", - "execution_count": 11, + "cell_type": "markdown", "id": "c04d7ddf-e499-4537-b2dc-629a3388aca0", "metadata": {}, - "outputs": [], "source": [ "## 3. Анализ уверенности модели (confidence_score)" ] @@ -564,11 +556,9 @@ ] }, { - "cell_type": "code", - "execution_count": 13, + "cell_type": "markdown", "id": "cb60ca85-7c6c-4ccf-be2c-ce480283297b", "metadata": {}, - "outputs": [], "source": [ "## 4. Сравнение confidence_score для REAL и FAKE" ] @@ -609,11 +599,9 @@ ] }, { - "cell_type": "code", - "execution_count": 15, + "cell_type": "markdown", "id": "29746ebe-43ce-4826-9b12-d40b286782c6", "metadata": {}, - "outputs": [], "source": [ "## 5. Аналитика по полу (gender)" ] @@ -656,11 +644,9 @@ ] }, { - "cell_type": "code", - "execution_count": 17, + "cell_type": "markdown", "id": "6ddaae9a-4fe6-49b7-ae76-b34796a4ffb1", "metadata": {}, - "outputs": [], "source": [ "## 6. Распределение по dataset_split (train/val/test)" ] @@ -714,11 +700,9 @@ ] }, { - "cell_type": "code", - "execution_count": 19, + "cell_type": "markdown", "id": "975704eb-8f65-4473-ad13-f72a6bfb8f1f", "metadata": {}, - "outputs": [], "source": [ "## 7. Группировка: средняя уверенность по возрастной группе и полу" ] @@ -774,11 +758,9 @@ ] }, { - "cell_type": "code", - "execution_count": 21, + "cell_type": "markdown", "id": "b22e2713-ef07-4670-be9f-82fcd9f24775", "metadata": {}, - "outputs": [], "source": [ "## 8. Связь между качеством изображения и уверенностью" ] @@ -819,11 +801,9 @@ ] }, { - "cell_type": "code", - "execution_count": 23, + "cell_type": "markdown", "id": "e87c755c-345e-4c08-96e1-5d21f3c349b6", "metadata": {}, - "outputs": [], "source": [ "## 9. Топ-5 самых распространённых категорий (category)" ] @@ -866,11 +846,9 @@ ] }, { - "cell_type": "code", - "execution_count": 25, + "cell_type": "markdown", "id": "04ce32c5-7c4b-485b-9ad5-b339ca6fa45e", "metadata": {}, - "outputs": [], "source": [ "## 10. TQDM – пример обработки с прогресс-баром" ] @@ -912,17 +890,15 @@ ] }, { - "cell_type": "code", - "execution_count": 27, + "cell_type": "markdown", "id": "a4a8dc57-510d-4c55-9dad-36cb829cbfad", "metadata": {}, - "outputs": [], "source": [ "## Выводы по датасету\n", - "###- Датасет содержит REAL и FAKE изображения в соотношении ...\n", - "###- Модель более уверена в REAL изображениях (средний confidence_score выше).\n", - "###- Разбиение train/val/test: большая часть в train, что нормально.\n", - "###- Качество изображения High даёт более высокую уверенность, чем Medium." + "- Датасет содержит REAL и FAKE изображения в соотношении ...\n", + "- Модель более уверена в REAL изображениях (средний confidence_score выше).\n", + "- Разбиение train/val/test: большая часть в train, что нормально.\n", + "- Качество изображения High даёт более высокую уверенность, чем Medium." ] } ],