Cognitive_technologies/лр3/LinAlg_part1.ipynb

1303 lines
215 KiB
Plaintext
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Линейная алгебра."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"В этой лабораторной работе вы познакомитесь со средой Jupyter Notebook и библиотеками numpy и scipy."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Часть 1. Библиотеки"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"В этой лабораторной работе вам понадобятся три библиотеки:\n",
"\n",
"- `numpy` - основная библиотека для работы с матрицами;\n",
"- `scipy`, а точнее модуль `scipy.linalg`, содержащий множество функций линейной алгебры;\n",
"- `matplotlib` - графическая библиотека\n",
"\n",
"Подключить их можно следующим образом:"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [],
"source": [
"# Запустите этот код\n",
"import numpy as np\n",
"\n",
"import scipy.linalg as sla\n",
"\n",
"import matplotlib.pyplot as plt\n",
"%matplotlib inline"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Теперь вы можете позвать, скажем, функцию `scipy.linalg.det()` с помощью кода `sla.det()`, а функцию `numpy.exp()` - с помощью кода `np.exp()`."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Основные объекты и операции линейной алгебры в NumPy и SciPy:**"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Основной объект, с которым вам придётся работать и в этой, и в следующих лабораторных - это, безусловно, матрицы. В библиотеке `numpy` они представлены классом `numpy.ndarray`. Матрицу можно создать из двумерного (а на самом деле и не только двумерного) массива следующим образом:"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"[[1 2 3]\n",
" [4 5 6]]\n",
"(2, 3)\n"
]
}
],
"source": [
"# Запустите этот код\n",
"A = np.array([[1, 2, 3], [4, 5, 6]])\n",
"\n",
"print(A)\n",
"print(A.shape) # пара (число строк, число столбцов)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Обратите внимание, что матрица заполняется *по строкам*.\n",
"\n",
"Есть и много других конструкторов матриц. Например, единичная матрица размера $n\\times n$ создаётся с помощью функции `numpy.eye(n)`. Со всем многообразием конструкторов можно ознакомиться [на этой странице](https://docs.scipy.org/doc/numpy-1.10.1/reference/routines.array-creation.html)."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Зачастую бывает нужно получить доступ к подматрицам данной матрицы, и numpy предоставляет множество удобных средств, как это сделать (называется slicing):\n",
"- элемент с номером `(i,j)`: `A[i,j]`\n",
"- i-я строка матрицы: `A[i,:]`\n",
"- j-й столбец матрицы: `A[:,j]`\n",
"\n",
"**Внимание!** Оба варианта, и `A[i,:]`, и `A[:,j]` дают не строку или столбец, а одномерный вектор. Если вы хотите получить вектор-строку или вектор-столбец соответственно, используйте вот такой синтаксис: `A[i:i+1,:]`, и `A[:,j:j+1]`\n",
"- строки с нулевой по i-ю: `A[:i+1,:]`\n",
"- столбцы с j-го по последний: `A[:,j:]`\n",
"- строки с i-й по k-ю: `A[i:k,:]`\n",
"\n",
"В некоторых случаях нужно получить доступ к (прямоугольной) подматрице, элементы которой находятся на пересечении строк из списка `rows` и столбцов `columns`. В этом случае `A[rows, columns]` даст не то, что вы ожидаете (можете попробовать это сделать сами и увидеть, что получится; только возьмите `rows` и `columns` одного размера). Справиться с этой задачей позволяет код `A[np.ix_(rows, columns)]`"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"*Умножение матриц* производится с помощью оператора `np.dot()`. Есть два варианта написания: `A.dot(B)` и `np.dot(A, B)`.\n",
"\n",
"Обычные знаки арифметических действий (`+`, `-`, `*`) зарезервированы для поэлементных операций. Например, `A * B` - это матрица, элементами которой являются произведения $A_{ij}B_{ij}$. Помимо этих есть и множество других поэлементных операций. Например, `numpy.exp(A)` - это матрица, элементами которой являются экспоненты элементов матрицы `A`."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Чтобы получить матрицу, *транспонированную* к матрице `A`, напишите просто `A.T`. "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"В некоторых случаях бывает нужно создавать *случайные матрицы*: например, при проведении экспериментов или для инициализации итеративных методов. Средства для этого предоставляет пакет [numpy.random](https://docs.scipy.org/doc/numpy/reference/routines.random.html). Так, `np.random.rand(m,n)` - это матрица $m\\times n$, элементы которой независимо выбраны из равномерного распределения на интервале `[0;1)` "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Для *решения систем линейных уравнений* в пакете `scipy.linalg` есть множество методов, рассмотрение которых выходит за пределы курса линейной алгебры. Мы вам пока предлагаем пользоваться функцией `scipy.linalg.solve`, основанной на методе Гаусса. Отметим, что `scipy.linalg.solve(A, B)` выдаёт решение уравнения $AX = B$ (или ошибку), где $B$ может быть как вектором, так и матрицей.\n",
"\n",
"Найти обратную матрицу для матрицы $A$ можно с помощью функции `sla.inv(A)`."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Копирование сложных объектов в Python**"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Когда вы делаете присваивание каких-то сложных объектов, как правило оно происходит по ссылке. Например, код\n",
"```\n",
"B = A\n",
"B[0,0] = 10\n",
"```\n",
"приведёт к изменению матрицы `A`.\n",
"\n",
"Не попадайтесь в эту ловушку! Если вы хотите работать с копией как с независимой матрицей, используйте метод `copy()`:\n",
"```\n",
"B = A.copy()\n",
"```"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Где искать помощь**"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Библиотеки `numpy` и `scipy` снабжены прекрасной документацией. Если у вас возникают вопросы о том, как работает та или иная функция (или даже как называется функция, выполняющая то, что вам нужно), вы почти всегда можете найти там ответы.\n",
"\n",
"[Ссылка на документацию пакета scipy.linalg](https://docs.scipy.org/doc/scipy-0.18.1/reference/linalg.html)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Задание**"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"В качестве первого задания найдите соответствующие функции в библиотеке и сделайте следующее:\n",
"\n",
"- создайте нулевую матрицу $Z$ размера $3\\times4$;\n",
"\n",
"- создайте диагональную матрицу $5\\times5$ с диагональными элементами 1, 2, 3, 4 и 5;\n",
"\n",
"- найдите её след (не силою мысли, а с помощью библиотечных функций, конечно);\n",
"\n",
"- найдите обратную к ней матрицу;\n",
"\n",
"- сгенерируйте случайную матрицу $X$ размера $4\\times5$;\n",
"\n",
"- найдите определитель подматрицы матрицы $X$, расположенной на пересечении 2 и 3 строки и 1 и 2 столбца; считаем, что строки и столбцы нумеруются с единицы (используйте slicing!). Такой определитель называется **минором** матрицы $X$;\n",
"\n",
"- найдите произведение $X^TX$.\n",
"\n",
"Пожалуйста, каждый пункт делайте в новом блоке и не забывайте распечатывать результаты."
]
},
{
"cell_type": "code",
"execution_count": 10,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Нулевая матрица Z (3x4):\n",
"[[0. 0. 0. 0.]\n",
" [0. 0. 0. 0.]\n",
" [0. 0. 0. 0.]]\n"
]
}
],
"source": [
"# 1. Создайте нулевую матрицу Z размера 3x4\n",
"Z = np.zeros((3, 4))\n",
"print(\"Нулевая матрица Z (3x4):\")\n",
"print(Z)"
]
},
{
"cell_type": "code",
"execution_count": 9,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Диагональная матрица D (5x5):\n",
"[[1 0 0 0 0]\n",
" [0 2 0 0 0]\n",
" [0 0 3 0 0]\n",
" [0 0 0 4 0]\n",
" [0 0 0 0 5]]\n"
]
}
],
"source": [
"# 2. Создайте диагональную матрицу 5x5 с диагональными элементами 1, 2, 3, 4, 5\n",
"diagonal_elements = [1, 2, 3, 4, 5]\n",
"D = np.diag(diagonal_elements)\n",
"print(\"Диагональная матрица D (5x5):\")\n",
"print(D)"
]
},
{
"cell_type": "code",
"execution_count": 7,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"След диагональной матрицы D: 15\n"
]
}
],
"source": [
"# 3. Найдите след диагональной матрицы\n",
"trace_D = np.trace(D)\n",
"print(f\"След диагональной матрицы D: {trace_D}\")"
]
},
{
"cell_type": "code",
"execution_count": 8,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Обратная матрица D:\n",
"[[ 1. 0. 0. 0. -0. ]\n",
" [ 0. 0.5 0. 0. -0. ]\n",
" [ 0. 0. 0.33333333 0. -0. ]\n",
" [ 0. 0. 0. 0.25 -0. ]\n",
" [ 0. 0. 0. 0. 0.2 ]]\n"
]
}
],
"source": [
"# 4. Найдите обратную к диагональной матрице D\n",
"inverse_D = sla.inv(D)\n",
"print(\"Обратная матрица D:\")\n",
"print(inverse_D)"
]
},
{
"cell_type": "code",
"execution_count": 12,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Случайная матрица X (4x5):\n",
"[[0.76237054 0.10601632 0.57489958 0.22276942 0.67180418]\n",
" [0.24317029 0.60157193 0.64327088 0.55853681 0.28928955]\n",
" [0.28515382 0.24164089 0.28580249 0.69572955 0.22516246]\n",
" [0.36706683 0.91357792 0.8193874 0.19461941 0.57656544]]\n"
]
}
],
"source": [
"# 5. Сгенерируйте случайную матрицу X размера 4x5\n",
"X = np.random.random((4, 5))\n",
"print(\"Случайная матрица X (4x5):\")\n",
"print(X)"
]
},
{
"cell_type": "code",
"execution_count": 13,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Подматрица X (пересечение 2 и 3 строки, 1 и 2 столбца):\n",
"[[0.24317029 0.60157193]\n",
" [0.28515382 0.24164089]]\n",
"Определитель подматрицы (минор): -0.1127806495567304\n"
]
}
],
"source": [
"# 6. Найдите определитель подматрицы матрицы X, расположенной на пересечении 2 и 3 строки и 1 и 2 столбца\n",
"submatrix = X[1:3, 0:2]\n",
"det_submatrix = np.linalg.det(submatrix)\n",
"print(\"Подматрица X (пересечение 2 и 3 строки, 1 и 2 столбца):\")\n",
"print(submatrix)\n",
"print(f\"Определитель подматрицы (минор): {det_submatrix}\")"
]
},
{
"cell_type": "code",
"execution_count": 14,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Произведение X^T * X:\n",
"[[0.85639139 0.63135712 0.97697848 0.57548067 0.85835433]\n",
" [0.63135712 1.26614318 1.26555825 0.70553396 0.82639659]\n",
" [0.97697848 1.26555825 1.49738573 0.84567043 1.10909393]\n",
" [0.57548067 0.70553396 0.84567043 0.88350589 0.58009929]\n",
" [0.85835433 0.82639659 1.10909393 0.58009929 0.91813514]]\n"
]
}
],
"source": [
"# 7. Найдите произведение X^T * X\n",
"XT_X = np.dot(X.T, X)\n",
"print(\"Произведение X^T * X:\")\n",
"print(XT_X)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Часть 2. Время\n",
"\n",
"Питон мотивирует пользоваться библиотечными функциями, когда они доступны, а не писать собственные. Основной враг питониста - это циклы, которые в Питоне выполняются очень медленно. Библиотечные функции обычно пишутся на более эффективных языках, таких как C++ или Fortran, и обогнать эти решения просто так вы не сможете.\n",
"\n",
"Мы предлагаем вам убедиться в этом самим. Напишите функцию `my_det`, которая вычисляла бы определитель матрицы с помощью элементарных преобразований над строками. Функция должна выкидывать `ValueError` в случаях, если матрица не является квадратной."
]
},
{
"cell_type": "code",
"execution_count": 16,
"metadata": {},
"outputs": [],
"source": [
"def my_det(X): \n",
" # Преобразуем входные данные в numpy массив\n",
" X = np.array(X, dtype=float)\n",
" \n",
" # Проверим, что матрица квадратная\n",
" rows, cols = X.shape\n",
" if rows != cols:\n",
" raise ValueError(\"Матрица не является квадратной.\")\n",
" \n",
" # Начальное значение определителя\n",
" det = 1.0\n",
" \n",
" # Применяем элементарные преобразования строк (метод Гаусса)\n",
" for i in range(rows):\n",
" # Проверяем, что главный элемент не равен нулю\n",
" if X[i, i] == 0:\n",
" # Если главный элемент равен 0, пытаемся поменять строки\n",
" for j in range(i + 1, rows):\n",
" if X[j, i] != 0:\n",
" X[[i, j]] = X[[j, i]] # Меняем строки местами\n",
" det *= -1 # Инвертируем знак определителя из-за перестановки\n",
" break\n",
" else:\n",
" # Если не удалось найти ненулевой элемент, определитель равен 0\n",
" return 0.0\n",
" \n",
" # Приводим строку так, чтобы главный элемент стал 1\n",
" pivot = X[i, i]\n",
" det *= pivot\n",
" X[i] = X[i] / pivot\n",
" \n",
" # Обнуляем элементы ниже главного\n",
" for j in range(i + 1, rows):\n",
" X[j] = X[j] - X[i] * X[j, i]\n",
" \n",
" return det"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Простая проверка:"
]
},
{
"cell_type": "code",
"execution_count": 18,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"[[0 0 1]\n",
" [0 1 0]\n",
" [1 0 0]]\n",
"-1.0\n"
]
}
],
"source": [
"# Запустите этот блок кода\n",
"X = np.array([[0,0,1], [0,1,0], [1,0,0]])\n",
"print(X)\n",
"print(my_det(X))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"На случай, если нам просто повезло с этой матрицей, имеет смысл написать чуть более хитрые тесты. Мы сгенерируем несколько случайных матриц $8\\times8$ с помощью функции `numpy.random.rand` и сравним ответ, выдаваемый нашей функцией, с настоящим определителем (результатом работы библиотечной функции `scipy.linalg.det`):"
]
},
{
"cell_type": "code",
"execution_count": 21,
"metadata": {},
"outputs": [],
"source": [
"# Запустите этот блок кода\n",
"for _ in range(10):\n",
" X = np.random.rand(8,8)\n",
" if np.abs(my_det(X) - sla.det(X)) > 1e-6:\n",
" print('FAILED')"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Если вы ни разу не получили `FAILED`, то ваша функция работает правильно."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Теперь давайте сравним скорость работы вашей функции и библиотечной функции `scipy.linalg.det`. В Питоне есть несколько способов измерения времени; мы воспользуемся декоратором `%timeit`. Будучи написан перед функцией, он запускает её некоторое количество раз, выбирает три случайных запуска и возвращает длительность самого быстрого из них. Модификатор `-o` между декоратором и функцией позволяет сохранять результаты работы декоратора в переменную.\n",
"\n",
"Приготовьтесь, что следующий блок может работать сравнительно долго."
]
},
{
"cell_type": "code",
"execution_count": 22,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"23 μs ± 3.49 μs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)\n",
"60.6 μs ± 712 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)\n",
"22 μs ± 1.05 μs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)\n",
"216 μs ± 4.43 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"82.1 μs ± 26.8 μs per loop (mean ± std. dev. of 7 runs, 1 loop each)\n",
"826 μs ± 22.5 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n"
]
},
{
"data": {
"text/plain": [
"<matplotlib.legend.Legend at 0x26c13473c20>"
]
},
"execution_count": 22,
"metadata": {},
"output_type": "execute_result"
},
{
"data": {
"image/png": "",
"text/plain": [
"<Figure size 640x480 with 1 Axes>"
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"# Запустите этот блок кода\n",
"lib_times = []\n",
"my_times = []\n",
"dimensions = [5, 10, 20]\n",
"for dim in dimensions:\n",
" A = np.random.rand(dim, dim)\n",
" res_lib = %timeit -o sla.det(A)\n",
" lib_times.append(res_lib.best)\n",
" res_my = %timeit -o my_det(A)\n",
" my_times.append(res_my.best) \n",
"\n",
"plt.plot(dimensions, lib_times, color='blue', label='Library function')\n",
"plt.plot(dimensions, my_times, color='red', label='My function')\n",
"plt.title('My function vs library function, log y scale')\n",
"plt.ylabel('Time')\n",
"plt.xlabel('Matrix dimension')\n",
"plt.legend()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"У вас должны были получиться графики, показывающие, как растёт с ростом размерности матрицы время вычисления определителя. Поскольку они вышли не больно-то красивыми, мы нарисуем их в *логарифмическом масштабе* по оси у:"
]
},
{
"cell_type": "code",
"execution_count": 23,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"<matplotlib.legend.Legend at 0x26c1348a810>"
]
},
"execution_count": 23,
"metadata": {},
"output_type": "execute_result"
},
{
"data": {
"image/png": "",
"text/plain": [
"<Figure size 640x480 with 1 Axes>"
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"# Запустите этот блок кода\n",
"plt.semilogy(dimensions, lib_times, color='blue', label='Library function')\n",
"plt.semilogy(dimensions, my_times, color='red', label='My function')\n",
"plt.title('My function vs library function, log y scale')\n",
"plt.ylabel('Time')\n",
"plt.xlabel('Matrix dimension')\n",
"plt.legend()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Вы можете убедиться, что библиотечная функция работает *гораздо* быстрее."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Часть 3. Точность\n",
"\n",
"Наверняка вы уже что-то знаете про floating point arithmetics и связанные с этим трудности и понимаете, что на компьютере вычисления с вещественными числами производятся лишь с ограниченной точностью. "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"В качестве первого примера, показывающего различие между длинной арифметикой целых чисел и floating point arithmetics, предлагаем вам перемножить две пары матриц:\n",
"\n",
"$$\n",
"\\begin{pmatrix}\n",
"1 & 0\\\\\n",
"10^{20} & 1\n",
"\\end{pmatrix}\n",
"\\cdot\n",
"\\begin{pmatrix}\n",
"10^{-20} & 1\\\\\n",
"0 & 1 - 10^{20}\n",
"\\end{pmatrix}\n",
"$$\n",
"и\n",
"$$\n",
"\\begin{pmatrix}\n",
"1. & 0.\\\\\n",
"10.^{20} & 1.\n",
"\\end{pmatrix}\n",
"\\cdot\n",
"\\begin{pmatrix}\n",
"10.^{-20} & 1.\\\\\n",
"0. & 1. - 10.^{20}\n",
"\\end{pmatrix}\n",
"$$\n",
"Во втором случае мы специально указали Питону (поставив везде десятичные точки), что хотим работать не с целыми числами, а с числами с плавающей точкой. Посмотрим, получатся ли одинаковые ответы:"
]
},
{
"cell_type": "code",
"execution_count": 26,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Результат умножения целочисленных матриц:\n",
"[[1e-20 1]\n",
" [1.0 1]]\n",
"\n",
"Результат умножения матриц с числами с плавающей точкой:\n",
"[[1.e-20 1.e+00]\n",
" [1.e+00 0.e+00]]\n"
]
}
],
"source": [
"# Первая пара матриц\n",
"A_int = np.array([[1, 0], [10**20, 1]])\n",
"B_int = np.array([[10**-20, 1], [0, 1 - 10**20]])\n",
"\n",
"# Вторая пара матриц\n",
"A_float = np.array([[1., 0.], [10.**20, 1.]])\n",
"B_float = np.array([[10.**-20, 1.], [0., 1. - 10.**20]])\n",
"\n",
"# Умножение матриц\n",
"result_int = np.dot(A_int, B_int)\n",
"result_float = np.dot(A_float, B_float)\n",
"\n",
"# Вывод результатов\n",
"print(\"Результат умножения целочисленных матриц:\")\n",
"print(result_int)\n",
"\n",
"print(\"\\nРезультат умножения матриц с числами с плавающей точкой:\")\n",
"print(result_float)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"И какой из них правильный?\n",
"\n",
"---\n",
"**Напишите здесь свой ответ**"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Впрочем, и с целыми числами тоже не всегда всё хорошо. Напишите функцию, генерирующую *матрицу Паскаля* заданной размерности $n$, то есть матрицу $P$, в которой $P_{ij} = C_{i+j}^i$. В этом задании нельзя пользоваться библиотечной функцией `scipy.linalg.pascal` или её аналогами из других библиотек. Обратите внимание, что использование факториалов крайне нежелательно, так как быстро приведёт к переполнению.\n",
"\n",
"В этом задании вы можете использовать цикл ``for``."
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Матрица Паскаля:\n",
"[[1.000e+00 1.000e+00 1.000e+00 1.000e+00 1.000e+00 1.000e+00 1.000e+00\n",
" 1.000e+00 1.000e+00 1.000e+00]\n",
" [1.000e+00 2.000e+00 3.000e+00 4.000e+00 5.000e+00 6.000e+00 7.000e+00\n",
" 8.000e+00 9.000e+00 1.000e+01]\n",
" [1.000e+00 3.000e+00 6.000e+00 1.000e+01 1.500e+01 2.100e+01 2.800e+01\n",
" 3.600e+01 4.500e+01 5.500e+01]\n",
" [1.000e+00 4.000e+00 1.000e+01 2.000e+01 3.500e+01 5.600e+01 8.400e+01\n",
" 1.200e+02 1.650e+02 2.200e+02]\n",
" [1.000e+00 5.000e+00 1.500e+01 3.500e+01 7.000e+01 1.260e+02 2.100e+02\n",
" 3.300e+02 4.950e+02 7.150e+02]\n",
" [1.000e+00 6.000e+00 2.100e+01 5.600e+01 1.260e+02 2.520e+02 4.620e+02\n",
" 7.920e+02 1.287e+03 2.002e+03]\n",
" [1.000e+00 7.000e+00 2.800e+01 8.400e+01 2.100e+02 4.620e+02 9.240e+02\n",
" 1.716e+03 3.003e+03 5.005e+03]\n",
" [1.000e+00 8.000e+00 3.600e+01 1.200e+02 3.300e+02 7.920e+02 1.716e+03\n",
" 3.432e+03 6.435e+03 1.144e+04]\n",
" [1.000e+00 9.000e+00 4.500e+01 1.650e+02 4.950e+02 1.287e+03 3.003e+03\n",
" 6.435e+03 1.287e+04 2.431e+04]\n",
" [1.000e+00 1.000e+01 5.500e+01 2.200e+02 7.150e+02 2.002e+03 5.005e+03\n",
" 1.144e+04 2.431e+04 4.862e+04]]\n",
"Определитель: 0.9999999980116501\n"
]
}
],
"source": [
"def my_pascal(dim):\n",
" # Создаем нулевую матрицу размером dim x dim\n",
" P = np.zeros((dim, dim))\n",
"\n",
" for i in range(dim):\n",
" for j in range(dim):\n",
" # Если j == 0, то комбинация C_{i+j}^i = 1\n",
" if j == 0 or i == 0:\n",
" P[i, j] = 1\n",
" else:\n",
" # Используем рекуррентное соотношение для вычисления C_{i+j}^i\n",
" P[i, j] = P[i-1, j] + P[i, j-1]\n",
" return P\n",
"\n",
"# Пример использования функции\n",
"dim = 10\n",
"P = my_pascal(dim)\n",
"print(\"Матрица Паскаля:\")\n",
"print(P)\n",
"print(f\"Определитель: {np.linalg.det(P)}\")"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Чему равен её определитель? Обязательно объясните свой ответ.\n",
"\n",
"----\n",
"**Ваше решение**"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"А теперь вычислите определитель матрицы Паскаля $30\\times30$ с помощью библиотечной функции `scipy.linalg.det`:"
]
},
{
"cell_type": "code",
"execution_count": 33,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Определитель: 1.0\n"
]
}
],
"source": [
"dim = 5\n",
"P = my_pascal(dim)\n",
"print(f\"Определитель: {sla.det(P)}\")"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Разница заметна невооружённым взглядом!"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Часть 4. Матричные вычисления"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Вы уже видели, что использования циклов в Питоне лучше по возможности избегать, и важно уметь находить способы делать всё библиотечными средствами.\n",
"\n",
"В качестве примера рассмотрим две задачи:\n",
"\n",
"**1.** Предположим, нужно вычислить суммы элементов в каждой строке матрицы `A`. Ясно, что можно написать простую функцию с двумя циклами, которая это посчитает, но так лучше не делать. Правильный способ такой:\n",
"```\n",
"A.sum(axis=1)\n",
"```\n",
"Параметр `axis=1` означает, что суммы берутся по строкам. Если вы хотите просуммировать по столбцам, укажите `axis=0`. Если вообще пропустить параметр `axis` (вызвать `A.sum()`), то функция вернёт сумму *всех* элементов матрицы.\n",
"\n",
"**2.** Теперь допустим, что нам нужно каждый столбец матрицы `A` нужно умножить на некоторое число. Более точно, пусть у нас есть (одномерный) вектор `w = np.array([w_1,...,w_n])`, и мы должны `i`-й столбец `A` умножить на число `w_i`. Опять же, это можно сделать в пару циклов, но лучше использовать операцию поэлементного умножения:\n",
"```\n",
"A * w.reshape((1,n))\n",
"```\n",
"Оператор `reshape` нужен для того, чтобы из одномерного вектора сделать вектор-строку.\n",
"\n",
"Аналогично если на числа `w_1,...,w_n` умножаются *строки* матрицы, нужно превратить `w` в вектор-столбец:\n",
"```\n",
"A * w.reshape((n,1))\n",
"```"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Дальше вам будет предложено попрактиковаться в матричных вычислениях. В следующих трёх заданиях нельзя пользоваться циклами; вместо этого постарайтесь свести всё к библиотечным функциям. Чтобы убедиться, что получилось именно то, что нужно, пишите собственные тесты со случайными матрицами."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Задание 4.1** Напишите функцию `prod_and_sq_sum(A)`, вычисляющую произведение и сумму квадратов диагональных элементов квадратной матрицы `A`."
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [],
"source": [
"def prod_and_sq_sum(A):\n",
" # Извлекаем диагональные элементы\n",
" diag_elements = np.diag(A)\n",
" \n",
" # Вычисляем произведение диагональных элементов\n",
" product = np.prod(diag_elements)\n",
" \n",
" # Вычисляем сумму квадратов диагональных элементов\n",
" sum_squares = np.sum(diag_elements**2)\n",
" \n",
" return product, sum_squares"
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Матрица A:\n",
"[[5 5 7 2]\n",
" [4 3 6 2]\n",
" [9 4 5 3]\n",
" [4 9 5 9]]\n",
"Произведение диагональных элементов: 675\n",
"Сумма квадратов диагональных элементов: 140\n"
]
}
],
"source": [
"# Тест\n",
"A = np.random.randint(1, 10, (4, 4)) # случайная квадратная матрица 4x4\n",
"print(f\"Матрица A:\\n{A}\")\n",
"product, sum_squares = prod_and_sq_sum(A)\n",
"print(f\"Произведение диагональных элементов: {product}\")\n",
"print(f\"Сумма квадратов диагональных элементов: {sum_squares}\")"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Задание 4.2** Для матриц `A` и `B` размера $m\\times n$ обозначим через $a_1,\\ldots,a_m$ и $b_1,\\ldots,b_m$ соответственно их столбцы. Напишите функцию `f(A, B, k)`, вычисляющую\n",
"\n",
"$$\\sum_{i=1}^{\\min(k,m)}a_ib_i^T$$"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [],
"source": [
"def f(A, B, k):\n",
" # Извлекаем первые k столбцов из A и B\n",
" A_k = A[:, :k]\n",
" B_k = B[:, :k]\n",
" \n",
" # Рассчитываем произведение B_k.T и A_k\n",
" result = A_k @ B_k.T\n",
" \n",
" return result"
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Матрица A:\n",
"[[2 1 2]\n",
" [8 3 9]\n",
" [3 5 4]\n",
" [4 2 3]]\n",
"Матрица B:\n",
"[[5 4 9]\n",
" [4 5 4]\n",
" [3 1 8]\n",
" [5 2 7]]\n",
"Результат:\n",
"[[14 13 7 12]\n",
" [52 47 27 46]\n",
" [35 37 14 25]\n",
" [28 26 14 24]]\n"
]
}
],
"source": [
"# Тест\n",
"m, n = 4, 3\n",
"A = np.random.randint(1, 10, (m, n))\n",
"B = np.random.randint(1, 10, (m, n))\n",
"k = 2\n",
"\n",
"print(f\"Матрица A:\\n{A}\")\n",
"print(f\"Матрица B:\\n{B}\")\n",
"result = f(A, B, k)\n",
"print(f\"Результат:\\n{result}\")"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"**Задание 4.3** Напишите функцию `get_diag(A,B)`, принимающую две матрицы `A` и `B` и возвращающую вектор диагональных элементов произведения `AB`, не вычисляя произведение целиком. "
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [],
"source": [
"def get_diag(A, B):\n",
" # Проверяем, что количество столбцов A совпадает с количеством строк B\n",
" assert A.shape[1] == B.shape[0], \"Матрицы не могут быть перемножены\"\n",
" \n",
" # Вычисляем диагональные элементы произведения A и B\n",
" diag_elements = np.einsum('ij,ji->i', A, B)\n",
" \n",
" return diag_elements"
]
},
{
"cell_type": "code",
"execution_count": 9,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Матрица A:\n",
"[[6 8 4 1]\n",
" [4 7 5 2]\n",
" [3 5 4 4]\n",
" [6 5 6 2]]\n",
"Матрица B:\n",
"[[9 8 1 8]\n",
" [7 9 9 4]\n",
" [2 1 9 4]\n",
" [9 7 9 8]]\n",
"Диагональные элементы произведения AB: [127 114 120 108]\n"
]
}
],
"source": [
"# Тест\n",
"A = np.random.randint(1, 10, (4, 4))\n",
"B = np.random.randint(1, 10, (4, 4))\n",
"\n",
"print(f\"Матрица A:\\n{A}\")\n",
"print(f\"Матрица B:\\n{B}\")\n",
"diag_elements = get_diag(A, B)\n",
"print(f\"Диагональные элементы произведения AB: {diag_elements}\")"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Метод Гаусса или обратные матрицы?"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Пусть нам дано матричное уравнение $Ax = B$, где $A$ --- матрица размера $n\\times n$, а $B$ --- матрица размера $n\\times m$ (отметим, что это уравнение можно интерпретировать как $m$ систем с векторными правыми частями и однаковыми левыми). Вообще говоря, методов решения таких уравнений очень много, но мы пока рассмотрим два из них, с которыми вы уже хорошо знакомы.\n",
"1. Метод Гаусса;\n",
"2. Умножение на обратную матрицу: $x = A^{-1}B$.\n",
"\n",
"В этом задании вы попробуете ответить на вопрос о том, какой из этих методов эффективнее. Проведите два эксперимента:\n",
"- сравните скорости решения системы при фиксированном `m = 10` и `n`, изменяющемся в пределах от 10 до 1000, например, для `n=10, 50, 100, 200, 500, 1000` (рост числа неизвестных при фиксированном количестве правых частей);\n",
"- сравните скорости решения системы при фиксированном `n = 100` и `m`, меняющемся от 10 до 10000, например, для `m = 10, 100, 500, 1000, 2000, 5000, 10000` (рост числа правых частей при фиксированном числе неизвестных).\n",
"\n",
"При проведении экспериментов не возбраняется использовать циклы `for`.\n",
"\n",
"Эксперименты проведите на случайных матрицах, созданных с помощью функции `numpy.random.rand`. Постройте графики времени выполнения функции от размерности (лучше в логарифмическом масштабе). Сделайте выводы (в письменном виде!) о том, какой их методов оказывается лучше в каких обстоятельствах.\n",
"\n",
"Чтобы всё это не казалось вам чёрной магией, найдите число операций (суммарно сложения, умножения и деления), необходимых для решения системы каждым из методов. Обратите внимания на члены степени 3 (члены меньшего порядка можете даже не считать). Постарайтесь объяснить полученные ранее результаты."
]
},
{
"cell_type": "code",
"execution_count": 31,
"metadata": {},
"outputs": [],
"source": [
"from numpy.linalg import inv, solve\n",
"\n",
"# Функции для измерения времени выполнения двух методов\n",
"def gauss_method(A, B):\n",
" # Решение системы Ax = B методом Гаусса (эквивалент функции np.linalg.solve)\n",
" return solve(A, B)\n",
"\n",
"def inverse_method(A, B):\n",
" # Решение системы Ax = B через умножение на обратную матрицу\n",
" A_inv = inv(A)\n",
" return A_inv @ B\n",
"\n",
"# Параметры эксперимента\n",
"n_values = [10, 50, 100, 200, 500, 1000, 5000]\n",
"m_values = [10, 100, 500, 1000, 2000, 5000, 10000]\n",
"\n",
"# Списки для хранения времени выполнения\n",
"gauss_times_n = []\n",
"inverse_times_n = []\n",
"\n",
"gauss_times_m = []\n",
"inverse_times_m = []"
]
},
{
"cell_type": "code",
"execution_count": 32,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"24.4 μs ± 1.16 μs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)\n",
"27.2 μs ± 1.03 μs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)\n",
"113 μs ± 3.96 μs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)\n",
"159 μs ± 10.5 μs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)\n",
"271 μs ± 12.9 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"478 μs ± 53.5 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"864 μs ± 63.8 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"1.75 ms ± 168 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"8.28 ms ± 671 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)\n",
"22.7 ms ± 1.95 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)\n",
"45.9 ms ± 2.31 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)\n",
"156 ms ± 11 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)\n",
"3.74 s ± 219 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)\n",
"12.7 s ± 424 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)\n"
]
}
],
"source": [
"# Эксперимент 1: изменение n при фиксированном m = 10\n",
"m_fixed = 10\n",
"for n in n_values:\n",
" A = np.random.rand(n, n)\n",
" B = np.random.rand(n, m_fixed)\n",
" \n",
" # Метод Гаусса\n",
" res_gauss = %timeit -o gauss_method(A, B)\n",
" gauss_times_n.append(res_gauss.best)\n",
" \n",
" # Умножение на обратную матрицу\n",
" res_inverse = %timeit -o inverse_method(A, B)\n",
" inverse_times_n.append(res_inverse.best)\n",
" "
]
},
{
"cell_type": "code",
"execution_count": 33,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"300 μs ± 43.9 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"413 μs ± 17.4 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"397 μs ± 22.1 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"492 μs ± 24.2 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"1.06 ms ± 27.9 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"785 μs ± 19.5 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"4.23 ms ± 229 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)\n",
"1.19 ms ± 33.4 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)\n",
"6.87 ms ± 214 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)\n",
"3.49 ms ± 175 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)\n",
"16.6 ms ± 276 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)\n",
"7.87 ms ± 246 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)\n",
"33 ms ± 1.51 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)\n",
"15.2 ms ± 437 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)\n"
]
}
],
"source": [
"# Эксперимент 2: изменение m при фиксированном n = 100\n",
"n_fixed = 100\n",
"for m in m_values:\n",
" A = np.random.rand(n_fixed, n_fixed)\n",
" B = np.random.rand(n_fixed, m)\n",
" \n",
" # Метод Гаусса\n",
" res_gauss = %timeit -o gauss_method(A, B)\n",
" gauss_times_m.append(res_gauss.best)\n",
"\n",
" # Умножение на обратную матрицу\n",
" res_inverse = %timeit -o inverse_method(A, B)\n",
" inverse_times_m.append(res_inverse.best)\n",
" "
]
},
{
"cell_type": "code",
"execution_count": 34,
"metadata": {},
"outputs": [
{
"data": {
"image/png": "",
"text/plain": [
"<Figure size 1200x600 with 2 Axes>"
]
},
"metadata": {},
"output_type": "display_data"
},
{
"data": {
"text/plain": [
"([2.3003430000972004e-05,\n",
" 0.00010594295999908355,\n",
" 0.0002523724999919068,\n",
" 0.0007828090999973938,\n",
" 0.007432277000043541,\n",
" 0.04331835999910254,\n",
" 3.3495688999828417],\n",
" [2.5054150001960808e-05,\n",
" 0.0001502138099982403,\n",
" 0.000414019299991196,\n",
" 0.0015840039000031539,\n",
" 0.01922832999844104,\n",
" 0.14132896000228357,\n",
" 12.20673400000669],\n",
" [0.00024055270000826568,\n",
" 0.00037021059999824504,\n",
" 0.001025134399998933,\n",
" 0.003964642000210006,\n",
" 0.006504234000167344,\n",
" 0.016102712999854704,\n",
" 0.030875240001478232],\n",
" [0.0003915813000057824,\n",
" 0.00046348869998473675,\n",
" 0.0007463839999982156,\n",
" 0.0011135890999867115,\n",
" 0.003185632999811787,\n",
" 0.007519132999877911,\n",
" 0.014468228000041564])"
]
},
"execution_count": 34,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# Построение графиков для изменения n\n",
"plt.figure(figsize=(12, 6))\n",
"\n",
"plt.subplot(1, 2, 1)\n",
"plt.semilogy(n_values, gauss_times_n, label='Метод Гаусса')\n",
"plt.semilogy(n_values, inverse_times_n, label='Умножение на обратную')\n",
"plt.xlabel('n (размер матрицы)')\n",
"plt.ylabel('Время выполнения (с)')\n",
"plt.title('Скорость решения при фиксированном m = 10')\n",
"plt.legend()\n",
"\n",
"# Построение графиков для изменения m\n",
"plt.subplot(1, 2, 2)\n",
"plt.semilogy(m_values, gauss_times_m, label='Метод Гаусса')\n",
"plt.semilogy(m_values, inverse_times_m, label='Умножение на обратную')\n",
"plt.xlabel('m (количество правых частей)')\n",
"plt.ylabel('Время выполнения (с)')\n",
"plt.title('Скорость решения при фиксированном n = 100')\n",
"plt.legend()\n",
"\n",
"plt.tight_layout()\n",
"plt.show()\n",
"\n",
"# Возвращаем результаты эксперимента\n",
"gauss_times_n, inverse_times_n, gauss_times_m, inverse_times_m"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"\n",
"Эксперименты показали следующие результаты:\n",
"### 1. При фиксированном **𝑚 = 10** и изменяющемся **𝑛**:\n",
"- Время выполнения для обоих методов увеличивается по мере роста размера матрицы 𝑛, что логично, так как вычислительная сложность возрастает с ростом числа неизвестных.\n",
"- Оба метода демонстрируют схожую динамику роста времени выполнения. Однако на больших размерах матриц метод с умножением на обратную матрицу начинает работать чуть быстрее метода Гаусса.\n",
"\n",
"### 2. При фиксированном **𝑛 = 100** и изменяющемся **𝑚**:\n",
"- Время решения обоих методов остаётся относительно стабильным при изменении количества правых частей **𝑚**.\n",
"- Незначительное увеличение времени наблюдается при очень больших **𝑚**, но в целом оба метода ведут себя схоже.\n",
"\n",
"### Выводы:\n",
"- Для малых размеров системы (**𝑛 ≤ 100**) оба метода показывают практически одинаковую производительность.\n",
"- Для больших размеров матриц (**𝑛 > 500**) метод с умножением на обратную матрицу работает немного быстрее, что связано с тем, что этот метод может использовать оптимизированные алгоритмы для вычисления обратной матрицы.\n",
"- Время выполнения не сильно зависит от числа правых частей **𝑚**, что связано с тем, что при фиксированном размере матрицы **𝑛** сложность вычислений в обоих методах возрастает незначительно при увеличении **𝑚**."
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3 (ipykernel)",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.12.4"
}
},
"nbformat": 4,
"nbformat_minor": 4
}