Матричная функция
В математике, матричная функция — это функция, отображающая матрицу в другую матрицу.
Содержание
1 Расширение скалярной функции до матричной функции
1.1 Степенные ряды
1.2 Разложение Жордана
1.2.1 Эрмитовы матрицы
1.3 Интеграл Коши
1.4 Матричные возмущения
1.5 Примеры
2 Классы матричных функций
2.1 Операторная монотонность
2.2 Операторная выпуклость/вогнутость
2.3 Примеры
3 См. также
4 Примечания
5 Литература
Расширение скалярной функции до матричной функции |
Существует несколько методов преобразования функции действительного переменного в функцию от квадратной матрицы, сохраняющих интересные свойства этой функции. Все приведённые ниже методы дают одну и ту же матричную функцию, но области их определения могут отличаться.
Степенные ряды |
Если вещественная функция f{displaystyle f} может быть представлена в виде ряда Тейлора
f(x)=f(0)+f′(0)⋅x+f″(0)⋅x22!+⋯{displaystyle f(x)=f(0)+f'(0)cdot x+f''(0)cdot {frac {x^{2}}{2!}}+cdots },
то матричная функция может быть определена путём замены x{displaystyle x} на матрицу: степени становятся матричными, сложение — суммой матриц, а умножение — умножением матрицы на число. Если вещественный ряд сходится при |x|<r{displaystyle |x|<r}, то соответствующий матричный ряд сходится для матриц A, удовлетворяющих условию ‖A‖<r{displaystyle |A|<r} в некоторой матричной норме ‖⋅‖{displaystyle |cdot |} , удовлетворяющей неравенству ‖AB‖≤‖A‖⋅‖B‖{displaystyle |AB|leq |A|cdot |B|}.
Разложение Жордана |
Пусть матрица A может быть приведена к диагональному виду, то есть мы можем найти матрицу P и диагональную матрицу D такие, что A=P⋅D⋅P−1{displaystyle A=Pcdot Dcdot P^{-1}}. Применяя определение через степенные ряды к этому разложению, мы получаем, что f(A){displaystyle f(A)} определяется выражением
- f(A)=P[f(d1)…0⋮⋱⋮0…f(dn)]P−1,{displaystyle f(A)=P{begin{bmatrix}f(d_{1})&dots &0\vdots &ddots &vdots \0&dots &f(d_{n})end{bmatrix}}P^{-1},}
где d1,…,dn{displaystyle d_{1},dots ,d_{n}} обозначает диагональные элементы матрицы D.
Любая матрица может быть приведена к жордановой нормальной форме A=P⋅J⋅P−1{displaystyle A=Pcdot Jcdot P^{-1}}, где матрица J состоит из жордановых клеток[en]. Рассмотрим эти блоки отдельно и применим метод степенных рядов к каждой жордановой клетке:
Это определение может быть использовано для расширения области определения матричной функции за пределы множества матриц, спектральный радиус которых меньше, чем радиус сходимости исходного степенного ряда. Отметим также связь с разделёнными разностями.
Родственным понятием является разложение Жордана-Шевалле[en], которая представляет матрицу как сумму диагонализируемой и нильпотентной частей.
Эрмитовы матрицы |
Согласно спектральной теореме, эрмитова матрица обладает только вещественными собственными значениями и всегда могут быть приведены к диагональному виду с помощью унитарной матрицы P. В этом случае естественным является жорданово определение. Более того, это определение продолжает стандартные неравенства для вещественных функций:
Если f(a)≤g(a){displaystyle f(a)leq g(a)} для всех собственных чисел матрицы A{displaystyle A}, то f(A)⪯g(A){displaystyle f(A)preceq g(A)}.
(По соглашению, X⪯Y⇔Y−X{displaystyle Xpreceq YLeftrightarrow Y-X} — положительно полуопределённая матрица). Доказательство следует непосредственно из определения.
Интеграл Коши |
Интегральная формула Коши из комплексного анализа также может быть использована для обобщения скалярных функций до матричных функций. Интегральная формула Коши гласит, что для любой аналитической функции f, определённой на множестве D⊂ℂ, имеет место равенство
f(x)=12πi∮Cf(z)z−xdz{displaystyle f(x)={frac {1}{2pi i}}oint _{C}{frac {f(z)}{z-x}},mathrm {d} z},
где C — замкнутая кривая внутри области определения D, охватывающая точку x. Заменим теперь x на матрицу A и рассмотрим контур C, лежащий внутри D и охватывающий все собственные значения матрицы. Один из возможных контуров C — круг, включающий начало координат, с радиусом, превышающим ‖A‖{displaystyle scriptstyle |A|} для произвольной нормы ‖⋅‖{displaystyle scriptstyle |cdot |}. Тогда f(A){displaystyle f(A)} определяется выражением
- f(A)=12πi∮Cf(z)(zI−A)−1dz .{displaystyle f(A)={frac {1}{2pi i}}oint _{C}{f(z)(zI-A)^{-1}},mathrm {d} z~.}
Этот интеграл может быть вычислен численно с помощью метода трапеций, который в данном случае сходится экспоненциально. Это означает, что точность результата удваивается при увеличении числа узлов в два раза.
Эта идея, применённая к линейным ограниченным операторам на банаховых пространствах, которые можно рассматривать без бесконечномерные матрицы, приводит к голоморфному функциональному исчислению[en].
Матричные возмущения |
Ряд Тейлора, приведённый выше, допускает замену скаляра x{displaystyle x} на матрицу. Но это недопустимо в общем случае, когда разложение осуществляется в терминах A(η)=A+ηB{displaystyle A(eta )=A+eta B} в окрестности точки η=0{displaystyle eta =0}, кроме случаев, когда [A,B]=0{displaystyle [A,B]=0}. Контр-примером является функция f(x)=x3{displaystyle f(x)=x^{3}}, ряд Тейлора которой содержит конечное число слагаемых. Вычислим его двумя способами.
- Непосредственно:
- f(A+ηB)=(A+ηB)3=A3+η(A2B+ABA+BA2)+η2(AB2+BAB+B2A)+η3B3{displaystyle f(A+eta B)=(A+eta B)^{3}=A^{3}+eta (A^{2}B+ABA+BA^{2})+eta ^{2}(AB^{2}+BAB+B^{2}A)+eta ^{3}B^{3}}
- Используя разложение Тейлора для скалярной функции f(a+ηb){displaystyle f(a+eta b)} и заменяя скаляры на матрицы в самом конце:
- f(a+ηb)=f(a)+f′(a)ηb1!+f″(a)(ηb)22!+f‴(a)(ηb)33!=a3+3a2(ηb)+3a(ηb)2+(ηb)3→A3+3A2(ηB)+3A(ηB)2+(ηB)3{displaystyle f(a+eta b)=f(a)+f'(a){frac {eta b}{1!}}+f''(a){frac {(eta b)^{2}}{2!}}+f'''(a){frac {(eta b)^{3}}{3!}}=a^{3}+3a^{2}(eta b)+3a(eta b)^{2}+(eta b)^{3}to A^{3}+3A^{2}(eta B)+3A(eta B)^{2}+(eta B)^{3}}
Скалярное выражение подразумевает коммутативность, а матричное — нет, поэтому их нельзя приравнивать, если не выполняется условие [A,B]=0{displaystyle [A,B]=0}. Для некоторых f(x) можно поступить так же, как для скалярных рядов Тейлора. Например, для f(x)=1x{displaystyle f(x)={frac {1}{x}}}: если существует A−1{displaystyle A^{-1}} , то f(A+ηB)=f(E+ηA−1B)f(A){displaystyle f(A+eta B)=f(E+eta A^{-1}B)f(A)}. Тогда
f(E+ηA−1B)=E−ηA−1B+(−ηA−1B)2+…=∑n=0∞(−ηA−1B)n{displaystyle f(E+eta A^{-1}B)=E-eta A^{-1}B+(-eta A^{-1}B)^{2}+ldots =sum _{n=0}^{infty }(-eta A^{-1}B)^{n}}.
Для сходимости этого степенного ряда требуется, чтобы в соответствующей матричной норме ‖ηA−1B‖{displaystyle Vert eta A^{-1}BVert } было достаточно мало. В общем случае, когда функция не может быть переписана таким образом, чтобы две матрицы коммутировали, при применении правила Лейбница нужно учитывать порядок умножения матриц.
Примеры |
- Алгебраическое уравнение Риккати[en]
- Матричный многочлен[en]
- Матричный корень
- Матричный логарифм[en]
- Матричная экспонента
Классы матричных функций |
Используя полуопределённые упорядочения матриц (X⪯Y⇔Y−X{displaystyle Xpreceq YLeftrightarrow Y-X} — положительная полуопределённая матрица, а X≺Y⇔Y−X{displaystyle Xprec YLeftrightarrow Y-X} — положительно определённая матрица), некоторые классы скалярных функций могут быть распространены на функции от эрмитовых матриц[1].
Операторная монотонность |
Функция f{displaystyle f} называется операторно монотонной, если
0≺A⪯H⇒f(A)⪯f(H){displaystyle 0prec Apreceq HRightarrow f(A)preceq f(H)}
для всех самосопряжённых матриц A,H{displaystyle A,H}, спектр которых принадлежит области определения функции f. Это аналог монотонной функции для скалярных функций.
Операторная выпуклость/вогнутость |
Функция f{displaystyle f} называется операторно вогнутой тогда и только тогда, когда
- τf(A)+(1−τ)f(H)⪯f(τA+(1−τ)H){displaystyle tau f(A)+(1-tau )f(H)preceq fleft(tau A+(1-tau )Hright)}
для всех самосопряжённых матриц A,H{displaystyle A,H} со спектром в области определения функции f и при τ∈[0,1]{displaystyle tau in [0,1]}. Это определение аналогично вогнутым скалярным функциям. Операторно выпуклая функция может быть путём замены ⪯{displaystyle preceq } на ⪰{displaystyle succeq } в предыдущем определении.
Примеры |
Матричный логарифм является и операторно монотонной, и операторно вогнутой. Матричный квадрат — операторно выпуклой. Экспонента матрицы не относится ни к одному из указанных классов. Теорема Лёвнера гласит, что функция на открытом интервале является операторно монотонной тогда и только тогда, когда у неё есть аналитическое продложение на верхнюю и нижнюю комплексную полуплоскости такие, что верхняя полуплоскость отображается на себя.[1]
См. также |
- Формула Сильвестра[en]
- Матричное исчисление[en]
- Неравенства для следа[en]
Примечания |
↑ 12 Bhatia, R. Matrix Analysis. — Springer, 1997. — Vol. 169.
Литература |
Higham, Nicholas J. (2008). Functions of matrices theory and computation. Philadelphia: Society for Industrial and Applied Mathematics. ISBN 9780898717778.