Матричная функция




В математике, матричная функция — это функция, отображающая матрицу в другую матрицу.




Содержание






  • 1 Расширение скалярной функции до матричной функции


    • 1.1 Степенные ряды


    • 1.2 Разложение Жордана


      • 1.2.1 Эрмитовы матрицы




    • 1.3 Интеграл Коши


    • 1.4 Матричные возмущения


    • 1.5 Примеры




  • 2 Классы матричных функций


    • 2.1 Операторная монотонность


    • 2.2 Операторная выпуклость/вогнутость


    • 2.3 Примеры




  • 3 См. также


  • 4 Примечания


  • 5 Литература





Расширение скалярной функции до матричной функции |


Существует несколько методов преобразования функции действительного переменного в функцию от квадратной матрицы, сохраняющих интересные свойства этой функции. Все приведённые ниже методы дают одну и ту же матричную функцию, но области их определения могут отличаться.



Степенные ряды |


Если вещественная функция f{displaystyle f}f может быть представлена в виде ряда Тейлора



f(x)=f(0)+f′(0)⋅x+f″(0)⋅x22!+⋯{displaystyle f(x)=f(0)+f'(0)cdot x+f''(0)cdot {frac {x^{2}}{2!}}+cdots }{displaystyle f(x)=f(0)+f'(0)cdot x+f''(0)cdot {frac {x^{2}}{2!}}+cdots },

то матричная функция может быть определена путём замены x{displaystyle x}x на матрицу: степени становятся матричными, сложение — суммой матриц, а умножение — умножением матрицы на число. Если вещественный ряд сходится при  |x|<r{displaystyle |x|<r}{displaystyle |x|<r}, то соответствующий матричный ряд сходится для матриц A, удовлетворяющих условию A‖<r{displaystyle |A|<r}{displaystyle |A|<r} в некоторой матричной норме {displaystyle |cdot |}|cdot | , удовлетворяющей неравенству  AB‖A‖B‖{displaystyle |AB|leq |A|cdot |B|}{displaystyle |AB|leq |A|cdot |B|}.



Разложение Жордана |


Пусть матрица A может быть приведена к диагональному виду, то есть мы можем найти матрицу P и диагональную матрицу D такие, что  A=P⋅D⋅P−1{displaystyle A=Pcdot Dcdot P^{-1}}{displaystyle A=Pcdot Dcdot P^{-1}}. Применяя определение через степенные ряды к этому разложению, мы получаем, что f(A){displaystyle f(A)}f(A) определяется выражением 


f(A)=P[f(d1)…0⋮0…f(dn)]P−1,{displaystyle f(A)=P{begin{bmatrix}f(d_{1})&dots &0\vdots &ddots &vdots \0&dots &f(d_{n})end{bmatrix}}P^{-1},}{displaystyle f(A)=P{begin{bmatrix}f(d_{1})&dots &0\vdots &ddots &vdots \0&dots &f(d_{n})end{bmatrix}}P^{-1},}

где d1,…,dn{displaystyle d_{1},dots ,d_{n}}{displaystyle d_{1},dots ,d_{n}} обозначает диагональные элементы матрицы D.


Любая матрица может быть приведена к жордановой нормальной форме A=P⋅J⋅P−1{displaystyle A=Pcdot Jcdot P^{-1}}{displaystyle A=Pcdot Jcdot P^{-1}}, где матрица J состоит из жордановых клеток[en]. Рассмотрим эти блоки отдельно и применим метод степенных рядов к каждой жордановой клетке:


Это определение может быть использовано для расширения области определения матричной функции за пределы множества матриц, спектральный радиус которых меньше, чем радиус сходимости исходного степенного ряда. Отметим также связь с разделёнными разностями.


Родственным понятием является разложение Жордана-Шевалле[en], которая представляет матрицу как сумму диагонализируемой и нильпотентной частей.



Эрмитовы матрицы |


Согласно спектральной теореме, эрмитова матрица обладает только вещественными собственными значениями и всегда могут быть приведены к диагональному виду с помощью унитарной матрицы P. В этом случае естественным является жорданово определение. Более того, это определение продолжает стандартные неравенства для вещественных функций:


Если f(a)≤g(a){displaystyle f(a)leq g(a)}{displaystyle f(a)leq g(a)} для всех собственных чисел матрицы A{displaystyle A}A, то f(A)⪯g(A){displaystyle f(A)preceq g(A)}{displaystyle f(A)preceq g(A)}.
(По соглашению, X⪯Y⇔Y−X{displaystyle Xpreceq YLeftrightarrow Y-X}{displaystyle Xpreceq YLeftrightarrow Y-X} — положительно полуопределённая матрица). Доказательство следует непосредственно из определения.



Интеграл Коши |


Интегральная формула Коши из комплексного анализа также может быть использована для обобщения скалярных функций до матричных функций. Интегральная формула Коши гласит, что для любой аналитической функции f, определённой на множестве D⊂ℂ, имеет место равенство



f(x)=12πi∮C⁡f(z)z−xdz{displaystyle f(x)={frac {1}{2pi i}}oint _{C}{frac {f(z)}{z-x}},mathrm {d} z}{displaystyle f(x)={frac {1}{2pi i}}oint _{C}{frac {f(z)}{z-x}},mathrm {d} z},

где C — замкнутая кривая внутри области определения D, охватывающая точку x. Заменим теперь x на матрицу A и рассмотрим контур C, лежащий внутри D и охватывающий все собственные значения матрицы. Один из возможных контуров C — круг, включающий начало координат, с радиусом, превышающим A‖{displaystyle scriptstyle |A|}{displaystyle scriptstyle |A|} для произвольной нормы {displaystyle scriptstyle |cdot |}{displaystyle scriptstyle |cdot |}. Тогда f(A){displaystyle f(A)}f(A) определяется выражением


f(A)=12πi∮C⁡f(z)(zI−A)−1dz .{displaystyle f(A)={frac {1}{2pi i}}oint _{C}{f(z)(zI-A)^{-1}},mathrm {d} z~.}{displaystyle f(A)={frac {1}{2pi i}}oint _{C}{f(z)(zI-A)^{-1}},mathrm {d} z~.}

Этот интеграл может быть вычислен численно с помощью метода трапеций, который в данном случае сходится экспоненциально. Это означает, что точность результата удваивается при увеличении числа узлов в два раза.


Эта идея, применённая к линейным ограниченным операторам на банаховых пространствах, которые можно рассматривать без бесконечномерные матрицы, приводит к голоморфному функциональному исчислению[en].



Матричные возмущения |


Ряд Тейлора, приведённый выше, допускает замену скаляра x{displaystyle x}x на матрицу. Но это недопустимо в общем случае, когда разложение осуществляется в терминах A(η)=A+ηB{displaystyle A(eta )=A+eta B}{displaystyle A(eta )=A+eta B} в окрестности точки η=0{displaystyle eta =0}{displaystyle eta =0}, кроме случаев, когда [A,B]=0{displaystyle [A,B]=0}{displaystyle [A,B]=0}. Контр-примером является функция f(x)=x3{displaystyle f(x)=x^{3}}{displaystyle f(x)=x^{3}}, ряд Тейлора которой содержит конечное число слагаемых. Вычислим его двумя способами.


  • Непосредственно:

f(A+ηB)=(A+ηB)3=A3+η(A2B+ABA+BA2)+η2(AB2+BAB+B2A)+η3B3{displaystyle f(A+eta B)=(A+eta B)^{3}=A^{3}+eta (A^{2}B+ABA+BA^{2})+eta ^{2}(AB^{2}+BAB+B^{2}A)+eta ^{3}B^{3}}{displaystyle f(A+eta B)=(A+eta B)^{3}=A^{3}+eta (A^{2}B+ABA+BA^{2})+eta ^{2}(AB^{2}+BAB+B^{2}A)+eta ^{3}B^{3}}

  • Используя разложение Тейлора для скалярной функции f(a+ηb){displaystyle f(a+eta b)}{displaystyle f(a+eta b)} и заменяя скаляры на матрицы в самом конце:

f(a+ηb)=f(a)+f′(a)ηb1!+f″(a)(ηb)22!+f‴(a)(ηb)33!=a3+3a2(ηb)+3a(ηb)2+(ηb)3→A3+3A2(ηB)+3A(ηB)2+(ηB)3{displaystyle f(a+eta b)=f(a)+f'(a){frac {eta b}{1!}}+f''(a){frac {(eta b)^{2}}{2!}}+f'''(a){frac {(eta b)^{3}}{3!}}=a^{3}+3a^{2}(eta b)+3a(eta b)^{2}+(eta b)^{3}to A^{3}+3A^{2}(eta B)+3A(eta B)^{2}+(eta B)^{3}}{displaystyle f(a+eta b)=f(a)+f'(a){frac {eta b}{1!}}+f''(a){frac {(eta b)^{2}}{2!}}+f'''(a){frac {(eta b)^{3}}{3!}}=a^{3}+3a^{2}(eta b)+3a(eta b)^{2}+(eta b)^{3}to A^{3}+3A^{2}(eta B)+3A(eta B)^{2}+(eta B)^{3}}

Скалярное выражение подразумевает коммутативность, а матричное — нет, поэтому их нельзя приравнивать, если не выполняется условие  [A,B]=0{displaystyle [A,B]=0}{displaystyle [A,B]=0}. Для некоторых f(x) можно поступить так же, как для скалярных рядов Тейлора. Например, для f(x)=1x{displaystyle f(x)={frac {1}{x}}}{displaystyle f(x)={frac {1}{x}}}: если существует A−1{displaystyle A^{-1}}A^{{-1}} , то f(A+ηB)=f(E+ηA−1B)f(A){displaystyle f(A+eta B)=f(E+eta A^{-1}B)f(A)}{displaystyle f(A+eta B)=f(E+eta A^{-1}B)f(A)}. Тогда



f(E+ηA−1B)=E−ηA−1B+(−ηA−1B)2+…=∑n=0∞(−ηA−1B)n{displaystyle f(E+eta A^{-1}B)=E-eta A^{-1}B+(-eta A^{-1}B)^{2}+ldots =sum _{n=0}^{infty }(-eta A^{-1}B)^{n}}{displaystyle f(E+eta A^{-1}B)=E-eta A^{-1}B+(-eta A^{-1}B)^{2}+ldots =sum _{n=0}^{infty }(-eta A^{-1}B)^{n}}.

Для сходимости этого степенного ряда требуется, чтобы в соответствующей матричной норме  ηA−1B‖{displaystyle Vert eta A^{-1}BVert }{displaystyle Vert eta A^{-1}BVert }  было достаточно мало. В общем случае, когда функция не может быть переписана таким образом, чтобы две матрицы коммутировали, при применении правила Лейбница нужно учитывать порядок умножения матриц.



Примеры |



  • Алгебраическое уравнение Риккати[en]

  • Матричный многочлен[en]

  • Матричный корень

  • Матричный логарифм[en]

  • Матричная экспонента



Классы матричных функций |


Используя полуопределённые упорядочения матриц (X⪯Y⇔Y−X{displaystyle Xpreceq YLeftrightarrow Y-X}{displaystyle Xpreceq YLeftrightarrow Y-X} — положительная полуопределённая матрица, а X≺Y⇔Y−X{displaystyle Xprec YLeftrightarrow Y-X}{displaystyle Xprec YLeftrightarrow Y-X} — положительно определённая матрица), некоторые классы скалярных функций могут быть распространены на функции от эрмитовых матриц[1].



Операторная монотонность |


Функция f{displaystyle f}f называется операторно монотонной, если 


0≺A⪯H⇒f(A)⪯f(H){displaystyle 0prec Apreceq HRightarrow f(A)preceq f(H)}{displaystyle 0prec Apreceq HRightarrow f(A)preceq f(H)} 
для всех самосопряжённых матриц A,H{displaystyle A,H}{displaystyle A,H}, спектр которых принадлежит области определения функции f. Это аналог монотонной функции для скалярных функций.



Операторная выпуклость/вогнутость |


Функция f{displaystyle f}f называется операторно вогнутой тогда и только тогда, когда


τf(A)+(1−τ)f(H)⪯f(τA+(1−τ)H){displaystyle tau f(A)+(1-tau )f(H)preceq fleft(tau A+(1-tau )Hright)}{displaystyle tau f(A)+(1-tau )f(H)preceq fleft(tau A+(1-tau )Hright)}

для всех самосопряжённых матриц A,H{displaystyle A,H}{displaystyle A,H} со спектром в области определения функции f и при τ[0,1]{displaystyle tau in [0,1]}{displaystyle tau in [0,1]}. Это определение аналогично вогнутым скалярным функциям. Операторно выпуклая функция может быть путём замены {displaystyle preceq }{displaystyle preceq } на {displaystyle succeq }succeq в предыдущем определении.



Примеры |


Матричный логарифм является и операторно монотонной, и операторно вогнутой. Матричный квадрат — операторно выпуклой. Экспонента матрицы не относится ни к одному из указанных классов. Теорема Лёвнера гласит, что функция на открытом интервале является операторно монотонной тогда и только тогда, когда у неё есть аналитическое продложение на верхнюю и нижнюю комплексную полуплоскости такие, что верхняя полуплоскость отображается на себя.[1]



См. также |



  • Формула Сильвестра[en]

  • Матричное исчисление[en]

  • Неравенства для следа[en]



Примечания |





  1. 12 Bhatia, R. Matrix Analysis. — Springer, 1997. — Vol. 169.




Литература |



  • Higham, Nicholas J. (2008). Functions of matrices theory and computation. Philadelphia: Society for Industrial and Applied Mathematics. ISBN 9780898717778. 



Popular posts from this blog

Steve Gadd

Подольск

Лира (музыкальный инструмент)