跳至內容

矩陣微積分

維基百科,自由的百科全書

數學中,矩陣微積分多元微積分的一種特殊表達,尤其是在矩陣空間上進行討論的時候。它把單個函數對多個變量或者多元函數對單個變量的偏導數寫成向量和矩陣的形式,使其可以被當成一個整體被處理。這使得要在多元函數尋找最大或最小值,又或是要為微分方程系統尋解的過程大幅簡化。這裡我們主要使用統計學工程學中的慣用記法,而張量下標記法更常用於物理學中。

記法

[編輯]

在本小節中,我們在表示向量和矩陣時,通過用單個變量來表示許多變量的方式,把矩陣記法的效用發揮到最大。接下來我們用不同字體來區分標量、向量和矩陣。我們使用M(n,m)來表示包含nm列的n×m矩陣的空間。該空間中的一般矩陣用粗體大寫字母表示,例如AXY等。而若該矩陣屬於M(n,1),即列向量,則用粗體小寫字母表示,如axy等。特別地,M(1,1)中的元素為標量,用小寫斜體字母表示,如atx等。XT 表示矩陣轉置,tr(X)表示矩陣的,而 det(X)或|X|表示行列式。除非專門註明,所有函數都默認屬於光滑函數C1。 通常字母表前半部分的字母(a, b, c, …)用於表示常量,而後半部分的字母(t, x, y, …)用於表示變量。

向量求導

[編輯]

由於向量可看成僅有一列的矩陣,最簡單的矩陣求導為向量求導。

這裡的標記方法可以通過如下方式表達大部分向量微積分:把n維向量構成的空間M(n,1)等同為歐氏空間 Rn, 標量M(1,1)等同於R。對應的向量微積分的概念在每小節末尾列出。

向量對標量求導

[編輯]

向量關於標量 x的導數可以(用分子記法)寫成

這裡的「分子布局記法」一般指,在表示導數向量(或矩陣)時,該導數的行數等於導數表達式中處於分子部分的參數維度,即的維度大小;若採用分母布局記法,則導數的行數等於導數表達式中處於分母部分的參數維度,即的維度大小。分子布局記法的結果與分母布局記法的結果互為轉置關係。

向量微積分中,向量關於標量的導數也被稱為向量切向量。注意這裡

例子 簡單的樣例包括歐式空間中的速度向量,它是位移向量(看作關於時間的函數)的切向量。更進一步而言, 加速度是速度的切向量。

標量對向量求導

[編輯]

標量y對向量的導數可以(用分子記法)寫成

向量微積分中,標量y在的空間Rn(其獨立坐標是x的分量)中的梯度是標量y對向量x的導數的轉置。在物理學中,電場電勢的負梯度向量。

標量函數f(x)對空間向量x在單位向量u(在這裡表示為列向量)方向上的方向導數可以用梯度定義:

使用剛才定義的標量對向量的導數的記法,我們可以把方向導數寫作 這類記法在證明乘法法則和鏈式法則的時候非常直觀,因為它們與我們熟悉的標量導數的形式較為相似。

向量對向量求導

[編輯]

前面兩種情況可以看作是向量對向量求導在其中一個是一維向量情況下的特例。類似地我們將會發現有關矩陣的求導可被以一種類似的方式化歸為向量求導。

向量函數 (分量為函數的向量) 對輸入向量的導數,可以(用分子記法) 寫作

向量微積分中,向量函數y對分量表示一個空間的向量x的導數也被稱為前推 (微分),或雅可比矩陣

向量函數fRn空間中向量v的前推為

矩陣求導

[編輯]

有兩種類型的矩陣求導可以被寫成相同大小的矩陣:矩陣對標量求導和標量對矩陣求導。它們在解決應用數學的許多領域常見的最小化問題中十分有用。類比於向量求導,相應的概念有切矩陣梯度矩陣

矩陣對標量求導

[編輯]

矩陣函數Y對標量x的導數被稱為切矩陣,(用分子記法)可寫成:

標量對矩陣求導

[編輯]

定義在元素是獨立變量的p×q矩陣X上的標量函數yX的導數可以(用分子記法)寫作

定義矩陣上的重要的標量函數包括矩陣的行列式

類比於向量微積分,這個導數常被寫成如下形式:

類似地,標量函數f(X)關於矩陣X在方向Y方向導數可寫成

梯度矩陣經常被應用在估計理論的最小化問題中,比如卡爾曼濾波算法的推導,因此在這些領域中有着重要的地位。

參考文獻

[編輯]

延伸閱讀

[編輯]
  • Lax, Peter D. 9. Calculus of Vector- and Matrix-Valued Functions. Linear algebra and its applications 2nd. Hoboken, N.J.: Wiley-Interscience. 2007. ISBN 978-0-471-75156-4. 

外部連結

[編輯]