正交矩陣
在矩陣論中,正交矩陣(英語:orthogonal matrix),又稱直交矩陣,是一個方塊矩陣,其元素為實數,而且行向量與列向量皆為正交的單位向量,使得該矩陣的轉置矩陣為其逆矩陣:
以下是一些重要的性質:
- 作為一個線性映射(變換矩陣),正交矩陣保持距離不變,所以它是一個保距映射,具體例子為旋轉與鏡射。
- 行列式值為+1的正交矩陣,稱為特殊正交矩陣,它是一個旋轉矩陣。
- 行列式值為-1的正交矩陣,稱為瑕旋轉矩陣。瑕旋轉是旋轉加上鏡射。鏡射也是一種瑕旋轉。
- 所有的正交矩陣對矩陣乘法形成一個群,稱為正交群。亦即,正交矩陣與正交矩陣的乘積也是一個正交矩陣。
- 所有特殊正交矩陣對矩陣乘法形成一個子群,稱為特殊正交群。亦即,旋轉矩陣與旋轉矩陣的乘積也是一個旋轉矩陣。
概述
[編輯]正交矩陣是實數特殊化的酉矩陣,因此總是正規矩陣。儘管我們在這裡只考慮實數矩陣,這個定義可用於其元素來自任何域的矩陣。正交矩陣畢竟是從內積自然引出的,對於複數的矩陣這導致了歸一要求。
要看出與內積的聯繫,考慮在n維實數內積空間中的關於正交基寫出的向量v。v的長度的平方是vTv。如果矩陣形式為Qv的線性變換保持了向量長度,則
- 。
所以有限維線性等距同構,比如旋轉、反射和它們的組合,都產生正交矩陣。反過來也成立:正交矩陣蘊涵了正交變換。但是,線性代數包括了在既不是有限維的也不是同樣維度的空間之間的正交變換,它們沒有等價的正交矩陣。
有多種原由使正交矩陣對理論和實踐是重要的。n×n正交矩陣形成了一個群,即指示為O(n)的正交群,它和它的子群廣泛的用在數學和物理科學中。例如,分子的點群是O(3)的子群。因為浮點版本的正交矩陣有有利的性質,它們是字數值線性代數中很多算法比如QR分解的關鍵,通過適當的規範化,離散餘弦變換(用於MP3壓縮)可用正交矩陣表示。
例子
[編輯]下面是一些小正交矩陣的例子和可能的解釋。
- 恆等變換。
- 旋轉16.26°。
- 針對x軸反射。
- 旋轉反演(rotoinversion):軸 (0,-3/5,4/5),角度90°。
- 置換坐標軸。
基本構造
[編輯]低維度
[編輯]最簡單的正交矩陣是1×1矩陣[1]和[−1],它們可分別解釋為恆等和實數線針對原點的反射。
如下形式的2×2矩陣
它的正交性要求滿足三個方程
。
在考慮第一個方程時,不丟失一般性而設p = cos θ, q = sin θ;因此要麼t = −q, u = p要麼t = q, u = −p。我們可以解釋第一種情況為旋轉θ(θ = 0是單位矩陣),第二個解釋為針對在角θ/2的直線的反射。
- 旋轉內射
在45°的反射對換x和y;它是置換矩陣,在每列和每行帶有一個單一的1(其他都是0):
- 。
單位矩陣也是置換矩陣。
反射是它自己的逆,這蘊涵了反射矩陣是對稱的(等於它的轉置矩陣)也是正交的。兩個旋轉矩陣的積是一個旋轉矩陣,兩個內射矩陣的積也是旋轉矩陣。
更高維度
[編輯]不管維度,總是可能把正交矩陣按純旋轉與否來分類,但是對於3×3矩陣和更高維度矩陣要比反射複雜多了。例如,
- 和
表示通過原點的反演和關於z軸的旋轉反演(逆時針旋轉90°後針對x-y平面反射,或逆時針旋轉270°後對原點反演)。
旋轉也變得更加複雜;它們不再由一個角來刻畫,並可能影響多於一個平面子空間。儘管經常以一個軸和角來描述3×3旋轉矩陣,在這個維度旋轉軸的存在是偶然的性質而不適用於其他維度。
但是,我們有了一般適用的基本建造板塊如置換、反射、和旋轉。
基本變換
[編輯]最基本的置換是換位(transposition),通過交換單位矩陣的兩行得到。任何n×n置換矩陣都可以構造為最多n−1次換位的積。構造自非零向量v的Householder反射為
- 。
這裡的分子是對稱矩陣,而分母是v的平方量的一個數。這是在垂直於v的超平面上的反射(取負平行於v任何向量分量)。如果v是單位向量,則Q = I−2vvT就足夠了。Householder反射典型的用於同時置零一列的較低部分。任何n×n正交矩陣都可以構造為最多n次這種反射的積。
Givens旋轉作用於由兩個坐標軸所生成的二維(平面)子空間上,按選定角度旋轉。它典型的用來置零一個單一的次對角線元素(subdiagonal entry)。任何n×n的旋轉矩陣都可以構造為最多n(n−1)/2次這種旋轉的積。在3x3矩陣的情況下,三個這種旋轉就足夠了;並且通過固定這個序列,我們可以用經常叫做歐拉角的三個角來(儘管不唯一)描述所有3×3旋轉矩陣。
雅可比旋轉有同Givens旋轉一樣的形式,但是被用做相似變換,選擇來置零2×2子矩陣的兩個遠離對角元素(off-diagonal entry)。
性質
[編輯]矩陣性質
[編輯]實數方塊矩陣是正交的,當且僅當它的列形成了帶有普通歐幾里得點積的歐幾里得空間Rn的正交規範基,它為真當且僅當它的行形成Rn的正交規範基。假設帶有正交(非正交規範)列的矩陣叫正交矩陣可能是誘人的,但是這種矩陣沒有特殊價值而沒有特殊名字;他們只是MTM = D,D是對角矩陣。
任何正交矩陣的行列式是 +1或−1。這可從關於行列式的如下基本事實得出:
- 。
逆敘述不真;有 +1行列式不保證正交性,即使帶有正交列,可由下列反例證實。
對於置換矩陣,行列式是 +1還是−1匹配置換是偶還是奇的標誌,行列式是行的交替函數。
比行列式限制更強的是正交矩陣總可以是在複數上可對角化來展示特徵值的完全的集合,它們全都必須有(複數的模長)絕對值1。
群性質
[編輯]正交矩陣的逆是正交的,兩個正交矩陣的積是正交的。事實上,所有n×n正交矩陣的集合滿足群的所有公理。它是n(n−1)/2維的緊緻李群,叫做正交群並指示為O(n)。
行列式為 +1的正交矩陣形成了路徑連通的子群指標為2的O(n)正規子群,叫做旋轉的特殊正交群SO(n)。商群O(n)/SO(n)同構於O(1),帶有依據行列式選擇[+1]或[−1]的投影映射。帶有行列式−1的正交矩陣不包括單位矩陣,所以不形成子群而只是陪集;它也是(分離的)連通的。所以每個正交群被分為兩個部分;因為投影映射分裂,O(n)是SO(n)與O(1)的半直積。用實用術語說,一個相當的陳述是任何正交矩陣可以通過採用一個旋轉矩陣並可能取負它的一列來生成,如我們在2×2矩陣中看到的。如果n是奇數,則半直積實際上是直積,任何正交矩陣可以通過採用一個旋轉矩陣並可能取負它的所有列來生成。
現在考慮 (n+1)×(n+1)右底元素等於1的正交矩陣。最後一列(和最後一行)的餘下元素必須是零,而任何兩個這種矩陣的積有同樣的形式。餘下的矩陣是n×n正交矩陣;因此O(n)是O(n+1)(和所有更高維群)的子群。
因為Householder正交矩陣形式的基本反射可把任何正交矩陣簡約成這種約束形式,一系列的這種反射可以把任何正交矩陣變回單位矩陣;因此正交群是反射群。最後一列可以被固定為任何單位向量,並且每種選擇給出不同的O(n)在O(n+1)中的複本;以這種方式O(n+1)是在單位球Sn與纖維O(n)上的叢。
類似的,SO(n)是SO(n+1)的子群;任何特定正交矩陣可以使用類似過程通過Givens平面旋轉來生成。叢結構持續:SO(n)↪ SO(n+1) → Sn。一個單一旋轉可以在最後一列的第一行生成一個零,而n−1次旋轉序列將置零n×n旋轉矩陣的除了最後一列的最後一行的所有元素。因為平面是固定的,每次旋轉只有一個自由度,就是它的角度。通過歸納,SO(n)因此有
自由度,O(n)也是。
置換矩陣簡單一些;它們不形成李群,只是一個有限群,n!次對稱群Sn。通過同類的討論,Sn是Sn+1的子群。偶置換生成行列式 +1的置換矩陣的子群,n!/2次交錯群。
規範形式
[編輯]更廣泛的說,任何正交矩陣的效果分離到在正交二維空間上的獨立動作。就是說,如果Q是狹義正交的,則你可以找到(旋轉)改變基的一個正交矩陣P,把Q帶回到分塊對角形式:
- (n偶數),(n奇數)。
這裡的矩陣R1,...,Rk是2×2旋轉矩陣,而餘下的元素是零。作為例外,一個旋轉塊可以是對角的,±I。因此如果需要的話取負一列,並注意2×2反射可對角化為+1和−1,任何正交矩陣可變為如下形式
- ,
矩陣R1,…,Rk給出位於複平面中單位圓上的特徵值的共軛對;所以這個分解複合確定所有帶有絕對值1的特徵值。如果n是奇數,至少有一個實數特徵值+1或−1;對於3×3旋轉,關聯着+1的特徵向量是旋轉軸。
數值線性代數
[編輯]優點
[編輯]數值分析自然的利用了正交矩陣的很多數值線性代數的性質。例如,經常需要計算空間的正交基,或基的正交變更;二者都採用了正交矩陣的形式。有行列式±1和所有模為1的特徵值是對數值穩定性非常有利的。一個蘊涵是條件數為1(這是極小的),所以在乘以正交矩陣的時候錯誤不放大。很多算法為此使用正交矩陣如Householder反射和Givens旋轉。有幫助的不只是正交矩陣是可逆的,還有它的逆矩陣本質上是免花費的,只需要對換索引(下標)。
置換是很多算法成功的根本,包括有局部定支點(partial pivoting)的運算繁重的高斯消去法(這裡的置換用來定支點)。但是它們很少明顯作為矩陣出現;它們的特殊形式允許更有限的表示,比如n個索引的列表。
同樣的,使用Householder和Givens矩陣的算法典型的使用特殊方法的乘法和存儲。例如,Givens旋轉只影響它所乘的矩陣的兩行,替代完全的n3次的矩陣乘法為更有效的n次運算。在使用這些反射和旋轉向矩陣介入零的時候,騰出的空間足夠存儲充足的數據來重生成這個變換。
分解
[編輯]一些重要的矩陣分解(Golub & Van Loan, 1996)涉及到了正交矩陣,包括:
參見
[編輯]參考資料
[編輯]- Diaconis, Persi; Mehrdad Shahshahani. The subgroup algorithm for generating uniform random variables. Prob. in Eng. and Info. Sci. 1987, 1: 15–32. ISSN 0269-9648.
- Dubrulle, Augustine A. Frobenius Iteration for the Matrix Polar Decomposition. HP Labs Technical Report HPL-94-117. 1994 [2007-06-23]. (原始內容存檔於2021-03-21).
- Golub, Gene H.; Charles F. Van Loan. Matrix Computations 3/e. Baltimore: Johns Hopkins University Press. 1996. ISBN 978-0-8018-5414-9.
- Higham, Nicholas. Computing the Polar Decomposition—with Applications. SIAM J. Sci. Stat. Comput. 1986, 7 (4): 1160–1174 [2007-06-23]. ISSN 0196-5204. (原始內容存檔於2007-10-07).
- Higham, Nicholas; Robert Schreiber. Fast polar decomposition of an arbitrary matrix. SIAM J. Sci. Stat. Comput. July 1990, 11 (4): 648–655 [2007-06-23]. ISSN 0196-5204. (原始內容存檔於2007-09-26). [1]
- Stewart, G. W. The Economical Storage of Plane Rotations. Numerische Mathematik. 1976, 25 (2): 137–138. ISSN 0029-599X.
- Stewart, G. W. The Efficient Generation of Random Orthogonal Matrices with an Application to Condition Estimators. SIAM J. Numer. Anal. 1980, 17 (3): 403–409. ISSN 0036-1429.