本文对标准正交基的计算方法加以分析,分别采用Schmidt正交化方法、初等变换法、合同变换法和Givens变换法进行标准正交基的求解。并在三维欧氏空间中,把向量积与这些方法结合,使得计算更为简单。 In this paper, the calculation methods of orthonormal basis are analyzed, and the orthonormal basis is obtained by Schmidt orthogonalization method, elementary transformation method, congruence transformation method and Givens transformation method, respectively. In the three-dimen- sional Euclidean space, cross product is combined with these methods to make the calculation simpler.
本文对标准正交基的计算方法加以分析,分别采用Schmidt正交化方法、初等变换法、合同变换法和Givens变换法进行标准正交基的求解。并在三维欧氏空间中,把向量积与这些方法结合,使得计算更为简单。
标准正交基,欧氏空间,Schmidt正交化,合同变换,Givens变换
Liwen Chen, Zhen Wang
College of Mathematics and Science, Yancheng Institute of Technology, Yancheng Jiangsu
Received: Feb. 5th, 2024; accepted: Mar. 22nd, 2024; published: Mar. 29th, 2024
In this paper, the calculation methods of orthonormal basis are analyzed, and the orthonormal basis is obtained by Schmidt orthogonalization method, elementary transformation method, congruence transformation method and Givens transformation method, respectively. In the three-dimensional Euclidean space, cross product is combined with these methods to make the calculation simpler.
Keywords:Orthonormal Basis, Euclidean Space, Schmidt Orthogonalization, Congruence Transformation, Givens Transformation
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
向量空间 [
欧氏空间的理论中,标准正交基是其中的一个重点和难点。就现有的参考文献而言,求解标准正交基的方法主要有Schmidt正交化法、初等变换法、合同变换法和Givens变换法等,为探索各方法的优缺点,本文将对各方法进行对比分析,以此得到规律。在三维欧氏空间中,我们将向量积与上述方法结合,运用在具体例题计算上,使得计算更为简单。
设 ℝ 是实数域,V是 ℝ 上的一个向量空间, α 1 , α 2 , ⋯ , α n 是V中的一组向量。若对任意的实数 k 1 , k 2 , ⋯ , k n ,总有 k 1 α 1 + k 2 α 2 + ⋯ + k n α n = 0 当且仅当 k 1 = k 2 = ⋯ = k n = 0 ,就称 α 1 , α 2 , ⋯ , α n 是线性无关的。若对任一向量 β ∈ V ,总有一组实数 l 1 , l 2 , ⋯ , l n ,使得 β = l 1 α 1 + l 2 α 2 + ⋯ + l n α n ,我们称 α 1 , α 2 , ⋯ , α n 是V的一组生成元。如果 α 1 , α 2 , ⋯ , α n 既是线性无关的,又是生成元,称 α 1 , α 2 , ⋯ , α n 是向量空间V的一组基。
V上的一个内积是指一个映射 ( ⋅ , ⋅ ) : V × V → ℝ ,满足非负性、线性性和对称性。赋有内积的向量空间称为欧氏空间,也称为内积空间。对任一向量 α ∈ V ,称 ‖ α ‖ : = ( α , α ) 为 α 的范数(或模长),它表示向量 α 的长度。如果 ‖ α ‖ = 1 ,称 α 是单位向量。任一非零向量都可以通过除以它的范数得到一个与它成比例的单位向量,这一过程称为标准化(或单位化)。著名的Cauchy-Schwarz不等式说明对任意向量 α , β ,总有 | ( α , β ) | ≤ ‖ α ‖ ‖ β ‖ 成立。利用这一不等式,可以抽象地定义 α , β 的夹角:设 ( α , β ^ ) 表示 α , β 的夹角,则定义 sin ( α , β ^ ) = ( α , β ) ‖ α ‖ ‖ β ‖ 。特别地,若 ( α , β ) = 0 ,称 α , β 正交(即垂直)。若一组向量 α 1 , α 2 , ⋯ , α n 两两正交,则称它们为正交向量组。若一组基 α 1 , α 2 , ⋯ , α n 两两正交,则称它们为V的一组正交基。若一组正交基 α 1 , α 2 , ⋯ , α n 中的每个向量都是单位向量,则称它们是V的一组标准正交基。此时V中任一向量 α 都可以由这组基线性表示,且很简单,即 α = ∑ i = 1 n ( α , α i ) α i ,并且范数也很简单, ‖ α ‖ = ∑ i = 1 n ( α , α i ) 2 。
对于正交基和标准正交基的存在性,有如下结论 [
在构造标准正交基的过程中,一般都是先给一组向量,对这组向量进行变化,得到另一组向量彼此正交(即垂直),然后再单位化。所以如果原来的一组向量有一些是相互垂直的,则可以简化正交基的计算过程。Schmidt正交化就是利用原来的向量组重新构造一组相互垂直的向量。
在一些特殊的空间中,也有其他的方法构造相互垂直的向量,比如在三维空间中,两个向量的向量积仍是一个向量,并且与原来的两个向量都垂直。因此在三维空间中计算标准正交基,我们可以把向量积和其它求标准正交基的方法结合起来,从而得到一个更简单有效的方法。
本节首先运用不同方法对同一例题进行标准正交基的求解,然后在下节对各方法进行对比分析,由此得到相关结论。
例题:在三维空间 ℝ 3 中,已知平面 z = x + 2 y ,求 ℝ 3 中的一组标准正交基使该标准正交基中每个向量与该平面或者平行或者垂直。
解:首先在平面上任取两个不共线的向量,这里取 a 1 = ( 1 , 1 , 3 ) T , a 2 = ( 1 , 0 , 1 ) T 。再令 a 3 = a 1 × a 2 = | i j k 1 1 3 1 0 1 | = ( 1 , 2 , − 1 ) T ,则 a 1 ⊥ a 3 , a 2 ⊥ a 3 ,因此 a 1 , a 2 , a 3 是一组基。下面我们对 a 1 , a 2 , a 3 采用
不同的方法构造满足要求的标准正交基。
Schmidt正交化方法是构造正交基最常用的方法,其原理是由原来的基,利用内积的性质,构造一组新的基,且使得新的基中的向量相互垂直。这种方法的步骤如下:
一、向量组正交化
令 b 1 = a 1 = ( 1 , 1 , 3 ) T ,
b 2 = a 2 − ( a 2 , b 1 ) ( b 1 , b 1 ) b 1 = 1 11 ( 7 , − 4 , − 1 ) T ,
b 3 = a 3 − ( a 3 , b 1 ) ( b 1 , b 1 ) b 1 − ( a 3 , b 2 ) ( b 2 , b 2 ) b 2 = a 3 = ( 1 , 2 , − 1 ) T ,
则 b 1 , b 2 , b 3 构成一组正交基。
二、向量组单位化
令 ε 1 = b 1 ‖ b 1 ‖ = 1 11 ( 1 , 1 , 3 ) T , ε 2 = b 2 ‖ b 2 ‖ = 1 66 ( 7 , − 4 , − 1 ) T , ε 3 = b 3 ‖ b 3 ‖ = 1 6 ( 1 , 2 , − 1 ) T 。
则 ε 1 , ε 2 , ε 3 即为所求的一组标准正交基。
初等变换法是利用初等列变换,对度量矩阵 A T A 和矩阵 A = ( a 1 , a 2 , a 3 ) 同时变换。这种方法的步骤如下:
一、构造矩阵 A = ( a 1 , a 2 , a 3 ) ,求出度量矩阵 A T A 。
由题意知 A = ( a 1 , a 2 , a 3 ) = ( 1 1 1 1 0 2 3 1 − 1 ) ,则有 A T A = ( 11 4 0 4 2 0 0 0 6 ) 。
二、构造 ( A T A A ) ,并对其进行初等列变换,直至 A T A 化成下三角矩阵,则矩阵A同时被化成B,则矩阵B的列向量组 α 1 , α 2 , α 3 即为正交基。若把用到的每个初等列变换所对应的初等矩阵依次记为 P 1 , ⋯ , P t ,把这些初等矩阵的乘积记为P,即 P = P 1 ⋯ P t ,则上面的过程相当于说 A T A P 是一个下三角矩阵,而矩阵 B = A P 的列向量组就构成一个正交基。所以由
( A T A A ) = ( 11 4 0 4 2 0 0 0 6 1 1 1 1 0 2 3 1 − 1 ) → c 2 − 4 11 c 1 ( 11 0 0 4 6 11 0 0 0 6 1 7 11 1 1 − 4 11 2 3 − 1 11 − 1 ) ,
令 B = ( 1 7 11 1 1 − 4 11 2 3 − 1 11 − 1 ) = ( α 1 , α 2 , α 3 ) ,则向量组 α 1 , α 2 , α 3 即为 ℝ 3 的一组正交基。
令 ε i = α i | α i | ( i = 1 , 2 , 3 ) ,即有
ε 1 = α 1 ‖ α 1 ‖ = 1 11 ( 1 , 1 , 3 ) T , ε 2 = α 2 ‖ α 2 ‖ = 1 66 ( 7 , − 4 , − 1 ) T , ε 3 = α 3 ‖ α 3 ‖ = 1 6 ( 1 , 2 , − 1 ) T ,
则 ε 1 , ε 2 , ε 3 就是所求的一组标准正交基。
该方法是利用合同变换对度量矩阵 A T A 进行变换。这种方法的步骤如下:
一、设矩阵 A = ( a 1 , a 2 , a 3 ) ,构造度量矩阵 A T A 。
这里度量矩阵 A T A = ( 11 4 0 4 2 0 0 0 6 ) 。
二、对 A T A 做合同变换,直到化为单位阵。
即对 A T A 做成对的初等行变换和初等列变换,使得最后变为单位阵。把所用到的初等列变换所对应的初等矩阵依次记为 P 1 , ⋯ , P t ,这些初等矩阵的乘积记为P,即 P = P 1 ⋯ P t ,则有 P T A T A P = E ,这里E是单位阵。
三、设 ( ε 1 , ε 2 , ε 3 ) = A P ,则 ε 1 , ε 2 , ε 3 就是要求的标准正交基。
在具体计算的过程中,可以将 A T A 与A放在一列,构成一个6 × 3的矩阵,然后对这个矩阵的上面三行与整个矩阵的三列做成对的初等行、列变换,使得上面三行变为单位阵,则下面的三行就是 ( ε 1 , ε 2 , ε 3 ) = A P 。
下面对 ( A T A A ) 做这样的变换:
( 11 4 0 4 2 0 0 0 6 1 1 1 1 0 2 3 1 − 1 ) → c 2 − 4 11 c 1 r 2 − 4 11 r ( 11 0 0 0 6 11 0 0 0 6 1 7 11 1 1 − 4 11 2 3 − 1 11 − 1 ) → ( 1 0 0 0 1 0 0 0 1 1 11 7 66 1 6 1 11 − 4 66 2 6 3 11 − 1 66 − 1 6 ) = ( E A P ) ,
其中第二步依次用 r 1 × 1 11 , c 1 × 1 11 , r 2 × 11 6 , c 2 × 11 6 以及 r 3 × 1 6 , c 3 × 1 6 这些初等变换。
因此 ε 1 = 1 11 ( 1 , 1 , 3 ) T , ε 2 = 1 66 ( 7 , − 4 , − 1 ) T , ε 3 = 1 6 ( 1 , 2 , − 1 ) T 就是所求的一组标准正交基。
我们首先介绍一下这个方法的原理。称形如
R i j = ( 1 ⋯ 0 ⋯ 0 ⋯ 0 ⋮ ⋮ ⋮ ⋮ 0 ⋯ cos θ ⋯ sin θ ⋯ 0 ⋮ ⋮ ⋮ ⋮ 0 ⋯ − sin θ ⋯ cos θ ⋯ 0 ⋮ ⋮ ⋮ ⋮ 0 ⋯ 0 ⋯ 0 ⋯ 1 )
的n阶矩阵为初等旋转矩阵,其中 cos θ 位于 ( i , i ) 与 ( j , j ) 位置, sin θ 位于 ( i , j ) 位置。设 x = ( x 1 , ⋯ , x n ) T , y = ( y 1 , ⋯ , y n ) T ,若 y = R i j x ,则 y i = x i cos θ + x j sin θ , y j = − x i sin θ + x j cos θ ,其余的 y t = x t , t ≠ i , j 。如果令 sin θ = x j x i 2 + x j 2 , cos θ = x i x i 2 + x j 2 ,则在 y = R i j x 中 y j = 0 。利用这一结果,对任一 n × m 矩阵A,其中 n ≥ m ,依次用适当的初等旋转矩阵 P 1 , ⋯ , P s 左乘A,最后可将A转化为 ( R 0 ) ,其中R是一个m阶上三角矩阵。则 P = P s ⋯ P 1 的转置 P T 的前m列向量就构成一个标准正交基。
这种方法的具体步骤如下:
一、构造矩阵 A = ( a 1 , a 2 , a 3 ) = ( 1 1 1 1 0 2 3 1 − 1 ) 。
二、对矩阵 ( A | E ) 左乘一系列初等旋转矩阵 P 1 , ⋯ , P s ,将A转化成 ( R 0 ) 形式,其中R是上三角矩阵,同时单位阵E就转化成一个正交矩阵P,且 P = P s ⋯ P 1 。或者单独对A左乘一系列初等旋转矩阵 P 1 , ⋯ , P s ,将A转化成 ( R 0 ) 形式,然后令 P = P s ⋯ P 1 。下面对A进行这种转化。
为了将A中 ( 2 , 1 ) 位置的1变为0,我们取第一列
三、标准正交基就是由正交矩阵P的转置矩阵 P T 的前3个列向量组成。
即 ε 1 = 1 11 ( 1 , 1 , 3 ) T , ε 2 = 1 66 ( 7 , − 4 , − 1 ) T , ε 3 = 1 6 ( 1 , 2 , − 1 ) T 是所求的一组标准正交基。
从上述计算过程中,本文得出以下结论:Schmidt正交化法较为直观,易于掌握,在一般课本里都有介绍。初等变换法应用了矩阵的初等列变换,也比较容易理解与掌握,计算量也较小,参见 [
同变换法应用了矩阵的合同变换,其优点在于能清楚揭示标准正交基与原基之间的关系,即 ( ε 1 , ε 2 , ε 3 ) = ( α 1 , α 2 , α 3 ) P ,该方法在 [
本文在计算 ℝ 3 中的一组标准正交基时,先找了两个不共线的向量 a 1 , a 2 ,然后用他们的向量积 a 3 = a 1 × a 2 作为第三个向量,从而得到 ℝ 3 中的一组基 a 1 , a 2 , a 3 ,再由这组基分别用不同方法得到一组标准正交基。由于 a 1 ⊥ a 3 , a 2 ⊥ a 3 ,因此在计算过程中减少了很多计算量。事实上,在计算中,本质上我们只需要对 a 1 , a 2 进行正交化即可。如果是任意找一个与 a 1 , a 2 不共面的向量 a 3 ,由基 a 1 , a 2 , a 3 通过上述各种方法去构造一组正交基,这时本质上是对三个向量做正交化,计算量显然比我们用向量积取 a 3 作为第三个向量的方法要多。因此在三维欧氏空间中将向量积与其它方法结合去计算标准正交基可以简化计算过程,比直接用这些方法去计算更简单。
盐城工学院2023年大学生创新创业训练计划项目(2023517, 2023518)。
陈丽雯,王 振. 三维欧氏空间中标准正交基的求解新方法A New Method to Compute Orthonormal Basis in Three-Dimensional Euclidean Spaces[J]. 理论数学, 2024, 14(03): 151-157. https://doi.org/10.12677/pm.2024.143094