PM Pure Mathematics 2160-7583 Scientific Research Publishing 10.12677/pm.2024.143094 PM-83844 pm2024143_151252311.pdf 数学与物理 三维欧氏空间中标准正交基的求解新方法 A New Method to Compute Orthonormal Basis in Three-Dimensional Euclidean Spaces 丽雯 2 1 2 1 盐城工学院数理学院,江苏 盐城 null 12 03 2024 14 03 151 157 © Copyright 2014 by authors and Scientific Research Publishing Inc. 2014 This work is licensed under the Creative Commons Attribution International License (CC BY). http://creativecommons.org/licenses/by/4.0/

本文对标准正交基的计算方法加以分析,分别采用Schmidt正交化方法、初等变换法、合同变换法和Givens变换法进行标准正交基的求解。并在三维欧氏空间中,把向量积与这些方法结合,使得计算更为简单。 In this paper, the calculation methods of orthonormal basis are analyzed, and the orthonormal basis is obtained by Schmidt orthogonalization method, elementary transformation method, congruence transformation method and Givens transformation method, respectively. In the three-dimen- sional Euclidean space, cross product is combined with these methods to make the calculation simpler.

标准正交基,欧氏空间,Schmidt正交化,合同变换,Givens变换, Orthonormal Basis Euclidean Space Schmidt Orthogonalization Congruence Transformation Givens Transformation
摘要

本文对标准正交基的计算方法加以分析,分别采用Schmidt正交化方法、初等变换法、合同变换法和Givens变换法进行标准正交基的求解。并在三维欧氏空间中,把向量积与这些方法结合,使得计算更为简单。

关键词

标准正交基,欧氏空间,Schmidt正交化,合同变换,Givens变换

A New Method to Compute Orthonormal Basis in Three-Dimensional Euclidean Spaces<sup> </sup>

Liwen Chen, Zhen Wang

College of Mathematics and Science, Yancheng Institute of Technology, Yancheng Jiangsu

Received: Feb. 5th, 2024; accepted: Mar. 22nd, 2024; published: Mar. 29th, 2024

ABSTRACT

In this paper, the calculation methods of orthonormal basis are analyzed, and the orthonormal basis is obtained by Schmidt orthogonalization method, elementary transformation method, congruence transformation method and Givens transformation method, respectively. In the three-dimensional Euclidean space, cross product is combined with these methods to make the calculation simpler.

Keywords:Orthonormal Basis, Euclidean Space, Schmidt Orthogonalization, Congruence Transformation, Givens Transformation

Copyright © 2024 by author(s) and beplay安卓登录

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

向量空间 [ 1 ] ,也称为线性空间,是线性代数中的一个基本概念,它用于描述一组具有线性结构的向量的集合。它可以是有限维的或者无限维的,并且可以包含不同类型的向量,例如实数向量、复数向量、矩阵等。向量空间的概念在数学和工程科学中有广泛的应用。但是在向量空间中,只考虑了向量与数的数乘、向量与向量的加法这两种线性运算,没有从几何的角度考虑向量的长度、向量与向量的夹角等几何方面的量。因此又引入内积的概念,使得向量空间成为欧氏空间。

欧氏空间的理论中,标准正交基是其中的一个重点和难点。就现有的参考文献而言,求解标准正交基的方法主要有Schmidt正交化法、初等变换法、合同变换法和Givens变换法等,为探索各方法的优缺点,本文将对各方法进行对比分析,以此得到规律。在三维欧氏空间中,我们将向量积与上述方法结合,运用在具体例题计算上,使得计算更为简单。

2. 相关概念及结论

设 ℝ 是实数域,V是 ℝ 上的一个向量空间, α 1 , α 2 , ⋯ , α n 是V中的一组向量。若对任意的实数 k 1 , k 2 , ⋯ , k n ,总有 k 1 α 1 + k 2 α 2 + ⋯ + k n α n = 0 当且仅当 k 1 = k 2 = ⋯ = k n = 0 ,就称 α 1 , α 2 , ⋯ , α n 是线性无关的。若对任一向量 β ∈ V ,总有一组实数 l 1 , l 2 , ⋯ , l n ,使得 β = l 1 α 1 + l 2 α 2 + ⋯ + l n α n ,我们称 α 1 , α 2 , ⋯ , α n 是V的一组生成元。如果 α 1 , α 2 , ⋯ , α n 既是线性无关的,又是生成元,称 α 1 , α 2 , ⋯ , α n 是向量空间V的一组基。

V上的一个内积是指一个映射 (   ⋅   ,   ⋅   ) : V × V → ℝ ,满足非负性、线性性和对称性。赋有内积的向量空间称为欧氏空间,也称为内积空间。对任一向量 α ∈ V ,称 ‖ α ‖ : = ( α , α ) 为 α 的范数(或模长),它表示向量 α 的长度。如果 ‖ α ‖ = 1 ,称 α 是单位向量。任一非零向量都可以通过除以它的范数得到一个与它成比例的单位向量,这一过程称为标准化(或单位化)。著名的Cauchy-Schwarz不等式说明对任意向量 α , β ,总有 | ( α , β ) | ≤ ‖ α ‖ ‖ β ‖ 成立。利用这一不等式,可以抽象地定义 α , β 的夹角:设 ( α , β ^ ) 表示 α , β 的夹角,则定义 sin ( α , β ^ ) = ( α , β ) ‖ α ‖ ‖ β ‖ 。特别地,若 ( α , β ) = 0 ,称 α , β 正交(即垂直)。若一组向量 α 1 , α 2 , ⋯ , α n 两两正交,则称它们为正交向量组。若一组基 α 1 , α 2 , ⋯ , α n 两两正交,则称它们为V的一组正交基。若一组正交基 α 1 , α 2 , ⋯ , α n 中的每个向量都是单位向量,则称它们是V的一组标准正交基。此时V中任一向量 α 都可以由这组基线性表示,且很简单,即 α = ∑ i = 1 n ( α , α i ) α i ,并且范数也很简单, ‖ α ‖ = ∑ i = 1 n ( α , α i ) 2 。

对于正交基和标准正交基的存在性,有如下结论 [ 1 ] :对于任意给定的有限维欧氏空间,总存在一组正交基和一组标准正交基。事实上,通过正交化过程,我们总可以从给定的一组基重新构造出一组正交基。通过将正交基进行标准化处理,即将每个基向量除以其模长,我们就得到一组标准正交基。

在构造标准正交基的过程中,一般都是先给一组向量,对这组向量进行变化,得到另一组向量彼此正交(即垂直),然后再单位化。所以如果原来的一组向量有一些是相互垂直的,则可以简化正交基的计算过程。Schmidt正交化就是利用原来的向量组重新构造一组相互垂直的向量。

在一些特殊的空间中,也有其他的方法构造相互垂直的向量,比如在三维空间中,两个向量的向量积仍是一个向量,并且与原来的两个向量都垂直。因此在三维空间中计算标准正交基,我们可以把向量积和其它求标准正交基的方法结合起来,从而得到一个更简单有效的方法。

3. 不同方法对标准正交基的求解

本节首先运用不同方法对同一例题进行标准正交基的求解,然后在下节对各方法进行对比分析,由此得到相关结论。

例题:在三维空间 ℝ 3 中,已知平面 z = x + 2 y ,求 ℝ 3 中的一组标准正交基使该标准正交基中每个向量与该平面或者平行或者垂直。

解:首先在平面上任取两个不共线的向量,这里取 a 1 = ( 1 , 1 , 3 ) T , a 2 = ( 1 , 0 , 1 ) T 。再令 a 3 = a 1 × a 2 = | i j k 1 1 3 1 0 1 | = ( 1 , 2 , − 1 ) T ,则 a 1 ⊥ a 3 , a 2 ⊥ a 3 ,因此 a 1 , a 2 , a 3 是一组基。下面我们对 a 1 , a 2 , a 3 采用

不同的方法构造满足要求的标准正交基。

3.1. Schmidt正交化方法

Schmidt正交化方法是构造正交基最常用的方法,其原理是由原来的基,利用内积的性质,构造一组新的基,且使得新的基中的向量相互垂直。这种方法的步骤如下:

一、向量组正交化

令 b 1 = a 1 = ( 1 , 1 , 3 ) T ,

b 2 = a 2 − ( a 2 , b 1 ) ( b 1 , b 1 ) b 1 = 1 11 ( 7 , − 4 , − 1 ) T ,

b 3 = a 3 − ( a 3 , b 1 ) ( b 1 , b 1 ) b 1 − ( a 3 , b 2 ) ( b 2 , b 2 ) b 2 = a 3 = ( 1 , 2 , − 1 ) T ,

则 b 1 , b 2 , b 3 构成一组正交基。

二、向量组单位化

令 ε 1 = b 1 ‖ b 1 ‖ = 1 11 ( 1 , 1 , 3 ) T , ε 2 = b 2 ‖ b 2 ‖ = 1 66 ( 7 , − 4 , − 1 ) T , ε 3 = b 3 ‖ b 3 ‖ = 1 6 ( 1 , 2 , − 1 ) T 。

则 ε 1 , ε 2 , ε 3 即为所求的一组标准正交基。

3.2. 初等变换法

初等变换法是利用初等列变换,对度量矩阵 A T A 和矩阵 A = ( a 1 , a 2 , a 3 ) 同时变换。这种方法的步骤如下:

一、构造矩阵 A = ( a 1 , a 2 , a 3 ) ,求出度量矩阵 A T A 。

由题意知 A = ( a 1 , a 2 , a 3 ) = ( 1 1 1 1 0 2 3 1 − 1 ) ,则有 A T A = ( 11 4 0 4 2 0 0 0 6 ) 。

二、构造 ( A T A A ) ,并对其进行初等列变换,直至 A T A 化成下三角矩阵,则矩阵A同时被化成B,则矩阵B的列向量组 α 1 , α 2 , α 3 即为正交基。若把用到的每个初等列变换所对应的初等矩阵依次记为 P 1 , ⋯ , P t ,把这些初等矩阵的乘积记为P,即 P = P 1 ⋯ P t ,则上面的过程相当于说 A T A P 是一个下三角矩阵,而矩阵 B = A P 的列向量组就构成一个正交基。所以由

( A T A A ) = ( 11 4 0 4 2 0 0 0 6 1 1 1 1 0 2 3 1 − 1 ) → c 2 − 4 11 c 1 ( 11 0 0 4 6 11 0 0 0 6 1 7 11 1 1 − 4 11 2 3 − 1 11 − 1 ) ,

令 B = ( 1 7 11 1 1 − 4 11 2 3 − 1 11 − 1 ) = ( α 1 , α 2 , α 3 ) ,则向量组 α 1 , α 2 , α 3 即为 ℝ 3 的一组正交基。

令 ε i = α i | α i | ( i = 1 , 2 , 3 ) ,即有

ε 1 = α 1 ‖ α 1 ‖ = 1 11 ( 1 , 1 , 3 ) T , ε 2 = α 2 ‖ α 2 ‖ = 1 66 ( 7 , − 4 , − 1 ) T , ε 3 = α 3 ‖ α 3 ‖ = 1 6 ( 1 , 2 , − 1 ) T ,

则 ε 1 , ε 2 , ε 3 就是所求的一组标准正交基。

3.3. 合同变换法

该方法是利用合同变换对度量矩阵 A T A 进行变换。这种方法的步骤如下:

一、设矩阵 A = ( a 1 , a 2 , a 3 ) ,构造度量矩阵 A T A 。

这里度量矩阵 A T A = ( 11 4 0 4 2 0 0 0 6 ) 。

二、对 A T A 做合同变换,直到化为单位阵。

即对 A T A 做成对的初等行变换和初等列变换,使得最后变为单位阵。把所用到的初等列变换所对应的初等矩阵依次记为 P 1 , ⋯ , P t ,这些初等矩阵的乘积记为P,即 P = P 1 ⋯ P t ,则有 P T A T A P = E ,这里E是单位阵。

三、设 ( ε 1 , ε 2 , ε 3 ) = A P ,则 ε 1 , ε 2 , ε 3 就是要求的标准正交基。

在具体计算的过程中,可以将 A T A 与A放在一列,构成一个6 × 3的矩阵,然后对这个矩阵的上面三行与整个矩阵的三列做成对的初等行、列变换,使得上面三行变为单位阵,则下面的三行就是 ( ε 1 , ε 2 , ε 3 ) = A P 。

下面对 ( A T A A ) 做这样的变换:

( 11 4 0 4 2 0 0 0 6 1 1 1 1 0 2 3 1 − 1 ) → c 2 − 4 11 c 1 r 2 − 4 11 r ( 11 0 0 0 6 11 0 0 0 6 1 7 11 1 1 − 4 11 2 3 − 1 11 − 1 ) → ( 1 0 0 0 1 0 0 0 1 1 11 7 66 1 6 1 11 − 4 66 2 6 3 11 − 1 66 − 1 6 ) = ( E A P ) ,

其中第二步依次用 r 1 × 1 11 , c 1 × 1 11 , r 2 × 11 6 , c 2 × 11 6 以及 r 3 × 1 6 , c 3 × 1 6 这些初等变换。

因此 ε 1 = 1 11 ( 1 , 1 , 3 ) T ,   ε 2 = 1 66 ( 7 , − 4 , − 1 ) T ,   ε 3 = 1 6 ( 1 , 2 , − 1 ) T 就是所求的一组标准正交基。

3.4. Givens变换法

我们首先介绍一下这个方法的原理。称形如

R i j = ( 1 ⋯ 0 ⋯ 0 ⋯ 0 ⋮ ⋮ ⋮ ⋮ 0 ⋯ cos θ ⋯ sin θ ⋯ 0 ⋮ ⋮ ⋮ ⋮ 0 ⋯ − sin θ ⋯ cos θ ⋯ 0 ⋮ ⋮ ⋮ ⋮ 0 ⋯ 0 ⋯ 0 ⋯ 1 )

的n阶矩阵为初等旋转矩阵,其中 cos θ 位于 ( i , i ) 与 ( j , j ) 位置, sin θ 位于 ( i , j ) 位置。设 x = ( x 1 , ⋯ , x n ) T , y = ( y 1 , ⋯ , y n ) T ,若 y = R i j x ,则 y i = x i cos θ + x j sin θ , y j = − x i sin θ + x j cos θ ,其余的 y t = x t , t ≠ i , j 。如果令 sin θ = x j x i 2 + x j 2 , cos θ = x i x i 2 + x j 2 ,则在 y = R i j x 中 y j = 0 。利用这一结果,对任一 n × m 矩阵A,其中 n ≥ m ,依次用适当的初等旋转矩阵 P 1 , ⋯ , P s 左乘A,最后可将A转化为 ( R 0 ) ,其中R是一个m阶上三角矩阵。则 P = P s ⋯ P 1 的转置 P T 的前m列向量就构成一个标准正交基。

这种方法的具体步骤如下:

一、构造矩阵 A = ( a 1 , a 2 , a 3 ) = ( 1 1 1 1 0 2 3 1 − 1 ) 。

二、对矩阵 ( A | E ) 左乘一系列初等旋转矩阵 P 1 , ⋯ , P s ,将A转化成 ( R 0 ) 形式,其中R是上三角矩阵,同时单位阵E就转化成一个正交矩阵P,且 P = P s ⋯ P 1 。或者单独对A左乘一系列初等旋转矩阵 P 1 , ⋯ , P s ,将A转化成 ( R 0 ) 形式,然后令 P = P s ⋯ P 1 。下面对A进行这种转化。

为了将A中 ( 2 , 1 ) 位置的1变为0,我们取第一列 的第1个和第2个分量1和1构造 sin θ = 1 1 2 + 1 2 = 2 2 , cos θ = 1 1 2 + 1 2 = 2 2 ,从而第一个初等旋转矩阵 T 12 = ( 2 2 2 2 0 − 2 2 2 2 0 0 0 1 ) ,直接计算得到 T 12 A = ( 2 2 2 3 2 2 0 − 2 2 2 2 3 1 − 1 ) 。为了将 T 12 A 中 ( 3 , 1 ) 位置的3变为0,我们取 T 12 A 中第一列 ( 2 0 3 ) 的第1个和第3个分量 2 和3构造 sin θ = 3 2 2 + 3 2 = 3 11 , cos θ = 2 2 2 + 3 2 = 2 11 ,从而第二个初等旋转矩阵 T 13 = ( 2 11 0 3 11 0 1 0 − 3 11 0 2 11 ) ,直接计算得到 T 13 T 12 A = ( 11 4 11 0 0 − 2 2 2 2 0 − 1 22 − 11 2 ) 。为了将 T 13 T 12 A 中 ( 3 , 2 ) 位置的 − 1 22 变为0,我们取 T 13 T 12 A 中第二列中的第2个和第3个分量 − 2 2 , − 1 22 构造 sin θ = − 1 22 ( − 2 2 ) 2 + ( − 1 22 ) 2 = − 1 2 3 , cos θ = − 2 2 ( − 2 2 ) 2 + ( − 1 22 ) 2 = − 11 2 3 ,从而第三个初等旋转矩阵 T 23 = ( 1 0 0 0 − 11 2 3 − 1 2 3 0 1 2 3 − 11 2 3 ) ,直接计算得到 T 23 T 13 T 12 A = ( 11 4 11 0 0 6 11 0 0 0 6 ) 。最后计算 P = T 23 T 13 T 12 ,则有 P = ( 1 11 1 11 3 11 7 66 − 4 66 − 1 66 1 6 2 6 − 1 6 ) 。

三、标准正交基就是由正交矩阵P的转置矩阵 P T 的前3个列向量组成。

即 ε 1 = 1 11 ( 1 , 1 , 3 ) T ,   ε 2 = 1 66 ( 7 , − 4 , − 1 ) T ,   ε 3 = 1 6 ( 1 , 2 , − 1 ) T 是所求的一组标准正交基。

4. 结论

从上述计算过程中,本文得出以下结论:Schmidt正交化法较为直观,易于掌握,在一般课本里都有介绍。初等变换法应用了矩阵的初等列变换,也比较容易理解与掌握,计算量也较小,参见 [ 2 ] [ 3 ] 。通过把 ( A T A A ) 转置可知,初等变换法也可以对 ( A T A , A T ) 做初等行变换把 A T A 化为上三角矩阵来实现。而合

同变换法应用了矩阵的合同变换,其优点在于能清楚揭示标准正交基与原基之间的关系,即 ( ε 1 , ε 2 , ε 3 ) = ( α 1 , α 2 , α 3 ) P ,该方法在 [ 2 ] - [ 7 ] 都有介绍。最后,Givens法相较于前三种方法,其算法稍微复杂,需构造一系列初等旋转矩阵,在 [ 2 ] [ 3 ] [ 8 ] 均有简单介绍,但初等旋转矩阵如何构造都没有介绍,本文对此介绍更为详细。

本文在计算 ℝ 3 中的一组标准正交基时,先找了两个不共线的向量 a 1 , a 2 ,然后用他们的向量积 a 3 = a 1 × a 2 作为第三个向量,从而得到 ℝ 3 中的一组基 a 1 , a 2 , a 3 ,再由这组基分别用不同方法得到一组标准正交基。由于 a 1 ⊥ a 3 , a 2 ⊥ a 3 ,因此在计算过程中减少了很多计算量。事实上,在计算中,本质上我们只需要对 a 1 , a 2 进行正交化即可。如果是任意找一个与 a 1 , a 2 不共面的向量 a 3 ,由基 a 1 , a 2 , a 3 通过上述各种方法去构造一组正交基,这时本质上是对三个向量做正交化,计算量显然比我们用向量积取 a 3 作为第三个向量的方法要多。因此在三维欧氏空间中将向量积与其它方法结合去计算标准正交基可以简化计算过程,比直接用这些方法去计算更简单。

基金项目

盐城工学院2023年大学生创新创业训练计划项目(2023517, 2023518)。

文章引用

陈丽雯,王 振. 三维欧氏空间中标准正交基的求解新方法A New Method to Compute Orthonormal Basis in Three-Dimensional Euclidean Spaces[J]. 理论数学, 2024, 14(03): 151-157. https://doi.org/10.12677/pm.2024.143094

参考文献 References 北京大学数学系. 高等代数[M]. 第三版. 北京: 高等教育出版社, 2003. 郭茜. 欧氏空间标准正交基的几种求法[J]. 科技风, 2013(12): 117-118. 朱凤娟. 欧氏空间标准正交基的求解方法的再探[J]. 课程教育研究, 2015(28): 155-156. 李宗胜. 标准正交基的一种求法[J]. 数学通报, 1991(3): 29. 姚存峰. 利用初等变换求标准正交基[J]. 数学通报, 1992(3): 42-43. 余巧生, 谢嘉宾. 标准正交基的另一种求法[J]. 黄冈师范学院学报, 2006(6): 7-9. 丁照银. 两种标准正交化方法的比较[J]. 科学技术创新, 2021(27): 62-63. 刘国志. 欧氏空间子空间的标准正交基的一种全新的求法——Givens变换法[J]. 抚顺石油学院学报, 1996(1): 78-81.
Baidu
map