对偶空间与双线性型
对偶空间与双线性型讲义
有限维内积空间上的线性函数
线性函数的定义
设 V 是数域 \mathbb{F} 上的线性空间,把 \mathbb{F} 看作自身上的一维空间,则 V \to \mathbb{F} 的线性映射称为 V 上的线性函数或线性泛函。即,若 f: V \to \mathbb{F} 是线性函数,则对任意 \boldsymbol{\alpha}, \boldsymbol{\beta} \in V, k \in \mathbb{F},有
本章 \mathbb{F} 取实数域或复数域,V 是内积空间,内积用 (-,-) 表示。对 V 中固定向量 v,显然
是一个线性函数。反之,对有限维空间,下述定理说明任意线性函数也是这样的。
线性函数的表示定理
定理:设 V 是 n 维内积空间,f 是 V 上线性函数,则必存在 V 中唯一向量 \mathbf{v},使得 f(\mathbf{x}) = (\mathbf{x}, \mathbf{v}) 式对一切 \mathbf{x} \in V 成立。
证明:
设 \varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n 是 V 的一组标准正交基,令
则直接验证在基向量上的作用效果可知,f(\mathbf{x}) = (\mathbf{x}, \mathbf{v})。
若还有向量 \mathbf{u} 使得 f(\mathbf{x}) = (\mathbf{x}, \mathbf{u}),取 \mathbf{x} = \mathbf{u} - \mathbf{v} 知 \mathbf{u} = \mathbf{v}。
伴随算子
伴随算子的存在唯一性
定理:设 V 是 n 维内积空间,\varphi 是 V 上线性变换,则唯一存在 V 上线性变换 \varphi^*,使得对一切 \mathbf{u}, \mathbf{v} \in V,有
习惯上称内积空间上的线性变换为线性算子,简称算子。
定义:设 \varphi 是内积空间 V 上线性算子,若存在算子 \varphi^* 满足上式,则称 \varphi^* 为 \varphi 的伴随算子,简称为 \varphi 的伴随。
证明:
对任意给定的 \mathbf{v} \in V,直接验证可知
是 V 上线性函数,由上页定理,唯一存在向量 \mathbf{v}' 使得
定义映射 \varphi^*(\mathbf{v}) = \mathbf{v}'。
还需证明 \varphi^* 是线性的,对任意 \mathbf{v}_1, \mathbf{v}_2 \in V, k \in \mathbb{F},记 \varphi^*(\mathbf{v}_1) = \mathbf{v}'_1, \varphi^*(\mathbf{v}_2) = \mathbf{v}'_2,则对任意 \mathbf{u} \in V,有
即 \varphi^*(k\mathbf{v}_1 + \mathbf{v}_2) = k\varphi^*(\mathbf{v}_1) + \varphi^*(\mathbf{v}_2),\varphi^* 是线性映射。
若还有线性变换 \psi 满足,对一切 \mathbf{u}, \mathbf{v} \in V,有
则 (\mathbf{u}, \varphi^*(\mathbf{v})) = (\mathbf{u}, \psi(\mathbf{v})) 对一切 \mathbf{u}, \mathbf{v} \in V 成立,从而 \varphi^*(\mathbf{v}) = \psi(\mathbf{v}) 对一切 \mathbf{v} \in V 成立,即 \varphi^* = \psi,既得唯一性。
伴随算子的矩阵表示
定理:设 \varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n 是 n 维内积空间 V 的一组标准正交基。若 V 上线性算子 \varphi 在该基下的矩阵为 A = (a_{ij}),则 \varphi^* 在同一组基下的矩阵为 \overline{A^T}。
证明:
由表示矩阵的定义,有
故
但 (\varphi(\varepsilon_i), \varepsilon_j) = (\varepsilon_i, \varphi^*(\varepsilon_j)),设
则
从而 a_{ji} = \overline{b_{ij}}。同样由表示矩阵的定义即得所证。
伴随算子的基本性质
定理:设 \varphi, \psi 是有限维内积空间 V 上的线性算子,k 为常数,则
- (\varphi + \psi)^* = \varphi^* + \psi^*
- (k\varphi)^* = \overline{k}\varphi^*
- (\varphi\psi)^* = \psi^*\varphi^*
- (\varphi^*)^* = \varphi
注:对方阵 A,有时也称 \overline{A^T} 为 A 的伴随矩阵,记为 A^*,我们以前用的伴随矩阵称为古典伴随。
自伴算子
自伴算子的定义
定义:设 \varphi 是有限维内积空间 V 上的线性算子,\varphi^* 是 \varphi 的伴随。若 \varphi^* = \varphi,则称 \varphi 是自伴算子。在 V 是欧氏空间时,又称为对称算子;在 V 是酉空间时,又称为Hermite 算子。
利用自伴算子的语言,我们可以重新证明 Hermite 矩阵(实对称矩阵)酉(正交)相似于对角阵。由于只是语言的转化,我们只列出结果,证明请同学们自行完成。
定理:
- 设 \varphi 是 n 维内积空间 V 上的自伴算子。则 \varphi 的特征值都是实数,且对应于不同特征值的特征向量互相正交。
- 设 \varphi 是 n 维内积空间 V 上的自伴算子,U 是 \varphi 的不变子空间。则 U 的正交补 U^\perp 也是 \varphi 的不变子空间。
- 设 \varphi 是 n 维内积空间 V 上的自伴算子。则存在 V 的一组标准正交基,使得 \varphi 在该基下的矩阵是对角阵。
对偶空间与对偶基
对偶空间的定义
定义:设 V 是数域 \mathbb{F} 上的线性空间,记 V 上线性函数(V \to \mathbb{F} 的线性映射)所成集合为 V^*。按照通常映射的加法和数乘 V^* 也构成 \mathbb{F} 上线性空间,称为 V 的共轭空间,当 V 是有限维空间时,常称 V^* 为 V 的对偶空间。
对偶基的存在性
定理:设 V 是数域 \mathbb{F} 上的 n 维线性空间,\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 是 V 的一组基,则
构成了 V^* 的一组基。
定义:(V^* 的)基 \mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 称为(V 的基) \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 的对偶基。
推论:设 V 是数域 \mathbb{F} 上的有限维线性空间,则 \dim V = \dim V^*。
注:对无限维空间,可以证明(需要用到分析的知识)该推论不成立。
证明:
由于线性空间 V 上的映射由它在 V 的基上的作用唯一确定,诸 \mathbf{f}_i 确实是线性函数。
设有线性组合使得
将上式依次作用在 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 上即知
所以 \mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 是 V^* 中无关向量组。
对任意 \mathbf{f} \in V^*,设 \mathbf{f}(\mathbf{e}_i) = a_i,则对 V 中任意向量
有
由 \mathbf{x} 的任意性,\mathbf{f} = a_1\mathbf{f}_1 + a_2\mathbf{f}_2 + \cdots + a_n\mathbf{f}_n,即 \mathbf{f} 可以由 \mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 线性表示。
综上,\mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 构成了 V^* 的一组基。
对偶空间的对称性记号
记号 \langle -,- \rangle
为了更好的理解 V 与 V^* 的对称性,引入记号 \langle -,- \rangle,
记号 \langle -,- \rangle 的简单性质:
- 若 \langle \mathbf{f}, \mathbf{x} \rangle = 0 对任意 \mathbf{x} \in V 成立当且仅当 \mathbf{f} = \mathbf{0}
- 若 \langle \mathbf{f}, \mathbf{x} \rangle = 0 对任意 \mathbf{f} \in V^* 成立当且仅当 \mathbf{x} = \mathbf{0}
证明:
(1) 显然,只需证明 (2)。充分性也是显然的。下面证明必要性的逆否命题。
若 \mathbf{x} \neq \mathbf{0},以其为第一个向量扩充成 V 的一组基 \mathbf{x} = \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n,则对对偶基的第一个向量 \mathbf{f}_1,有 \mathbf{f}_1(\mathbf{e}_1) = 1。
对偶之对偶 V^{**}
固定 \mathbf{f} \in V^*,则 \langle \mathbf{f}, - \rangle 就是 V 上线性函数。同样地,固定 \mathbf{x} \in V,则 \langle -, \mathbf{x} \rangle 可以看作 V^* 上线性函数。实际上,对任意 \mathbf{f}_1, \mathbf{f}_2 \in V^*, k \in \mathbb{F},有
从而 \langle -, \mathbf{x} \rangle 是 V^* 上线性函数。
V^* 作为 \mathbb{F} 上线性空间,也有共轭空间 V^{**} := (V^*)^*,上面的讨论表明 \langle -, \mathbf{x} \rangle \in V^{**}。
定义 V \to V^{**} 的映射 \boldsymbol{\varphi}:
则对任意 \mathbf{x}_1, \mathbf{x}_2 \in V, k \in \mathbb{F},有
即 \boldsymbol{\varphi} 是 V \to V^{**} 的线性映射。
互为对偶
再来计算 \boldsymbol{\varphi} 的核。若 \boldsymbol{\varphi}(\mathbf{x}) = \mathbf{0}(这里的 \mathbf{0} 是 V^{**} 中零向量),即,对任意 \mathbf{f} \in V^* 有 \langle \mathbf{f}, \mathbf{x} \rangle = 0,由性质 (2),必有 \mathbf{x} = \mathbf{0}。故 \ker \boldsymbol{\varphi} = \mathbf{0},所以 \boldsymbol{\varphi} 是单射。
现在进一步假设 V 是有限维的,则 \dim V = \dim V^* = \dim V^{**},从而 \boldsymbol{\varphi} 也是满射,故是双射。即 \boldsymbol{\varphi} 是 V \to V^{**} 的线性同构。在这个同构意义下把 V 和 V^{**} 等同起来,则 V 与 V^* 具有平等的地位:互为对偶。
定理:设 V 是数域 \mathbb{F} 上的 n 维线性空间,则 V^{**} \simeq V。
注:一个可供类比的说法:对区间 [0,1] 上的函数 f(x),我们以前经常说"f 在 x_0 点处的取值",现在我们也可以认为那是"x_0 在 f 处的取值"。
对偶映射
对偶映射的定义
下面考虑把线性映射诱导到对偶空间上去。
设 U, V 是数域 \mathbb{F} 上两个线性空间,U^*, V^* 分别是它们的对偶空间。
若 \mathscr{A} 是从 U 到 V 的线性映射,则对 V^* 中任意线性函数 \mathbf{f},\mathbf{f}\mathscr{A} 是 U 上线性函数。
定义 V^* \to U^* 的映射 \mathscr{A}^* 如下:
由于对任意 \mathbf{f}_1, \mathbf{f}_2 \in V^*, k \in \mathbb{F},按上式有
\mathscr{A}^* 还是线性映射。
定义:记号如上,我们称 \mathscr{A}^* 是线性映射 \mathscr{A} 的对偶映射。
对偶映射的性质
定理:设 U, V, W 分别是数域 \mathbb{F} 上线性空间。\mathscr{A}, \mathscr{B} 分别是 U \to V 和 V \to W 的线性映射,\mathscr{A}^*: V^* \to U^*, \mathscr{B}^*: W^* \to V^* 分别是 \mathscr{A}, \mathscr{B} 的对偶映射,则
- 对任意的 \mathbf{x} \in U 及任意的 \mathbf{f} \in V^*,总有
并且若 \widetilde{\mathscr{A}} 是 V^* \to U^* 的线性映射,对任意 \mathbf{x} \in U 及任意的 \mathbf{f} \in V^* 满足
则 \widetilde{\mathscr{A}} = \mathscr{A}^*;
- (\mathscr{B}\mathscr{A})^* = \mathscr{A}^*\mathscr{B}^*;
- 若 U = V,\rm I 表示 V 上恒等映射,则 \rm I^* 是 V^* 上恒等映射(通常仍记为 \rm I);
- \mathscr{A} 是单射当且仅当 \mathscr{A}^* 是满射;
- \mathscr{A} 是满射当且仅当 \mathscr{A}^* 是单射;
- \mathscr{A} 是同构当且仅当 \mathscr{A}^* 也是同构。
证明:
(1) 由 \langle -,- \rangle 及 \mathscr{A}^* 的定义,有
又若 \widetilde{\mathscr{A}} 使得等式成立,则对任意 \mathbf{x} \in U 及任意的 \mathbf{f} \in V^*,有
因此对任意 \mathbf{f} \in V^*,\widetilde{\mathscr{A}}(\mathbf{f}) = \mathscr{A}^*(\mathbf{f}) 成立,即 \widetilde{\mathscr{A}} = \mathscr{A}^*。
(2) 对任意 \mathbf{x} \in U, \mathbf{g} \in W^*,由性质 (1) 有
(3) 结论显然。
(4) \mathscr{A} 是单射的充要条件式存在 V \to U 的线性映射 \mathscr{C},使得 \mathscr{C}\mathscr{A} = \rm I,\rm I 是 U 上恒等映射。此时,\mathscr{A}^*\mathscr{C}^* = (\mathscr{C}\mathscr{A})^* = \text{\rm I}^*,此为 \mathscr{A}^* 是满射的充要条件。
(5) 与 (4) 同理。
(6) 由 (4), (5) 立得。
例题解析
列向量空间的对偶
例 1:设 V 是数域 \mathbb{F} 上 n 维列向量空间,V' 是数域 \mathbb{F} 上 n 维行向量空间。
对 X = (x_1, x_2, \cdots, x_n)^T \in V 与 Y = (y_1, y_2, \cdots, y_n) \in V',定义
则对固定的 Y,\langle Y, - \rangle 是 V 上线性函数。
反之,若 \mathbf{f} 是 V 上线性函数。取 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 为 V 的自然基(单位阵的列向量组),记 \mathbf{f}(\mathbf{e}_i) = a_i 并令 Y_0 = (a_1, a_2, \cdots, a_n) \in V'。则直接验证可知,对任意 X \in V,有
这说明我们可以把 V' 看作 V 的对偶空间。同理也可以把 V 看作 V' 的对偶空间。
显然 \mathbf{e}_1^T, \mathbf{e}_2^T, \cdots, \mathbf{e}_n^T(单位阵的行向量组)构成了 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 的对偶基。
矩阵诱导的对偶映射
例 2:设 U, V 分别是数域 \mathbb{F} 上 n 维和 m 维列向量空间。m \times n 矩阵 A 通过
的方式定义了 U \to V 的线性映射 \mathscr{A}。
由上例可知,U, V 的对偶空间分别是 n 维和 m 维行向量空间 U', V'。且 A 通过
的方式定义了 V' \to U' 的线性映射 \mathscr{A}^*。
又
而由性质 (1) 知 \mathscr{A}^* 恰为 \mathscr{A} 的对偶映射。
双线性型
双线性型的定义
上一节中,我们在两个线性空间 V^*, V 中定义了函数 \langle -,- \rangle,它可以看作一个"双变元"函数,其中一个变元在 V^* 内,另一个变元在 V 中。这个双变元函数关于每个变元都是线性的,即
这个性质称为双线性性,\langle -,- \rangle 称为 V^* 与 V 上的双线性函数。更一般地,我们有如下的
定义:设 U, V 是数域 \mathbb{F} 上两个线性空间,g 是 U \times V \to \mathbb{F} 的映射,若对任意 \mathbf{x}, \mathbf{y} \in U, \mathbf{z}, \mathbf{w} \in V, k, \ell \in \mathbb{F},有
则称 g 是 U 与 V 上双线性型或双线性函数。
有限维空间上双线性型的矩阵表示
定义:设 g 是 m 维空间 U 与 n 维空间 V 上双线性型。分别选取 U 的基 \mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m 与 V 的基 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n,则 m \times n 矩阵
称为 g(在基 \mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m 与 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n 下)的矩阵。
任取 \mathbf{u} = \sum_{i=1}^m x_i\mathbf{u}_i = (\mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m)X, \mathbf{v} = \sum_{j=1}^n y_j\mathbf{v}_j = (\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n)Y,则
不同基下矩阵的关系
反之,给定 U 的基 \mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m 与 V 的基 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n,则任意 m \times n 矩阵 A 通过
的方式确定一个双线性型,其中 X, Y 同上文一样,分别是 \mathbf{u}, \mathbf{v} 的坐标。
设 \mathbf{u}_1', \mathbf{u}_2', \cdots, \mathbf{u}_m' 是 U 的另一组基,基过渡矩阵为 P,再设 \mathbf{u} 在 \mathbf{u}_1', \mathbf{u}_2', \cdots, \mathbf{u}_m' 下的坐标 X_1,则有坐标变换公式 X = PX_1。同样地,设 \mathbf{v}_1', \mathbf{v}_2', \cdots, \mathbf{v}_n' 是 V 的另一组基,基过渡矩阵为 Q,再设 \mathbf{v} 在 \mathbf{v}_1', \mathbf{v}_2', \cdots, \mathbf{v}_n' 下的坐标 Y_1,则 Y = QY_1,于是,在新基下
即双线性型在不同基下的矩阵是相抵的。从而有
定理:设 g 是 m 维空间 U 与 n 维空间 V 上双线性型。则分别存在 U 的基 \mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m 与 V 的基 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n,使得 g 在这两组基下的矩阵为 \begin{pmatrix} E_r & O \\ O & O \end{pmatrix}。且 r 是由 g 唯一确定的,称为 g 的秩。
根子空间
定义:设 g 是 U 与 V 上双线性型。令
则 L 与 R 分别是 U 与 V 的子空间,分别称为 g 的左根子空间与右根子空间。
若 U 与 V 的维数分别为 m 与 n,g 的秩为 r,则由上页定理(采用相同记号)可知左根子空间恰由 \mathbf{u}_{r+1}, \cdots, \mathbf{u}_m 生成,右根子空间恰由 \mathbf{v}_{r+1}, \cdots, \mathbf{v}_n 生成,于是有
定义:若双线性型 g 的左、右根子空间都为零空间,则称其为非退化的。
定理:若 g 的秩为 r,则 g 非退化当且仅当 \dim U = \dim V = r。
推论:g 非退化的充要条件是 g 在 U 与 V 的任意两组基下的矩阵为可逆阵。
非退化双线性型
设 g 是 U 与 V 上非退化双线性型。固定 \mathbf{u},则 g(\mathbf{u}, -) 就是 V 上线性函数,作 U \to V^* 的映射
显然 \varphi 是一个线性映射。
由于 g 是非退化的,若 \varphi(\mathbf{u}) = \mathbf{0}---零函数,即对任意 \mathbf{v} 有 g(\mathbf{u}, \mathbf{v}) = 0,则必有 \mathbf{u} = \mathbf{0},从而 \ker\varphi = \mathbf{0},\varphi 是单射,再设 \dim U(=\dim V)有限,则 \varphi 是双射。
另一方面,\dim V^* = \dim V = \dim U,故 \varphi 是线性同构。若将 \mathbf{u} 与 g(\mathbf{u}, -) 等同起来,则 U 就成了 V 的对偶空间 V^*。这时有 \langle\varphi(\mathbf{u}), \mathbf{v}\rangle = g(\mathbf{u}, \mathbf{v})。
类似地,我们可以将 V 与 U^* 等同起来,即存在线性同构 \psi: V \to U^*,使 \langle\mathbf{u}, \psi(\mathbf{v})\rangle = g(\mathbf{u}, \mathbf{v}) 对任意 \mathbf{u} \in U, \mathbf{v} \in V 成立。
以上讨论说明非退化双线性型本质上就是对偶空间中的 \langle -,- \rangle。反之,\langle -,- \rangle 给出的双线性型显然是非退化的(为什么?)。
对偶映射的推广
定理:设 g_1, g_2 都是 U 与 V 上非退化双线性型。则分别存在 U 上可逆线性变换 \varphi 与 V 上可逆线性变换 \psi,使得
对任意 \mathbf{u} \in U, \mathbf{v} \in V 成立。
证明:
由上面的讨论知存在 U \to V^* 的线性同构 \varphi_1,使得
同理存在线性同构 \varphi_2,使得
令 \varphi = \varphi_2^{-1}\varphi_1,则 \varphi 是 U 上可逆映射,且
同理可证关于 \psi 的结论。
关于双线性型的对偶映射
定义:设 g_1, g_2 都是 U 与 V 上非退化双线性型,\varphi 是 V 上线性变换。若存在 U 上线性变换 \varphi^*,使得
对任意 \mathbf{u} \in U, \mathbf{v} \in V 成立,则称 \varphi^* 是 \varphi 关于 g_1, g_2 的对偶。
定理:设 g_1, g_2 都是 U 与 V 上非退化双线性型,\varphi 是 V 上线性变换,则 \varphi^* 存在且唯一。
证明:
存在性。由上文知,分别存在 U \to V^* 的线性同构 \varphi_1, \varphi_2,使得
取 \widetilde{\varphi} 为 \varphi 关于 \langle -,- \rangle 的对偶,即 \langle \widetilde{\varphi}(\mathbf{u}), \mathbf{v} \rangle = \langle \mathbf{u}, \varphi(\mathbf{v}) \rangle。
则 \varphi^* = \varphi_2^{-1}\widetilde{\varphi}\varphi_1 就是 \varphi 的对偶映射。事实上,
唯一性。设还有 U 上线性变换 \eta 满足
则
对任意 \mathbf{u} \in U, \mathbf{v} \in V 成立,进而
对任意 \mathbf{v} \in V 成立。由 g_2 是非退化的,
对任意 \mathbf{u} \in U 成立,即 \eta = \varphi^*。
纯量积
对称型与交错型
定义:设 g 是 V \times V 上双线性函数,则称 g 是 V 上的纯量积。进一步地,若还有
对任意 \mathbf{x}, \mathbf{y} \in V 成立,则称 g 是 V 上的对称型;而若还有
对任意 \mathbf{x}, \mathbf{y} \in V 成立,则称 g 是 V 上的交错型。
交错型又称为反对称型,一个等价的定义是对任意 \mathbf{x} \in V,必有 g(\mathbf{x}, \mathbf{x}) = 0。
事实上,由 g(\mathbf{x}, \mathbf{x}) = -g(\mathbf{x}, \mathbf{x}) 立得 g(\mathbf{x}, \mathbf{x}) = 0。
反之,由
可得另一个方向的等价性。
纯量积的矩阵表示
同一般双线性型一样,纯量积也可以用矩阵表示。当然,现在只涉及到一个线性空间 V,我们没有必要选两组基。
定义:设 g 是 n 维线性空间 V 上纯量积,\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 是 V 的一组基。则称
为 g(在基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 下)的矩阵。
任取 \mathbf{x} = \sum_{i=1}^n x_i\mathbf{e}_i = (\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n)X, \mathbf{y} = \sum_{j=1}^n y_i\mathbf{e}_j = (\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n)Y,则
设 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n 是 V 的另一组基,基过渡矩阵为 P,则 g 在基 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n 下的矩阵
注:有人也称上式为 A 合同于 B,注意这里没有对称性的要求。
垂直与正交
定义:设 g 是 V 上纯量积,若 g(\mathbf{x}, \mathbf{y}) = 0,则称 \mathbf{x}左垂直于\mathbf{y} 或 \mathbf{y}右垂直于\mathbf{x},记为 \mathbf{x} \perp \mathbf{y}。
当 g 为对称型或交错型时,\mathbf{x} \perp \mathbf{y} 与 \mathbf{y} \perp \mathbf{x} 等价,此时,称 \mathbf{x} 与 \mathbf{y}正交。反之,我们有
定理:设 g 是 V 上纯量积,若在 V 中 \mathbf{x} \perp \mathbf{y} 与 \mathbf{y} \perp \mathbf{x} 等价,则 g 必为对称型或交错型。
证明:
对 V 中任意向量 \mathbf{x}, \mathbf{y}, \mathbf{z},令
则
即 \mathbf{x} \perp \mathbf{w},故 \mathbf{w} \perp \mathbf{x},也就是
故对任意 \mathbf{x}, \mathbf{y}, \mathbf{z},有
取 \mathbf{x} = \mathbf{y},则上式进一步化为对 \mathbf{x}, \mathbf{z},有
若对所有 \mathbf{x}, \mathbf{z},已经有 g(\mathbf{z}, \mathbf{x}) = g(\mathbf{x}, \mathbf{z}),则 g 是对称型。
若有 \mathbf{x}_0, \mathbf{z}_0,使得 g(\mathbf{z}_0, \mathbf{x}_0) \neq g(\mathbf{x}_0, \mathbf{z}_0),则由 (2) 式,必有 g(\mathbf{x}_0, \mathbf{x}_0) = g(\mathbf{z}_0, \mathbf{z}_0) = 0。
现在用反证法证明 g 是交错型。设有 \mathbf{y}_0 使得 g(\mathbf{y}_0, \mathbf{y}_0) \neq 0,则由 (2) 式,必有 g(\mathbf{y}_0, \mathbf{x}_0) = g(\mathbf{x}_0, \mathbf{y}_0), g(\mathbf{y}_0, \mathbf{z}_0) = g(\mathbf{z}_0, \mathbf{y}_0)。而由 (1) 式,又有
即 g(\mathbf{y}_0, \mathbf{x}_0) = g(\mathbf{x}_0, \mathbf{y}_0) = 0,同理有 g(\mathbf{y}_0, \mathbf{z}_0) = g(\mathbf{z}_0, \mathbf{y}_0) = 0。于是,
但是,又由 (2) 式,g(\mathbf{z}_0, \mathbf{x}_0) = g(\mathbf{z}_0, \mathbf{x}_0 + \mathbf{y}_0) = g(\mathbf{x}_0 + \mathbf{y}_0, \mathbf{z}_0) = g(\mathbf{x}_0, \mathbf{z}_0),矛盾。
正交与内积空间的比较
设 g 是 V 上对称型或交错型,U 是 V 的子空间,记
特别地,取 U = V,则左根子空间等于右根子空间,称为根子空间。
定义:上式中的 U^\perp 称为 U 的正交补(空间)。
注:纯量积中正交的概念是内积空间中正交概念的推广,但二者并不完全一致。例如,在内积空间中,必有 U \cap U^\perp = \{\mathbf{0}\},而在纯量积中,即使是非退化情况,这也未必成立。
例:设 V 是二维实线性空间,\mathbf{e}_1, \mathbf{e}_2 是 V 的一组基,g 是矩阵 \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} 定义的纯量积,显然 g 是非退化对称型。令 \mathbf{u} = \mathbf{e}_1 + \mathbf{e}_2,则 g(\mathbf{u}, \mathbf{u}) = 0,即 \mathbf{u} \perp \mathbf{u}。若取 U 为 \mathbf{u} 的生成子空间,则 U \perp U。
非退化对称型中 U \cap U^\perp = \{0\} 的判别
定理:设 g 是 n 维空间 V 上非退化对称型,U 是 V 的子空间,则 U \cap U^\perp = \{\mathbf{0}\} 的充要条件是 g 限制在 U 上是 U 的一个非退化纯量积,此时,有直和分解:
证明:
首先证明
对任意 \mathbf{x} \in V,g(\mathbf{x}, -) 限制在 U 上是 U 上线性函数。作 V \to U^* 的映射 \varphi:
则 \varphi 是线性映射且 \ker \varphi = U^\perp。
另一方面,对任意 \mathbf{f} \in U^*,把 \mathbf{f} 线性扩张为 V 上线性函数,仍记为 \mathbf{f}。由 g 非退化,必有 \mathbf{x} \in V,使得 \mathbf{f} = g(\mathbf{x}, -),故 \varphi 是满射。于是
再由 \dim U = \dim U^* 就得到 (1) 式。
现在设 U \cap U^\perp = \{\mathbf{0}\},则由 (1) 式有 V = U \oplus U^\perp。
若 g 限制在 U 上退化,则存在 \mathbf{u} \neq \mathbf{0}, g(\mathbf{u}, U) = 0,且显然有 g(\mathbf{u}, U^\perp) = 0,于是 g(\mathbf{u}, V) = 0。这与 g 在 V 上非退化矛盾。必要性得证。
若 g 限制在 U 上非退化,则对任意 \mathbf{x} \in U \cap U^\perp,有 g(\mathbf{x}, U) = 0,即有 \mathbf{x} = \mathbf{0},从而 U \cap U^\perp = \{\mathbf{0}\}。充分性得证。
注:当 g 限制在 U 上非退化时,g 限制在 U^\perp 上也非退化。此时有 (U^\perp)^\perp = U。
纯量积与线性变换
定理:设 g 与 h 是 n 维空间 V 上两个非退化纯量积,则存在 V 上唯一可逆线性变换 \varphi,使得对任意 \mathbf{x}, \mathbf{y} \in V,有
证明:
取 V 的一组基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n。记 A = (h(\mathbf{e}_i, \mathbf{e}_j)), B = (g(\mathbf{e}_i, \mathbf{e}_j))。设 \mathbf{x}, \mathbf{y} 的坐标分别为 X, Y,则
只需要(且必须要,为什么?)取 \varphi 在基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 下的矩阵 C 使得 C^T = AB^{-1},此时,\varphi(\mathbf{x}) 的坐标为 CX,于是
交错型与辛空间
交错型的标准型
定理:设 g 是 n 维空间 V 上交错型,则存在 V 的一组基
使得 g 在这组基下的矩阵为分块对角矩阵
其中,共有 r 个 2 阶方阵 S = \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}。
证明:
不妨设 g \neq 0。这时必有 \mathbf{u}, \mathbf{v} 使得 g(\mathbf{u}, \mathbf{v}) = a \neq 0。取 \mathbf{u}_1 = a^{-1}\mathbf{u}, \mathbf{v}_1 = \mathbf{v},则 g(\mathbf{u}_1, \mathbf{v}_1) = -g(\mathbf{v}_1, \mathbf{u}_1) = 1。又 \mathbf{u}_1, \mathbf{v}_1 必线性无关,否则 g(\mathbf{u}_1, \mathbf{v}_1) = 0。
现在假设已经取定 \mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_j, \mathbf{v}_j 共 2j 个无关向量,满足
设 W 是 \mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_j, \mathbf{v}_j 的生成子空间,令
显然 g 限制在 W 上是非退化的。若 \mathbf{u} \in W \cap W^\perp,则 g(\mathbf{u}, W) = 0,由非退化可知 \mathbf{u} = \mathbf{0},故 W \cap W^\perp = \{0\}。
对任意 \mathbf{x} \in V,令
则
因此 \mathbf{y} \in W^\perp。于是,由
知,V = W \oplus W^\perp。
若 g 在 W^\perp 上限制为 \mathbf{0}(零函数),则 r = j 已经符合要求。
否则,可以在 W^\perp 中继续找到 \mathbf{u}_{j+1}, \mathbf{v}_{j+1},继续以上步骤,即可找到符合定理要求的基。
辛空间与辛基
由以上定理可知,反对称矩阵 A 的"合同"标准型为
其中 2r 是 A 的秩。
推论:
- 数域 \mathbb{F} 上反对称矩阵的秩必为偶数,行列式必为 \mathbb{F} 中某元素的平方。
- 数域 \mathbb{F} 上两个反对称矩阵"合同"当且仅当它们有相同的秩。
定义:设 V 是数域 \mathbb{F} 上有限维空间,若 V 上定义了一个非退化交错型 g,则称 V 是一个辛空间。此时,(由非退化)定理中的 \mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_r, \mathbf{v}_r 称为 V 的辛基。
辛基下 g 的形式非常简单。设
则
辛变换
定义:设 V 是辛空间(其交错型为 g),\varphi 是 V 上可逆线性变换,若对任意 \mathbf{x}, \mathbf{y} \in V,有
则称 \varphi 是 V 上辛变换。
性质:
- V 上线性变换 \varphi 是辛变换的充要条件是 \varphi 把辛基变为辛基;
- 两个辛变换之积仍然是辛变换;
- 恒等变换是辛变换;
- 辛变换的逆变换是辛变换。
证明:
(1) 由辛基下 g 的形式直接代入得到,(2),(3),(4) 是 (1) 的显然推论,细节留给同学们。
对称型与正交几何
对称型与二次型的关系
设 V 是 n 维线性空间,g 是 V 上对称型。取 V 的一组基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n,记 g 的矩阵为 A,显然 A 是对称阵。设 V 中向量 \mathbf{x}, \mathbf{y} 的坐标分别为 X, Y,则
我们得到一个 V 上二次型。
反之,给定对称矩阵 A 及二次型 f(\mathbf{x}) = X^TAX,则
给出 V 上一个对称型。
所以,对称型与二次型可以说是同一个结构的两种不同表述方式。
正交基
由二次型理论(配方法),我们知道任意对称阵必合同于对角阵。因此若 g 是对称型,必存在 V 的一组基,使得 g 的矩阵为对角阵。
定义:若 V 的一组基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 使得对称型 g 在其下的矩阵为对角阵,则称为正交基。
注:注意对称型的正交基比欧氏空间的正交基要求要弱得多。实际上,欧氏空间中的内积是一个正定对称型。若 V 上带有一个非退化的对称型,则 V 上的几何学称为正交几何学,它是欧氏几何的推广。
正交变换
定义:设 V_1, V_2 都是 n 维空间(其上分别有非退化对称型 g_1, g_2),\eta 是 V_1 \to V_2 的线性同构,若对任意 \mathbf{x}, \mathbf{y} \in V_1,有
则称 \eta 是 V_1 \to V_2 的保距同构。特别地,当 V_1 = V_2, g_1 = g_2 时,\eta 称为 (V_1, g_1) 上的一个正交变换。
性质:
- V 上两个正交变换之积仍然是正交变换;
- 恒等变换是正交变换;
- 正交变换的逆变换也是正交变换。
证明:证明是平凡的,代入定义直接验证即可。
镜像变换
对给定的 \mathbf{v} \in V 使得 g(\mathbf{v}, \mathbf{v}) \neq 0,构造映射
则
即,S_{\mathbf{v}} 是一个正交变换。
显然,S_{\mathbf{v}}(\mathbf{v}) = -\mathbf{v};而对 \mathbf{u} \perp \mathbf{v},有 S_{\mathbf{v}}(\mathbf{u}) = \mathbf{u},其映射效果正如镜子反射一样。
正交变换的分解
引理:若 \eta 是 V 上正交变换,则
证明:直接计算,
定理:设 V 是 n 维线性空间,g 是 V 上非退化对称型,\eta 是 V 上正交变换,则 \eta 可以表为不超过 n 个镜像变换之积。
证明:
对维数用归纳法。
当 n = 1 时,注意到必有 \eta(\mathbf{x}) = \pm \mathbf{x},结论显然成立。
现在假设结论对 n-1 维空间成立。由 g 非退化,必有 \mathbf{u} \in V 使得 g(\mathbf{u}, \mathbf{u}) \neq 0。令 \mathbf{v} = \eta(\mathbf{u}),则 g(\mathbf{v}, \mathbf{v}) = g(\mathbf{u}, \mathbf{u}) \neq 0。以下构造镜像变换 \rho,使得 \rho(\mathbf{u}) = \mathbf{v} 或 \rho(\mathbf{u}) = -\mathbf{v}。由于
不妨设 g(\mathbf{u} - \mathbf{v}, \mathbf{u} - \mathbf{v}) \neq 0(否则用 -\mathbf{v} 代替 \mathbf{v})。令 \mathbf{z} = \mathbf{u} - \mathbf{v}, \rho = S_{\mathbf{z}}。由于 g(\mathbf{v}, \mathbf{v}) = g(\mathbf{u}, \mathbf{u}),故 g(\mathbf{u} + \mathbf{v}, \mathbf{u} - \mathbf{v}) = g(\mathbf{u} + \mathbf{v}, \mathbf{z}) = 0,即 g(\mathbf{u}, \mathbf{z}) = -g(\mathbf{v}, \mathbf{z})。
进而,g(\mathbf{z}, \mathbf{z}) = g(\mathbf{u} - \mathbf{v}, \mathbf{u} - \mathbf{v}) = 2g(\mathbf{u}, \mathbf{z})。故
现在令 \xi = \rho^{-1}\eta,则 \xi 是正交变换,且 \xi(\mathbf{u}) = \mathbf{u}(或 \xi(\mathbf{u}) = -\mathbf{u}),由于对任意 \mathbf{x} \in \langle \mathbf{u} \rangle^\perp,有
\langle \mathbf{u} \rangle^\perp 是 \xi 的不变子空间。
显然,\xi 限制在 \langle \mathbf{u} \rangle^\perp 上还是正交变换。由归纳法假设,\xi 可表为 \langle \mathbf{u} \rangle^\perp 上不超过 n-1 个镜像变换之积。
用显然的方式把 \langle \mathbf{u} \rangle^\perp 上镜像变换扩张成 V 上镜像变换,则得到定理结论。
推论:n 维欧氏空间中任意正交矩阵可以表为不超过 n 个镜像矩阵之积。