对偶空间与双线性型

对偶空间与双线性型讲义

有限维内积空间上的线性函数

线性函数的定义

​V 是数域 ​\mathbb{F} 上的线性空间,把 ​\mathbb{F} 看作自身上的一维空间,则 ​V \to \mathbb{F} 的线性映射称为 ​V 上的线性函数线性泛函。即,若 ​f: V \to \mathbb{F} 是线性函数,则对任意 ​\boldsymbol{\alpha}, \boldsymbol{\beta} \in V, k \in \mathbb{F},有

f(\boldsymbol{\alpha} + \boldsymbol{\beta}) = f(\boldsymbol{\alpha}) + f(\boldsymbol{\beta}), \quad f(k\boldsymbol{\alpha}) = kf(\boldsymbol{\alpha}).

本章 ​\mathbb{F} 取实数域或复数域,​V 是内积空间,内积用 ​(-,-) 表示。对 ​V 中固定向量 ​v,显然

f(\mathbf{x}) = (\mathbf{x}, \mathbf{v})

是一个线性函数。反之,对有限维空间,下述定理说明任意线性函数也是这样的。

线性函数的表示定理

定理:设 ​V​n 维内积空间,​f​V 上线性函数,则必存在 ​V 中唯一向量 ​\mathbf{v},使得 ​f(\mathbf{x}) = (\mathbf{x}, \mathbf{v}) 式对一切 ​\mathbf{x} \in V 成立。

证明
​\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n​V 的一组标准正交基,令

\mathbf{v} = \overline{f(\varepsilon_1)}\varepsilon_1 + \overline{f(\varepsilon_2)}\varepsilon_2 + \cdots + \overline{f(\varepsilon_n)}\varepsilon_n.

则直接验证在基向量上的作用效果可知,​f(\mathbf{x}) = (\mathbf{x}, \mathbf{v})

若还有向量 ​\mathbf{u} 使得 ​f(\mathbf{x}) = (\mathbf{x}, \mathbf{u}),取 ​\mathbf{x} = \mathbf{u} - \mathbf{v}​\mathbf{u} = \mathbf{v}

伴随算子

伴随算子的存在唯一性

定理:设 ​V​n 维内积空间,​\varphi​V 上线性变换,则唯一存在 ​V 上线性变换 ​\varphi^*,使得对一切 ​\mathbf{u}, \mathbf{v} \in V,有

(\varphi(\mathbf{u}), \mathbf{v}) = (\mathbf{u}, \varphi^*(\mathbf{v})).

习惯上称内积空间上的线性变换为线性算子,简称算子

定义:设 ​\varphi 是内积空间 ​V 上线性算子,若存在算子 ​\varphi^* 满足上式,则称 ​\varphi^*​\varphi伴随算子,简称为 ​\varphi伴随

证明
对任意给定的 ​\mathbf{v} \in V,直接验证可知

\mathbf{u} \to (\varphi(\mathbf{u}), \mathbf{v})

​V 上线性函数,由上页定理,唯一存在向量 ​\mathbf{v}' 使得

(\varphi(\mathbf{u}), \mathbf{v}) = (\mathbf{u}, \mathbf{v}').

定义映射 ​\varphi^*(\mathbf{v}) = \mathbf{v}'

还需证明 ​\varphi^* 是线性的,对任意 ​\mathbf{v}_1, \mathbf{v}_2 \in V, k \in \mathbb{F},记 ​\varphi^*(\mathbf{v}_1) = \mathbf{v}'_1, \varphi^*(\mathbf{v}_2) = \mathbf{v}'_2,则对任意 ​\mathbf{u} \in V,有

\begin{aligned} (\varphi(\mathbf{u}), k\mathbf{v}_1 + \mathbf{v}_2) &= (\varphi(\mathbf{u}), k\mathbf{v}_1) + (\varphi(\mathbf{u}), \mathbf{v}_2) \\ &= \overline{k}(\varphi(\mathbf{u}), \mathbf{v}_1) + (\varphi(\mathbf{u}), \mathbf{v}_2) = \overline{k}(\mathbf{u}, \mathbf{v}'_1) + (\mathbf{u}, \mathbf{v}'_2) \\ &= (\mathbf{u}, k\mathbf{v}'_1) + (\mathbf{u}, \mathbf{v}'_2) = (\mathbf{u}, k\mathbf{v}'_1 + \mathbf{v}'_2). \end{aligned}

​\varphi^*(k\mathbf{v}_1 + \mathbf{v}_2) = k\varphi^*(\mathbf{v}_1) + \varphi^*(\mathbf{v}_2)​\varphi^* 是线性映射。

若还有线性变换 ​\psi 满足,对一切 ​\mathbf{u}, \mathbf{v} \in V,有

(\varphi(\mathbf{u}), \mathbf{v}) = (\mathbf{u}, \psi(\mathbf{v})).

​(\mathbf{u}, \varphi^*(\mathbf{v})) = (\mathbf{u}, \psi(\mathbf{v})) 对一切 ​\mathbf{u}, \mathbf{v} \in V 成立,从而 ​\varphi^*(\mathbf{v}) = \psi(\mathbf{v}) 对一切 ​\mathbf{v} \in V 成立,即 ​\varphi^* = \psi,既得唯一性。

伴随算子的矩阵表示

定理:设 ​\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n​n 维内积空间 ​V 的一组标准正交基。若 ​V 上线性算子 ​\varphi 在该基下的矩阵为 ​A = (a_{ij}),则 ​\varphi^* 在同一组基下的矩阵为 ​\overline{A^T}

证明
由表示矩阵的定义,有

\varphi(\varepsilon_i) = a_{1i}\varepsilon_1 + a_{2i}\varepsilon_2 + \cdots + a_{ni}\varepsilon_n.

(\varphi(\varepsilon_i), \varepsilon_j) = a_{ji}.

​(\varphi(\varepsilon_i), \varepsilon_j) = (\varepsilon_i, \varphi^*(\varepsilon_j)),设

\varphi^*(\varepsilon_j) = b_{1j}\varepsilon_1 + b_{2j}\varepsilon_2 + \cdots + b_{nj}\varepsilon_n,

(\varepsilon_i, \varphi^*(\varepsilon_j)) = \overline{b_{ij}}.

从而 ​a_{ji} = \overline{b_{ij}}。同样由表示矩阵的定义即得所证。

伴随算子的基本性质

定理:设 ​\varphi, \psi 是有限维内积空间 ​V 上的线性算子,​k 为常数,则

  • ​(\varphi + \psi)^* = \varphi^* + \psi^*
  • ​(k\varphi)^* = \overline{k}\varphi^*
  • ​(\varphi\psi)^* = \psi^*\varphi^*
  • ​(\varphi^*)^* = \varphi

:对方阵 ​A,有时也称 ​\overline{A^T}​A 的伴随矩阵,记为 ​A^*,我们以前用的伴随矩阵称为古典伴随。

自伴算子

自伴算子的定义

定义:设 ​\varphi 是有限维内积空间 ​V 上的线性算子,​\varphi^*​\varphi 的伴随。若 ​\varphi^* = \varphi,则称 ​\varphi自伴算子。在 ​V 是欧氏空间时,又称为对称算子;在 ​V 是酉空间时,又称为Hermite 算子

利用自伴算子的语言,我们可以重新证明 Hermite 矩阵(实对称矩阵)酉(正交)相似于对角阵。由于只是语言的转化,我们只列出结果,证明请同学们自行完成。

定理

  1. ​\varphi​n 维内积空间 ​V 上的自伴算子。则 ​\varphi 的特征值都是实数,且对应于不同特征值的特征向量互相正交。
  2. ​\varphi​n 维内积空间 ​V 上的自伴算子,​U​\varphi 的不变子空间。则 ​U 的正交补 ​U^\perp 也是 ​\varphi 的不变子空间。
  3. ​\varphi​n 维内积空间 ​V 上的自伴算子。则存在 ​V 的一组标准正交基,使得 ​\varphi 在该基下的矩阵是对角阵。

对偶空间与对偶基

对偶空间的定义

定义:设 ​V 是数域 ​\mathbb{F} 上的线性空间,记 ​V 上线性函数(​V \to \mathbb{F} 的线性映射)所成集合为 ​V^*。按照通常映射的加法和数乘 ​V^* 也构成 ​\mathbb{F} 上线性空间,称为 ​V共轭空间,当 ​V 是有限维空间时,常称 ​V^*​V对偶空间

对偶基的存在性

定理:设 ​V 是数域 ​\mathbb{F} 上的 ​n 维线性空间,​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n​V 的一组基,则

\mathbf{f}_i(\mathbf{e}_j) = \delta_{ij} = \begin{cases} 1, & i=j \\ 0, & i \neq j \end{cases}, \quad i,j=1,2,\cdots,n,

构成了 ​V^* 的一组基。

定义:(​V^* 的)基 ​\mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 称为(​V 的基) ​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n对偶基

推论:设 ​V 是数域 ​\mathbb{F} 上的有限维线性空间,则 ​\dim V = \dim V^*

:对无限维空间,可以证明(需要用到分析的知识)该推论不成立。

证明
由于线性空间 ​V 上的映射由它在 ​V 的基上的作用唯一确定,诸 ​\mathbf{f}_i 确实是线性函数。

设有线性组合使得

k_1\mathbf{f}_1 + k_2\mathbf{f}_2 + \cdots + k_n\mathbf{f}_n = \mathbf{0},

将上式依次作用在 ​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 上即知

k_1 = k_2 = \cdots = k_n = 0.

所以 ​\mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n​V^* 中无关向量组。

对任意 ​\mathbf{f} \in V^*,设 ​\mathbf{f}(\mathbf{e}_i) = a_i,则对 ​V 中任意向量

\mathbf{x} = x_1\mathbf{e}_1 + x_2\mathbf{e}_2 + \cdots + x_n\mathbf{e}_n,

\begin{aligned} \mathbf{f}(\mathbf{x}) &= x_1\mathbf{f}(\mathbf{e}_1) + x_2\mathbf{f}(\mathbf{e}_2) + \cdots + x_n\mathbf{f}(\mathbf{e}_n) \\ &= x_1a_1 + x_2a_2 + \cdots + x_na_n \\ &= a_1\mathbf{f}_1(\mathbf{x}) + a_2\mathbf{f}_2(\mathbf{x}) + \cdots + a_n\mathbf{f}_n(\mathbf{x}) \\ &= (a_1\mathbf{f}_1 + a_2\mathbf{f}_2 + \cdots + a_n\mathbf{f}_n)(\mathbf{x}). \end{aligned}

​\mathbf{x} 的任意性,​\mathbf{f} = a_1\mathbf{f}_1 + a_2\mathbf{f}_2 + \cdots + a_n\mathbf{f}_n,即 ​\mathbf{f} 可以由 ​\mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 线性表示。

综上,​\mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 构成了 ​V^* 的一组基。

对偶空间的对称性记号

记号 ​\langle -,- \rangle

为了更好的理解 ​V​V^* 的对称性,引入记号 ​\langle -,- \rangle

\langle \mathbf{f}, \mathbf{x} \rangle = \mathbf{f}(\mathbf{x}), \quad \forall \mathbf{f} \in V^*, \mathbf{x} \in V.

记号 ​\langle -,- \rangle 的简单性质:

  1. ​\langle \mathbf{f}, \mathbf{x} \rangle = 0 对任意 ​\mathbf{x} \in V 成立当且仅当 ​\mathbf{f} = \mathbf{0}
  2. ​\langle \mathbf{f}, \mathbf{x} \rangle = 0 对任意 ​\mathbf{f} \in V^* 成立当且仅当 ​\mathbf{x} = \mathbf{0}

证明
(1) 显然,只需证明 (2)。充分性也是显然的。下面证明必要性的逆否命题。

​\mathbf{x} \neq \mathbf{0},以其为第一个向量扩充成 ​V 的一组基 ​\mathbf{x} = \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n,则对对偶基的第一个向量 ​\mathbf{f}_1,有 ​\mathbf{f}_1(\mathbf{e}_1) = 1

对偶之对偶 ​V^{**}

固定 ​\mathbf{f} \in V^*,则 ​\langle \mathbf{f}, - \rangle 就是 ​V 上线性函数。同样地,固定 ​\mathbf{x} \in V,则 ​\langle -, \mathbf{x} \rangle 可以看作 ​V^* 上线性函数。实际上,对任意 ​\mathbf{f}_1, \mathbf{f}_2 \in V^*, k \in \mathbb{F},有

\langle k\mathbf{f}_1 + \mathbf{f}_2, \mathbf{x} \rangle = k\langle \mathbf{f}_1, \mathbf{x} \rangle + \langle \mathbf{f}_2, \mathbf{x} \rangle.

从而 ​\langle -, \mathbf{x} \rangle​V^* 上线性函数。

​V^* 作为 ​\mathbb{F} 上线性空间,也有共轭空间 ​V^{**} := (V^*)^*,上面的讨论表明 ​\langle -, \mathbf{x} \rangle \in V^{**}

定义 ​V \to V^{**} 的映射 ​\boldsymbol{\varphi}

\boldsymbol{\varphi}(\mathbf{x}) = \langle -, \mathbf{x} \rangle, \quad \forall \mathbf{x} \in V.

则对任意 ​\mathbf{x}_1, \mathbf{x}_2 \in V, k \in \mathbb{F},有

\boldsymbol{\varphi}(k\mathbf{x}_1 + \mathbf{x}_2) = \langle -, k\mathbf{x}_1 + \mathbf{x}_2 \rangle = k\langle -, \mathbf{x}_1 \rangle + \langle -, \mathbf{x}_2 \rangle.

​\boldsymbol{\varphi}​V \to V^{**} 的线性映射。

互为对偶

再来计算 ​\boldsymbol{\varphi} 的核。若 ​\boldsymbol{\varphi}(\mathbf{x}) = \mathbf{0}(这里的 ​\mathbf{0}​V^{**} 中零向量),即,对任意 ​\mathbf{f} \in V^*​\langle \mathbf{f}, \mathbf{x} \rangle = 0,由性质 (2),必有 ​\mathbf{x} = \mathbf{0}。故 ​\ker \boldsymbol{\varphi} = \mathbf{0},所以 ​\boldsymbol{\varphi} 是单射。

现在进一步假设 ​V 是有限维的,则 ​\dim V = \dim V^* = \dim V^{**},从而 ​\boldsymbol{\varphi} 也是满射,故是双射。即 ​\boldsymbol{\varphi}​V \to V^{**} 的线性同构。在这个同构意义下把 ​V​V^{**} 等同起来,则 ​V​V^* 具有平等的地位:互为对偶。

定理:设 ​V 是数域 ​\mathbb{F} 上的 ​n 维线性空间,则 ​V^{**} \simeq V

:一个可供类比的说法:对区间 ​[0,1] 上的函数 ​f(x),我们以前经常说"​f​x_0 点处的取值",现在我们也可以认为那是"​x_0​f 处的取值"。

对偶映射

对偶映射的定义

下面考虑把线性映射诱导到对偶空间上去。

​U, V 是数域 ​\mathbb{F} 上两个线性空间,​U^*, V^* 分别是它们的对偶空间。

​\mathscr{A} 是从 ​U​V 的线性映射,则对 ​V^* 中任意线性函数 ​\mathbf{f}​\mathbf{f}\mathscr{A}​U 上线性函数。

定义 ​V^* \to U^* 的映射 ​\mathscr{A}^* 如下:

\mathscr{A}^*(\mathbf{f}) = \mathbf{f}\mathscr{A}, \quad \forall \mathbf{f} \in V^*.

由于对任意 ​\mathbf{f}_1, \mathbf{f}_2 \in V^*, k \in \mathbb{F},按上式有

\mathscr{A}^*(k\mathbf{f}_1 + \mathbf{f}_2) = (k\mathbf{f}_1 + \mathbf{f}_2)\mathscr{A} = k\mathbf{f}_1\mathscr{A} + \mathbf{f}_2\mathscr{A} = k\mathscr{A}^*(\mathbf{f}_1) + \mathscr{A}^*(\mathbf{f}_2),

​\mathscr{A}^* 还是线性映射。

定义:记号如上,我们称 ​\mathscr{A}^* 是线性映射 ​\mathscr{A}对偶映射

对偶映射的性质

定理:设 ​U, V, W 分别是数域 ​\mathbb{F} 上线性空间。​\mathscr{A}, \mathscr{B} 分别是 ​U \to V​V \to W 的线性映射,​\mathscr{A}^*: V^* \to U^*, \mathscr{B}^*: W^* \to V^* 分别是 ​\mathscr{A}, \mathscr{B} 的对偶映射,则

  1. 对任意的 ​\mathbf{x} \in U 及任意的 ​\mathbf{f} \in V^*,总有
\langle \mathscr{A}^*(\mathbf{f}), \mathbf{x} \rangle = \langle \mathbf{f}, \mathscr{A}(\mathbf{x}) \rangle,

并且若 ​\widetilde{\mathscr{A}}​V^* \to U^* 的线性映射,对任意 ​\mathbf{x} \in U 及任意的 ​\mathbf{f} \in V^* 满足

\langle \widetilde{\mathscr{A}}(\mathbf{f}), \mathbf{x} \rangle = \langle \mathbf{f}, \mathscr{A}(\mathbf{x}) \rangle,

​\widetilde{\mathscr{A}} = \mathscr{A}^*

  1. ​(\mathscr{B}\mathscr{A})^* = \mathscr{A}^*\mathscr{B}^*
  2. ​U = V​\rm I 表示 ​V 上恒等映射,则 ​\rm I^*​V^* 上恒等映射(通常仍记为 ​\rm I);
  3. ​\mathscr{A} 是单射当且仅当 ​\mathscr{A}^* 是满射;
  4. ​\mathscr{A} 是满射当且仅当 ​\mathscr{A}^* 是单射;
  5. ​\mathscr{A} 是同构当且仅当 ​\mathscr{A}^* 也是同构。

证明
(1) 由 ​\langle -,- \rangle​\mathscr{A}^* 的定义,有

\langle \mathscr{A}^*(\mathbf{f}), \mathbf{x} \rangle = \mathscr{A}^*(\mathbf{f})(\mathbf{x}) = (\mathbf{f}\mathscr{A})(\mathbf{x}) = \mathbf{f}(\mathscr{A}\mathbf{x}) = \langle \mathbf{f}, \mathscr{A}(\mathbf{x}) \rangle.

又若 ​\widetilde{\mathscr{A}} 使得等式成立,则对任意 ​\mathbf{x} \in U 及任意的 ​\mathbf{f} \in V^*,有

\widetilde{\mathscr{A}}(\mathbf{f})(\mathbf{x}) = \langle \widetilde{\mathscr{A}}(\mathbf{f}), \mathbf{x} \rangle = \langle \mathbf{f}, \mathscr{A}(\mathbf{x}) \rangle = \langle \mathscr{A}^*(\mathbf{f}), \mathbf{x} \rangle = \mathscr{A}^*(\mathbf{f})(\mathbf{x}),

因此对任意 ​\mathbf{f} \in V^*​\widetilde{\mathscr{A}}(\mathbf{f}) = \mathscr{A}^*(\mathbf{f}) 成立,即 ​\widetilde{\mathscr{A}} = \mathscr{A}^*

(2) 对任意 ​\mathbf{x} \in U, \mathbf{g} \in W^*,由性质 (1) 有

\begin{aligned} \langle (\mathscr{B}\mathscr{A})^*(\mathbf{g}), \mathbf{x} \rangle &= \langle \mathbf{g}, (\mathscr{B}\mathscr{A})(\mathbf{x}) \rangle \\ &= \langle \mathbf{g}, \mathscr{B}\mathscr{A}(\mathbf{x}) \rangle = \langle \mathscr{B}^*(\mathbf{g}), \mathscr{A}(\mathbf{x}) \rangle \\ &= \langle \mathscr{A}^*(\mathscr{B}^*(\mathbf{g})), \mathbf{x} \rangle = \langle (\mathscr{A}^*\mathscr{B}^*)(\mathbf{g}), \mathbf{x} \rangle. \end{aligned}

(3) 结论显然。

(4) ​\mathscr{A} 是单射的充要条件式存在 ​V \to U 的线性映射 ​\mathscr{C},使得 ​\mathscr{C}\mathscr{A} = \rm I​\rm I​U 上恒等映射。此时,​\mathscr{A}^*\mathscr{C}^* = (\mathscr{C}\mathscr{A})^* = \text{\rm I}^*,此为 ​\mathscr{A}^* 是满射的充要条件。

(5) 与 (4) 同理。

(6) 由 (4), (5) 立得。

例题解析

列向量空间的对偶

例 1:设 ​V 是数域 ​\mathbb{F}​n 维列向量空间,​V' 是数域 ​\mathbb{F}​n 维行向量空间。

​X = (x_1, x_2, \cdots, x_n)^T \in V​Y = (y_1, y_2, \cdots, y_n) \in V',定义

\langle Y, X \rangle = x_1y_1 + x_2y_2 + \cdots + x_ny_n = YX.

则对固定的 ​Y​\langle Y, - \rangle​V 上线性函数。

反之,若 ​\mathbf{f}​V 上线性函数。取 ​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n​V 的自然基(单位阵的列向量组),记 ​\mathbf{f}(\mathbf{e}_i) = a_i 并令 ​Y_0 = (a_1, a_2, \cdots, a_n) \in V'。则直接验证可知,对任意 ​X \in V,有

\mathbf{f}(X) = \langle Y_0, X \rangle.

这说明我们可以把 ​V' 看作 ​V 的对偶空间。同理也可以把 ​V 看作 ​V' 的对偶空间。

显然 ​\mathbf{e}_1^T, \mathbf{e}_2^T, \cdots, \mathbf{e}_n^T(单位阵的行向量组)构成了 ​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 的对偶基。

矩阵诱导的对偶映射

例 2:设 ​U, V 分别是数域 ​\mathbb{F}​n 维和 ​m 维列向量空间。​m \times n 矩阵 ​A 通过

\mathscr{A}(X) = AX, \quad \forall X \in U,

的方式定义了 ​U \to V 的线性映射 ​\mathscr{A}

由上例可知,​U, V 的对偶空间分别是 ​n 维和 ​m 维行向量空间 ​U', V'。且 ​A 通过

\mathscr{A}^*(Y) = YA, \quad \forall Y \in V',

的方式定义了 ​V' \to U' 的线性映射 ​\mathscr{A}^*

\langle YA, X \rangle = (YA)X = Y(AX) = \langle Y, AX \rangle,

而由性质 (1) 知 ​\mathscr{A}^* 恰为 ​\mathscr{A} 的对偶映射。

双线性型

双线性型的定义

上一节中,我们在两个线性空间 ​V^*, V 中定义了函数 ​\langle -,- \rangle,它可以看作一个"双变元"函数,其中一个变元在 ​V^* 内,另一个变元在 ​V 中。这个双变元函数关于每个变元都是线性的,即

\begin{aligned} \langle k\mathbf{f}_1 + \mathbf{f}_2, \mathbf{x} \rangle &= k\langle \mathbf{f}_1, \mathbf{x} \rangle + \langle \mathbf{f}_2, \mathbf{x} \rangle, \\ \langle \mathbf{f}, \ell\mathbf{x}_1 + \mathbf{x}_2 \rangle &= \ell\langle \mathbf{f}, \mathbf{x}_1 \rangle + \langle \mathbf{f}, \mathbf{x}_2 \rangle. \end{aligned}

这个性质称为双线性性,​\langle -,- \rangle 称为 ​V^*​V 上的双线性函数。更一般地,我们有如下的

定义:设 ​U, V 是数域 ​\mathbb{F} 上两个线性空间,​g​U \times V \to \mathbb{F} 的映射,若对任意 ​\mathbf{x}, \mathbf{y} \in U, \mathbf{z}, \mathbf{w} \in V, k, \ell \in \mathbb{F},有

\begin{aligned} g(k\mathbf{x} + \mathbf{y}, \mathbf{z}) &= kg(\mathbf{x}, \mathbf{z}) + g(\mathbf{y}, \mathbf{z}), \\ g(\mathbf{x}, \ell\mathbf{z} + \mathbf{w}) &= \ell g(\mathbf{x}, \mathbf{z}) + g(\mathbf{x}, \mathbf{w}), \end{aligned}

则称 ​g​U​V双线性型双线性函数

有限维空间上双线性型的矩阵表示

定义:设 ​g​m 维空间 ​U​n 维空间 ​V 上双线性型。分别选取 ​U 的基 ​\mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m​V 的基 ​\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n,则 ​m \times n 矩阵

A = \begin{pmatrix} g(\mathbf{u}_1, \mathbf{v}_1) & g(\mathbf{u}_1, \mathbf{v}_2) & \cdots & g(\mathbf{u}_1, \mathbf{v}_n) \\ g(\mathbf{u}_2, \mathbf{v}_1) & g(\mathbf{u}_2, \mathbf{v}_2) & \cdots & g(\mathbf{u}_2, \mathbf{v}_n) \\ \vdots & \vdots & \ddots & \vdots \\ g(\mathbf{u}_m, \mathbf{v}_1) & g(\mathbf{u}_m, \mathbf{v}_2) & \cdots & g(\mathbf{u}_m, \mathbf{v}_n) \end{pmatrix}

称为 ​g(在基 ​\mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m​\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n 下)的矩阵。

任取 ​\mathbf{u} = \sum_{i=1}^m x_i\mathbf{u}_i = (\mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m)X, \mathbf{v} = \sum_{j=1}^n y_j\mathbf{v}_j = (\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n)Y,则

g(\mathbf{u}, \mathbf{v}) = X^TAY.

不同基下矩阵的关系

反之,给定 ​U 的基 ​\mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m​V 的基 ​\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n,则任意 ​m \times n 矩阵 ​A 通过

g(\mathbf{u}, \mathbf{v}) = X^TAY

的方式确定一个双线性型,其中 ​X, Y 同上文一样,分别是 ​\mathbf{u}, \mathbf{v} 的坐标。

​\mathbf{u}_1', \mathbf{u}_2', \cdots, \mathbf{u}_m'​U 的另一组基,基过渡矩阵为 ​P,再设 ​\mathbf{u}​\mathbf{u}_1', \mathbf{u}_2', \cdots, \mathbf{u}_m' 下的坐标 ​X_1,则有坐标变换公式 ​X = PX_1。同样地,设 ​\mathbf{v}_1', \mathbf{v}_2', \cdots, \mathbf{v}_n'​V 的另一组基,基过渡矩阵为 ​Q,再设 ​\mathbf{v}​\mathbf{v}_1', \mathbf{v}_2', \cdots, \mathbf{v}_n' 下的坐标 ​Y_1,则 ​Y = QY_1,于是,在新基下

g(\mathbf{u}, \mathbf{v}) = X_1^TP^TAQY_1,

即双线性型在不同基下的矩阵是相抵的。从而有

定理:设 ​g​m 维空间 ​U​n 维空间 ​V 上双线性型。则分别存在 ​U 的基 ​\mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m​V 的基 ​\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n,使得 ​g 在这两组基下的矩阵为 ​\begin{pmatrix} E_r & O \\ O & O \end{pmatrix}。且 ​r 是由 ​g 唯一确定的,称为 ​g

根子空间

定义:设 ​g​U​V 上双线性型。令

\begin{aligned} L &= \{\mathbf{u} \mid g(\mathbf{u}, \mathbf{v}) = 0, \forall \mathbf{v} \in V\}, \\ R &= \{\mathbf{v} \mid g(\mathbf{u}, \mathbf{v}) = 0, \forall \mathbf{u} \in U\}, \end{aligned}

​L​R 分别是 ​U​V 的子空间,分别称为 ​g左根子空间右根子空间

​U​V 的维数分别为 ​m​n​g 的秩为 ​r,则由上页定理(采用相同记号)可知左根子空间恰由 ​\mathbf{u}_{r+1}, \cdots, \mathbf{u}_m 生成,右根子空间恰由 ​\mathbf{v}_{r+1}, \cdots, \mathbf{v}_n 生成,于是有

\dim L = m - r, \quad \dim R = n - r.

定义:若双线性型 ​g 的左、右根子空间都为零空间,则称其为非退化的。

定理:若 ​g 的秩为 ​r,则 ​g 非退化当且仅当 ​\dim U = \dim V = r

推论​g 非退化的充要条件是 ​g​U​V 的任意两组基下的矩阵为可逆阵。

非退化双线性型

​g​U​V 上非退化双线性型。固定 ​\mathbf{u},则 ​g(\mathbf{u}, -) 就是 ​V 上线性函数,作 ​U \to V^* 的映射

\varphi(\mathbf{u}) = g(\mathbf{u}, -),

显然 ​\varphi 是一个线性映射。

由于 ​g 是非退化的,若 ​\varphi(\mathbf{u}) = \mathbf{0}---零函数,即对任意 ​\mathbf{v}​g(\mathbf{u}, \mathbf{v}) = 0,则必有 ​\mathbf{u} = \mathbf{0},从而 ​\ker\varphi = \mathbf{0}​\varphi 是单射,再设 ​\dim U​=\dim V)有限,则 ​\varphi 是双射。

另一方面,​\dim V^* = \dim V = \dim U,故 ​\varphi 是线性同构。若将 ​\mathbf{u}​g(\mathbf{u}, -) 等同起来,则 ​U 就成了 ​V 的对偶空间 ​V^*。这时有 ​\langle\varphi(\mathbf{u}), \mathbf{v}\rangle = g(\mathbf{u}, \mathbf{v})

类似地,我们可以将 ​V​U^* 等同起来,即存在线性同构 ​\psi: V \to U^*,使 ​\langle\mathbf{u}, \psi(\mathbf{v})\rangle = g(\mathbf{u}, \mathbf{v}) 对任意 ​\mathbf{u} \in U, \mathbf{v} \in V 成立。

以上讨论说明非退化双线性型本质上就是对偶空间中的 ​\langle -,- \rangle。反之,​\langle -,- \rangle 给出的双线性型显然是非退化的(为什么?)。

对偶映射的推广

定理:设 ​g_1, g_2 都是 ​U​V 上非退化双线性型。则分别存在 ​U 上可逆线性变换 ​\varphi​V 上可逆线性变换 ​\psi,使得

g_2(\varphi(\mathbf{u}), \mathbf{v}) = g_1(\mathbf{u}, \mathbf{v}), \quad g_2(\mathbf{u}, \psi(\mathbf{v})) = g_1(\mathbf{u}, \mathbf{v})

对任意 ​\mathbf{u} \in U, \mathbf{v} \in V 成立。

证明
由上面的讨论知存在 ​U \to V^* 的线性同构 ​\varphi_1,使得

\langle \varphi_1(\mathbf{u}), \mathbf{v} \rangle = g_1(\mathbf{u}, \mathbf{v}).

同理存在线性同构 ​\varphi_2,使得

\langle \varphi_2(\mathbf{u}), \mathbf{v} \rangle = g_2(\mathbf{u}, \mathbf{v}).

​\varphi = \varphi_2^{-1}\varphi_1,则 ​\varphi​U 上可逆映射,且

g_2(\varphi(\mathbf{u}), \mathbf{v}) = \langle \varphi_2\varphi(\mathbf{u}), \mathbf{v} \rangle = \langle \varphi_1(\mathbf{u}), \mathbf{v} \rangle = g_1(\mathbf{u}, \mathbf{v}).

同理可证关于 ​\psi 的结论。

关于双线性型的对偶映射

定义:设 ​g_1, g_2 都是 ​U​V 上非退化双线性型,​\varphi​V 上线性变换。若存在 ​U 上线性变换 ​\varphi^*,使得

g_2(\varphi^*(\mathbf{u}), \mathbf{v}) = g_1(\mathbf{u}, \varphi(\mathbf{v}))

对任意 ​\mathbf{u} \in U, \mathbf{v} \in V 成立,则称 ​\varphi^*​\varphi 关于 ​g_1, g_2 的对偶。

定理:设 ​g_1, g_2 都是 ​U​V 上非退化双线性型,​\varphi​V 上线性变换,则 ​\varphi^* 存在且唯一。

证明
存在性。由上文知,分别存在 ​U \to V^* 的线性同构 ​\varphi_1, \varphi_2,使得

\langle \varphi_1(\mathbf{u}), \mathbf{v} \rangle = g_1(\mathbf{u}, \mathbf{v}), \quad \langle \varphi_2(\mathbf{u}), \mathbf{v} \rangle = g_2(\mathbf{u}, \mathbf{v}).

​\widetilde{\varphi}​\varphi 关于 ​\langle -,- \rangle 的对偶,即 ​\langle \widetilde{\varphi}(\mathbf{u}), \mathbf{v} \rangle = \langle \mathbf{u}, \varphi(\mathbf{v}) \rangle

​\varphi^* = \varphi_2^{-1}\widetilde{\varphi}\varphi_1 就是 ​\varphi 的对偶映射。事实上,

g_2(\varphi^*(\mathbf{u}), \mathbf{v}) = \langle \varphi_2\varphi^*(\mathbf{u}), \mathbf{v} \rangle = \langle \widetilde{\varphi}\varphi_1(\mathbf{u}), \mathbf{v} \rangle = \langle \varphi_1(\mathbf{u}), \varphi(\mathbf{v}) \rangle = g_1(\mathbf{u}, \varphi(\mathbf{v})).

唯一性。设还有 ​U 上线性变换 ​\eta 满足

g_2(\eta(\mathbf{u}), \mathbf{v}) = g_1(\mathbf{u}, \varphi(\mathbf{v})).

g_2(\eta(\mathbf{u}), \mathbf{v}) = g_2(\varphi^*(\mathbf{u}), \mathbf{v})

对任意 ​\mathbf{u} \in U, \mathbf{v} \in V 成立,进而

g_2(\eta(\mathbf{u}) - \varphi^*(\mathbf{u}), \mathbf{v}) = 0

对任意 ​\mathbf{v} \in V 成立。由 ​g_2 是非退化的,

\eta(\mathbf{u}) = \varphi^*(\mathbf{u})

对任意 ​\mathbf{u} \in U 成立,即 ​\eta = \varphi^*

纯量积

对称型与交错型

定义:设 ​g​V \times V 上双线性函数,则称 ​g​V 上的纯量积。进一步地,若还有

g(\mathbf{x}, \mathbf{y}) = g(\mathbf{y}, \mathbf{x})

对任意 ​\mathbf{x}, \mathbf{y} \in V 成立,则称 ​g​V 上的对称型;而若还有

g(\mathbf{x}, \mathbf{y}) = -g(\mathbf{y}, \mathbf{x})

对任意 ​\mathbf{x}, \mathbf{y} \in V 成立,则称 ​g​V 上的交错型

交错型又称为反对称型,一个等价的定义是对任意 ​\mathbf{x} \in V,必有 ​g(\mathbf{x}, \mathbf{x}) = 0

事实上,由 ​g(\mathbf{x}, \mathbf{x}) = -g(\mathbf{x}, \mathbf{x}) 立得 ​g(\mathbf{x}, \mathbf{x}) = 0

反之,由

g(\mathbf{x} + \mathbf{y}, \mathbf{x} + \mathbf{y}) = g(\mathbf{x}, \mathbf{x}) + g(\mathbf{y}, \mathbf{y}) + g(\mathbf{x}, \mathbf{y}) + g(\mathbf{y}, \mathbf{x}),

可得另一个方向的等价性。

纯量积的矩阵表示

同一般双线性型一样,纯量积也可以用矩阵表示。当然,现在只涉及到一个线性空间 ​V,我们没有必要选两组基。

定义:设 ​g​n 维线性空间 ​V 上纯量积,​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n​V 的一组基。则称

A = (g(\mathbf{e}_i, \mathbf{e}_j))

​g(在基 ​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 下)的矩阵。

任取 ​\mathbf{x} = \sum_{i=1}^n x_i\mathbf{e}_i = (\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n)X, \mathbf{y} = \sum_{j=1}^n y_i\mathbf{e}_j = (\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n)Y,则

g(\mathbf{x}, \mathbf{y}) = X^TAY.

​\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n​V 的另一组基,基过渡矩阵为 ​P,则 ​g 在基 ​\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n 下的矩阵

B = P^TAP.

:有人也称上式为 ​A 合同于 ​B,注意这里没有对称性的要求。

垂直与正交

定义:设 ​g​V 上纯量积,若 ​g(\mathbf{x}, \mathbf{y}) = 0,则称 ​\mathbf{x}左垂直于​\mathbf{y}​\mathbf{y}右垂直于​\mathbf{x},记为 ​\mathbf{x} \perp \mathbf{y}

​g 为对称型或交错型时,​\mathbf{x} \perp \mathbf{y}​\mathbf{y} \perp \mathbf{x} 等价,此时,称 ​\mathbf{x}​\mathbf{y}正交。反之,我们有

定理:设 ​g​V 上纯量积,若在 ​V​\mathbf{x} \perp \mathbf{y}​\mathbf{y} \perp \mathbf{x} 等价,则 ​g 必为对称型或交错型。

证明
​V 中任意向量 ​\mathbf{x}, \mathbf{y}, \mathbf{z},令

\mathbf{w} = g(\mathbf{x}, \mathbf{y})\mathbf{z} - g(\mathbf{x}, \mathbf{z})\mathbf{y},

g(\mathbf{x}, \mathbf{w}) = g(\mathbf{x}, g(\mathbf{x}, \mathbf{y})\mathbf{z} - g(\mathbf{x}, \mathbf{z})\mathbf{y}) = g(\mathbf{x}, \mathbf{y})g(\mathbf{x}, \mathbf{z}) - g(\mathbf{x}, \mathbf{z})g(\mathbf{x}, \mathbf{y}) = 0.

​\mathbf{x} \perp \mathbf{w},故 ​\mathbf{w} \perp \mathbf{x},也就是

g(\mathbf{w}, \mathbf{x}) = g(\mathbf{x}, \mathbf{y})g(\mathbf{z}, \mathbf{x}) - g(\mathbf{x}, \mathbf{z})g(\mathbf{y}, \mathbf{x}) = 0.

故对任意 ​\mathbf{x}, \mathbf{y}, \mathbf{z},有

g(\mathbf{x}, \mathbf{y})g(\mathbf{z}, \mathbf{x}) = g(\mathbf{y}, \mathbf{x})g(\mathbf{x}, \mathbf{z}) \quad (1)

​\mathbf{x} = \mathbf{y},则上式进一步化为对 ​\mathbf{x}, \mathbf{z},有

g(\mathbf{x}, \mathbf{x})(g(\mathbf{z}, \mathbf{x}) - g(\mathbf{x}, \mathbf{z})) = 0 \quad (2)

若对所有 ​\mathbf{x}, \mathbf{z},已经有 ​g(\mathbf{z}, \mathbf{x}) = g(\mathbf{x}, \mathbf{z}),则 ​g 是对称型。

若有 ​\mathbf{x}_0, \mathbf{z}_0,使得 ​g(\mathbf{z}_0, \mathbf{x}_0) \neq g(\mathbf{x}_0, \mathbf{z}_0),则由 (2) 式,必有 ​g(\mathbf{x}_0, \mathbf{x}_0) = g(\mathbf{z}_0, \mathbf{z}_0) = 0

现在用反证法证明 ​g 是交错型。设有 ​\mathbf{y}_0 使得 ​g(\mathbf{y}_0, \mathbf{y}_0) \neq 0,则由 (2) 式,必有 ​g(\mathbf{y}_0, \mathbf{x}_0) = g(\mathbf{x}_0, \mathbf{y}_0), g(\mathbf{y}_0, \mathbf{z}_0) = g(\mathbf{z}_0, \mathbf{y}_0)。而由 (1) 式,又有

g(\mathbf{x}_0, \mathbf{y}_0)g(\mathbf{z}_0, \mathbf{x}_0) = g(\mathbf{y}_0, \mathbf{x}_0)g(\mathbf{x}_0, \mathbf{z}_0).

​g(\mathbf{y}_0, \mathbf{x}_0) = g(\mathbf{x}_0, \mathbf{y}_0) = 0,同理有 ​g(\mathbf{y}_0, \mathbf{z}_0) = g(\mathbf{z}_0, \mathbf{y}_0) = 0。于是,

g(\mathbf{x}_0 + \mathbf{y}_0, \mathbf{x}_0 + \mathbf{y}_0) = g(\mathbf{x}_0, \mathbf{y}_0) + g(\mathbf{y}_0, \mathbf{x}_0) + g(\mathbf{y}_0, \mathbf{y}_0) = g(\mathbf{y}_0, \mathbf{y}_0) \neq 0.

但是,又由 (2) 式,​g(\mathbf{z}_0, \mathbf{x}_0) = g(\mathbf{z}_0, \mathbf{x}_0 + \mathbf{y}_0) = g(\mathbf{x}_0 + \mathbf{y}_0, \mathbf{z}_0) = g(\mathbf{x}_0, \mathbf{z}_0),矛盾。

正交与内积空间的比较

​g​V 上对称型或交错型,​U​V 的子空间,记

U^\perp = \{\mathbf{x} \in V \mid g(\mathbf{x}, \mathbf{y}) = 0, \forall \mathbf{y} \in U\}.

特别地,取 ​U = V,则左根子空间等于右根子空间,称为根子空间。

定义:上式中的 ​U^\perp 称为 ​U 的正交补(空间)。

:纯量积中正交的概念是内积空间中正交概念的推广,但二者并不完全一致。例如,在内积空间中,必有 ​U \cap U^\perp = \{\mathbf{0}\},而在纯量积中,即使是非退化情况,这也未必成立。

:设 ​V 是二维实线性空间,​\mathbf{e}_1, \mathbf{e}_2​V 的一组基,​g 是矩阵 ​\begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} 定义的纯量积,显然 ​g 是非退化对称型。令 ​\mathbf{u} = \mathbf{e}_1 + \mathbf{e}_2,则 ​g(\mathbf{u}, \mathbf{u}) = 0,即 ​\mathbf{u} \perp \mathbf{u}。若取 ​U​\mathbf{u} 的生成子空间,则 ​U \perp U

非退化对称型中 ​U \cap U^\perp = \{0\} 的判别

定理:设 ​g​n 维空间 ​V 上非退化对称型,​U​V 的子空间,则 ​U \cap U^\perp = \{\mathbf{0}\} 的充要条件是 ​g 限制在 ​U 上是 ​U 的一个非退化纯量积,此时,有直和分解:

V = U \oplus U^\perp.

证明
首先证明

\dim U^\perp = n - \dim U \quad (1)

对任意 ​\mathbf{x} \in V​g(\mathbf{x}, -) 限制在 ​U 上是 ​U 上线性函数。作 ​V \to U^* 的映射 ​\varphi

\varphi(\mathbf{x}) = g(\mathbf{x}, -),

​\varphi 是线性映射且 ​\ker \varphi = U^\perp

另一方面,对任意 ​\mathbf{f} \in U^*,把 ​\mathbf{f} 线性扩张为 ​V 上线性函数,仍记为 ​\mathbf{f}。由 ​g 非退化,必有 ​\mathbf{x} \in V,使得 ​\mathbf{f} = g(\mathbf{x}, -),故 ​\varphi 是满射。于是

\dim U^\perp + \dim U^* = n.

再由 ​\dim U = \dim U^* 就得到 (1) 式。

现在设 ​U \cap U^\perp = \{\mathbf{0}\},则由 (1) 式有 ​V = U \oplus U^\perp

​g 限制在 ​U 上退化,则存在 ​\mathbf{u} \neq \mathbf{0}, g(\mathbf{u}, U) = 0,且显然有 ​g(\mathbf{u}, U^\perp) = 0,于是 ​g(\mathbf{u}, V) = 0。这与 ​g​V 上非退化矛盾。必要性得证。

​g 限制在 ​U 上非退化,则对任意 ​\mathbf{x} \in U \cap U^\perp,有 ​g(\mathbf{x}, U) = 0,即有 ​\mathbf{x} = \mathbf{0},从而 ​U \cap U^\perp = \{\mathbf{0}\}。充分性得证。

:当 ​g 限制在 ​U 上非退化时,​g 限制在 ​U^\perp 上也非退化。此时有 ​(U^\perp)^\perp = U

纯量积与线性变换

定理:设 ​g​h​n 维空间 ​V 上两个非退化纯量积,则存在 ​V 上唯一可逆线性变换 ​\varphi,使得对任意 ​\mathbf{x}, \mathbf{y} \in V,有

h(\mathbf{x}, \mathbf{y}) = g(\varphi(\mathbf{x}), \mathbf{y}).

证明
​V 的一组基 ​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n。记 ​A = (h(\mathbf{e}_i, \mathbf{e}_j)), B = (g(\mathbf{e}_i, \mathbf{e}_j))。设 ​\mathbf{x}, \mathbf{y} 的坐标分别为 ​X, Y,则

h(\mathbf{x}, \mathbf{y}) = X^TAY, \quad g(\mathbf{x}, \mathbf{y}) = X^TBY.

只需要(且必须要,为什么?)取 ​\varphi 在基 ​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 下的矩阵 ​C 使得 ​C^T = AB^{-1},此时,​\varphi(\mathbf{x}) 的坐标为 ​CX,于是

g(\varphi(\mathbf{x}), \mathbf{y}) = X^TC^TBY = X^TAY = h(\mathbf{x}, \mathbf{y}).

交错型与辛空间

交错型的标准型

定理:设 ​g​n 维空间 ​V 上交错型,则存在 ​V 的一组基

\mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_r, \mathbf{v}_r, \mathbf{w}_{2r+1}, \cdots, \mathbf{w}_n,

使得 ​g 在这组基下的矩阵为分块对角矩阵

\text{diag}\{S, \cdots, S; 0, \cdots, 0\},

其中,共有 ​r 个 2 阶方阵 ​S = \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}

证明
不妨设 ​g \neq 0。这时必有 ​\mathbf{u}, \mathbf{v} 使得 ​g(\mathbf{u}, \mathbf{v}) = a \neq 0。取 ​\mathbf{u}_1 = a^{-1}\mathbf{u}, \mathbf{v}_1 = \mathbf{v},则 ​g(\mathbf{u}_1, \mathbf{v}_1) = -g(\mathbf{v}_1, \mathbf{u}_1) = 1。又 ​\mathbf{u}_1, \mathbf{v}_1 必线性无关,否则 ​g(\mathbf{u}_1, \mathbf{v}_1) = 0

现在假设已经取定 ​\mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_j, \mathbf{v}_j​2j 个无关向量,满足

\begin{aligned} g(\mathbf{u}_i, \mathbf{v}_i) &= -g(\mathbf{v}_i, \mathbf{u}_i) = 1, \quad i = 1,2,\cdots,j; \\ g(\mathbf{u}_i, \mathbf{y}) &= 0, \quad \mathbf{y} \neq \mathbf{v}_i, \mathbf{y} \in \{\mathbf{u}_k\} \cup \{\mathbf{v}_k\}, k = 1,2,\cdots,j; \\ g(\mathbf{x}, \mathbf{v}_i) &= 0, \quad \mathbf{x} \neq \mathbf{u}_i, \mathbf{x} \in \{\mathbf{u}_k\} \cup \{\mathbf{v}_k\}, k = 1,2,\cdots,j. \end{aligned}

​W​\mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_j, \mathbf{v}_j 的生成子空间,令

W^\perp = \{\mathbf{v} \mid g(\mathbf{v}, W) = 0\},

显然 ​g 限制在 ​W 上是非退化的。若 ​\mathbf{u} \in W \cap W^\perp,则 ​g(\mathbf{u}, W) = 0,由非退化可知 ​\mathbf{u} = \mathbf{0},故 ​W \cap W^\perp = \{0\}

对任意 ​\mathbf{x} \in V,令

\mathbf{y} = \mathbf{x} - \sum_{i=1}^j g(\mathbf{x}, \mathbf{v}_i)\mathbf{u}_i + \sum_{i=1}^j g(\mathbf{x}, \mathbf{u}_i)\mathbf{v}_i,

\begin{aligned} g(\mathbf{y}, \mathbf{u}_k) &= g(\mathbf{x}, \mathbf{u}_k) + g(\mathbf{x}, \mathbf{u}_k)g(\mathbf{v}_k, \mathbf{u}_k) = 0, \\ g(\mathbf{y}, \mathbf{v}_k) &= g(\mathbf{x}, \mathbf{v}_k) - g(\mathbf{x}, \mathbf{v}_k)g(\mathbf{u}_k, \mathbf{v}_k) = 0. \end{aligned}

因此 ​\mathbf{y} \in W^\perp。于是,由

\mathbf{x} = \mathbf{y} + \sum_{i=1}^j g(\mathbf{x}, \mathbf{v}_i)\mathbf{u}_i - \sum_{i=1}^j g(\mathbf{x}, \mathbf{u}_i)\mathbf{v}_i,

知,​V = W \oplus W^\perp

​g​W^\perp 上限制为 ​\mathbf{0}(零函数),则 ​r = j 已经符合要求。

否则,可以在 ​W^\perp 中继续找到 ​\mathbf{u}_{j+1}, \mathbf{v}_{j+1},继续以上步骤,即可找到符合定理要求的基。

辛空间与辛基

由以上定理可知,反对称矩阵 ​A 的"合同"标准型为

\text{diag}\{S, \cdots, S; 0, \cdots, 0\},

其中 ​2r​A 的秩。

推论

  1. 数域 ​\mathbb{F} 上反对称矩阵的秩必为偶数,行列式必为 ​\mathbb{F} 中某元素的平方。
  2. 数域 ​\mathbb{F} 上两个反对称矩阵"合同"当且仅当它们有相同的秩。

定义:设 ​V 是数域 ​\mathbb{F} 上有限维空间,若 ​V 上定义了一个非退化交错型 ​g,则称 ​V 是一个辛空间。此时,(由非退化)定理中的 ​\mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_r, \mathbf{v}_r 称为 ​V辛基

辛基下 ​g 的形式非常简单。设

\begin{aligned} \mathbf{x} &= a_1\mathbf{u}_1 + b_1\mathbf{v}_1 + \cdots + a_r\mathbf{u}_r + b_r\mathbf{v}_r, \\ \mathbf{y} &= c_1\mathbf{u}_1 + d_1\mathbf{v}_1 + \cdots + c_r\mathbf{u}_r + d_r\mathbf{v}_r, \end{aligned}

g(\mathbf{x}, \mathbf{y}) = a_1d_1 - b_1c_1 + \cdots + a_rd_r - b_rc_r.

辛变换

定义:设 ​V 是辛空间(其交错型为 ​g),​\varphi​V 上可逆线性变换,若对任意 ​\mathbf{x}, \mathbf{y} \in V,有

g(\varphi(\mathbf{x}), \varphi(\mathbf{y})) = g(\mathbf{x}, \mathbf{y}),

则称 ​\varphi​V辛变换

性质

  1. ​V 上线性变换 ​\varphi 是辛变换的充要条件是 ​\varphi 把辛基变为辛基;
  2. 两个辛变换之积仍然是辛变换;
  3. 恒等变换是辛变换;
  4. 辛变换的逆变换是辛变换。

证明
(1) 由辛基下 ​g 的形式直接代入得到,(2),(3),(4) 是 (1) 的显然推论,细节留给同学们。

对称型与正交几何

对称型与二次型的关系

​V​n 维线性空间,​g​V 上对称型。取 ​V 的一组基 ​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n,记 ​g 的矩阵为 ​A,显然 ​A 是对称阵。设 ​V 中向量 ​\mathbf{x}, \mathbf{y} 的坐标分别为 ​X, Y,则

g(\mathbf{x}, \mathbf{x}) = X^TAX,

我们得到一个 ​V 上二次型。

反之,给定对称矩阵 ​A 及二次型 ​f(\mathbf{x}) = X^TAX,则

\begin{aligned} g(\mathbf{x}, \mathbf{y}) &= \frac{1}{2}[f(\mathbf{x} + \mathbf{y}) - f(\mathbf{x}) - f(\mathbf{y})] \\ &= \frac{1}{2}[(X+Y)^TA(X+Y) - X^TAX - Y^TAY] \\ &= X^TAY. \end{aligned}

给出 ​V 上一个对称型。

所以,对称型与二次型可以说是同一个结构的两种不同表述方式。

正交基

由二次型理论(配方法),我们知道任意对称阵必合同于对角阵。因此若 ​g 是对称型,必存在 ​V 的一组基,使得 ​g 的矩阵为对角阵。

定义:若 ​V 的一组基 ​\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 使得对称型 ​g 在其下的矩阵为对角阵,则称为正交基

:注意对称型的正交基比欧氏空间的正交基要求要弱得多。实际上,欧氏空间中的内积是一个正定对称型。若 ​V 上带有一个非退化的对称型,则 ​V 上的几何学称为正交几何学,它是欧氏几何的推广。

正交变换

定义:设 ​V_1, V_2 都是 ​n 维空间(其上分别有非退化对称型 ​g_1, g_2),​\eta​V_1 \to V_2 的线性同构,若对任意 ​\mathbf{x}, \mathbf{y} \in V_1,有

g_2(\eta(\mathbf{x}), \eta(\mathbf{y})) = g_1(\mathbf{x}, \mathbf{y}),

则称 ​\eta​V_1 \to V_2保距同构。特别地,当 ​V_1 = V_2, g_1 = g_2 时,​\eta 称为 ​(V_1, g_1) 上的一个正交变换

性质

  1. ​V 上两个正交变换之积仍然是正交变换;
  2. 恒等变换是正交变换;
  3. 正交变换的逆变换也是正交变换。

证明:证明是平凡的,代入定义直接验证即可。

镜像变换

对给定的 ​\mathbf{v} \in V 使得 ​g(\mathbf{v}, \mathbf{v}) \neq 0,构造映射

S_{\mathbf{v}}(\mathbf{x}) = \mathbf{x} - \frac{2g(\mathbf{x}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}\mathbf{v},

\begin{aligned} g(S_{\mathbf{v}}(\mathbf{x}), S_{\mathbf{v}}(\mathbf{y})) &= g\left(\mathbf{x} - \frac{2g(\mathbf{x}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}\mathbf{v}, \mathbf{y} - \frac{2g(\mathbf{y}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}\mathbf{v}\right) \\ &= g(\mathbf{x}, \mathbf{y}) - \frac{2g(\mathbf{y}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}g(\mathbf{x}, \mathbf{v}) \\ &\quad - \frac{2g(\mathbf{x}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}g(\mathbf{y}, \mathbf{v}) + \frac{4g(\mathbf{x}, \mathbf{v})g(\mathbf{y}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})^2}g(\mathbf{v}, \mathbf{v}) \\ &= g(\mathbf{x}, \mathbf{y}). \end{aligned}

即,​S_{\mathbf{v}} 是一个正交变换。

显然,​S_{\mathbf{v}}(\mathbf{v}) = -\mathbf{v};而对 ​\mathbf{u} \perp \mathbf{v},有 ​S_{\mathbf{v}}(\mathbf{u}) = \mathbf{u},其映射效果正如镜子反射一样。

正交变换的分解

引理:若 ​\eta​V 上正交变换,则

\eta S_{\mathbf{v}} \eta^{-1} = S_{\eta(\mathbf{v})}.

证明:直接计算,

\begin{aligned} \eta S_{\mathbf{v}} \eta^{-1}(\mathbf{x}) &= \eta\left[\eta^{-1}(\mathbf{x}) - \frac{2g(\eta^{-1}(\mathbf{x}), \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}\mathbf{v}\right] \\ &= \eta\left[\eta^{-1}(\mathbf{x}) - \frac{2g(\eta\eta^{-1}(\mathbf{x}), \eta(\mathbf{v}))}{g(\mathbf{v}, \mathbf{v})}\mathbf{v}\right] \\ &= \mathbf{x} - \frac{2g(\mathbf{x}, \eta(\mathbf{v}))}{g(\eta(\mathbf{v}), \eta(\mathbf{v}))}\eta(\mathbf{v}) = S_{\eta(\mathbf{v})}(\mathbf{x}). \end{aligned}

定理:设 ​V​n 维线性空间,​g​V 上非退化对称型,​\eta​V 上正交变换,则 ​\eta 可以表为不超过 ​n 个镜像变换之积。

证明
对维数用归纳法。

​n = 1 时,注意到必有 ​\eta(\mathbf{x}) = \pm \mathbf{x},结论显然成立。

现在假设结论对 ​n-1 维空间成立。由 ​g 非退化,必有 ​\mathbf{u} \in V 使得 ​g(\mathbf{u}, \mathbf{u}) \neq 0。令 ​\mathbf{v} = \eta(\mathbf{u}),则 ​g(\mathbf{v}, \mathbf{v}) = g(\mathbf{u}, \mathbf{u}) \neq 0。以下构造镜像变换 ​\rho,使得 ​\rho(\mathbf{u}) = \mathbf{v}​\rho(\mathbf{u}) = -\mathbf{v}。由于

g(\mathbf{u} + \mathbf{v}, \mathbf{u} + \mathbf{v}) + g(\mathbf{u} - \mathbf{v}, \mathbf{u} - \mathbf{v}) = 4g(\mathbf{u}, \mathbf{u}) \neq 0,

不妨设 ​g(\mathbf{u} - \mathbf{v}, \mathbf{u} - \mathbf{v}) \neq 0(否则用 ​-\mathbf{v} 代替 ​\mathbf{v})。令 ​\mathbf{z} = \mathbf{u} - \mathbf{v}, \rho = S_{\mathbf{z}}。由于 ​g(\mathbf{v}, \mathbf{v}) = g(\mathbf{u}, \mathbf{u}),故 ​g(\mathbf{u} + \mathbf{v}, \mathbf{u} - \mathbf{v}) = g(\mathbf{u} + \mathbf{v}, \mathbf{z}) = 0,即 ​g(\mathbf{u}, \mathbf{z}) = -g(\mathbf{v}, \mathbf{z})

进而,​g(\mathbf{z}, \mathbf{z}) = g(\mathbf{u} - \mathbf{v}, \mathbf{u} - \mathbf{v}) = 2g(\mathbf{u}, \mathbf{z})。故

\rho(\mathbf{u}) = S_{\mathbf{z}}(\mathbf{u}) = \mathbf{u} - \frac{2g(\mathbf{u}, \mathbf{z})}{g(\mathbf{z}, \mathbf{z})}\mathbf{z} = \mathbf{v}.

现在令 ​\xi = \rho^{-1}\eta,则 ​\xi 是正交变换,且 ​\xi(\mathbf{u}) = \mathbf{u}(或 ​\xi(\mathbf{u}) = -\mathbf{u}),由于对任意 ​\mathbf{x} \in \langle \mathbf{u} \rangle^\perp,有

g(\xi(\mathbf{x}), \mathbf{u}) = \pm g(\xi(\mathbf{x}), \xi(\mathbf{u})) = g(\mathbf{x}, \mathbf{u}) = 0,

​\langle \mathbf{u} \rangle^\perp​\xi 的不变子空间。

显然,​\xi 限制在 ​\langle \mathbf{u} \rangle^\perp 上还是正交变换。由归纳法假设,​\xi 可表为 ​\langle \mathbf{u} \rangle^\perp 上不超过 ​n-1 个镜像变换之积。

用显然的方式把 ​\langle \mathbf{u} \rangle^\perp 上镜像变换扩张成 ​V 上镜像变换,则得到定理结论。

推论​n 维欧氏空间中任意正交矩阵可以表为不超过 ​n 个镜像矩阵之积。


对偶空间与双线性型
https://www.fengyuchen.top/archives/1772533127406
作者
Oasis
发布于
2026年03月03日
许可协议