对偶空间与双线性型

对偶空间与双线性型讲义

有限维内积空间上的线性函数

线性函数的定义

设 V 是数域 \mathbb{F} 上的线性空间，把 \mathbb{F} 看作自身上的一维空间，则 V \to \mathbb{F} 的线性映射称为 V 上的线性函数或线性泛函。即，若 f: V \to \mathbb{F} 是线性函数，则对任意 \boldsymbol{\alpha}, \boldsymbol{\beta} \in V, k \in \mathbb{F}，有

f(\boldsymbol{\alpha} + \boldsymbol{\beta}) = f(\boldsymbol{\alpha}) + f(\boldsymbol{\beta}), \quad f(k\boldsymbol{\alpha}) = kf(\boldsymbol{\alpha}).

本章 \mathbb{F} 取实数域或复数域，V 是内积空间，内积用 (-,-) 表示。对 V 中固定向量 v，显然

f(\mathbf{x}) = (\mathbf{x}, \mathbf{v})

是一个线性函数。反之，对有限维空间，下述定理说明任意线性函数也是这样的。

线性函数的表示定理

定理：设 V 是 n 维内积空间，f 是 V 上线性函数，则必存在 V 中唯一向量 \mathbf{v}，使得 f(\mathbf{x}) = (\mathbf{x}, \mathbf{v}) 式对一切 \mathbf{x} \in V 成立。

证明：
设 \varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n 是 V 的一组标准正交基，令

\mathbf{v} = \overline{f(\varepsilon_1)}\varepsilon_1 + \overline{f(\varepsilon_2)}\varepsilon_2 + \cdots + \overline{f(\varepsilon_n)}\varepsilon_n.

则直接验证在基向量上的作用效果可知，f(\mathbf{x}) = (\mathbf{x}, \mathbf{v})。

若还有向量 \mathbf{u} 使得 f(\mathbf{x}) = (\mathbf{x}, \mathbf{u})，取 \mathbf{x} = \mathbf{u} - \mathbf{v} 知 \mathbf{u} = \mathbf{v}。

伴随算子

伴随算子的存在唯一性

定理：设 V 是 n 维内积空间，\varphi 是 V 上线性变换，则唯一存在 V 上线性变换 \varphi^*，使得对一切 \mathbf{u}, \mathbf{v} \in V，有

(\varphi(\mathbf{u}), \mathbf{v}) = (\mathbf{u}, \varphi^*(\mathbf{v})).

习惯上称内积空间上的线性变换为线性算子，简称算子。

定义：设 \varphi 是内积空间 V 上线性算子，若存在算子 \varphi^* 满足上式，则称 \varphi^* 为 \varphi 的伴随算子，简称为 \varphi 的伴随。

证明：
对任意给定的 \mathbf{v} \in V，直接验证可知

\mathbf{u} \to (\varphi(\mathbf{u}), \mathbf{v})

是 V 上线性函数，由上页定理，唯一存在向量 \mathbf{v}' 使得

(\varphi(\mathbf{u}), \mathbf{v}) = (\mathbf{u}, \mathbf{v}').

定义映射 \varphi^*(\mathbf{v}) = \mathbf{v}'。

还需证明 \varphi^* 是线性的，对任意 \mathbf{v}_1, \mathbf{v}_2 \in V, k \in \mathbb{F}，记 \varphi^*(\mathbf{v}_1) = \mathbf{v}'_1, \varphi^*(\mathbf{v}_2) = \mathbf{v}'_2，则对任意 \mathbf{u} \in V，有

\begin{aligned} (\varphi(\mathbf{u}), k\mathbf{v}_1 + \mathbf{v}_2) &= (\varphi(\mathbf{u}), k\mathbf{v}_1) + (\varphi(\mathbf{u}), \mathbf{v}_2) \\ &= \overline{k}(\varphi(\mathbf{u}), \mathbf{v}_1) + (\varphi(\mathbf{u}), \mathbf{v}_2) = \overline{k}(\mathbf{u}, \mathbf{v}'_1) + (\mathbf{u}, \mathbf{v}'_2) \\ &= (\mathbf{u}, k\mathbf{v}'_1) + (\mathbf{u}, \mathbf{v}'_2) = (\mathbf{u}, k\mathbf{v}'_1 + \mathbf{v}'_2). \end{aligned}

即 \varphi^*(k\mathbf{v}_1 + \mathbf{v}_2) = k\varphi^*(\mathbf{v}_1) + \varphi^*(\mathbf{v}_2)，\varphi^* 是线性映射。

若还有线性变换 \psi 满足，对一切 \mathbf{u}, \mathbf{v} \in V，有

(\varphi(\mathbf{u}), \mathbf{v}) = (\mathbf{u}, \psi(\mathbf{v})).

则 (\mathbf{u}, \varphi^*(\mathbf{v})) = (\mathbf{u}, \psi(\mathbf{v})) 对一切 \mathbf{u}, \mathbf{v} \in V 成立，从而 \varphi^*(\mathbf{v}) = \psi(\mathbf{v}) 对一切 \mathbf{v} \in V 成立，即 \varphi^* = \psi，既得唯一性。

伴随算子的矩阵表示

定理：设 \varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n 是 n 维内积空间 V 的一组标准正交基。若 V 上线性算子 \varphi 在该基下的矩阵为 A = (a_{ij})，则 \varphi^* 在同一组基下的矩阵为 \overline{A^T}。

证明：
由表示矩阵的定义，有

\varphi(\varepsilon_i) = a_{1i}\varepsilon_1 + a_{2i}\varepsilon_2 + \cdots + a_{ni}\varepsilon_n.

故

(\varphi(\varepsilon_i), \varepsilon_j) = a_{ji}.

但 (\varphi(\varepsilon_i), \varepsilon_j) = (\varepsilon_i, \varphi^*(\varepsilon_j))，设

\varphi^*(\varepsilon_j) = b_{1j}\varepsilon_1 + b_{2j}\varepsilon_2 + \cdots + b_{nj}\varepsilon_n,

则

(\varepsilon_i, \varphi^*(\varepsilon_j)) = \overline{b_{ij}}.

从而 a_{ji} = \overline{b_{ij}}。同样由表示矩阵的定义即得所证。

伴随算子的基本性质

定理：设 \varphi, \psi 是有限维内积空间 V 上的线性算子，k 为常数，则

(\varphi + \psi)^* = \varphi^* + \psi^*
(k\varphi)^* = \overline{k}\varphi^*
(\varphi\psi)^* = \psi^*\varphi^*
(\varphi^*)^* = \varphi

注：对方阵 A，有时也称 \overline{A^T} 为 A 的伴随矩阵，记为 A^*，我们以前用的伴随矩阵称为古典伴随。

自伴算子

自伴算子的定义

定义：设 \varphi 是有限维内积空间 V 上的线性算子，\varphi^* 是 \varphi 的伴随。若 \varphi^* = \varphi，则称 \varphi 是自伴算子。在 V 是欧氏空间时，又称为对称算子；在 V 是酉空间时，又称为Hermite 算子。

利用自伴算子的语言，我们可以重新证明 Hermite 矩阵（实对称矩阵）酉（正交）相似于对角阵。由于只是语言的转化，我们只列出结果，证明请同学们自行完成。

定理：

设 \varphi 是 n 维内积空间 V 上的自伴算子。则 \varphi 的特征值都是实数，且对应于不同特征值的特征向量互相正交。
设 \varphi 是 n 维内积空间 V 上的自伴算子，U 是 \varphi 的不变子空间。则 U 的正交补 U^\perp 也是 \varphi 的不变子空间。
设 \varphi 是 n 维内积空间 V 上的自伴算子。则存在 V 的一组标准正交基，使得 \varphi 在该基下的矩阵是对角阵。

对偶空间与对偶基

对偶空间的定义

定义：设 V 是数域 \mathbb{F} 上的线性空间，记 V 上线性函数（V \to \mathbb{F} 的线性映射）所成集合为 V^*。按照通常映射的加法和数乘 V^* 也构成 \mathbb{F} 上线性空间，称为 V 的共轭空间，当 V 是有限维空间时，常称 V^* 为 V 的对偶空间。

对偶基的存在性

定理：设 V 是数域 \mathbb{F} 上的 n 维线性空间，\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 是 V 的一组基，则

\mathbf{f}_i(\mathbf{e}_j) = \delta_{ij} = \begin{cases} 1, & i=j \\ 0, & i \neq j \end{cases}, \quad i,j=1,2,\cdots,n,

构成了 V^* 的一组基。

定义：(V^* 的)基 \mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 称为(V 的基) \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 的对偶基。

推论：设 V 是数域 \mathbb{F} 上的有限维线性空间，则 \dim V = \dim V^*。

注：对无限维空间，可以证明（需要用到分析的知识）该推论不成立。

证明：
由于线性空间 V 上的映射由它在 V 的基上的作用唯一确定，诸 \mathbf{f}_i 确实是线性函数。

设有线性组合使得

k_1\mathbf{f}_1 + k_2\mathbf{f}_2 + \cdots + k_n\mathbf{f}_n = \mathbf{0},

将上式依次作用在 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 上即知

k_1 = k_2 = \cdots = k_n = 0.

所以 \mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 是 V^* 中无关向量组。

对任意 \mathbf{f} \in V^*，设 \mathbf{f}(\mathbf{e}_i) = a_i，则对 V 中任意向量

\mathbf{x} = x_1\mathbf{e}_1 + x_2\mathbf{e}_2 + \cdots + x_n\mathbf{e}_n,

有

\begin{aligned} \mathbf{f}(\mathbf{x}) &= x_1\mathbf{f}(\mathbf{e}_1) + x_2\mathbf{f}(\mathbf{e}_2) + \cdots + x_n\mathbf{f}(\mathbf{e}_n) \\ &= x_1a_1 + x_2a_2 + \cdots + x_na_n \\ &= a_1\mathbf{f}_1(\mathbf{x}) + a_2\mathbf{f}_2(\mathbf{x}) + \cdots + a_n\mathbf{f}_n(\mathbf{x}) \\ &= (a_1\mathbf{f}_1 + a_2\mathbf{f}_2 + \cdots + a_n\mathbf{f}_n)(\mathbf{x}). \end{aligned}

由 \mathbf{x} 的任意性，\mathbf{f} = a_1\mathbf{f}_1 + a_2\mathbf{f}_2 + \cdots + a_n\mathbf{f}_n，即 \mathbf{f} 可以由 \mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 线性表示。

综上，\mathbf{f}_1, \mathbf{f}_2, \cdots, \mathbf{f}_n 构成了 V^* 的一组基。

对偶空间的对称性记号

记号 \langle -,- \rangle

为了更好的理解 V 与 V^* 的对称性，引入记号 \langle -,- \rangle，

\langle \mathbf{f}, \mathbf{x} \rangle = \mathbf{f}(\mathbf{x}), \quad \forall \mathbf{f} \in V^*, \mathbf{x} \in V.

记号 \langle -,- \rangle 的简单性质：

若 \langle \mathbf{f}, \mathbf{x} \rangle = 0 对任意 \mathbf{x} \in V 成立当且仅当 \mathbf{f} = \mathbf{0}
若 \langle \mathbf{f}, \mathbf{x} \rangle = 0 对任意 \mathbf{f} \in V^* 成立当且仅当 \mathbf{x} = \mathbf{0}

证明：
(1) 显然，只需证明 (2)。充分性也是显然的。下面证明必要性的逆否命题。

若 \mathbf{x} \neq \mathbf{0}，以其为第一个向量扩充成 V 的一组基 \mathbf{x} = \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n，则对对偶基的第一个向量 \mathbf{f}_1，有 \mathbf{f}_1(\mathbf{e}_1) = 1。

对偶之对偶 V^{**}

固定 \mathbf{f} \in V^*，则 \langle \mathbf{f}, - \rangle 就是 V 上线性函数。同样地，固定 \mathbf{x} \in V，则 \langle -, \mathbf{x} \rangle 可以看作 V^* 上线性函数。实际上，对任意 \mathbf{f}_1, \mathbf{f}_2 \in V^*, k \in \mathbb{F}，有

\langle k\mathbf{f}_1 + \mathbf{f}_2, \mathbf{x} \rangle = k\langle \mathbf{f}_1, \mathbf{x} \rangle + \langle \mathbf{f}_2, \mathbf{x} \rangle.

从而 \langle -, \mathbf{x} \rangle 是 V^* 上线性函数。

V^* 作为 \mathbb{F} 上线性空间，也有共轭空间 V^{**} := (V^*)^*，上面的讨论表明 \langle -, \mathbf{x} \rangle \in V^{**}。

定义 V \to V^{**} 的映射 \boldsymbol{\varphi}：

\boldsymbol{\varphi}(\mathbf{x}) = \langle -, \mathbf{x} \rangle, \quad \forall \mathbf{x} \in V.

则对任意 \mathbf{x}_1, \mathbf{x}_2 \in V, k \in \mathbb{F}，有

\boldsymbol{\varphi}(k\mathbf{x}_1 + \mathbf{x}_2) = \langle -, k\mathbf{x}_1 + \mathbf{x}_2 \rangle = k\langle -, \mathbf{x}_1 \rangle + \langle -, \mathbf{x}_2 \rangle.

即 \boldsymbol{\varphi} 是 V \to V^{**} 的线性映射。

互为对偶

再来计算 \boldsymbol{\varphi} 的核。若 \boldsymbol{\varphi}(\mathbf{x}) = \mathbf{0}（这里的 \mathbf{0} 是 V^{**} 中零向量），即，对任意 \mathbf{f} \in V^* 有 \langle \mathbf{f}, \mathbf{x} \rangle = 0，由性质 (2)，必有 \mathbf{x} = \mathbf{0}。故 \ker \boldsymbol{\varphi} = \mathbf{0}，所以 \boldsymbol{\varphi} 是单射。

现在进一步假设 V 是有限维的，则 \dim V = \dim V^* = \dim V^{**}，从而 \boldsymbol{\varphi} 也是满射，故是双射。即 \boldsymbol{\varphi} 是 V \to V^{**} 的线性同构。在这个同构意义下把 V 和 V^{**} 等同起来，则 V 与 V^* 具有平等的地位：互为对偶。

定理：设 V 是数域 \mathbb{F} 上的 n 维线性空间，则 V^{**} \simeq V。

注：一个可供类比的说法：对区间 [0,1] 上的函数 f(x)，我们以前经常说"f 在 x_0 点处的取值"，现在我们也可以认为那是"x_0 在 f 处的取值"。

对偶映射

对偶映射的定义

下面考虑把线性映射诱导到对偶空间上去。

设 U, V 是数域 \mathbb{F} 上两个线性空间，U^*, V^* 分别是它们的对偶空间。

若 \mathscr{A} 是从 U 到 V 的线性映射，则对 V^* 中任意线性函数 \mathbf{f}，\mathbf{f}\mathscr{A} 是 U 上线性函数。

定义 V^* \to U^* 的映射 \mathscr{A}^* 如下：

\mathscr{A}^*(\mathbf{f}) = \mathbf{f}\mathscr{A}, \quad \forall \mathbf{f} \in V^*.

由于对任意 \mathbf{f}_1, \mathbf{f}_2 \in V^*, k \in \mathbb{F}，按上式有

\mathscr{A}^*(k\mathbf{f}_1 + \mathbf{f}_2) = (k\mathbf{f}_1 + \mathbf{f}_2)\mathscr{A} = k\mathbf{f}_1\mathscr{A} + \mathbf{f}_2\mathscr{A} = k\mathscr{A}^*(\mathbf{f}_1) + \mathscr{A}^*(\mathbf{f}_2),

\mathscr{A}^* 还是线性映射。

定义：记号如上，我们称 \mathscr{A}^* 是线性映射 \mathscr{A} 的对偶映射。

对偶映射的性质

定理：设 U, V, W 分别是数域 \mathbb{F} 上线性空间。\mathscr{A}, \mathscr{B} 分别是 U \to V 和 V \to W 的线性映射，\mathscr{A}^*: V^* \to U^*, \mathscr{B}^*: W^* \to V^* 分别是 \mathscr{A}, \mathscr{B} 的对偶映射，则

对任意的 \mathbf{x} \in U 及任意的 \mathbf{f} \in V^*，总有

\langle \mathscr{A}^*(\mathbf{f}), \mathbf{x} \rangle = \langle \mathbf{f}, \mathscr{A}(\mathbf{x}) \rangle,

并且若 \widetilde{\mathscr{A}} 是 V^* \to U^* 的线性映射，对任意 \mathbf{x} \in U 及任意的 \mathbf{f} \in V^* 满足

\langle \widetilde{\mathscr{A}}(\mathbf{f}), \mathbf{x} \rangle = \langle \mathbf{f}, \mathscr{A}(\mathbf{x}) \rangle,

则 \widetilde{\mathscr{A}} = \mathscr{A}^*；

(\mathscr{B}\mathscr{A})^* = \mathscr{A}^*\mathscr{B}^*；
若 U = V，\rm I 表示 V 上恒等映射，则 \rm I^* 是 V^* 上恒等映射（通常仍记为 \rm I）；
\mathscr{A} 是单射当且仅当 \mathscr{A}^* 是满射；
\mathscr{A} 是满射当且仅当 \mathscr{A}^* 是单射；
\mathscr{A} 是同构当且仅当 \mathscr{A}^* 也是同构。

证明：
(1) 由 \langle -,- \rangle 及 \mathscr{A}^* 的定义，有

\langle \mathscr{A}^*(\mathbf{f}), \mathbf{x} \rangle = \mathscr{A}^*(\mathbf{f})(\mathbf{x}) = (\mathbf{f}\mathscr{A})(\mathbf{x}) = \mathbf{f}(\mathscr{A}\mathbf{x}) = \langle \mathbf{f}, \mathscr{A}(\mathbf{x}) \rangle.

又若 \widetilde{\mathscr{A}} 使得等式成立，则对任意 \mathbf{x} \in U 及任意的 \mathbf{f} \in V^*，有

\widetilde{\mathscr{A}}(\mathbf{f})(\mathbf{x}) = \langle \widetilde{\mathscr{A}}(\mathbf{f}), \mathbf{x} \rangle = \langle \mathbf{f}, \mathscr{A}(\mathbf{x}) \rangle = \langle \mathscr{A}^*(\mathbf{f}), \mathbf{x} \rangle = \mathscr{A}^*(\mathbf{f})(\mathbf{x}),

因此对任意 \mathbf{f} \in V^*，\widetilde{\mathscr{A}}(\mathbf{f}) = \mathscr{A}^*(\mathbf{f}) 成立，即 \widetilde{\mathscr{A}} = \mathscr{A}^*。

(2) 对任意 \mathbf{x} \in U, \mathbf{g} \in W^*，由性质 (1) 有

\begin{aligned} \langle (\mathscr{B}\mathscr{A})^*(\mathbf{g}), \mathbf{x} \rangle &= \langle \mathbf{g}, (\mathscr{B}\mathscr{A})(\mathbf{x}) \rangle \\ &= \langle \mathbf{g}, \mathscr{B}\mathscr{A}(\mathbf{x}) \rangle = \langle \mathscr{B}^*(\mathbf{g}), \mathscr{A}(\mathbf{x}) \rangle \\ &= \langle \mathscr{A}^*(\mathscr{B}^*(\mathbf{g})), \mathbf{x} \rangle = \langle (\mathscr{A}^*\mathscr{B}^*)(\mathbf{g}), \mathbf{x} \rangle. \end{aligned}

(3) 结论显然。

(4) \mathscr{A} 是单射的充要条件式存在 V \to U 的线性映射 \mathscr{C}，使得 \mathscr{C}\mathscr{A} = \rm I，\rm I 是 U 上恒等映射。此时，\mathscr{A}^*\mathscr{C}^* = (\mathscr{C}\mathscr{A})^* = \text{\rm I}^*，此为 \mathscr{A}^* 是满射的充要条件。

(5) 与 (4) 同理。

(6) 由 (4), (5) 立得。

例题解析

列向量空间的对偶

例 1：设 V 是数域 \mathbb{F} 上 n 维列向量空间，V' 是数域 \mathbb{F} 上 n 维行向量空间。

对 X = (x_1, x_2, \cdots, x_n)^T \in V 与 Y = (y_1, y_2, \cdots, y_n) \in V'，定义

\langle Y, X \rangle = x_1y_1 + x_2y_2 + \cdots + x_ny_n = YX.

则对固定的 Y，\langle Y, - \rangle 是 V 上线性函数。

反之，若 \mathbf{f} 是 V 上线性函数。取 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 为 V 的自然基（单位阵的列向量组），记 \mathbf{f}(\mathbf{e}_i) = a_i 并令 Y_0 = (a_1, a_2, \cdots, a_n) \in V'。则直接验证可知，对任意 X \in V，有

\mathbf{f}(X) = \langle Y_0, X \rangle.

这说明我们可以把 V' 看作 V 的对偶空间。同理也可以把 V 看作 V' 的对偶空间。

显然 \mathbf{e}_1^T, \mathbf{e}_2^T, \cdots, \mathbf{e}_n^T（单位阵的行向量组）构成了 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 的对偶基。

矩阵诱导的对偶映射

例 2：设 U, V 分别是数域 \mathbb{F} 上 n 维和 m 维列向量空间。m \times n 矩阵 A 通过

\mathscr{A}(X) = AX, \quad \forall X \in U,

的方式定义了 U \to V 的线性映射 \mathscr{A}。

由上例可知，U, V 的对偶空间分别是 n 维和 m 维行向量空间 U', V'。且 A 通过

\mathscr{A}^*(Y) = YA, \quad \forall Y \in V',

的方式定义了 V' \to U' 的线性映射 \mathscr{A}^*。

又

\langle YA, X \rangle = (YA)X = Y(AX) = \langle Y, AX \rangle,

而由性质 (1) 知 \mathscr{A}^* 恰为 \mathscr{A} 的对偶映射。

双线性型

双线性型的定义

上一节中，我们在两个线性空间 V^*, V 中定义了函数 \langle -,- \rangle，它可以看作一个"双变元"函数，其中一个变元在 V^* 内，另一个变元在 V 中。这个双变元函数关于每个变元都是线性的，即

\begin{aligned} \langle k\mathbf{f}_1 + \mathbf{f}_2, \mathbf{x} \rangle &= k\langle \mathbf{f}_1, \mathbf{x} \rangle + \langle \mathbf{f}_2, \mathbf{x} \rangle, \\ \langle \mathbf{f}, \ell\mathbf{x}_1 + \mathbf{x}_2 \rangle &= \ell\langle \mathbf{f}, \mathbf{x}_1 \rangle + \langle \mathbf{f}, \mathbf{x}_2 \rangle. \end{aligned}

这个性质称为双线性性，\langle -,- \rangle 称为 V^* 与 V 上的双线性函数。更一般地，我们有如下的

定义：设 U, V 是数域 \mathbb{F} 上两个线性空间，g 是 U \times V \to \mathbb{F} 的映射，若对任意 \mathbf{x}, \mathbf{y} \in U, \mathbf{z}, \mathbf{w} \in V, k, \ell \in \mathbb{F}，有

\begin{aligned} g(k\mathbf{x} + \mathbf{y}, \mathbf{z}) &= kg(\mathbf{x}, \mathbf{z}) + g(\mathbf{y}, \mathbf{z}), \\ g(\mathbf{x}, \ell\mathbf{z} + \mathbf{w}) &= \ell g(\mathbf{x}, \mathbf{z}) + g(\mathbf{x}, \mathbf{w}), \end{aligned}

则称 g 是 U 与 V 上双线性型或双线性函数。

有限维空间上双线性型的矩阵表示

定义：设 g 是 m 维空间 U 与 n 维空间 V 上双线性型。分别选取 U 的基 \mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m 与 V 的基 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n，则 m \times n 矩阵

A = \begin{pmatrix} g(\mathbf{u}_1, \mathbf{v}_1) & g(\mathbf{u}_1, \mathbf{v}_2) & \cdots & g(\mathbf{u}_1, \mathbf{v}_n) \\ g(\mathbf{u}_2, \mathbf{v}_1) & g(\mathbf{u}_2, \mathbf{v}_2) & \cdots & g(\mathbf{u}_2, \mathbf{v}_n) \\ \vdots & \vdots & \ddots & \vdots \\ g(\mathbf{u}_m, \mathbf{v}_1) & g(\mathbf{u}_m, \mathbf{v}_2) & \cdots & g(\mathbf{u}_m, \mathbf{v}_n) \end{pmatrix}

称为 g（在基 \mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m 与 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n 下）的矩阵。

任取 \mathbf{u} = \sum_{i=1}^m x_i\mathbf{u}_i = (\mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m)X, \mathbf{v} = \sum_{j=1}^n y_j\mathbf{v}_j = (\mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n)Y，则

g(\mathbf{u}, \mathbf{v}) = X^TAY.

不同基下矩阵的关系

反之，给定 U 的基 \mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m 与 V 的基 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n，则任意 m \times n 矩阵 A 通过

g(\mathbf{u}, \mathbf{v}) = X^TAY

的方式确定一个双线性型，其中 X, Y 同上文一样，分别是 \mathbf{u}, \mathbf{v} 的坐标。

设 \mathbf{u}_1', \mathbf{u}_2', \cdots, \mathbf{u}_m' 是 U 的另一组基，基过渡矩阵为 P，再设 \mathbf{u} 在 \mathbf{u}_1', \mathbf{u}_2', \cdots, \mathbf{u}_m' 下的坐标 X_1，则有坐标变换公式 X = PX_1。同样地，设 \mathbf{v}_1', \mathbf{v}_2', \cdots, \mathbf{v}_n' 是 V 的另一组基，基过渡矩阵为 Q，再设 \mathbf{v} 在 \mathbf{v}_1', \mathbf{v}_2', \cdots, \mathbf{v}_n' 下的坐标 Y_1，则 Y = QY_1，于是，在新基下

g(\mathbf{u}, \mathbf{v}) = X_1^TP^TAQY_1,

即双线性型在不同基下的矩阵是相抵的。从而有

定理：设 g 是 m 维空间 U 与 n 维空间 V 上双线性型。则分别存在 U 的基 \mathbf{u}_1, \mathbf{u}_2, \cdots, \mathbf{u}_m 与 V 的基 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n，使得 g 在这两组基下的矩阵为 \begin{pmatrix} E_r & O \\ O & O \end{pmatrix}。且 r 是由 g 唯一确定的，称为 g 的秩。

根子空间

定义：设 g 是 U 与 V 上双线性型。令

\begin{aligned} L &= \{\mathbf{u} \mid g(\mathbf{u}, \mathbf{v}) = 0, \forall \mathbf{v} \in V\}, \\ R &= \{\mathbf{v} \mid g(\mathbf{u}, \mathbf{v}) = 0, \forall \mathbf{u} \in U\}, \end{aligned}

则 L 与 R 分别是 U 与 V 的子空间，分别称为 g 的左根子空间与右根子空间。

若 U 与 V 的维数分别为 m 与 n，g 的秩为 r，则由上页定理（采用相同记号）可知左根子空间恰由 \mathbf{u}_{r+1}, \cdots, \mathbf{u}_m 生成，右根子空间恰由 \mathbf{v}_{r+1}, \cdots, \mathbf{v}_n 生成，于是有

\dim L = m - r, \quad \dim R = n - r.

定义：若双线性型 g 的左、右根子空间都为零空间，则称其为非退化的。

定理：若 g 的秩为 r，则 g 非退化当且仅当 \dim U = \dim V = r。

推论：g 非退化的充要条件是 g 在 U 与 V 的任意两组基下的矩阵为可逆阵。

非退化双线性型

设 g 是 U 与 V 上非退化双线性型。固定 \mathbf{u}，则 g(\mathbf{u}, -) 就是 V 上线性函数，作 U \to V^* 的映射

\varphi(\mathbf{u}) = g(\mathbf{u}, -),

显然 \varphi 是一个线性映射。

由于 g 是非退化的，若 \varphi(\mathbf{u}) = \mathbf{0}---零函数，即对任意 \mathbf{v} 有 g(\mathbf{u}, \mathbf{v}) = 0，则必有 \mathbf{u} = \mathbf{0}，从而 \ker\varphi = \mathbf{0}，\varphi 是单射，再设 \dim U（=\dim V）有限，则 \varphi 是双射。

另一方面，\dim V^* = \dim V = \dim U，故 \varphi 是线性同构。若将 \mathbf{u} 与 g(\mathbf{u}, -) 等同起来，则 U 就成了 V 的对偶空间 V^*。这时有 \langle\varphi(\mathbf{u}), \mathbf{v}\rangle = g(\mathbf{u}, \mathbf{v})。

类似地，我们可以将 V 与 U^* 等同起来，即存在线性同构 \psi: V \to U^*，使 \langle\mathbf{u}, \psi(\mathbf{v})\rangle = g(\mathbf{u}, \mathbf{v}) 对任意 \mathbf{u} \in U, \mathbf{v} \in V 成立。

以上讨论说明非退化双线性型本质上就是对偶空间中的 \langle -,- \rangle。反之，\langle -,- \rangle 给出的双线性型显然是非退化的（为什么？）。

对偶映射的推广

定理：设 g_1, g_2 都是 U 与 V 上非退化双线性型。则分别存在 U 上可逆线性变换 \varphi 与 V 上可逆线性变换 \psi，使得

g_2(\varphi(\mathbf{u}), \mathbf{v}) = g_1(\mathbf{u}, \mathbf{v}), \quad g_2(\mathbf{u}, \psi(\mathbf{v})) = g_1(\mathbf{u}, \mathbf{v})

对任意 \mathbf{u} \in U, \mathbf{v} \in V 成立。

证明：
由上面的讨论知存在 U \to V^* 的线性同构 \varphi_1，使得

\langle \varphi_1(\mathbf{u}), \mathbf{v} \rangle = g_1(\mathbf{u}, \mathbf{v}).

同理存在线性同构 \varphi_2，使得

\langle \varphi_2(\mathbf{u}), \mathbf{v} \rangle = g_2(\mathbf{u}, \mathbf{v}).

令 \varphi = \varphi_2^{-1}\varphi_1，则 \varphi 是 U 上可逆映射，且

g_2(\varphi(\mathbf{u}), \mathbf{v}) = \langle \varphi_2\varphi(\mathbf{u}), \mathbf{v} \rangle = \langle \varphi_1(\mathbf{u}), \mathbf{v} \rangle = g_1(\mathbf{u}, \mathbf{v}).

同理可证关于 \psi 的结论。

关于双线性型的对偶映射

定义：设 g_1, g_2 都是 U 与 V 上非退化双线性型，\varphi 是 V 上线性变换。若存在 U 上线性变换 \varphi^*，使得

g_2(\varphi^*(\mathbf{u}), \mathbf{v}) = g_1(\mathbf{u}, \varphi(\mathbf{v}))

对任意 \mathbf{u} \in U, \mathbf{v} \in V 成立，则称 \varphi^* 是 \varphi 关于 g_1, g_2 的对偶。

定理：设 g_1, g_2 都是 U 与 V 上非退化双线性型，\varphi 是 V 上线性变换，则 \varphi^* 存在且唯一。

证明：
存在性。由上文知，分别存在 U \to V^* 的线性同构 \varphi_1, \varphi_2，使得

\langle \varphi_1(\mathbf{u}), \mathbf{v} \rangle = g_1(\mathbf{u}, \mathbf{v}), \quad \langle \varphi_2(\mathbf{u}), \mathbf{v} \rangle = g_2(\mathbf{u}, \mathbf{v}).

取 \widetilde{\varphi} 为 \varphi 关于 \langle -,- \rangle 的对偶，即 \langle \widetilde{\varphi}(\mathbf{u}), \mathbf{v} \rangle = \langle \mathbf{u}, \varphi(\mathbf{v}) \rangle。

则 \varphi^* = \varphi_2^{-1}\widetilde{\varphi}\varphi_1 就是 \varphi 的对偶映射。事实上，

g_2(\varphi^*(\mathbf{u}), \mathbf{v}) = \langle \varphi_2\varphi^*(\mathbf{u}), \mathbf{v} \rangle = \langle \widetilde{\varphi}\varphi_1(\mathbf{u}), \mathbf{v} \rangle = \langle \varphi_1(\mathbf{u}), \varphi(\mathbf{v}) \rangle = g_1(\mathbf{u}, \varphi(\mathbf{v})).

唯一性。设还有 U 上线性变换 \eta 满足

g_2(\eta(\mathbf{u}), \mathbf{v}) = g_1(\mathbf{u}, \varphi(\mathbf{v})).

则

g_2(\eta(\mathbf{u}), \mathbf{v}) = g_2(\varphi^*(\mathbf{u}), \mathbf{v})

对任意 \mathbf{u} \in U, \mathbf{v} \in V 成立，进而

g_2(\eta(\mathbf{u}) - \varphi^*(\mathbf{u}), \mathbf{v}) = 0

对任意 \mathbf{v} \in V 成立。由 g_2 是非退化的，

\eta(\mathbf{u}) = \varphi^*(\mathbf{u})

对任意 \mathbf{u} \in U 成立，即 \eta = \varphi^*。

纯量积

对称型与交错型

定义：设 g 是 V \times V 上双线性函数，则称 g 是 V 上的纯量积。进一步地，若还有

g(\mathbf{x}, \mathbf{y}) = g(\mathbf{y}, \mathbf{x})

对任意 \mathbf{x}, \mathbf{y} \in V 成立，则称 g 是 V 上的对称型；而若还有

g(\mathbf{x}, \mathbf{y}) = -g(\mathbf{y}, \mathbf{x})

对任意 \mathbf{x}, \mathbf{y} \in V 成立，则称 g 是 V 上的交错型。

交错型又称为反对称型，一个等价的定义是对任意 \mathbf{x} \in V，必有 g(\mathbf{x}, \mathbf{x}) = 0。

事实上，由 g(\mathbf{x}, \mathbf{x}) = -g(\mathbf{x}, \mathbf{x}) 立得 g(\mathbf{x}, \mathbf{x}) = 0。

反之，由

g(\mathbf{x} + \mathbf{y}, \mathbf{x} + \mathbf{y}) = g(\mathbf{x}, \mathbf{x}) + g(\mathbf{y}, \mathbf{y}) + g(\mathbf{x}, \mathbf{y}) + g(\mathbf{y}, \mathbf{x}),

可得另一个方向的等价性。

纯量积的矩阵表示

同一般双线性型一样，纯量积也可以用矩阵表示。当然，现在只涉及到一个线性空间 V，我们没有必要选两组基。

定义：设 g 是 n 维线性空间 V 上纯量积，\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 是 V 的一组基。则称

A = (g(\mathbf{e}_i, \mathbf{e}_j))

为 g（在基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 下）的矩阵。

任取 \mathbf{x} = \sum_{i=1}^n x_i\mathbf{e}_i = (\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n)X, \mathbf{y} = \sum_{j=1}^n y_i\mathbf{e}_j = (\mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n)Y，则

g(\mathbf{x}, \mathbf{y}) = X^TAY.

设 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n 是 V 的另一组基，基过渡矩阵为 P，则 g 在基 \mathbf{v}_1, \mathbf{v}_2, \cdots, \mathbf{v}_n 下的矩阵

B = P^TAP.

注：有人也称上式为 A 合同于 B，注意这里没有对称性的要求。

垂直与正交

定义：设 g 是 V 上纯量积，若 g(\mathbf{x}, \mathbf{y}) = 0，则称 \mathbf{x}左垂直于\mathbf{y} 或 \mathbf{y}右垂直于\mathbf{x}，记为 \mathbf{x} \perp \mathbf{y}。

当 g 为对称型或交错型时，\mathbf{x} \perp \mathbf{y} 与 \mathbf{y} \perp \mathbf{x} 等价，此时，称 \mathbf{x} 与 \mathbf{y}正交。反之，我们有

定理：设 g 是 V 上纯量积，若在 V 中 \mathbf{x} \perp \mathbf{y} 与 \mathbf{y} \perp \mathbf{x} 等价，则 g 必为对称型或交错型。

证明：
对 V 中任意向量 \mathbf{x}, \mathbf{y}, \mathbf{z}，令

\mathbf{w} = g(\mathbf{x}, \mathbf{y})\mathbf{z} - g(\mathbf{x}, \mathbf{z})\mathbf{y},

则

g(\mathbf{x}, \mathbf{w}) = g(\mathbf{x}, g(\mathbf{x}, \mathbf{y})\mathbf{z} - g(\mathbf{x}, \mathbf{z})\mathbf{y}) = g(\mathbf{x}, \mathbf{y})g(\mathbf{x}, \mathbf{z}) - g(\mathbf{x}, \mathbf{z})g(\mathbf{x}, \mathbf{y}) = 0.

即 \mathbf{x} \perp \mathbf{w}，故 \mathbf{w} \perp \mathbf{x}，也就是

g(\mathbf{w}, \mathbf{x}) = g(\mathbf{x}, \mathbf{y})g(\mathbf{z}, \mathbf{x}) - g(\mathbf{x}, \mathbf{z})g(\mathbf{y}, \mathbf{x}) = 0.

故对任意 \mathbf{x}, \mathbf{y}, \mathbf{z}，有

g(\mathbf{x}, \mathbf{y})g(\mathbf{z}, \mathbf{x}) = g(\mathbf{y}, \mathbf{x})g(\mathbf{x}, \mathbf{z}) \quad (1)

取 \mathbf{x} = \mathbf{y}，则上式进一步化为对 \mathbf{x}, \mathbf{z}，有

g(\mathbf{x}, \mathbf{x})(g(\mathbf{z}, \mathbf{x}) - g(\mathbf{x}, \mathbf{z})) = 0 \quad (2)

若对所有 \mathbf{x}, \mathbf{z}，已经有 g(\mathbf{z}, \mathbf{x}) = g(\mathbf{x}, \mathbf{z})，则 g 是对称型。

若有 \mathbf{x}_0, \mathbf{z}_0，使得 g(\mathbf{z}_0, \mathbf{x}_0) \neq g(\mathbf{x}_0, \mathbf{z}_0)，则由 (2) 式，必有 g(\mathbf{x}_0, \mathbf{x}_0) = g(\mathbf{z}_0, \mathbf{z}_0) = 0。

现在用反证法证明 g 是交错型。设有 \mathbf{y}_0 使得 g(\mathbf{y}_0, \mathbf{y}_0) \neq 0，则由 (2) 式，必有 g(\mathbf{y}_0, \mathbf{x}_0) = g(\mathbf{x}_0, \mathbf{y}_0), g(\mathbf{y}_0, \mathbf{z}_0) = g(\mathbf{z}_0, \mathbf{y}_0)。而由 (1) 式，又有

g(\mathbf{x}_0, \mathbf{y}_0)g(\mathbf{z}_0, \mathbf{x}_0) = g(\mathbf{y}_0, \mathbf{x}_0)g(\mathbf{x}_0, \mathbf{z}_0).

即 g(\mathbf{y}_0, \mathbf{x}_0) = g(\mathbf{x}_0, \mathbf{y}_0) = 0，同理有 g(\mathbf{y}_0, \mathbf{z}_0) = g(\mathbf{z}_0, \mathbf{y}_0) = 0。于是，

g(\mathbf{x}_0 + \mathbf{y}_0, \mathbf{x}_0 + \mathbf{y}_0) = g(\mathbf{x}_0, \mathbf{y}_0) + g(\mathbf{y}_0, \mathbf{x}_0) + g(\mathbf{y}_0, \mathbf{y}_0) = g(\mathbf{y}_0, \mathbf{y}_0) \neq 0.

但是，又由 (2) 式，g(\mathbf{z}_0, \mathbf{x}_0) = g(\mathbf{z}_0, \mathbf{x}_0 + \mathbf{y}_0) = g(\mathbf{x}_0 + \mathbf{y}_0, \mathbf{z}_0) = g(\mathbf{x}_0, \mathbf{z}_0)，矛盾。

正交与内积空间的比较

设 g 是 V 上对称型或交错型，U 是 V 的子空间，记

U^\perp = \{\mathbf{x} \in V \mid g(\mathbf{x}, \mathbf{y}) = 0, \forall \mathbf{y} \in U\}.

特别地，取 U = V，则左根子空间等于右根子空间，称为根子空间。

定义：上式中的 U^\perp 称为 U 的正交补（空间）。

注：纯量积中正交的概念是内积空间中正交概念的推广，但二者并不完全一致。例如，在内积空间中，必有 U \cap U^\perp = \{\mathbf{0}\}，而在纯量积中，即使是非退化情况，这也未必成立。

例：设 V 是二维实线性空间，\mathbf{e}_1, \mathbf{e}_2 是 V 的一组基，g 是矩阵 \begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix} 定义的纯量积，显然 g 是非退化对称型。令 \mathbf{u} = \mathbf{e}_1 + \mathbf{e}_2，则 g(\mathbf{u}, \mathbf{u}) = 0，即 \mathbf{u} \perp \mathbf{u}。若取 U 为 \mathbf{u} 的生成子空间，则 U \perp U。

非退化对称型中 U \cap U^\perp = \{0\} 的判别

定理：设 g 是 n 维空间 V 上非退化对称型，U 是 V 的子空间，则 U \cap U^\perp = \{\mathbf{0}\} 的充要条件是 g 限制在 U 上是 U 的一个非退化纯量积，此时，有直和分解：

V = U \oplus U^\perp.

证明：
首先证明

\dim U^\perp = n - \dim U \quad (1)

对任意 \mathbf{x} \in V，g(\mathbf{x}, -) 限制在 U 上是 U 上线性函数。作 V \to U^* 的映射 \varphi：

\varphi(\mathbf{x}) = g(\mathbf{x}, -),

则 \varphi 是线性映射且 \ker \varphi = U^\perp。

另一方面，对任意 \mathbf{f} \in U^*，把 \mathbf{f} 线性扩张为 V 上线性函数，仍记为 \mathbf{f}。由 g 非退化，必有 \mathbf{x} \in V，使得 \mathbf{f} = g(\mathbf{x}, -)，故 \varphi 是满射。于是

\dim U^\perp + \dim U^* = n.

再由 \dim U = \dim U^* 就得到 (1) 式。

现在设 U \cap U^\perp = \{\mathbf{0}\}，则由 (1) 式有 V = U \oplus U^\perp。

若 g 限制在 U 上退化，则存在 \mathbf{u} \neq \mathbf{0}, g(\mathbf{u}, U) = 0，且显然有 g(\mathbf{u}, U^\perp) = 0，于是 g(\mathbf{u}, V) = 0。这与 g 在 V 上非退化矛盾。必要性得证。

若 g 限制在 U 上非退化，则对任意 \mathbf{x} \in U \cap U^\perp，有 g(\mathbf{x}, U) = 0，即有 \mathbf{x} = \mathbf{0}，从而 U \cap U^\perp = \{\mathbf{0}\}。充分性得证。

注：当 g 限制在 U 上非退化时，g 限制在 U^\perp 上也非退化。此时有 (U^\perp)^\perp = U。

纯量积与线性变换

定理：设 g 与 h 是 n 维空间 V 上两个非退化纯量积，则存在 V 上唯一可逆线性变换 \varphi，使得对任意 \mathbf{x}, \mathbf{y} \in V，有

h(\mathbf{x}, \mathbf{y}) = g(\varphi(\mathbf{x}), \mathbf{y}).

证明：
取 V 的一组基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n。记 A = (h(\mathbf{e}_i, \mathbf{e}_j)), B = (g(\mathbf{e}_i, \mathbf{e}_j))。设 \mathbf{x}, \mathbf{y} 的坐标分别为 X, Y，则

h(\mathbf{x}, \mathbf{y}) = X^TAY, \quad g(\mathbf{x}, \mathbf{y}) = X^TBY.

只需要（且必须要，为什么？）取 \varphi 在基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 下的矩阵 C 使得 C^T = AB^{-1}，此时，\varphi(\mathbf{x}) 的坐标为 CX，于是

g(\varphi(\mathbf{x}), \mathbf{y}) = X^TC^TBY = X^TAY = h(\mathbf{x}, \mathbf{y}).

交错型与辛空间

交错型的标准型

定理：设 g 是 n 维空间 V 上交错型，则存在 V 的一组基

\mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_r, \mathbf{v}_r, \mathbf{w}_{2r+1}, \cdots, \mathbf{w}_n,

使得 g 在这组基下的矩阵为分块对角矩阵

\text{diag}\{S, \cdots, S; 0, \cdots, 0\},

其中，共有 r 个 2 阶方阵 S = \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}。

证明：
不妨设 g \neq 0。这时必有 \mathbf{u}, \mathbf{v} 使得 g(\mathbf{u}, \mathbf{v}) = a \neq 0。取 \mathbf{u}_1 = a^{-1}\mathbf{u}, \mathbf{v}_1 = \mathbf{v}，则 g(\mathbf{u}_1, \mathbf{v}_1) = -g(\mathbf{v}_1, \mathbf{u}_1) = 1。又 \mathbf{u}_1, \mathbf{v}_1 必线性无关，否则 g(\mathbf{u}_1, \mathbf{v}_1) = 0。

现在假设已经取定 \mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_j, \mathbf{v}_j 共 2j 个无关向量，满足

\begin{aligned} g(\mathbf{u}_i, \mathbf{v}_i) &= -g(\mathbf{v}_i, \mathbf{u}_i) = 1, \quad i = 1,2,\cdots,j; \\ g(\mathbf{u}_i, \mathbf{y}) &= 0, \quad \mathbf{y} \neq \mathbf{v}_i, \mathbf{y} \in \{\mathbf{u}_k\} \cup \{\mathbf{v}_k\}, k = 1,2,\cdots,j; \\ g(\mathbf{x}, \mathbf{v}_i) &= 0, \quad \mathbf{x} \neq \mathbf{u}_i, \mathbf{x} \in \{\mathbf{u}_k\} \cup \{\mathbf{v}_k\}, k = 1,2,\cdots,j. \end{aligned}

设 W 是 \mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_j, \mathbf{v}_j 的生成子空间，令

W^\perp = \{\mathbf{v} \mid g(\mathbf{v}, W) = 0\},

显然 g 限制在 W 上是非退化的。若 \mathbf{u} \in W \cap W^\perp，则 g(\mathbf{u}, W) = 0，由非退化可知 \mathbf{u} = \mathbf{0}，故 W \cap W^\perp = \{0\}。

对任意 \mathbf{x} \in V，令

\mathbf{y} = \mathbf{x} - \sum_{i=1}^j g(\mathbf{x}, \mathbf{v}_i)\mathbf{u}_i + \sum_{i=1}^j g(\mathbf{x}, \mathbf{u}_i)\mathbf{v}_i,

则

\begin{aligned} g(\mathbf{y}, \mathbf{u}_k) &= g(\mathbf{x}, \mathbf{u}_k) + g(\mathbf{x}, \mathbf{u}_k)g(\mathbf{v}_k, \mathbf{u}_k) = 0, \\ g(\mathbf{y}, \mathbf{v}_k) &= g(\mathbf{x}, \mathbf{v}_k) - g(\mathbf{x}, \mathbf{v}_k)g(\mathbf{u}_k, \mathbf{v}_k) = 0. \end{aligned}

因此 \mathbf{y} \in W^\perp。于是，由

\mathbf{x} = \mathbf{y} + \sum_{i=1}^j g(\mathbf{x}, \mathbf{v}_i)\mathbf{u}_i - \sum_{i=1}^j g(\mathbf{x}, \mathbf{u}_i)\mathbf{v}_i,

知，V = W \oplus W^\perp。

若 g 在 W^\perp 上限制为 \mathbf{0}（零函数），则 r = j 已经符合要求。

否则，可以在 W^\perp 中继续找到 \mathbf{u}_{j+1}, \mathbf{v}_{j+1}，继续以上步骤，即可找到符合定理要求的基。

辛空间与辛基

由以上定理可知，反对称矩阵 A 的"合同"标准型为

\text{diag}\{S, \cdots, S; 0, \cdots, 0\},

其中 2r 是 A 的秩。

推论：

数域 \mathbb{F} 上反对称矩阵的秩必为偶数，行列式必为 \mathbb{F} 中某元素的平方。
数域 \mathbb{F} 上两个反对称矩阵"合同"当且仅当它们有相同的秩。

定义：设 V 是数域 \mathbb{F} 上有限维空间，若 V 上定义了一个非退化交错型 g，则称 V 是一个辛空间。此时，（由非退化）定理中的 \mathbf{u}_1, \mathbf{v}_1, \cdots, \mathbf{u}_r, \mathbf{v}_r 称为 V 的辛基。

辛基下 g 的形式非常简单。设

\begin{aligned} \mathbf{x} &= a_1\mathbf{u}_1 + b_1\mathbf{v}_1 + \cdots + a_r\mathbf{u}_r + b_r\mathbf{v}_r, \\ \mathbf{y} &= c_1\mathbf{u}_1 + d_1\mathbf{v}_1 + \cdots + c_r\mathbf{u}_r + d_r\mathbf{v}_r, \end{aligned}

则

g(\mathbf{x}, \mathbf{y}) = a_1d_1 - b_1c_1 + \cdots + a_rd_r - b_rc_r.

辛变换

定义：设 V 是辛空间（其交错型为 g），\varphi 是 V 上可逆线性变换，若对任意 \mathbf{x}, \mathbf{y} \in V，有

g(\varphi(\mathbf{x}), \varphi(\mathbf{y})) = g(\mathbf{x}, \mathbf{y}),

则称 \varphi 是 V 上辛变换。

性质：

V 上线性变换 \varphi 是辛变换的充要条件是 \varphi 把辛基变为辛基；
两个辛变换之积仍然是辛变换；
恒等变换是辛变换；
辛变换的逆变换是辛变换。

证明：
(1) 由辛基下 g 的形式直接代入得到，(2),(3),(4) 是 (1) 的显然推论，细节留给同学们。

对称型与正交几何

对称型与二次型的关系

设 V 是 n 维线性空间，g 是 V 上对称型。取 V 的一组基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n，记 g 的矩阵为 A，显然 A 是对称阵。设 V 中向量 \mathbf{x}, \mathbf{y} 的坐标分别为 X, Y，则

g(\mathbf{x}, \mathbf{x}) = X^TAX,

我们得到一个 V 上二次型。

反之，给定对称矩阵 A 及二次型 f(\mathbf{x}) = X^TAX，则

\begin{aligned} g(\mathbf{x}, \mathbf{y}) &= \frac{1}{2}[f(\mathbf{x} + \mathbf{y}) - f(\mathbf{x}) - f(\mathbf{y})] \\ &= \frac{1}{2}[(X+Y)^TA(X+Y) - X^TAX - Y^TAY] \\ &= X^TAY. \end{aligned}

给出 V 上一个对称型。

所以，对称型与二次型可以说是同一个结构的两种不同表述方式。

正交基

由二次型理论（配方法），我们知道任意对称阵必合同于对角阵。因此若 g 是对称型，必存在 V 的一组基，使得 g 的矩阵为对角阵。

定义：若 V 的一组基 \mathbf{e}_1, \mathbf{e}_2, \cdots, \mathbf{e}_n 使得对称型 g 在其下的矩阵为对角阵，则称为正交基。

注：注意对称型的正交基比欧氏空间的正交基要求要弱得多。实际上，欧氏空间中的内积是一个正定对称型。若 V 上带有一个非退化的对称型，则 V 上的几何学称为正交几何学，它是欧氏几何的推广。

正交变换

定义：设 V_1, V_2 都是 n 维空间（其上分别有非退化对称型 g_1, g_2），\eta 是 V_1 \to V_2 的线性同构，若对任意 \mathbf{x}, \mathbf{y} \in V_1，有

g_2(\eta(\mathbf{x}), \eta(\mathbf{y})) = g_1(\mathbf{x}, \mathbf{y}),

则称 \eta 是 V_1 \to V_2 的保距同构。特别地，当 V_1 = V_2, g_1 = g_2 时，\eta 称为 (V_1, g_1) 上的一个正交变换。

性质：

V 上两个正交变换之积仍然是正交变换；
恒等变换是正交变换；
正交变换的逆变换也是正交变换。

证明：证明是平凡的，代入定义直接验证即可。

镜像变换

对给定的 \mathbf{v} \in V 使得 g(\mathbf{v}, \mathbf{v}) \neq 0，构造映射

S_{\mathbf{v}}(\mathbf{x}) = \mathbf{x} - \frac{2g(\mathbf{x}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}\mathbf{v},

则

\begin{aligned} g(S_{\mathbf{v}}(\mathbf{x}), S_{\mathbf{v}}(\mathbf{y})) &= g\left(\mathbf{x} - \frac{2g(\mathbf{x}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}\mathbf{v}, \mathbf{y} - \frac{2g(\mathbf{y}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}\mathbf{v}\right) \\ &= g(\mathbf{x}, \mathbf{y}) - \frac{2g(\mathbf{y}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}g(\mathbf{x}, \mathbf{v}) \\ &\quad - \frac{2g(\mathbf{x}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}g(\mathbf{y}, \mathbf{v}) + \frac{4g(\mathbf{x}, \mathbf{v})g(\mathbf{y}, \mathbf{v})}{g(\mathbf{v}, \mathbf{v})^2}g(\mathbf{v}, \mathbf{v}) \\ &= g(\mathbf{x}, \mathbf{y}). \end{aligned}

即，S_{\mathbf{v}} 是一个正交变换。

显然，S_{\mathbf{v}}(\mathbf{v}) = -\mathbf{v}；而对 \mathbf{u} \perp \mathbf{v}，有 S_{\mathbf{v}}(\mathbf{u}) = \mathbf{u}，其映射效果正如镜子反射一样。

正交变换的分解

引理：若 \eta 是 V 上正交变换，则

\eta S_{\mathbf{v}} \eta^{-1} = S_{\eta(\mathbf{v})}.

证明：直接计算，

\begin{aligned} \eta S_{\mathbf{v}} \eta^{-1}(\mathbf{x}) &= \eta\left[\eta^{-1}(\mathbf{x}) - \frac{2g(\eta^{-1}(\mathbf{x}), \mathbf{v})}{g(\mathbf{v}, \mathbf{v})}\mathbf{v}\right] \\ &= \eta\left[\eta^{-1}(\mathbf{x}) - \frac{2g(\eta\eta^{-1}(\mathbf{x}), \eta(\mathbf{v}))}{g(\mathbf{v}, \mathbf{v})}\mathbf{v}\right] \\ &= \mathbf{x} - \frac{2g(\mathbf{x}, \eta(\mathbf{v}))}{g(\eta(\mathbf{v}), \eta(\mathbf{v}))}\eta(\mathbf{v}) = S_{\eta(\mathbf{v})}(\mathbf{x}). \end{aligned}

定理：设 V 是 n 维线性空间，g 是 V 上非退化对称型，\eta 是 V 上正交变换，则 \eta 可以表为不超过 n 个镜像变换之积。

证明：
对维数用归纳法。

当 n = 1 时，注意到必有 \eta(\mathbf{x}) = \pm \mathbf{x}，结论显然成立。

现在假设结论对 n-1 维空间成立。由 g 非退化，必有 \mathbf{u} \in V 使得 g(\mathbf{u}, \mathbf{u}) \neq 0。令 \mathbf{v} = \eta(\mathbf{u})，则 g(\mathbf{v}, \mathbf{v}) = g(\mathbf{u}, \mathbf{u}) \neq 0。以下构造镜像变换 \rho，使得 \rho(\mathbf{u}) = \mathbf{v} 或 \rho(\mathbf{u}) = -\mathbf{v}。由于

g(\mathbf{u} + \mathbf{v}, \mathbf{u} + \mathbf{v}) + g(\mathbf{u} - \mathbf{v}, \mathbf{u} - \mathbf{v}) = 4g(\mathbf{u}, \mathbf{u}) \neq 0,

不妨设 g(\mathbf{u} - \mathbf{v}, \mathbf{u} - \mathbf{v}) \neq 0（否则用 -\mathbf{v} 代替 \mathbf{v}）。令 \mathbf{z} = \mathbf{u} - \mathbf{v}, \rho = S_{\mathbf{z}}。由于 g(\mathbf{v}, \mathbf{v}) = g(\mathbf{u}, \mathbf{u})，故 g(\mathbf{u} + \mathbf{v}, \mathbf{u} - \mathbf{v}) = g(\mathbf{u} + \mathbf{v}, \mathbf{z}) = 0，即 g(\mathbf{u}, \mathbf{z}) = -g(\mathbf{v}, \mathbf{z})。

进而，g(\mathbf{z}, \mathbf{z}) = g(\mathbf{u} - \mathbf{v}, \mathbf{u} - \mathbf{v}) = 2g(\mathbf{u}, \mathbf{z})。故

\rho(\mathbf{u}) = S_{\mathbf{z}}(\mathbf{u}) = \mathbf{u} - \frac{2g(\mathbf{u}, \mathbf{z})}{g(\mathbf{z}, \mathbf{z})}\mathbf{z} = \mathbf{v}.

现在令 \xi = \rho^{-1}\eta，则 \xi 是正交变换，且 \xi(\mathbf{u}) = \mathbf{u}（或 \xi(\mathbf{u}) = -\mathbf{u}），由于对任意 \mathbf{x} \in \langle \mathbf{u} \rangle^\perp，有

g(\xi(\mathbf{x}), \mathbf{u}) = \pm g(\xi(\mathbf{x}), \xi(\mathbf{u})) = g(\mathbf{x}, \mathbf{u}) = 0,

\langle \mathbf{u} \rangle^\perp 是 \xi 的不变子空间。

显然，\xi 限制在 \langle \mathbf{u} \rangle^\perp 上还是正交变换。由归纳法假设，\xi 可表为 \langle \mathbf{u} \rangle^\perp 上不超过 n-1 个镜像变换之积。

用显然的方式把 \langle \mathbf{u} \rangle^\perp 上镜像变换扩张成 V 上镜像变换，则得到定理结论。

推论：n 维欧氏空间中任意正交矩阵可以表为不超过 n 个镜像矩阵之积。

对偶空间与双线性型

https://www.fengyuchen.top/archives/1772533127406

作者

Oasis

发布于

2026年03月03日

许可协议

半无界一维对流弥散方程的解析解上一篇

对偶空间与双线性型

对偶空间与双线性型讲义

有限维内积空间上的线性函数

线性函数的定义

线性函数的表示定理

伴随算子

伴随算子的存在唯一性

伴随算子的矩阵表示

伴随算子的基本性质

自伴算子

自伴算子的定义

对偶空间与对偶基

对偶空间的定义

对偶基的存在性

对偶空间的对称性记号

记号 ​\langle -,- \rangle

对偶之对偶 ​V^{**}

互为对偶

对偶映射

对偶映射的定义

对偶映射的性质

例题解析

列向量空间的对偶

矩阵诱导的对偶映射

双线性型

双线性型的定义

有限维空间上双线性型的矩阵表示

不同基下矩阵的关系

根子空间

非退化双线性型

对偶映射的推广

关于双线性型的对偶映射

纯量积

对称型与交错型

纯量积的矩阵表示

垂直与正交

正交与内积空间的比较

非退化对称型中 ​U \cap U^\perp = \{0\} 的判别

纯量积与线性变换

交错型与辛空间

交错型的标准型

辛空间与辛基

辛变换

对称型与正交几何

对称型与二次型的关系

正交基

正交变换

镜像变换

正交变换的分解

记号 \langle -,- \rangle

对偶之对偶 V^{**}

非退化对称型中 U \cap U^\perp = \{0\} 的判别