基本知识的简单回顾

$ \mathbb{L}(\mathbb{V},\mathbb{W}) $表示从$\mathbb{V}$到$\mathbb{W}$的所有线性映射的集合。

当表示一个$\mathbb{V}$->$\mathbb{V}$的线性映射时,我们也叫其为线性变换。

有限维向量空间$\mathbb{V}$中所有元素可以由坐标映射表示为基向量的线性组合,线性组合的系数就是该元素在这组基下的坐标,也即通过坐标映射将$\mathbb{V}$中的元素映射到$\mathbb{F}^n$中的元素。

记号的一些澄清

$\sigma(\mathbf{a_1},\mathbf{a_2},…,\mathbf{a_n})=\begin{bmatrix}\mathbf{b_1} & \mathbf{b_2} & \ldots &\mathbf{b_m} \end{bmatrix}A$

  这个记号用矩阵$A_{m\times n}$表示从从n维线性空间到m维线性空间的映射。实际上它描述的是基与基之间的相互表示关系,是在抽象地定义这个线性变换,而不是在做坐标变换等具体的计算。

  当我们知道上式后,计算n维向量空间中的向量$\mathbf{a}$在$\sigma$下的像,便可以如此操作:

  对$\mathbf{a}$做坐标分解,$\mathbf{a}=\begin{bmatrix}\mathbf{a_1} & \mathbf{a_2} & \ldots & \mathbf{a_n}\end{bmatrix}\begin{bmatrix}\mathbf{x_1} \\ \mathbf{x_2} \\ \vdots \\ \mathbf{x_n}\end{bmatrix}$,

则$\sigma(\mathbf{a})=\sigma(\begin{bmatrix}\mathbf{a_1} & \mathbf{a_2} & \ldots & \mathbf{a_n}\end{bmatrix}\begin{bmatrix}\mathbf{x_1} \\ \mathbf{x_2} \\ \vdots \\ \mathbf{x_n}\end{bmatrix})=\sigma(\mathbf{a_1},\mathbf{a_2},\ldots,\mathbf{a_n})\begin{bmatrix}\mathbf{x_1} \\ \mathbf{x_2} \\ \vdots \\ \mathbf{x_n}\end{bmatrix}=\begin{bmatrix}\mathbf{b_1} & \mathbf{b_2} & \ldots &\mathbf{b_m} \end{bmatrix}A\begin{bmatrix}\mathbf{x_1} \\ \mathbf{x_2} \\ \vdots \\ \mathbf{x_n}\end{bmatrix}$。

  同时我们由坐标的定义知道,$\sigma(\mathbf{a})$在该基底下的坐标就是$A\begin{bmatrix}\mathbf{x_1} \\ \mathbf{x_2} \\ \vdots \\ \mathbf{x_n}\end{bmatrix}$。第二个等号看起来像是把列向量到了线性变换$\sigma$外面,十分的优雅且怪异,实际上这是由于前后两个记号$\sigma$的含义不完全一致(应该不一致吧?大概也许)导致的。

  其中,左侧的记号实际上是行向量$\begin{bmatrix} \sigma(\mathbf{a_1})& … & \sigma(\mathbf{a_n}))\end{bmatrix}$的简写。(个人觉得这个记号其实并不是很好?因为还有$\sigma(x_1,x_2,x_3)=(x_1+2x_2,x_1+x_3)^T$​这种表示坐标变换关系的记号与之相似,使用时要注意区分)

  于是,不难理解对于另一个含有n行的矩阵$B$,存在如下关系:$\sigma(\mathbf{a_1},\mathbf{a_2},…,\mathbf{a_n})B=\sigma(\begin{bmatrix}\mathbf{a_1} & \mathbf{a_2} &\ldots & \mathbf{a_n}\end{bmatrix}B)$​​。事实上,这一式子是对线性映射后坐标计算的推广。

  当$\sigma$取为n维线性空间上的线性变换的特殊情形时,我们可以说$\sigma$在某一组基下的矩阵表示——即输入元素和输出元素均用这组基来表示。即$\sigma(\mathbf{a_1},\mathbf{a_2},…,\mathbf{a_n})=\begin{bmatrix}\mathbf{a_1} & \mathbf{a_2} & \ldots &\mathbf{a_n} \end{bmatrix}A$​。

  如果此时又有$\sigma(\mathbf{b_1},\mathbf{b_2},…,\mathbf{b_n})=\begin{bmatrix}\mathbf{b_1} & \mathbf{b_2} & \ldots &\mathbf{b_n} \end{bmatrix}B$,$\begin{bmatrix}\mathbf{a_1} & \mathbf{a_2} & \ldots &\mathbf{a_n} \end{bmatrix}=\begin{bmatrix}\mathbf{b_1} & \mathbf{b_2} & \ldots &\mathbf{b_n} \end{bmatrix}C$,即

C是从${\mathbf{b_1},\mathbf{b_2},…\mathbf{b_n}}$到${\mathbf{a_1},\mathbf{a_2},…,\mathbf{a_n}}$的过渡矩阵,则$A,B,C$存在如下关系:由于$$ \sigma(\mathbf{a_1},\mathbf{a_2},…,\mathbf{a_n})=\begin{bmatrix}\mathbf{a_1}&\mathbf{a_2}&…&\mathbf{a_n}\end{bmatrix}A=\begin{bmatrix}\mathbf{b_1}&\mathbf{b_2}&…&\mathbf{b_n}\end{bmatrix}CA\=\sigma(\begin{bmatrix}\mathbf{b_1}&\mathbf{b_2} & \ldots &\mathbf{b_n} \end{bmatrix}C)=c=\begin{bmatrix}\mathbf{b_1} & \mathbf{b_2} & \ldots &\mathbf{b_n} \end{bmatrix}BC $$

  从而$CA=BC,A=C^{-1}BC$。结论上是正确的。

  怎么看都好奇怪,总觉得还有哪里有问题,下次再说吧。

补谈

  在学习对偶空间时,看到王崇政蓝金两位答主的回答,发现果然不止我一个人觉得上文所讲的记号很奇怪。

  简单总结一下答主蓝金的观点(仅用于理解,不对内容正确性有任何保证):定义在$\mathbb{F}$上的线性空间$\mathbb{V}$中的元素也可以看作从$\mathbb{F}$到$\mathbb{V}$中元素的线性映射$\lambda \mapsto \lambda v $。这种意义下,当我们在写元素$v$时,我们其实是在对$v(1)$​做简写。

  对于$n$维线性空间,坐标分解$\mathbf{a}=\begin{bmatrix}\mathbf{a_1} & \mathbf{a_2} & \ldots & \mathbf{a_n}\end{bmatrix}\begin{bmatrix}\mathbf{x_1} \\ \mathbf{x_2} \\ \vdots \\ \mathbf{x_n}\end{bmatrix}$,可以视为$\mathbb{F}^n \mapsto \mathbb{V}$和$\mathbb{F}\mapsto \mathbb{F}^n$的两个线性变换的复合。

  而记号$\sigma(\mathbf{a_1},\mathbf{a_2},…,\mathbf{a_n})=\begin{bmatrix}\mathbf{b_1} & \mathbf{b_2} & \ldots &\mathbf{b_m} \end{bmatrix}A$实际上描述的,等式左侧是$\sigma:\mathbb{V} \mapsto \mathbb{W}$和变换$\mathbb{F}^n \mapsto \mathbb{V}$的线性复合,等式右端是$\mathbb{F}^m \mapsto \mathbb{W} $和$\mathbb{F}^n \mapsto \mathbb{F}^m$两个线性映射的复合。这样子我们就可以理解为何我们可以将$\sigma(\mathbf{a_1},\mathbf{a_2},…,\mathbf{a_n})$直接代换为$\sigma(\mathbf{b_1} , \mathbf{b_2} , \ldots ,\mathbf{b_n} )C$了。