线性代数的本质

矩阵可以理解为一个线性变换(linear transformation),每一列代表某个原来的基向量在变换后的新基向量,在原坐标系下的坐标。如果是 3x2 的矩阵,可以想象成两个二维空间的基向量,变成两个三位空间的基向量。如果是 2x3 的矩阵,可以想象成 3 个 3 维空间的基向量,变成 3 个二维空间的基向量。

如果我们将向量的表达认为是竖着的,那么对一个向量进行变换必须是左乘矩阵。

线性方程组 $ax=y$ 就是将 x 作变换 a 后,变成新向量 y。

点积的理解:两个向量的点积可以理解成前一个向量转置为一个矩阵的线性变化,并应用于另一个向量。或说:一个向量的转置是一个线性变换而且是从多维化为一维的线性变换,且可以证明这种变换的就是将某一个向量投影到被转置的向量(转置之前在坐标系中)所在的直线上。

为什么是这样的呢?下面我们的证明命题是:转置一个向量得到的线性变换是将任意一个该空间中的点投影到此向量方向的直线上。

我们首先发现,在投影到直线这种变化下,原来的基向量 x 和 y 被投影到的一维坐标,实际上就是被转置向量所在直线上的单位向量在原来坐标系的 x,y 原坐标。(证明通过几何作图)这意味着什么呢?这意味着,这中线性变化的矩阵表述就可以直接通过原来的被转置向量的原坐标得出了!如果被转置向量的长度就是 1(即满足它是这条直线上的单位向量),那么对应投影线性变换的矩阵的第一个值就是该向量的 x 坐标,第二个值就是 y 坐标,以此类推,或者说,就是他的转置!

在这种条件下,投影线性变换矩阵就是那个向量的转置!这证明了上一段中我们的假设

关于基变换:一个向量左乘一个矩阵,可以看成是这个向量在经历了矩阵代表的线性变换后,落到了新向量,也可以把矩阵看成是新坐标系下基向量的表示坐标,求出了在新坐标系下的向量在原坐标系的值是什么,这是的矩阵叫做基变换矩阵,(和前一种理解有相反意味)。在这种情况下,这个基变换矩阵是将新系坐标转换成我们所研究的现系坐标的工具。举个例子,我们不知道新系的(-2,1)在我们现系的哪里,但是我们知道新系的基向量的现系坐标,我们就可以组成基变换矩阵,计算出这个向量在我们的系的具体坐标位置。

注:一组基向量决定了一种坐标系

如果对基变换矩阵求逆,那么翻译的功能会相反,将我们的现在坐标,翻译到新坐标系基向量下应该的坐标。

基变换同样可以运用在矩阵上。如果需要将我们坐标系下的矩阵转换到新的坐标系下,该怎么做?不妨将目标定为:求一个矩阵(代表的线性变换),使得输入新坐标系下的坐标,得到线性变换后的新坐标系下坐标。

如何去实现?首先为了调用我们坐标系下已知的矩阵,我们可以在矩阵左右各乘上基变换矩阵的逆和基变换矩阵,即先将任意新坐标系下向量变成现在的坐标系下的向量,使用我们已知的矩阵变换后,再转换回新坐标系。这就是A-1BA 这种公式的来源:将已知的变换用新的视角/坐标系去表示和理解。当然,这就是相似变换

理解特征根和涉及相似对角化:对于一个线性变换,有可能使得某一个方向上的(某个)向量,其不会偏离原来的方向,只会进行放缩变换。这样的向量和放缩比的组合就是这个线性变换下的特征向量和特征根。eigen 非常有用,比如可以将特征向量作为基向量组,从而只通过放缩不需旋转就描述出一个线性变换的(几何)变换过程,而不是通过指定某一个具体的观察坐标系,观察其中发生旋转和放缩的其他向量去刻画变换的几何过程。

如果特征向量本身就是原来坐标系的基向量,那么以这组基对应的线性变换表达式研究线性变换将非常方便,一方面因为基向量只进行了放缩变换,这样就不需要考虑旋转了。而且其表示出来的线性变换矩阵是对角矩阵(每一列都是特征向量所在直线,对角线上的值是特征值)。

但是这种巧合(特征向量为基向量)不容易出现。不过只要我们有足够表示整个空间的一组特征向量,我们可以通过基转换的方式将基向量改为特征向量,然后方便地研究我们的线性变换。如何实现?通过 A-1BA 的方法,我们就能把旧的线性变换表达式 B,换成在新基(称为特征基)下线性变换的样子,基变换矩阵为 A。根据之前所证,现在所研究的线性变换会在新坐标系下研究,且因为特征向量为基向量,所以线性变换只会表现为空间的放缩了!而且表示出来的线性变换矩阵 A-1BA 还是对角矩阵!这就是使用特征向量组成的基变换矩阵使得相似变换变为对角阵的知识

关于线性方程组:Ax=y 可以理解为一种线性变换将向量 x 变为 y。但是对于解的组成的讨论,即知道 y 以后,求 x 的组成,值得深思。任意 x 条件下,考察Ax 组成的空间,叫做列空间。因为这个空间可以看作以 A 为基的坐标系/线性组合创造的空间,即 A 的列向量组成的空间。列空间的维数就是秩,因此在方程组中,秩也可以叫做线性变换的结果空间的维数。如果秩小于原空间,空间维数会缩减。这时如果不幸 y 不在解空间中(满秩时不会出现),此时代表 y 无法找到对应 x。但如果 y 正好在列空间内,就会有无数个解能被转换成 y(无解和无穷解两种情况可以画图详细理解)。另外,秩不满情况下,将会存在一系列的向量,被压缩到原点。这些向量构成的空间叫做零空间,或叫核。零空间的维数恰好是总维数减秩(代数基本定理)。零空间可以成为 Ax=0 的解系(满秩时无解无零空间),也可以在 Ax=v 有解时,找到所有符合条件的解系(基础解系)。为什么呢?因为 Ax 都是 0 了,解里面加不加这零空间内的向量就无关紧要了,所以在特解后面加上零空间内的向量得到的都会是 Ax=v 的解。这就是基础解系的由来