矩阵的行列式计算及性质(抛弃复杂的运算来理解)

这是《机器学习中的数学基础》系列的第4篇。

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(1)

上一篇我们知道了,矩阵其实就是一个线性变换,矩阵的各列就是由原来的基向量变换而来。在此基础上,假如我们把两个矩阵放在一起,也就是说,让两个矩阵做乘法,它又有什么含义呢?

  • 矩阵乘法

我们还是先从矩阵和向量的乘法看起:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(2)

矩阵乘以一个向量,得到一个新向量。如果我们把新向量再乘以一个矩阵呢?又得到一个向量:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(3)

把(1)式代入(2)式,就得到:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(4)

我们已经知道矩阵是一个线性变换,从上面的式子可以看出,两个矩阵相乘,就相当于连续进行两个线性变换,作用还是将一个旧向量变成一个新向量。那我们不禁会想,肯定存在一个复合矩阵,它的效果等同于两个矩阵相乘。用公式表示就是:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(5)

很明显,我们要找的这个复合矩阵,就是两个矩阵的乘积:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(6)

思路有了,那复合矩阵到底怎么算呢?别急,我们还是从基的角度去解决这个问题。

上式中的矩阵[a,b;c,d]就是由原来的基向量ij变换而来,我们把它看做新的基(a,c)和(b,d)。那么新的基再乘以矩阵[i,j;k,l]是什么含义呢?就相当于把新的基分别再做了一次线性变换。因此,复合矩阵就相当于:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(7)

复合矩阵的第一列,就是矩阵[i,j;k,l]与向量(a,c)的乘积;复合矩阵的第二列,就是矩阵[i,j;k,l]与向量(b,d)的乘积。把上式展开,得到复合矩阵为:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(8)

这就是矩阵乘法的定义,我们从另一个角度去理解了它的内涵。

  • 行列式

接下来,我们来看矩阵的行列式在几何上的意义。这里先放结论,行列式就是线性变换前后,面积的缩放倍数。到底是怎么回事呢?我们先看下图:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(9)

如图,是我们的ij基向量所围成的面积。现在让它乘以一个矩阵[2,0;0,2],看看有什么变化:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(10)

从上图可以很容易看出,在矩阵的作用下,i变为原来的2倍,j也变为原来的2倍,因此新的基向量围成的面积是原来的4倍。

所以,矩阵[2,0;0,2]的行列式就等于4.

哦,或许你还是有点不明白。没关系,我们把它一般化,看看行列式的公式到底怎么来的。二维矩阵行列式的公式如下:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(11)

我们用det()来表示矩阵的行列式,那上面的公式是怎么得出的呢?我们来画个图:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(12)

如图,OA就是新的基向量(a,c),而OC就是基向量(b,d)。那么平行四边形OABC就是新的两个基向量围成的面积,如何计算这个面积呢?我们可以把它补成一个长方形,如下图:

矩阵的行列式计算及性质(抛弃复杂的运算来理解)(13)

不难看出,平行四边形的面积等于长方形的面积减去边角的面积。其中,长方形的面积为(a b)(c d)。边角的面积由4个三角形和2个小长方形构成,它们的面积是:ac bd 2bc。然后用长方形的面积减去边角的面积,就是平行四边形的面积:

(a b)(c d)-(ac bd 2bc)=ac bc ad bd-ac-bd-2bc=ad-bc

而ad-bc正是上面公式最后的结果。

今天分享的这些,你都明白了吗?欢迎留言讨论。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页