线性代数1-3

矩阵

\(n \times m\) 个数排成 \(n\)\(n\) 列的矩形数表叫做矩阵。

\[ A= [a_{ij}]_{n \times m} = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1m}\\ a_{21} & a_{22} & \cdots & a_{2m}\\ \cdots & \cdots & \cdots & \cdots\\ a_{n1} & a_{n2} & \cdots & a_{nm}\\ \end{bmatrix} \]

其中 \(a_{ij}\) 被称为 \(A\)\((i,j)\) 元素。

如果 \(n=m\),称 \(A\) 为方阵。

所有元素都为实数的矩阵称为实矩阵;都是复数的叫复矩阵。

对于方阵,将 \(a_{ii}\) 的元素称为主对角线元素,构成主对角线;将 \(a_{i,n-i+1}\) 称为副对角线元素,构成副对角线。

若两个矩阵行数与列数都相同,称两矩阵同型。

若两个同型矩阵所有元素对应相等,则称两矩阵相等。

特殊矩阵

零矩阵

\(O = [0]_{n \times m}\) 称为 \(n\)\(m\) 列的零矩阵。

注意并非所有零矩阵都相等。

对角矩阵

非主对角线元素全零的方阵称为对角阵,记作:

\[ A = \operatorname{diag}(a_{11}, a_{22}, \cdots, a_{nn}) \]

单位矩阵

\(\operatorname{diag}(1,1,\cdots,1)\) 为单位矩阵 \(I\)

数量矩阵

\(\operatorname{diag}(\lambda, \lambda, \cdots, \lambda)\) 为大小为 \(\lambda\) 的数量矩阵。

行/列矩阵

将只有一行的矩阵称为行矩阵或行向量;同理,将只有一列的矩阵称为列矩阵或列向量。

其中的元素也被称作分量。

三角矩阵

将主对角线下方为 0 的矩阵称为上三角矩阵;同理,主对角线上方为 0 的矩阵称为下三角矩阵。

负矩阵

什么运算性质也好意思凑热闹

\(-A = [-a_{ij}]_{n\times m}\)

矩阵的代数运算

加法

对于同型矩阵 \(A = [a_{ij}]_{n \times m}\), \(B = [b_{ij}]_{n \times m}\),定义:

\[ A + B = [a_{ij} + b_{ij}]_{n \times m} \]

运算律

  • 交换律:\(A+B = B+A\)
  • 结合律:\((A+B)+C = A+(B+C)\)
  • 零元:\(A+O=A\)

减法

定义 \(A-B = A+(-B)\)

数乘

对于常数 \(k\),定义:

\[ Ak = kA = [ka_{ij}]_{n\times m} \]

运算律

  • 幺元:\(1A = A\)
  • 常交换律:\(\lambda(\mu A) = \mu(\lambda A)\)
  • 关于常数的分配律:\((\lambda + \mu)A = \lambda A + \mu A\)
  • 关于矩阵的分配律:\(\lambda (A+B) = \lambda A + \lambda B\)
  • 常零元:\(0A = O\)
  • 矩阵零元:\(\lambda O = O\)

数乘与加减共称为矩阵的线性运算。

乘法

\(A = [a_{ij}]_{n\times k}\)\(B = [b_{ij}]_{k \times m}\),定义:

\[ AB = C = [c_{ij}]_{n\times m} = \left[\sum_{p=1}^ka_{ip}b_{pj}\right]_{n\times m} \]

注意矩阵乘法是一个 \(\mathbb R^{n \times k} \times \mathbb R^{k \times m} \to \mathbb R^{n \times m}\) 的运算。

实际上,\(C_{ij}\) 等于 \(A\) 的第 \(i\) 行向量与 \(B\) 的第 \(j\) 列向量的内积。

另一种思考方式如下:

\[ C = \sum_{p=1}^k\left[a_{ip}b_{pj}\right]_{n\times m} \]

有什么区别呢?这不只是把e求和符号提出来了吗?

这其实是另一种视角:

我们取出 \(A\) 的第 \(p\) 列放在左边,\(B\) 的第 \(p\) 行放在上面,一个自然的想法就是做出一张乘法表:

\[ \begin{aligned} &\begin{matrix} \ \ \ \ \ \ \ \ b_{p1}\ \ \ \ \ \ & b_{p2} & \cdots & \ \ \ \ \ b_{pm}\ \ \ \ \ \end{matrix}\\ \begin{matrix} a_{1p} \\ a_{2p} \\ \cdots \\ a_{np} \end{matrix}&\begin{bmatrix} a_{1p}b_{p1} & a_{1p}b_{p2} & \cdots & a_{1p}b_{pm}\\ a_{2p}b_{p1} & a_{2p}b_{p2} & \cdots & a_{2p}b_{pm}\\ \cdots & \cdots & \cdots & \cdots \\ a_{np}b_{p1} & a_{np}b_{p2} & \cdots & a_{np}b_{pm}\\ \end{bmatrix} \end{aligned} \]

中间的那个表记作 \(C_p\),则 \(AB = C = \sum C_p\)

这两种视角都有助于展示矩阵乘法的含义。

运算律

决不具有交换律

  • 结合律:\((AB)C = A(BC)\)。可以亲自展开试一试?这个有点过分地 trival 了。
  • 零元:\(OA = AO = O\)
  • 幺元:\(IA = AI = A\)
  • 分配律:\(A(B+C) = AB + AC\)\((B+C)A = BA + CA\)
  • 关于数乘的交换律与结合律:\(k(AB) = (kA)B = A(kB)\)

矩阵的幂

定义 \(A^0 = I\)\(\forall n \in \mathbb Z_+ ,A^n = AA^{n-1}\)

运算律

  • 关于数乘的分配律:\((\lambda A)^k = \lambda^kA^k\)
  • 不存在关于乘法的分配律:\((AB)^k \ne A^k B^k\)
  • 类似 \((A+B)^2\)\(A^2-B^2\) 的公式都不成立

转置

\(A = [a_{ij}]_{n \times m}\),定义:

\[ A^\mathrm T = [a_{ji}]_{m\times n} \]

运算律

  • 周期性:\(\left(A^\mathrm T\right)^\mathrm T = A\)
  • 数乘:\((\lambda A)^\mathrm T = \lambda A^\mathrm T\)
  • 乘法逆序原则:\((AB)^\mathrm T = B^\mathrm T A^\mathrm T\)。证明也是展开?

线性方程组和矩阵

\[ \begin{aligned} Ax &= b \\ \Leftrightarrow \begin{bmatrix} A_1x\\ A_2x\\ \cdots\\ A_nx\\ \end{bmatrix} &= b\\ \Leftrightarrow \begin{bmatrix} A_{11}x_1 + A_{12}x_2 + \cdots + A_{1m}x_m\\ A_{21}x_1 + A_{22}x_2 + \cdots + A_{2m}x_m\\ \cdots\\ A_{n1}x_1 + A_{n2}x_2 + \cdots + A_{nm}x_m\\ \end{bmatrix} &= \begin{bmatrix} b_1 \\ b_2 \\ \cdots \\ b_n \end{bmatrix} \end{aligned} \]

\(\bar{A} = [A:b]\)\(A\) 的增广矩阵。

线性变换

\(y = Ax\),称 \(A\)\(x\)\(y\) 的一个线性变换。

单位变换

单位阵 \(I\) 对应的变换叫单位变换,满足 \(y=Ix=x\)

复合变换

\(y = Ax\)\(z=By\),则从 \(x\)\(z\) 的线性变换为 \(AB\)