量子力学的数学原理1
线性代数一个极其美妙的点在于,它自然地成为了量子力学中每个部分的基石。这篇文章我将向各位展示,教材上几乎每个不知所谓的定理,是如何自然融入到量子力学之中。
基本假设
从数学角度来说,量子力学是描述向量随时间演化的过程。这个“向量”对应的物理实质可能是某个粒子。
最为人所熟知的是哥本哈根诠释:向量 \(p\) 是一个以位置为输入的复函数,而 \(p(x)\) 的模长表示粒子处在位置 \(x\) 的概率密度。在这种情况之下,\(p\) 处在一个无限维的向量空间。由于它必须是一个概率密度函数,所以该空间应该只包含平方可积函数。
量子力学假设任何孤立的物理系统都与一个称作系统状态空间的复内积向量空间相连。系统的状态可以用状态空间内的一个单位向量完全描述。量子力学并不要求这个空间具体是什么。它只要求这个空间定义了内积。虽然无限维和有限维的内积空间在性质上稍有不同,但是量子力学也不在意,照单全收。
注意一点,系统的状态应该是一个单位向量,这就是说它的模长是 1。你可以从多方面来理解这一点:
- 系统状态是概率幅,它决定了系统在测量时出现某个特定结果的概率,因此,它必须是归一化的。
- 模长并不对应于任何可观测的物理量,因此,它不具有任何物理意义。但是归一化带来了数学上的方便性,使得我们可以使用一些非常强大的工具来研究量子系统。
事实上,想要具体确定状态空间究竟是什么是非常困难的。我们学量子力学的困难也是来源于此。但是,如果把这个物理实现抛开,量子力学本身像牛顿第二定律一样简洁。
记号
在量子力学中,状态向量一般用 \(\ket{\psi}\) 来表示。这个 \(\ket{\cdot}\) 符号被称为 ket,而里面的字母只是个记号。而向量的对偶向量,你可以理解为共轭转置 \(u^\dagger\),被记作 \(\bra{\psi}\)。
自然的,两个向量的内积被记作 \(\braket{\varphi|\psi}\)。你可以理解为 \(u^\dagger u\)。
另外,两个向量的外积生成一个算子:\(A = \ket \varphi \bra \psi\)。这个算子满足 \(A\ket u = \braket{\psi|u}\ket{\varphi}\)。你可以理解为 \(uu^\dagger\)。
演化
酉变换
重复一下,量子力学是描述向量随时间演化的过程。具体是怎样的呢?
量子力学假设,封闭量子系统的演化可以用酉变换来描述。换句话说,确定了两个时间 \(t_1\) 和 \(t_2\),这两个时刻的状态向量可以用一个酉算子 \(U_{t_1,t_2}\) 来确定:
\[ \ket{\psi(t_2)} = U(t_1, t_2)\ket{\psi(t_1)} \]
这个算子是什么?这又是一个“难”的问题。不同的系统有不同的算子。但是只要这个算子是酉的,这就是一个符合量子力学要求的系统,虽然大自然可能不选择这个系统。
回顾一下,酉的意思是 \(U^\dagger U = I\)。其中 \(U^\dagger\) 是伴随,被定义为 \(\braket{\varphi|U\psi} = \braket{U^\dagger \varphi | \psi}\)。你也可以简单理解为共轭转置。
为什么要保证是酉算子?首先,酉算子是可逆的,而且这个逆很简单,很自然。这符合我们对物理系统的期待:一个孤立的系统,总是可以在时间上双向传播(有一些理论确实对此提出了质疑,这也是量子力学和其他理论结合的难点所在)。其次,更重要的一点是,酉运算保持了内积不变:
\[ \braket{\varphi|\psi} = \braket{\varphi |U^\dagger U|\psi} \]
这对应了很多量关于时间的守恒。如果内积关于时间都不守恒,我们所熟知的能量守恒、动量守恒等等都消失不见。
薛定谔方程
上面这个假设是离散的,描述了两个不同时刻的状态。刻画状态向量随时间连续变化的方程就是著名的薛定谔方程:
\[ \mathrm i \hbar \frac{\mathrm d\ket{\psi(t)}}{\mathrm dt} = H\ket{\psi(t)} \]
你可以把它和牛顿第二定律做个对比。\(\mathrm i\) 是虚数单位,\(\hbar\) 是普朗克常量。如果把常数都隐去,这是个简单的一阶常微分方程 \(x' = Hx\),是在大一就出现在高数书上的内容。
既然如此,我们可以简单地写出其通解:
\[ \ket{\psi(t_2)} = \exp\left(-\frac{\mathrm iH(t_2-t_1)}{\hbar}\right)\ket{\psi(t_1)} \]
不难发现,此时:
\[ U(t_1,t_2) = \exp\left(-\frac{\mathrm iH(t_2-t_1)}{\hbar}\right) \]
\(H\) 被称作系统的哈密顿量。它的具体内容也是一个“难”的问题。但抽象来说,它被要求为一个常厄米算子。回顾一下,厄米算子指的是自伴的算子,即 \(H^\dagger = H\)。这个限制其实等价于要求 \(U\) 是酉的。折叠内容说明了这一点。
我们将从正反两方面证明 \(U\) 是酉的等价于 \(H\) 是厄米的。
对于任意酉算子 \(U\),定义 \(K = -\mathrm i \log U\)。我们用如下方法定义对数:既然 \(U^\dagger U = UU^\dagger = I\),说明 \(U\) 是正规的(即 \(U^\dagger U = UU^\dagger\))。根据复谱定理, \(U\) 有其谱分解(或者说特征值分解):
\[ U = \sum_{i}\lambda_i \ket{i}\bra{i} \]
其中 \(\ket i\) 是一组单位正交基。这其实是我们熟知的 \(U = P\Lambda P^\dagger\) 的另一种形式。你可以简单地验证,对于所有的特征向量 \(\ket i\),有:
\[ \begin{aligned} U\ket i &= \sum_j \lambda_j (\ket j \bra j) \ket i \\ &=\sum_j \lambda_j \braket{j|i}\ket j \\ &= \lambda_i \ket i \end{aligned} \]
最后一个等号是注意到单位正交性,只有 \(\braket{i|i}=1\),而对于 \(j \ne i\),\(\braket{j,i}=0\)。
回到 \(K = -\mathrm i \log U\)。我们如下定义 \(\log U\):
\[ \log U = \sum_i \log \lambda_i \ket i \bra i \]
其中 \(\log \lambda_i\) 取主值。
注意到酉算子保持内积不变,所以有:
\[ \bra i U^\dagger U \ket i = \braket{ i |\lambda_i|^2 i} = \braket {i|i} \]
所以 \(|\lambda_i|^2 = 1\)。那么我们可以用欧拉定理重写 \(\lambda_i = \mathrm{e}^{\mathrm i\theta_i}\)。那么重点来了, \(\log \lambda_i\) 的主值就是 \(\mathrm i\theta_i\)。
这里我们发现,虚数单位 \(\mathrm i\) 自然地浮现,从一个角度展示了为什么薛定谔方程有这个量。
所以:
\[ \begin{aligned} K &= -\mathrm i \log U \\ &= \sum_i \theta_i \ket i \bra i \end{aligned} \]
现在,我们发现 \(K\) 的特征值就是 \(\theta_i\),而且是非负实数。即 \(K\) 是厄米算子。自然,\(H = \hbar K\) 也是厄米算子。
(为了提醒对谱定理不熟悉的人,所谓厄米算子在实数上就是实对称矩阵,这句话在实数域上就是说实对称矩阵有非负特征值。)
所以,对于每个酉算子 \(U\),都有一个厄米算子 \(H\) 与之对应。反过来,我们不难验证,通解所定义的 \(U(t_1,t_2)\) 是酉的:
\[ U(t_1,t_2) = \exp\left(-\frac{\mathrm iH(t_2-t_1)}{\hbar}\right) \]
对于可以谱分解的算子,\(\exp\) 的定义如下:
\[ \exp{H} = \sum_i \mathrm e^{\lambda_i}\ket i\bra i \]
同时有性质:如果 \(AB=BA\),那么 \(\exp(A)\exp(B)=\exp(A+B)\)。这其实是在说可对易的算子具有相同特征向量。或者你可以使用 \(\exp\) 的级数定义,用二项式定理证明这一点。
总而言之,我们有:
\[ \begin{aligned} U &= \sum_i \mathrm e^{-\frac{\mathrm i}{\hbar}\lambda_i}\ket i\bra i \\ U^\dagger &= \sum_i \mathrm e^{\frac{\mathrm i}{\hbar}\lambda_i}\ket i\bra i \\ UU^\dagger &= \sum_i \ket i \bra i = I \end{aligned} \]
所以,上述两种对封闭系统演化过程的假设是等价的。
既然 \(H\) 是厄米的,高数书告诉我们,这个薛定谔方程是有特解的。
考虑 \(H\) 的特征值分解:
\[ H = \sum_i E_i \ket {E_i} \bra {E_i} \]
其中 \(E_i\) 是非负的特征值。我们说 \(E_i\) 是状态 \(\ket {E_i}\) 的能量,而 \(\ket {E_i}\) 一般被称作能量本征态。最小的 \(E\) 对应的状态被称为系统的基态能量,而相应的 \(\ket E\) 被称作基态。不难联想到所谓的电子轨道。你会发现,特征向量 \(\ket {E_i}\) 随时间演化只改变一个常数因子 \(\exp(-\frac{\mathrm i E_i t}{\hbar})\)。
这是量子力学的一个设定,所有的可观察量都是某个玩意的特征值。这符合观察到的量子化特征。在描述单个粒子的薛定谔方程中,哈密顿量被设定为 \(-\frac{\hbar^2}{2m}\nabla^2 + V\),其中 \(V\psi\) 描述某状态的势能,而 \(\nabla\) 是(关于空间的)梯度算子,也就是能量等于动能加势能。
在上述具体的例子里,我们抽象定义的“能量”粒子的真实能量相契合。
总结
到这里,我们完整描述了封闭物理系统随时间的一切演化。就像是无位移电流的麦克斯韦方程组。我们用到了如下在线性代数书上令人摸不着头脑的定义:
- 内积
- 外积
- 酉
- 厄米
- 谱分解
我们叙述了两个量子力学的基础假设:
- 任何孤立的物理系统都与一个称作系统状态空间的复内积向量空间相连。系统的状态可以用状态空间内的一个向量完全描述。
- 封闭量子系统的演化可以用酉变换来描述。
之后,我会继续介绍一个物理系统是如何与外界作用的,即所谓“测量”。这也是量子力学反直觉的地方:它以概率返回测量结果,同时测量作用本身会改变系统状态。