量子力学的数学原理2
测量
相比经典物理的测量,量子力学中的测量展示出如下特点:
- 测量的结果是不确定的。这并不是说对同一个物体进行多次测量时得到的结果会不同,而是说对于处在同一状态下的两个不同的粒子,它们的测量结果可能完全不同。
- 测量会改变系统的状态。如果我们测量了一个量子态,实际上就是在破坏它。这种破坏的程度取决于测量的方法,有的测量具有可重复性,你可以认为量子“坍缩”到测量结果上,并且呆在那个状态上,比如测量电子的自旋;有的测量则会破坏量子态,比如用感光屏记录光子的位置,这种测量会破坏光子,当然不能再测到同一个位置。
我们要时刻把上面两点记在心里。准备好了吗?开始迎接反常识的量子旅程吧!
量子比特的例子
我们先来考虑一个最简单的单量子系统:量子比特。量子比特处在一个二维复空间中,这个复空间有两个基 $ , $,你可以想象是电子的基态和激发态,或是电子的自旋。
回顾一下,一个量子态必须是归一化的,所以对于量子比特 \(\ket{\psi}\),我们可以将其表示为:
\[ \ket{\psi} = \alpha \ket{0} + \beta \ket{1} \]
其中 \(\alpha\) 和 \(\beta\) 是复数,并且满足归一化条件:
\[ |\alpha|^2 + |\beta|^2 = 1 \]
自然,我们可以用有序数对的形式来记录这个向量:\((\alpha, \beta)\) 代表 \(\alpha \ket 0 + \beta \ket 1\)。
下面,我们介绍两个特殊的量子比特:\(\ket +\) 和 \(\ket -\)。
\[ \begin{aligned} \ket{+} &= \frac{1}{\sqrt{2}} (\ket{0} + \ket{1})\\ \ket{-} &= \frac{1}{\sqrt{2}} (\ket{0} - \ket{1}) \end{aligned} \]
不难发现,这两个量子比特对应 \((\frac{1}{\sqrt 2}, \frac{1}{\sqrt 2})\) 和 \((\frac{1}{\sqrt 2}, -\frac{1}{\sqrt 2})\)。
好啦!现在,假设我们有了一个 \(\ket +\)。我们要对它进行测量。在量子力学中,所谓测量,其实是将量子比特投影到某个基态上。在这个例子中,我们将 \(\ket +\) 投影到 \(\ket{0}\) 上,考虑到它们都是单位向量,其实就是在求内积。我们把这称为“在 \(\ket{0}\) 方向上测量”:
\[ \begin{aligned} \braket{0|+} &= \frac{1}{\sqrt{2}} (\braket{0|0} + \braket{0|1})\\ &= \frac{1}{\sqrt 2} \end{aligned} \]
这就是有序数对里的内容。这是自然的,因为有序数对表示其实暗含着选择 \(\ket 0, \ket 1\) 为基。相似的,我们也可以在 \(\ket +\) 方向上测量:
\[ \braket{+|+} = 1 \]
测量结果的模长的平方代表着得到这一结果的概率。因此,得到 \(\ket{+}\) 的概率是 \(1^2 = 1\),即每次测量都会得到这个结果。而得到 \(\ket 0\) 或 \(\ket 1\) 的概率都是 \((\frac{1}{\sqrt{2}})^2 = \frac{1}{2}\)。
总结一下,在上面的例子中,测量过程可以看作是选择一个基,然后在该基上进行投影。测量结果的概率由投影算符的模长平方给出。由于量子态是归一化的,因此投影算符的模长平方之和必须等于 1。这确保了所有可能结果的概率总和为 1。
带着这个理解,我们来看一般的测量表示。
一般测量
对于一个量子态 \(\ket{\psi}\),测量由一组测量算符 \(M_i\) 组成,这些算符满足如下完备性方程:
\[ \sum_{i} M_i^\dagger M_i = I \]
其中 \(I\) 是单位算符。每个测量结果 \(i\) 的概率由以下公式给出:
\[ p(i) = \braket{\psi | M_i^\dagger M_i | \psi} \]
这也就是 \(M_i \ket \psi\) 的模的平方。
测量之后系统的状态变为:
\[ \ket{\psi'} = \frac{M_i \ket{\psi}}{\sqrt{\braket{\psi | M_i^\dagger M_i | \psi}}} \]
其中 \(\ket{\psi'}\) 是归一化的结果态。
你可以把测量对量子态的影响和量子态的自然演化做一个对比:演化过程由一个酉算符 \(U(t)\) 给出,而测量则通过一个非酉算符 \(M_i\) 来描述。前者保持内积,而后者不保持,所以我们要进行归一化。
测量的复杂性在于,它几乎没有对 \(M\) 做任何要求。在前文量子比特的例子中,在 \(\ket 0,\ket 1\) 上测量其实就是选择如下算符:
\[ \begin{aligned} M_0 &= \ket 0 \bra 0 \\ M_1 &= \ket 1 \bra 1 \end{aligned} \]
这满足完备性方程,因为 \(I\) 的一个谱分解就是 \(I = M_0^\dagger M_0 + M_1^\dagger M_1\)。
得到 0 的概率是:
\[ p(0) = \braket{+|M_0^\dagger M_0|+} = \braket{+|M_0|+} = \left|\braket{+|0}\right|^2 = \frac{1}{2} \]
而测量后,量子态变为:
\[ \frac{\ket 0 \braket{0|+}}{\sqrt{p(0)}} = \ket 0 \]
量子态“坍缩”到了 \(\ket 0\) 上!这说明这个测量是具有可重复性的,也即之后的测量会得到相同的结果。
但并不是所有的测量都是如此。事实上,我们所举的例子是一种特殊的测量,称为“投影测量”。
投影测量
如果一组测量算子的每一项都是一个投影算子,那么这些测量被称为投影测量。投影算子 \(P\) 被定义为把投影空间内的向量映射到自身,而把投影空间正交补的向量映射到零。它满足:\(P^2=P\)(幂等),\(P^\dagger = P\)(自伴/厄米)。
投影测量被一个厄米算子 \(M\) 来描述,它被按照谱分解的方式定义:
\[ M = \sum_m m P_m \]
其中 \(P_m\) 是与 \(M\) 的特征值 \(m\) 对应的投影算子,而 \(m\) 是可能的观测结果。这种 \(M\) 在习惯上被称作一种“可观测量”,它具有固定的量子化取值,而且是实数,也就是它的特征值。当我们在说一个可观测量时,在数学上,其实是在讨论这个厄米算子。
如果你在思考一般测量和投影测量的联系,注意到下面的数学细节:\(M\) 是厄米的,其特征值 \(m\) 也许对应若干特征向量 \(u^m_i\),则 \(P_m\) 被定义为:
\[ P_m = \sum_i \ket {u^m_i} \bra {u^m_i} \]
又注意到 \(P^\dagger P = P^2 = P\),并且不同特征值的投影算子是正交的,而投影算子本身在其子空间上就是 \(I\),所以有:
\[ \sum_m P_m^\dagger P_m = I \]
我们把这样一组特殊的测量算子 \(\{P_m\}\) 用谱分解的形式打包成一个算子 \(M\),就得到了投影测量。
测量得到结果 \(m\) 的概率是:
\[ p(m) = \braket{\psi | P_m | \psi} \]
测量后结果立即变为:
\[ \ket{\psi} \leftarrow \frac{P_m \ket{\psi}}{\sqrt{p(m)}} \]
这种谱分解的打包形式有什么好处?我们选取了测量结果作为特征值,这让测量结果的统计性质计算起来变得非常方便。例如,测量结果的期望为:
\[ \begin{aligned} \mathrm{E}[M] &= \sum_m m p(m)\\ &= \sum_m m \braket{\psi | P_m | \psi}\\ &= \braket{\psi | M | \psi} \end{aligned} \]
多简洁!为了方便,我们一般把期望简写为 \(\braket{M}\)。
同理,测量结果的方差可以计算为:
\[ \begin{aligned} \braket {\Delta (M)} &= \braket{(M - \braket{M})^2} \\ &= \braket{M^2} - \braket M^2 \end{aligned} \]
有了这个,我们可以导向一个著名的结论:海森堡不确定性原理。
海森堡不确定性原理
对易式
对于同一空间上的两个算子 \(A,B\),我们定义它们的对易式为:
\[ [A, B] = AB - BA \]
相似的,定义反对易式为:
\[ \{A, B\} = AB + BA \]
如果 \([A,B]=0\),意味着 \(A,B\) 是可交换的。顺带一提,当 \(A,B\) 都是厄米算子时,这代表它们有相同的本征态(特征向量),且 \(AB\) 也是一个厄米算子。这一点在线性代数的考试中经常出现。
一个自然的问题是:如果两个测量算子是不可交换的,这意味着什么?测量的结果会互相影响?
不确定性
对于两个表示测量的厄米算子 \(A,B\),我们先来进行一些纯数学推导。
首先,因为 \((AB)^\dagger = BA\),我们有:
\[ \braket{\psi | AB | \psi} = \braket{\psi | BA | \psi} ^\dagger \]
假设 \(\braket{\psi|AB|\psi} = x + \mathrm iy\),那么:
\[ \begin{aligned} &&\braket{\psi | [A,B] | \psi} &= \braket{\psi | AB - BA | \psi} = 2\mathrm iy \\ &&\braket{\psi | \{A,B\} | \psi} &= \braket{\psi | AB + BA | \psi}= 2x \\ \end{aligned} \]
对比它们的值,我们发现:
\[ \begin{aligned} \left|\braket{\psi | [A,B] | \psi}\right|^2 + \left|\braket{\psi | \{A,B\} | \psi}\right|^2 &= 4 \left|\braket{\psi|AB|\psi}\right|^2 \\ \left|\braket{\psi | [A,B] | \psi}\right|^2 &\leq 4 \left|\braket{\psi|AB|\psi}\right|^2 \\ \end{aligned} \]
另外,我们有柯西-施瓦茨不等式:
\[ \left|\braket{\psi|AB|\psi}\right|^2 \le \braket{\psi|A^2|\psi}\braket{\psi|B^2|\psi} \]
如果你对这个式子感到疑惑,说明你和我一样对 braket 记号不熟悉,考虑 \(u=A \ket \psi, v = B \ket \psi\),就变成这个简单形式:
\[ (u^\dagger v)^2 \le |u|^2|v|^2 \]
总而言之,综合上面的两个不等式,我们得到:
\[ \left|\braket{\psi | [A,B] | \psi}\right|^2 \le 4\braket{\psi|A^2|\psi}\braket{\psi|B^2|\psi} \]
好!最后一步魔法,我们考虑两个中心化后的新算子 \(C = A - \braket A, D = B - \braket B\)。还记得方差的表示吗?
\[ [\Delta(A)]^2 = \braket{\psi | (A-\braket{A})^2 | \psi} = \braket{\psi | C^2 | \psi} \]
我们把 \(C,D\) 带入不等式中,就得到:
\[ \begin{aligned} &&\left|\braket{\psi | [C,D] | \psi}\right|^2 &\le 4\braket{\psi|C^2|\psi}\braket{\psi|D^2|\psi} \\ &\Rightarrow&\left|\braket{\psi | [A,B] | \psi}\right|^2 &\le 4[\Delta(A)]^2 [\Delta(B)]^2\\ &\Rightarrow& \Delta(A)\Delta(B) &\ge \frac{\left|\braket{\psi | [A,B] | \psi}\right|}{2} \end{aligned} \]
你可以自行检验 \([C,D] = [A,B]\)。
这就是海森堡不确定性原理的一般数学形式。对于任意两个可观测量 \(A,B\),如果我们准备了大量的量子态 \(\psi\),一些测量 \(A\),另一些测量 \(B\),那么测量结果的标准差必然满足上述不等式。不难发现,“测不准”的程度取决于两个观测量的“非可交换性”(即它们的对易子不为零),而一个最著名的例子就是位置和动量的不确定性:
\[ [\hat x, \hat p] = -\mathrm i \hbar x \frac{\mathrm d}{\mathrm dx} + \mathrm i \hbar \frac{\mathrm d}{\mathrm dx} x = \mathrm i \hbar \]
我需要对上面的推导做出一些说明。我们这里得到的,是所谓“制备不确定性”,即大量制备相同量子态的系统时,系统的位置和动量不可能同时完全一致或大致相同,其误差是有下限的。
另一种不确定性是“顺序测量不确定性”,这种不确定性是说位置测量会对动量产生扰动,也即前者测量后量子态的变化会让后者的测量结果有偏差(这是一个极其含混的词语,海森堡本人也没有定义过,相对什么的偏差?什么和什么做差?一般认为,这里实是在说测量的系统误差);反过来,动量测量也会对位置产生扰动。有趣的是,这种不确定性的数值和“制备不确定性”是相同的。许多人相信这些不同的不确定性之间是统一的,但是现在还没有一个明确的理论来解释它们之间的关系。
在科普的过程中,这个原理常常遭到误解。一种常见的误解是“位置测量越精确,动量测量就越不准确”。这是完全从经典物理学的角度出发的误解:量子力学中并没有“精确”这个概念,只有概率分布。对于一个量子态,并不存在一个所谓的“真实值”。只是有一个统计意义上的期望值。单次测量总是得到唯一一个结果,只是有的结果距离期望值比较远,而有的值比较近。