量子力学的数学原理3

叠加态和混合态

“叠加态”是一个广为流传的名字。这主要是由于其反常识的特性。这里的“叠加”是相对于基态而言的,它描述的是一种线性代数上的事实:任何一个量子态都可以表示为多个基态的线性组合。比如 \(|+\rangle = \frac{1}{\sqrt{2}}(|0\rangle + |1\rangle)\) 就是一个叠加态。之所以这个名字给人深刻印象,是因为在 \(|0\rangle\)\(|1\rangle\) 方向上测量时,结果是随机的。但这并不是说量子态本身是随机的。

举例来说,如果这个量子比特代表了一束光子的偏振方向,那么这束光能够完美穿过一个 \(|+\rangle\) 方向的滤波器,而有 \(50\%\) 的概率穿过一个 \(|0\rangle\) 方向的滤波器。

但是,如果量子态本身是 \(|0\rangle\) 或者 \(|1\rangle\) 中随机选取,那么只有 \(50\%\) 的概率能够通过 \(|+\rangle\) 滤波器(对于 \(|0 \rangle\)\(|1 \rangle\) 都如此),而也只有 \(50 \%\) 的概率通过 \(|0\rangle\) 滤波器(剩下的状态为 \(|1\rangle\))。事实上,这样的一束 \(|0\rangle,|1\rangle\) 混合的光子总有 \(50\%\) 的概率通过任何方向的滤波器。

前者是正确的叠加态,而后面的状态我们称为混合态。显然,这两种状态无论在本质上还是在测量结果上都有很大的区别,是我们有必要去区分的。

和混合态相对的,是“纯态”。纯态是指量子系统处于一个确定的状态,即量子态不能被分解为更小的子系统。例如,如果一个光子处于 \(|0\rangle\) 状态,那么它就是一个纯态;如果一个光子处于 \(|+\rangle\) 状态,那么它也是一个纯态。纯态里面,再分有基态和叠加态,但这只是一个视角的问题,换个基,并不改变纯态的本质。

什么时候会出现混合态呢?当我们无法获取关于量子系统的完整信息时,就会出现混合态。最常见的一种情况是,我们所描述的系统是一个更大封闭系统的一部分,但是我们只知道这个子系统的信息。比方说两个量子比特形成如下状态:

\[ |\psi\rangle = \frac{1}{\sqrt2}|01\rangle + \frac{1}{\sqrt2}|10\rangle \]

这是一个经典的所谓“纠缠对”。一个典例是假设一个零自旋中性π介子衰变成一个电子与一个正电子,那么两个电子拥有相反的自旋,他们两个的自旋状态可以被如上表示。如果我们通过正负电荷把所有的负电子筛出来,然后对这些电子测量,就会出现符合混合态的统计结果:无论在哪个方向测量,得到的结果都是 \(50 \%\)。说明负电子并不具有一个单一确定的量子态表示自旋。

换而言之,当多个系统之间发生纠缠时,它们的状态不能被描述为独立的个体状态,而必须作为一个整体来考虑。如果我们只考虑其中的一部分,就会得到一个不完整的,在统计意义上等价于概率混合的结果,我们称这个部分处于混合态。

我们有必要深入考虑多系统带来的复杂情况。

复合系统

在量子力学中,复合系统是指由多个独立的子系统组成的系统。复合系统自身若是封闭的,那么这个系统就可以被一个向量表示。注意,这个大系统处在一个纯态,因为它是封闭的,用一个向量就能完全描述。

具体来说,大系统的状态 \(|\psi\rangle\) 和子系统的状态 \(|\psi_i\rangle\) 之间的关系可以通过以下公式来表达:

\[ |\psi\rangle = |\psi_1\rangle \otimes |\psi_2\rangle \otimes ... \otimes |\psi_n\rangle \]

其中,\(\otimes\) 表示张量积(tensor product),它是一种将多个向量组合成一个新向量的方法。要注意的是,这个公式仅适用于子系统之间相互独立的情况,相当于说,我决定把这些系统看作一个整体,“看作”这一步符合这个公式。接下来,如果整个复合系统开始协同演化,子系统之间产生了纠缠,这个公式就不再适用了,事实上,子系统就无法用单一向量描述了。

先不急,我们先看看什么是张量积?

(下面的数学内容较多,如果你懒得看,记住一点:张量积把 \(n\) 维和 \(m\) 维的乘出一个 \(nm\) 维的东西,而且是线性的)

张量积

密度算子

对于一个复合系统,如果我们能够完整了解整个系统的状态,那么用纯态向量来表示是可行的。然而,在实际操作中,我们通常只能获得部分子系统的信息。这些子系统处在混合态,无法用纯态向量表示,这时就需要使用密度算子来描述系统的状态。

不难想到,要描述一个混合态,要指定下面两点:

  1. 系统可能处于的各个纯态;
  2. 每个纯态出现的概率。

这被称为一个系综:\(\{|\psi_i\rangle, p_i\}\)。其中\(|\psi_i\rangle\)是系统可能处于的纯态,\(p_i\)是该纯态出现的概率。我们有一个巧妙的方法摆脱大括号,用经典概率(不是量子概率振幅)线性组合来表示混合态:

\[ \rho = \sum_{i} p_i |\psi_i\rangle\langle\psi_i| \]

这里 \(\rho\) 是密度矩阵,它是一个对称的、半正定的、迹为 1 的复数矩阵。

我要预先说明一点:使用密度矩阵是因为这种组合的线性性质使得混合态的演化、观测变得方便,但我们抛弃了一点信息:我们不再知道具体是哪些纯态构成了混合态。这是自然的,因为多个不同的纯态可以以相同的方式构成一个混合态。如果你不太相信,注意到 \(|\psi_i \rangle\) 不一定是正交的,但是 \(\rho\) 可以有一个非负的实谱分解,说明至少有一组正交的纯态也可以产生这个密度矩阵。

定义

我们来详细看看密度算子的定义和性质:

密度算子 \(\rho\) 是一个迹为 1 的,半正定的厄米算子,一个满足上述条件的算子至少与一个系综相关,反过来,任何一个系综都可以用一个密度算子来描述。

要注意的是,纯态系综和混合态系综都可以用密度算子来描述。两者还是有些区别。由于纯态的密度算子就是 \(\rho = |\psi \rangle \langle \psi |\),其矩阵可表示为 \(\text{diag}\{1,0,\dots\}\),而混合态的对角线都小于一,所以可以这样分辨:

计算 \(\text{tr}(\rho^2)\) 的值,如果等于 1,则表示是纯态;如果小于 1,则表示是混合态。

演化

我们知道,纯态的演化可以用一个酉算子 \(U\) 来表示,而对于混合态,其系综中的每一个纯态都被 \(U\) 作用,整个密度算子的变化如下:

\[ \rho' = \sum_i p_i U |\psi_i\rangle\langle \psi_i| U^\dagger = U \rho U^\dagger \]

测量

对于一般的测量,对于一组满足归一化条件的测量算子 \(\{M_m\}\),如果系统处在纯态 \(|\psi_i\rangle\) 下,那么测量得到 \(m\) 的概率为:

\[ p(m|i) = \langle \psi_i | M_m^\dagger M_m |\psi_i\rangle = \text{tr}(M_m^\dagger M_m |\psi_i\rangle\langle \psi_i|) \]

第二个等号是上面提到的迹的重要公式。

然后,用经典概率的全概率公式可以得到总的测量概率:

\[ p(m) = \sum_i p(m|i) p_i = \text{tr}(M_m^\dagger M_m \rho) \]

如果测量得到了结果 \(m\),那么每个纯态会发生如下变化:

\[ |\psi_i\rangle \rightarrow |\psi_i'\rangle = \frac{M_m |\psi_i\rangle}{\sqrt{\langle \psi_i | M_m^\dagger M_m |\psi_i\rangle}} \]

这是比较复杂的。但是密度算子会简化这一点。首先,我们来考察 \(|\psi_i'\rangle\langle \psi_i'|\)

\[ |\psi_i'\rangle\langle \psi_i'| = \frac{M_m |\psi_i\rangle \langle \psi_i| M_m^\dagger}{\langle \psi_i | M_m^\dagger M_m |\psi_i\rangle} = \frac{M_m |\psi_i\rangle \langle \psi_i| M_m^\dagger}{p(m|i)} \]

另外要注意,系综不只纯态变化了,对应的概率也变化了,原来的 \(p_i\) 变成了 \(p(i|m)\),根据贝叶斯公式:

\[ p(i|m) = \frac{p(m|i)p(i)}{p(m)} \]

整合起来,总的密度算子变为:

\[ \begin{aligned} \rho_m &= \sum_{i} p(i|m) |\psi_i'\rangle\langle \psi_i'| \\ &= \sum_{i} \frac{p(m|i)p(i)}{p(m)} \frac{M_m |\psi_i\rangle \langle \psi_i| M_m^\dagger}{p(m|i)}\\ &= \frac{\sum_{i} p(i) M_m |\psi_i\rangle \langle \psi_i| M_m^\dagger}{p(m)} \\ &= \frac{M_m\rho M_m ^\dagger}{\text{tr}(M_m^\dagger M_m \rho)} \end{aligned} \]

绝了!一个算子,把原来的一切复杂性都简化了。

复合

最后,对于复合系统,仍有:

\[ \rho^{AB} = \rho^A \otimes \rho^B \]

约化算子

除了让测量更简洁,使用密度算子的另一个好处,就是本文一开始反复提到的:密度算子可以处理复合系统的子系统。对于一个由两个子系统组成的复合系统 \(AB\),有一个方法可以提取出子系统的状态,就是使用之前提到的偏迹:

\[ \rho^A = \text{tr}_B(\rho^{AB}) \]

\(\rho^A\) 被称为 \(\rho^{AB}\) 的约化算子。这个操作会把复合系统 \(AB\) 的密度算子,投影到子系统 \(A\) 上。举例来说,如果 \(\rho^{AB} = \rho^A \otimes \rho^B\),那么:

\[ \text{tr}_B(\rho^{AB}) = \text{tr}_B(\rho^A \otimes \rho^B) = \rho^A\text{tr(B)} = \rho^A \]

最后一个等式是因为 \(\rho^B\) 是一个密度算子,其迹为 1。

即使复合系统的状态无法用一个张量积表示(即发生了纠缠),这个状态仍然可以写成:

\[ \rho^{AB} = \sum_{i,j} p_{ij} \rho^A_i \otimes \rho^B_j \]

其中 \(p_{ij}\) 是一组概率。它们的和必须等于 1,以确保 \(\rho^{AB}\) 是一个有效的密度算子。此时,由于偏迹的线性性质,我们仍然可以从 \(\rho^{AB}\) 中提取出 \(\rho^A\)

我们再重新来看纠缠对的例子:复合态 \(|\psi\rangle = \frac{1}{\sqrt2}(|01\rangle+ |10\rangle)\)。这个态是一个纯态,不过我们仍可以求出对应的密度算子。它对应的密度算子:

\[ \rho^{AB} = |\psi\rangle\langle\psi| = \frac{|01\rangle\langle01| + |10\rangle\langle10| + |01\rangle\langle10| + |10\rangle\langle01|}{2} \]

或者,如果你想看个矩阵形式,我们取基为 \(|00\rangle, |01\rangle, |10\rangle, |11\rangle\)

\[ \mathcal M(\rho^{AB}) = \frac{1}{2}\begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 1 & 1 & 0 \\ 0 & 1 & 1 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix} \]

(如果你觉得对角线不是 \(\{1,0,0,0\}\),疑惑这是不是个纯态,那请注意如果取 \(|\psi\rangle\) 自身为基就得到 \(\text{diag}(\{1,0,0,0\})\)。你可以自行验证上面这个矩阵平方还是自身)

此时,我们想知道纠缠对其中一个粒子的自旋状态,对 \(B\) 取偏迹,得到:

\[ \begin{aligned} \rho^A = \text{tr}_B(\rho^{AB}) &= \frac{|0\rangle\langle0|\text{tr}(|1\rangle\langle1|) + |1\rangle\langle1|\text{tr}(|0\rangle\langle0|) + |0\rangle\langle1|\text{tr}(|1\rangle\langle0|) + |1\rangle\langle0|\text{tr}(|0\rangle\langle1|)}{2} \\ &= \frac{|0\rangle\langle0| + |1\rangle\langle1|}{2} \\ &= \frac{I}{2} \end{aligned} \]

\((\rho^A)^2 = \frac{I}{4}\),这的确是个混合态了!我们看到,偏迹成功地提取了子系统的状态,也看到了,在纠缠系统中,尽管整个系统处在纯态,但是子系统可以是混合态。

补充内容

  • 偏迹是在密度算子定义下唯一能够还原量子态的算符。这个证明比较难。

  • “系综”只是对密度算子的一个解释。使用密度算子本身就可以构建完整的量子力学,尽管一个密度算子可能对应多个不同的“系综”,但是从物理上来说,没有任何实验可以区分对应相同密度算子的不同“系综”。

    比如上面的纠缠对的例子,\(\frac{I}{2}\) 并不是说一定是 \(|0\rangle\)\(|1\rangle\) 的混合态。但是无疑,这个算子描述了两个正交态的混合。

    数学上来说,这对应一种酉变换的自由度。如果两个系综能够用如下方式联系起来:

    \[ \sqrt{p_i} |\psi_i\rangle = u_{ij} \sqrt{q_j} |\varphi_j\rangle \]

    其中 \(u_{ij}\) 是一个酉矩阵的分量,较小的系综用零概率补全,那么这两个系综是等价的。从另一个方面看,这是说全局的一个相位系数 \(\mathrm e^{i\theta}\) 不具有物理意义。