量子力学的数学原理3
叠加态和混合态
“叠加态”是一个广为流传的名字。这主要是由于其反常识的特性。这里的“叠加”是相对于基态而言的,它描述的是一种线性代数上的事实:任何一个量子态都可以表示为多个基态的线性组合。比如 \(|+\rangle = \frac{1}{\sqrt{2}}(|0\rangle + |1\rangle)\) 就是一个叠加态。之所以这个名字给人深刻印象,是因为在 \(|0\rangle\) 和 \(|1\rangle\) 方向上测量时,结果是随机的。但这并不是说量子态本身是随机的。
举例来说,如果这个量子比特代表了一束光子的偏振方向,那么这束光能够完美穿过一个 \(|+\rangle\) 方向的滤波器,而有 \(50\%\) 的概率穿过一个 \(|0\rangle\) 方向的滤波器。
但是,如果量子态本身是 \(|0\rangle\) 或者 \(|1\rangle\) 中随机选取,那么只有 \(50\%\) 的概率能够通过 \(|+\rangle\) 滤波器(对于 \(|0 \rangle\) 和 \(|1 \rangle\) 都如此),而也只有 \(50 \%\) 的概率通过 \(|0\rangle\) 滤波器(剩下的状态为 \(|1\rangle\))。事实上,这样的一束 \(|0\rangle,|1\rangle\) 混合的光子总有 \(50\%\) 的概率通过任何方向的滤波器。
前者是正确的叠加态,而后面的状态我们称为混合态。显然,这两种状态无论在本质上还是在测量结果上都有很大的区别,是我们有必要去区分的。
和混合态相对的,是“纯态”。纯态是指量子系统处于一个确定的状态,即量子态不能被分解为更小的子系统。例如,如果一个光子处于 \(|0\rangle\) 状态,那么它就是一个纯态;如果一个光子处于 \(|+\rangle\) 状态,那么它也是一个纯态。纯态里面,再分有基态和叠加态,但这只是一个视角的问题,换个基,并不改变纯态的本质。
什么时候会出现混合态呢?当我们无法获取关于量子系统的完整信息时,就会出现混合态。最常见的一种情况是,我们所描述的系统是一个更大封闭系统的一部分,但是我们只知道这个子系统的信息。比方说两个量子比特形成如下状态:
\[ |\psi\rangle = \frac{1}{\sqrt2}|01\rangle + \frac{1}{\sqrt2}|10\rangle \]
这是一个经典的所谓“纠缠对”。一个典例是假设一个零自旋中性π介子衰变成一个电子与一个正电子,那么两个电子拥有相反的自旋,他们两个的自旋状态可以被如上表示。如果我们通过正负电荷把所有的负电子筛出来,然后对这些电子测量,就会出现符合混合态的统计结果:无论在哪个方向测量,得到的结果都是 \(50 \%\)。说明负电子并不具有一个单一确定的量子态表示自旋。
换而言之,当多个系统之间发生纠缠时,它们的状态不能被描述为独立的个体状态,而必须作为一个整体来考虑。如果我们只考虑其中的一部分,就会得到一个不完整的,在统计意义上等价于概率混合的结果,我们称这个部分处于混合态。
我们有必要深入考虑多系统带来的复杂情况。
复合系统
在量子力学中,复合系统是指由多个独立的子系统组成的系统。复合系统自身若是封闭的,那么这个系统就可以被一个向量表示。注意,这个大系统处在一个纯态,因为它是封闭的,用一个向量就能完全描述。
具体来说,大系统的状态 \(|\psi\rangle\) 和子系统的状态 \(|\psi_i\rangle\) 之间的关系可以通过以下公式来表达:
\[ |\psi\rangle = |\psi_1\rangle \otimes |\psi_2\rangle \otimes ... \otimes |\psi_n\rangle \]
其中,\(\otimes\) 表示张量积(tensor product),它是一种将多个向量组合成一个新向量的方法。要注意的是,这个公式仅适用于子系统之间相互独立的情况,相当于说,我决定把这些系统看作一个整体,“看作”这一步符合这个公式。接下来,如果整个复合系统开始协同演化,子系统之间产生了纠缠,这个公式就不再适用了,事实上,子系统就无法用单一向量描述了。
先不急,我们先看看什么是张量积?
(下面的数学内容较多,如果你懒得看,记住一点:张量积把 \(n\) 维和 \(m\) 维的乘出一个 \(nm\) 维的东西,而且是线性的)
张量积
考虑到这是一个线性代数教材中不怎么教的内容,我先给出一个传统的列向量表示:
若
\[ \mathbf{a} = \begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}, \quad \mathbf{b} = \begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \end{pmatrix} \]
那么它们的张量积为:
\[ \mathbf{a} \otimes \mathbf{b} = \begin{pmatrix} a_1 b_1 \\ a_1 b_2 \\ \vdots \\ a_1 b_m \\ a_2 b_1 \\ a_2 b_2 \\ \vdots \\ a_2 b_m \\ \vdots \\ \vdots \\ \vdots \\ a_n b_1 \\ a_n b_2 \\ \vdots \\ a_n b_m \end{pmatrix} \]
你可以看作是将外积 \(\mathbf a \mathbf b^\text T\) 展平成一个向量。
一般地,如果 \(V\) 和 \(W\) 是 \(n\) 维和 \(m\) 维的线性空间,那么它们的张量积 \(V \otimes W\) 是一个 \((nm)\) 维的线性空间,\(V \otimes W\) 中的元素可以表示为 \(|v\rangle \otimes |w\rangle\) 的线性组合,其中 \(|v\rangle \in V\) 和 \(|w\rangle \in W\)。特别的,如果 \(|i\rangle\) 和 \(|j\rangle\) 分别是 \(V\) 和 \(W\) 中的一组基,那么 \(|i\rangle \otimes |j\rangle = |ij\rangle\) 是 \(V \otimes W\) 中的一组基。
我们一般用 \(|u\rangle|v\rangle,|u,v\rangle,|uv\rangle\) 等符号来简写张量积。
不仅空间中的向量可以张量积,定义在空间上的算子也可以。对于两个算子 \(A\) 和 \(B\),它们的张量积 \(A \otimes B\) 定义为 \((A \otimes B)|uv\rangle = A|u\rangle \otimes B|v\rangle\)。那么,对于一个张量积空间中的一般向量 \(u\),可以通过基的方式定义算子的作用:
\[ (A \otimes B)u = (A \otimes B)\sum_{i,j}^{n,m} u_{ij}|i\rangle\otimes|j\rangle = \sum_{i,j}^{n,m} u_{ij}A|i\rangle\otimes B|j\rangle \]
这里,\(u_{ij}\) 是向量 \(u\) 在基 \(|i\rangle\otimes|j\rangle\) 下的分量。
另一方面,空间上的算子也组成一个算子空间,这仍然是一个线性空间。所以,张量积空间中的一般算子 \(C\)(这个算子空间有 \((nm)^2\) 维),也可以表示为 \(A_i \otimes B_j\) 的线性组合。
\[ C = \sum_{i,j}^{n^2,m^2} c_{ij} A_i \otimes B_j \]
而 \(A_i\) 是 \(V\) 对应算子空间中的基算子,\(B_j\) 是 \(W\) 对应算子空间中的基算子。
如果你对于怎么构造基算子比较困惑,可以考虑这一组基算子:\(|i\rangle \langle j|\)。它把基向量 \(|j\rangle\) 投影到 \(|i\rangle\),而其他的都投影到零。
一个很爽但没什么用的式子是把张量积空间中的一般算子对于张量积空间的一般向量的作用写出来,会得到一个 \((nm)^3\) 的循环,可以留给读者自己爽一下。
张量运算依然保持了最大程度的线性性,一般来说 \(c|u\rangle \otimes d(|v\rangle + |w\rangle) = cd |u\rangle \otimes |v\rangle + cd |u\rangle \otimes |w\rangle\) 之类的式子都成立。
最后我们补充内积和偏迹的定义。从线性角度,内积被自然定义如下:
若 \(|a\rangle = \sum_i a_i |(uv)_i\rangle\),\(|b\rangle = \sum_j b_j |(uv)_j\rangle\),则
\[ \langle a | b \rangle = \sum_{i,j} a_i^\dagger b_j \langle u_i | u_j \rangle\langle v_i | v_j \rangle \]
而偏迹是相对于迹的概念。矩阵的迹我们已经见过。我们先来深入看一些迹的性质:
首先,迹是线性的,即对于任意两个矩阵 \(A\) 和 \(B\),
\[ \text{tr}(cA + dB) = c\cdot \text{tr}(A) + d \cdot \text{tr}(B) \]
迹具有循环性,即对于任意两个方阵 \(A\) 和 \(B\),
\[ \text{tr}(AB) = \text{tr}(BA) \]
这两个值都等于 \(\sum_{i,j} A_{ij} B_{ji}\)。这意味着迹在酉变换下不变:
\[ \text{tr}(UAU^\dagger) = \text{tr}(U^\dagger UA)= \text{tr}(A) \]
所以,一个算子的任意矩阵表示的迹都是相等的。基于此我们可以定义算子的迹:
\[ \text{tr}(A) = \sum_{i} \langle i| A | i\rangle \]
其中 \(|i\rangle\) 是任何一组规范正交基。
下面我们给出一个在量子力学中非常好用的迹的性质:对于单位向量 \(|\psi\rangle\),补全一组规范正交基 \(|i\rangle\),使得 \(|\psi\rangle\) 是一个基向量。那么:
\[ \text{tr}(A |\psi\rangle\langle \psi|) = \sum_i \langle i| A | \psi \rangle \langle \psi|i\rangle = \langle \psi| A |\psi\rangle \]
如果你比较敏锐,就会发现右边是测量算子 \(A\) 在量子态 \(|\psi\rangle\) 上的期望值。下面我们会看到,左边是测量的另一种形式。
好了,我们回到偏迹。
偏迹是一种在张量结果中还原部分性质的运算,它和迹一样具有线性性质,所以我们只要定义它对基算子的效果:
\[ \text{tr}_B(|a_i\rangle \langle a_j| \otimes |b_i\rangle \langle b_j|) = |a_i\rangle \langle a_j| \text{tr}(|b_i\rangle \langle b_j|) \]
偏迹的定义和迹非常相似,只是它只对第二个因子进行求和。这个运算在量子力学中非常重要,因为它可以帮助我们理解系统的部分性质。
密度算子
对于一个复合系统,如果我们能够完整了解整个系统的状态,那么用纯态向量来表示是可行的。然而,在实际操作中,我们通常只能获得部分子系统的信息。这些子系统处在混合态,无法用纯态向量表示,这时就需要使用密度算子来描述系统的状态。
不难想到,要描述一个混合态,要指定下面两点:
- 系统可能处于的各个纯态;
- 每个纯态出现的概率。
这被称为一个系综:\(\{|\psi_i\rangle, p_i\}\)。其中\(|\psi_i\rangle\)是系统可能处于的纯态,\(p_i\)是该纯态出现的概率。我们有一个巧妙的方法摆脱大括号,用经典概率(不是量子概率振幅)线性组合来表示混合态:
\[ \rho = \sum_{i} p_i |\psi_i\rangle\langle\psi_i| \]
这里 \(\rho\) 是密度矩阵,它是一个对称的、半正定的、迹为 1 的复数矩阵。
我要预先说明一点:使用密度矩阵是因为这种组合的线性性质使得混合态的演化、观测变得方便,但我们抛弃了一点信息:我们不再知道具体是哪些纯态构成了混合态。这是自然的,因为多个不同的纯态可以以相同的方式构成一个混合态。如果你不太相信,注意到 \(|\psi_i \rangle\) 不一定是正交的,但是 \(\rho\) 可以有一个非负的实谱分解,说明至少有一组正交的纯态也可以产生这个密度矩阵。
定义
我们来详细看看密度算子的定义和性质:
密度算子 \(\rho\) 是一个迹为 1 的,半正定的厄米算子,一个满足上述条件的算子至少与一个系综相关,反过来,任何一个系综都可以用一个密度算子来描述。
要注意的是,纯态系综和混合态系综都可以用密度算子来描述。两者还是有些区别。由于纯态的密度算子就是 \(\rho = |\psi \rangle \langle \psi |\),其矩阵可表示为 \(\text{diag}\{1,0,\dots\}\),而混合态的对角线都小于一,所以可以这样分辨:
计算 \(\text{tr}(\rho^2)\) 的值,如果等于 1,则表示是纯态;如果小于 1,则表示是混合态。
演化
我们知道,纯态的演化可以用一个酉算子 \(U\) 来表示,而对于混合态,其系综中的每一个纯态都被 \(U\) 作用,整个密度算子的变化如下:
\[ \rho' = \sum_i p_i U |\psi_i\rangle\langle \psi_i| U^\dagger = U \rho U^\dagger \]
测量
对于一般的测量,对于一组满足归一化条件的测量算子 \(\{M_m\}\),如果系统处在纯态 \(|\psi_i\rangle\) 下,那么测量得到 \(m\) 的概率为:
\[ p(m|i) = \langle \psi_i | M_m^\dagger M_m |\psi_i\rangle = \text{tr}(M_m^\dagger M_m |\psi_i\rangle\langle \psi_i|) \]
第二个等号是上面提到的迹的重要公式。
然后,用经典概率的全概率公式可以得到总的测量概率:
\[ p(m) = \sum_i p(m|i) p_i = \text{tr}(M_m^\dagger M_m \rho) \]
如果测量得到了结果 \(m\),那么每个纯态会发生如下变化:
\[ |\psi_i\rangle \rightarrow |\psi_i'\rangle = \frac{M_m |\psi_i\rangle}{\sqrt{\langle \psi_i | M_m^\dagger M_m |\psi_i\rangle}} \]
这是比较复杂的。但是密度算子会简化这一点。首先,我们来考察 \(|\psi_i'\rangle\langle \psi_i'|\):
\[ |\psi_i'\rangle\langle \psi_i'| = \frac{M_m |\psi_i\rangle \langle \psi_i| M_m^\dagger}{\langle \psi_i | M_m^\dagger M_m |\psi_i\rangle} = \frac{M_m |\psi_i\rangle \langle \psi_i| M_m^\dagger}{p(m|i)} \]
另外要注意,系综不只纯态变化了,对应的概率也变化了,原来的 \(p_i\) 变成了 \(p(i|m)\),根据贝叶斯公式:
\[ p(i|m) = \frac{p(m|i)p(i)}{p(m)} \]
整合起来,总的密度算子变为:
\[ \begin{aligned} \rho_m &= \sum_{i} p(i|m) |\psi_i'\rangle\langle \psi_i'| \\ &= \sum_{i} \frac{p(m|i)p(i)}{p(m)} \frac{M_m |\psi_i\rangle \langle \psi_i| M_m^\dagger}{p(m|i)}\\ &= \frac{\sum_{i} p(i) M_m |\psi_i\rangle \langle \psi_i| M_m^\dagger}{p(m)} \\ &= \frac{M_m\rho M_m ^\dagger}{\text{tr}(M_m^\dagger M_m \rho)} \end{aligned} \]
绝了!一个算子,把原来的一切复杂性都简化了。
复合
最后,对于复合系统,仍有:
\[ \rho^{AB} = \rho^A \otimes \rho^B \]
约化算子
除了让测量更简洁,使用密度算子的另一个好处,就是本文一开始反复提到的:密度算子可以处理复合系统的子系统。对于一个由两个子系统组成的复合系统 \(AB\),有一个方法可以提取出子系统的状态,就是使用之前提到的偏迹:
\[ \rho^A = \text{tr}_B(\rho^{AB}) \]
\(\rho^A\) 被称为 \(\rho^{AB}\) 的约化算子。这个操作会把复合系统 \(AB\) 的密度算子,投影到子系统 \(A\) 上。举例来说,如果 \(\rho^{AB} = \rho^A \otimes \rho^B\),那么:
\[ \text{tr}_B(\rho^{AB}) = \text{tr}_B(\rho^A \otimes \rho^B) = \rho^A\text{tr(B)} = \rho^A \]
最后一个等式是因为 \(\rho^B\) 是一个密度算子,其迹为 1。
即使复合系统的状态无法用一个张量积表示(即发生了纠缠),这个状态仍然可以写成:
\[ \rho^{AB} = \sum_{i,j} p_{ij} \rho^A_i \otimes \rho^B_j \]
其中 \(p_{ij}\) 是一组概率。它们的和必须等于 1,以确保 \(\rho^{AB}\) 是一个有效的密度算子。此时,由于偏迹的线性性质,我们仍然可以从 \(\rho^{AB}\) 中提取出 \(\rho^A\)。
我们再重新来看纠缠对的例子:复合态 \(|\psi\rangle = \frac{1}{\sqrt2}(|01\rangle+ |10\rangle)\)。这个态是一个纯态,不过我们仍可以求出对应的密度算子。它对应的密度算子:
\[ \rho^{AB} = |\psi\rangle\langle\psi| = \frac{|01\rangle\langle01| + |10\rangle\langle10| + |01\rangle\langle10| + |10\rangle\langle01|}{2} \]
或者,如果你想看个矩阵形式,我们取基为 \(|00\rangle, |01\rangle, |10\rangle, |11\rangle\):
\[ \mathcal M(\rho^{AB}) = \frac{1}{2}\begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 1 & 1 & 0 \\ 0 & 1 & 1 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix} \]
(如果你觉得对角线不是 \(\{1,0,0,0\}\),疑惑这是不是个纯态,那请注意如果取 \(|\psi\rangle\) 自身为基就得到 \(\text{diag}(\{1,0,0,0\})\)。你可以自行验证上面这个矩阵平方还是自身)
此时,我们想知道纠缠对其中一个粒子的自旋状态,对 \(B\) 取偏迹,得到:
\[ \begin{aligned} \rho^A = \text{tr}_B(\rho^{AB}) &= \frac{|0\rangle\langle0|\text{tr}(|1\rangle\langle1|) + |1\rangle\langle1|\text{tr}(|0\rangle\langle0|) + |0\rangle\langle1|\text{tr}(|1\rangle\langle0|) + |1\rangle\langle0|\text{tr}(|0\rangle\langle1|)}{2} \\ &= \frac{|0\rangle\langle0| + |1\rangle\langle1|}{2} \\ &= \frac{I}{2} \end{aligned} \]
\((\rho^A)^2 = \frac{I}{4}\),这的确是个混合态了!我们看到,偏迹成功地提取了子系统的状态,也看到了,在纠缠系统中,尽管整个系统处在纯态,但是子系统可以是混合态。
补充内容
偏迹是在密度算子定义下唯一能够还原量子态的算符。这个证明比较难。
“系综”只是对密度算子的一个解释。使用密度算子本身就可以构建完整的量子力学,尽管一个密度算子可能对应多个不同的“系综”,但是从物理上来说,没有任何实验可以区分对应相同密度算子的不同“系综”。
比如上面的纠缠对的例子,\(\frac{I}{2}\) 并不是说一定是 \(|0\rangle\) 和 \(|1\rangle\) 的混合态。但是无疑,这个算子描述了两个正交态的混合。
数学上来说,这对应一种酉变换的自由度。如果两个系综能够用如下方式联系起来:
\[ \sqrt{p_i} |\psi_i\rangle = u_{ij} \sqrt{q_j} |\varphi_j\rangle \]
其中 \(u_{ij}\) 是一个酉矩阵的分量,较小的系综用零概率补全,那么这两个系综是等价的。从另一个方面看,这是说全局的一个相位系数 \(\mathrm e^{i\theta}\) 不具有物理意义。