从线性代数到量子力学(26):聊聊自旋

PeiLingX
物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》第26课。

了解本系列及本专栏其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

我们在第23课末尾看到,自旋似乎和相对论有着一些微妙的天然联系。

但在上节课对于相对论性的克莱因$-$高登方程(后文依旧简称“K-G方程”)的构造过程和结果中,我们看到,它仍然没有给出自旋信息(而且还有负能态和负概率的问题……)。

不过话说回来,我们其实到目前为止,都还没有看过,一个包含了自旋信息的波函数和能量本征方程应该是什么样的。

所以,这节课里,我们要首先来聊聊自旋信息应该如何描述,然后看看以及如何融入波函数和能量本征方程当中去(为了简单起见,我们仍然以薛定谔方程为例)。

本课内容会比较抽象,但它们这些将成为我们下节课讨论的重要铺垫,而且,在不久的将来,我们还会通过它们窥见自旋背后那个令人拍案惊奇的空间性质和对称性,所以请同学们一定跟上节奏。


1) 自旋的“量子三件套”

关于自旋的经典图像,我们在第4课已经讨论过:我们可以直接将自旋想象一个带电小球的自转(虽然它并没有真的在转),它有角动量,同时会产生“环形电流”的效果、从而产生磁矩,并且与磁场发生相互作用。

这些经典图像可以帮助我们在脑中建立物理直观,但也就仅此而已,我们不再需要过多谈论它,而应该将更多注意力放在自旋的量子特性上面。

具体说来,我们是要找出自旋的“量子三件套”:本征值、本征态、算符,然后将它们糅合到波函数以及薛定谔方程中。

同学们还记得吗,我们在第4、5课介绍自旋时提到过一些性质:

当我们要测量粒子在某个方向上的自旋时,可能会得到测量方向上一正一负两个本征态。

假设测量方向为$ \small z $方向,我们可以将两个本征态分别记为$ \small \left|z_+\right>,\left|z_-\right>$

而根据我们对自旋的经典类比,可以知道,这两个本征态就对应了两个大小相等但符号相反的角动量,它们的值为$ \small \pm\frac{\hbar}{2} ($可以直观想象为电子的“逆时针自转”和“顺时针自转”,虽然并没有真实的转动产生),于是相应的本征值关系就是:

$\small \begin{cases} \hat S_z\left|z_{+}\right>=\frac{\hbar}{2}\left|z_{+}\right>\\ \hat S_z\left|z_{-}\right>=-\frac{\hbar}{2}\left|z_{-}\right> \end{cases} \quad{\scriptsize (式26.1)}$

考虑到两个本征态正交归一,因此我们不妨选择两个最简单的分量形式来描述它们:

$\small \left|z_+\right>=(1,0)^T,\ \left|z_-\right>=(0,1)^T \quad{\scriptsize (式26.2)}$

这其实就意味着我们选取了$ \small z $方向自旋表象。因为这两个基底刚好组成一个单位矩阵,所以两个$ \small z $方向自旋本征态基底就是坐标基底本身。而我们在第12课知道,如果选取了某个力学量$ \small F $的本征态作为基底本身,就意味着我们选取了$ \small F $表象,于是我们这组基底对应的就是$ \small z $方向自旋表象。

接下来,我们来构造$ \small z $方向自旋的算符。

线性代数课告诉我们,已知某个矩阵的特征值和全部特征向量(假设矩阵可相似对角化)时,那么我们可以通过简单的相似变换将原来的矩阵还原出来:

$\small \boldsymbol A=\begin{bmatrix}\boldsymbol \alpha_1&\boldsymbol \alpha_2&\cdots&\boldsymbol \alpha_n\end{bmatrix}\begin{bmatrix}\lambda_1&0&\cdots&0\\ 0&\lambda_2&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&\lambda_n\end{bmatrix}\begin{bmatrix}\boldsymbol \alpha_1&\boldsymbol \alpha_2&\cdots&\boldsymbol \alpha_n\end{bmatrix}^{-1} \quad{\scriptsize (式26.3)}$

其中$ \small {\boldsymbol \alpha_1,\boldsymbol\alpha_2,\cdots,\boldsymbol\alpha_n} $和$ \small {\lambda_1,\lambda_2,\cdots,\lambda_n} $分别是矩阵$ \small \boldsymbol A $的完备特征向量组和相应的特征值序列。

于是$ \small z $方向自旋算符就是:

$\small \begin{align} \hat S_z&=\begin{bmatrix}\left|z_+\right>&\left|z_-\right>\end{bmatrix} \begin{bmatrix}\frac{\hbar}{2}&0\\0&-\frac{\hbar}{2}\end{bmatrix}\begin{bmatrix}\left|z_+\right>&\left|z_-\right>\end{bmatrix}^{-1}\\ &=\begin{bmatrix}1&0\\0&1\end{bmatrix} \begin{bmatrix}\frac{\hbar}{2}&0\\0&-\frac{\hbar}{2}\end{bmatrix}\begin{bmatrix}1&0\\0&1\end{bmatrix}\\ &=\frac{\hbar}{2}\begin{bmatrix}1&0\\0&-1\end{bmatrix} \end{align} \quad{\scriptsize (式26.4)}$

这样,我们就构造出了$ \small z $方向自旋的“量子三件套”。

现在我们来构造另外两个方向的“三件套”。

由于空间各个方向都没有特殊性,因此首先可以肯定的是,我们在任意方向上测量自旋,都会得到相同的本征值$ \small \pm \frac{\hbar}{2} $,所以我们只需要搞定剩下的两样东西:本征态和算符的具体形式。

我们先来看$ \small x $方向,根据S-G实验的结果,我们知道,当粒子在$ \small z $方向具有确定的自旋、比如处于本征态$ \small \left|z_+\right> $时,如果测量它在$ \small x $方向的自旋值,我们会有相同的机会得到$ \small \left|x_+\right>,\left|x_-\right> $两个本征态,这就意味着,$ \small \left|z_+\right> $在$ \small \left|x_+\right>,\left|x_-\right> $上的“投影长度”是相等的。

如果在某个平面上画出它们的“几何关系”,那么一个很容易猜到的情形就是这样:

于是,我们可以通过这组几何关系求出$ \small \left|x_+\right>,\left|x_-\right> $的分量形式:

$\small \begin{cases} \left|x_+\right>=\frac{1}{\sqrt{2}}\left|z_+\right>+\frac{1}{\sqrt{2}}\left|z_-\right>=\left(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}}\right)^T\\ \left|x_-\right>=-\frac{1}{\sqrt{2}}\left|z_+\right>+\frac{1}{\sqrt{2}}\left|z_-\right>=\left(-\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}}\right)^T \end{cases} \quad{\scriptsize (式26.5)}$

然后,我们可以求出$ \small x $方向的自旋算符:

$\small \begin{align} \hat S_x&=\begin{bmatrix}\left|x_+\right>&\left|x_-\right>\end{bmatrix} \begin{bmatrix}\frac{\hbar}{2}&0\\0&-\frac{\hbar}{2}\end{bmatrix}\begin{bmatrix}\left|x_+\right>&\left|x_-\right>\end{bmatrix}^{-1}\\ &=\begin{bmatrix}\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix} \begin{bmatrix}\frac{\hbar}{2}&0\\0&-\frac{\hbar}{2}\end{bmatrix}\begin{bmatrix}\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\-\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix}\\ &=\frac{\hbar}{2}\begin{bmatrix}0&1\\1&0\end{bmatrix} \end{align} \quad{\scriptsize (式26.6)}$

然后我们用同样的思路来构造$ \small y $方向的本征态……

但是,我们立马会发现,平面上似乎没有可用的基底了,因为我们再也找不到能同时和$ \small x,z $的本征态都成45度角的基底。

不过我们不用绝望,当实数空间不够用的时候,我们可以考虑拿复数来凑,毕竟量子力学里冒出来个复数也不是什么新鲜事儿了。

比如我们在第二个分量上加上一个虚数单位$ \small \text i $,就能绝处逢生,又找出一对相互正交的态矢量,作为自旋$ \small y $在$ \small z $自旋表象下的本征态:

$\small \begin{cases} \left|y_+\right>=\frac{1}{\sqrt{2}}\left|z_+\right>+\frac{1}{\sqrt{2}}\text i\left|z_-\right>=\left(\frac{1}{\sqrt{2}},\frac{\text 1}{\sqrt{2}}\text i\right)^T\\ \left|y_-\right>=-\frac{1}{\sqrt{2}}\left|z_+\right>+\frac{1}{\sqrt{2}}\text i\left|z_-\right>=\left(-\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}}\text i\right)^T \end{cases} \quad{\scriptsize (式26.7)}$

(它们在$ \small z $自旋本征态上的“投影”的模长也是相等的,自然也符合实验事实)

而自旋$ \small y $相应的算符就是:

$\small \begin{align} \hat S_y&=\begin{bmatrix}\left|y_+\right>&\left|y_-\right>\end{bmatrix} \begin{bmatrix}\frac{\hbar}{2}&0\\0&-\frac{\hbar}{2}\end{bmatrix}\begin{bmatrix}\left|y_+\right>&\left|y_-\right>\end{bmatrix}^{-1}\\ &=\begin{bmatrix}\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}\text i&\frac{1}{\sqrt{2}}\text i\end{bmatrix} \begin{bmatrix}\frac{\hbar}{2}&0\\0&-\frac{\hbar}{2}\end{bmatrix} \begin{bmatrix}\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\text i\\-\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\text i\end{bmatrix}\\ &=\frac{\hbar}{2}\begin{bmatrix}0&-\text i\\\text i&0\end{bmatrix} \end{align} \quad{\scriptsize (式26.8)}$

这样,我们就得到了$ \small z $自旋表象下,三个方向上的自旋算符和本征态:

$\small \begin{cases} \hat S_x=\frac{\hbar}{2}\begin{bmatrix}0&1\\1&0\end{bmatrix} &|x_+\rangle=\begin{bmatrix}\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}\end{bmatrix} &|x_-\rangle=\begin{bmatrix}-\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}\end{bmatrix} \\ \hat S_y=\frac{\hbar}{2}\begin{bmatrix}0&-\text i\\\text i&0\end{bmatrix}& |y_+\rangle=\begin{bmatrix}\frac{1}{\sqrt{2}}\\\frac{\text i}{\sqrt{2}}\end{bmatrix} & |y_-\rangle=\begin{bmatrix}-\frac{1}{\sqrt{2}}\\\frac{\text i}{\sqrt{2}}\end{bmatrix} \\\hat S_z=\frac{\hbar}{2}\begin{bmatrix}1&0\\0&-1\end{bmatrix} &|z_+\rangle=\begin{bmatrix}1\\0\end{bmatrix}&|z_-\rangle=\begin{bmatrix}0\\1\end{bmatrix}\\ \end{cases} \quad{\scriptsize (式26.9)}$

其中,三个自旋算符对应的矩阵(不包含$ \small \frac{\hbar}{2} $因子)被称为泡利矩阵

(没错,就是那个泡利,那个当初打死也不接受“自旋”概念、最后却喊着“真香”写下了自旋算符矩阵的泡利)

通过这三个特殊方向上的自旋算符,我们还能构造任意方向上的自旋算符,它就是三个算符构成的三维角动量矢量和该方向的单位向量$ \small \boldsymbol n=\left(n_x,n_y,n_z\right)^T $做内积:

$\small \begin{align} \hat S_{\boldsymbol n}&=\boldsymbol n\cdot\hat {\boldsymbol S}\\ &=n_x\hat S_x+n_y\hat S_y+n_z\hat S_z\\ &={\scriptsize n_x\frac{\hbar}{2}\begin{bmatrix}0&1\\1&0\end{bmatrix}+n_y\frac{\hbar}{2}\begin{bmatrix}0&-\text i\\ \text i&0\end{bmatrix}+n_z\frac{\hbar}{2}\begin{bmatrix}1&0\\0&-1\end{bmatrix}}\\ &=\frac{\hbar}{2}\begin{bmatrix}n_z&n_x-\text in_y\\n_x+\text in_y&-n_z\end{bmatrix} \end{align} \quad{\scriptsize (式26.10)}$

而如果我们知道了$ \small \boldsymbol n $的方向角为$ \small \theta,\varphi $,那么自旋算符还可以表示为:

$\small \begin{align} \hat S_{\boldsymbol n}&=\frac{\hbar}{2}\begin{bmatrix}\cos\theta&\cos\varphi\sin\theta-\text i\sin\varphi\sin\theta\\cos\varphi\sin\theta+\text i\sin\varphi\sin\theta&-\cos\theta\end{bmatrix}\\ &=\frac{\hbar}{2}\begin{bmatrix}\cos\theta&\text e^{-\text i\varphi}\sin\theta\\ \text e^{\text i\varphi}\sin\theta&-\cos\theta\end{bmatrix} \end{align} \quad{\scriptsize (式26.11)}$

通过我们在线性代数课上已经烂熟于胸的特征向量的求解过程,我们能算出它的两个本征态为:

$\small |n_+\rangle=\begin{bmatrix}\cos\frac{\theta}{2}\\ \text e^{\text i\varphi}\sin\frac{\theta}{2}\end{bmatrix},\ |n_-\rangle=\begin{bmatrix}-\sin\frac{\theta}{2}\\ \text e^{\text i\varphi}\cos\frac{\theta}{2}\end{bmatrix} \quad{\scriptsize (式26.12)}$

这样,关于自旋的最基本信息、也就是它的“量子三件套”,我们就全部给出来了。

这里再多说两句:
我们这里讨论自旋的时候,其实涉及了两个空间:一个是三维的物理空间,一个是自旋态所处的态空间。
它在三维物理空间中表现得和普通的三维角动量没太大区别,也是表示成三个基底,只是这三个基底不再是数,而是三个算符$ \small \hat S_x,\hat S_y,\hat S_z $,我们在式26.10中构造任意方向自旋算符时用到的内积运算,就是三个基底算符与方向向量的三个分量分别相乘后求和的结果,这也和普通的内积运算相似,仅仅是计算对象从数变成了算符而已;
而更值得我们讨论的是自旋的态空间,我们刚才为了“凑出”自旋$ \small y $的本征态,“被迫”引入了复数,但以后我们会意识到,这个处理带来的变化,不仅仅是数域的扩张。实际上,从这一刻开始,我们就已经触碰到了一个全新的奇妙空间,它有着令人惊叹的、内涵丰富的代数结构,这一点我们未来会一点点体会。

现在我们还是回来关注这些算符和本征态本身。

回顾前面的构造过程,我们会发现一个问题:

上面的自旋算符和本征态其实都是我们连蒙带猜胡乱凑出来的……

啊不对,我们应该换个高情商的说法:

上面的自旋算符和本征态都是我们通过合理的想象构造出来的……

那么问题来了,这些“合理的想象”是不是真的合理呢?

要验证这一点,我们就要来继续考察,这些算符是否符合自旋的量子特性。

比如我们知道,自旋也是角动量的一种,那么我们首先需要验证的,就是自旋是否符合角动量的量子特性,比如最典型的就是各个方向上自旋算符的对易关系


2) 自旋算符的对易关系

我们在第19课中看到,角动量算符在三个方向上的分量之间满足这些对易关系:

$\small \begin{cases} \left[\hat J_y,\hat J_z\right]=\text i\hbar \hat J_x,\ \left[\hat J_z,\hat J_x\right]=\text i\hbar \hat J_y,\ \left[\hat J_x,\hat J_y\right]=\text i\hbar \hat J_z&\text{(a)}\\ \left[\hat J_i,\hat J^2\right]=0\quad (i=x,y,z)&\text{(b)}\ \end{cases} \quad{\scriptsize (式26.13)}$

而自旋作为角动量的一种,自然也应该满足相同的关系。

我们把上面的式子原封不动抄一遍,把$ \small \hat {J} $换成自旋算符$ \small \hat S $:

$\small \begin{cases} \left[\hat S_y,\hat S_z\right]=\text i\hbar \hat S_x,\ \left[\hat S_z,\hat S_x\right]=\text i\hbar \hat S_y,\ \left[\hat S_x,\hat S_y\right]=\text i\hbar \hat S_z&\text{(a)}\\ \left[\hat S_i,\hat S^2\right]=0\quad (i=x,y,z)&\text{(b)}\ \end{cases} \quad{\scriptsize (式26.14)}$

然后来验证它们。

(a)组中的关系只需要简单的矩阵运算就能证明,以$ \scriptsize \left[\hat S_y,\hat S_z\right] $为例:

$\small \begin{align} \left[\hat S_y,\hat S_z\right]&=\hat S_y\hat S_z-\hat S_z\hat S_y\\ &=\frac{\hbar^2}{4}\left(\begin{bmatrix}0&-\text i\\\text i&0\end{bmatrix}\begin{bmatrix}1&0\\0&-1\end{bmatrix}-\begin{bmatrix}1&0\\0&-1\end{bmatrix}\begin{bmatrix}0&-\text i\\\text i&0\end{bmatrix}\right)\\ &=\frac{\hbar^2}{4}\begin{bmatrix}0&2\text i\\2\text i&0\end{bmatrix}\\ &=\text i\hbar \cdot\frac{\hbar}{2}\begin{bmatrix}0&1\\1&0\end{bmatrix}\\ &=\text i\hbar \hat S_x \end{align} \quad{\scriptsize (式26.15)}$

(剩下的$ \scriptsize \left[\hat S_x,\hat S_y\right] $以及$ \scriptsize \left[\hat S_z,\hat S_x\right] $请同学们自行验证)

(b)组中的关系更容易证明,因为:

$\small \begin{align} \hat S^2&=\hat S_x^2+\hat S_y^2+\hat S_z^2\\ &=\frac{\hbar^2}{4}\begin{bmatrix}1&0\\0&1\end{bmatrix}+\frac{\hbar^2}{4}\begin{bmatrix}1&0\\0&1\end{bmatrix}+\frac{\hbar^2}{4}\begin{bmatrix}1&0\\0&1\end{bmatrix}\\ &=\frac{3\hbar^2}{4}\hat I \end{align} \quad{\scriptsize (式26.16)}$

其中$ \small \hat I $是单位矩阵,它天然地就可以和任意算符对易,所以(b)组中的关系也天然成立。

这样,我们就看到了,用自旋矩阵描述的自旋算符满足角动量算符的对易关系。

这里我们也看到,自旋角动量和轨道角动量一样,三个分量之间互相不对易,也就意味着一个方向上的自旋确定时、另外两个方向的自旋处于不确定状态,这也是我们在第5课介绍的级联S-G实验中所看到的。

而另一方面,$ \scriptsize \left[\hat S_z,\hat S^2\right]=0 $也意味着$ \scriptsize \left[\hat S_z,\hat S_x^2+\hat S_y^2\right]=0 $,也就是$ \small S_z $分量确定时,虽然另外两个方向的角动量分量各自不确定,但它们的平方和却是确定的,对应的物理图像就是:

自旋角动量也是分布在以$ \small S_z=\pm\frac{\hbar}{2} $为高、$ \scriptsize \sqrt{S^2-S_z^2}=\frac{\hbar}{\sqrt{2}} $为底面半径的圆锥面上,而总的自旋角动量$ \small S^2 $的本征值也是我们前面给出的单位矩阵前的系数:

$\small S^2=\frac{3}{4}\hbar^2 \quad{\scriptsize (式26.17)}$

如果我们再回忆起轨道角动量的角量子数与总角动量的关系式:

$\small l(l+1)\hbar^2=L^2 \quad{\scriptsize (式26.18)}$

我们也能类比着定义出一个自旋角量子数$ \small s $:

$\small s(s+1)\hbar^2=S^2=\frac{3}{4}\hbar^2 \quad{\scriptsize (式26.19)}$

这意味着$ \small s $也是一个常数,舍去负值,我们就得到:

$\small s=\frac{1}{2} \quad{\scriptsize (式26.20)}$

(这正好就是自旋本征值的绝对值)

它和轨道角动量的唯一区别就是它只有一个值而不是一组数。

到此,我们就看到,前面构造的各个方向的自旋算符,是符合角动量算符的量子特性的,可以放心使用。

那么接下来,我们就要来回答这节课的最后一个问题:

怎么样才能将自旋信息融合到波函数和薛定谔方程中去?


3) 含自旋信息的波函数

在波函数中加入自旋信息其实很简单:

直接用波函数乘以自旋量子态,就搞定了。

比如,我们假设某个粒子的自旋态处于$ \small \left|z_{+}\right> $与$ \small \left|z_{-}\right> $的叠加态:

$\small \begin{align} \left|S\right>=c_{+}\left|{z_{+}}\right>+c_{-}\left|{z_{-}}\right>=\begin{bmatrix}c_{+}\\c_{-}\end{bmatrix}\ \end{align} \quad{\scriptsize (式26.21)}$

其中$ \small\left|c_+\right|^2+\left|c_-\right|^2=1$

那么将它的波函数信息加进去,就是:

$\small\begin{align}\left|\psi,S\right>=\begin{bmatrix}c_{+}\psi(\boldsymbol x,t)\\c_{-}\psi(\boldsymbol x,t)\end{bmatrix}=\begin{bmatrix}c_{+}\\c_{-}\end{bmatrix}\psi(\boldsymbol x,t):=\begin{bmatrix}\psi_{1}\\ \psi_{2}\end{bmatrix}\end{align} \quad{\scriptsize (式26.22)}$

(这在数学上可以看成表示经典力学量量子态的波函数和表示自旋量子态的二维“向量”的直积)

我们可以验证这样做的合理性。

我们知道,自旋作为一种完全独立于经典力学量的“纯量子力学量”,它与各种经典力学量是互不干扰的。这就意味着,无论自旋处于什么态,都不会影响到其他力学量的概率分布结果,反过来也是一样。

比如,对于刚才给出的粒子的状态,我们要去测量它出现在空间中$ \small \boldsymbol x $处的概率,仍然有:

$\small\begin{align} \rho(\boldsymbol x,t) &=\left(\begin{bmatrix}c^*_{+}&c^*_{-}\end{bmatrix}\psi^*(\boldsymbol x,t)\right)\left(\begin{bmatrix}c_{+}\\c_{-}\end{bmatrix}\psi(\boldsymbol x,t)\right)\\ &=\left(\left|c_+\right|^2+\left|c_-\right|^2\right)\psi^*(\boldsymbol x,t)\psi(\boldsymbol x,t)\\ &=\psi^*(\boldsymbol x,t)\psi(\boldsymbol x,t) \end{align} \quad{\scriptsize (式26.23)}$

可以看到,最终结果与$ \small c_+,c_- $无关,也就是自旋态并没有影响到位置的概率分布。

反过来,测量$ \small z $方向自旋时,坍缩到两个本征态$ \small |z_+\rangle,|z_-\rangle $上的概率,也分别是:

$\small \begin{cases} P\left(|z_+\rangle\right)=\int_{\mathbb{R}} \left(c_+\psi*\right)c_+\psi\text d\boldsymbol x=c_+^*c_+\int_{\mathbb{R}} \psi^*\psi\text d\boldsymbol x=c_+^*c_+=\left|c_+\right|^2\\ P\left(|z_-\rangle\right)=\int_{\mathbb{R}} \left(c_-\psi*\right)c_-\psi\text d\boldsymbol x=c_-^*c_-\int_{\mathbb{R}} \psi^*\psi\text d\boldsymbol x=c_-^*c_-=\left|c_-\right|^2 \end{cases} \quad{\scriptsize (式26.24)}$

这两个值也完全与波函数无关,也就是波函数并没有影响到自旋的概率分布。

所以,经过直积运算融合后的自旋态和原来的波函数仍然可以互不干扰。

接下来,我们来看看如何将自旋信息融入到薛定谔方程中去。


4) 含自旋信息的薛定谔方程

我们在第23课中知道,自旋的发现,是因为自旋磁矩与外磁场(人为加上的磁场或者轨道角动量产生的磁场)相互作用产生了耦合能,从而进一步产生了能级分裂。

所以,要在薛定谔方程中“有物理意义地”体现自旋信息,我们就要考虑有外磁场存在的情形。

为简单起见,我们假设外磁场的方向为$ \small +z $方向(由于空间在各个方向上是对称的,因此这样做并不会失去一般性)、磁感应强度大小为$ \small B $,而自旋可能有$ \small \pm \frac{\hbar}{2} $两种取值,于是耦合能也就有两种可能:

$\small \begin{align} E_{C,\pm}=\pm\mu_S B=\pm\frac{\hbar}{2}\frac{-e}{2m_ec}B \end{align} \quad{\scriptsize (式26.25)}$

(其中$ \small \mu_S $为自旋磁矩)

将它们作为势能的补充项代入薛定谔方程中,薛定谔方程就变成了两个:

$\small \begin{cases} \text i\hbar\frac{\partial }{\partial t}\psi_1=-\frac{\hbar^2}{2m}\nabla^2\psi_1+V\psi_1\color{red}{+\frac{\hbar}{2}\frac{-eB}{2m_ec}\psi_1}\\ \text i\hbar\frac{\partial }{\partial t}\psi_2=-\frac{\hbar^2}{2m}\nabla^2\psi_2+V\psi_2\color{red}{-\frac{\hbar}{2}\frac{-eB}{2m_ec}\psi_2} \end{cases} \quad{\scriptsize (式26.26)}$

(两个方程对应两个不同的能量本征值,这也是能级分裂来源的又一次体现)

我们可以将它们合并成矩阵形式:

$\small \begin{align} \text i\hbar\frac{\partial }{\partial t}\begin{bmatrix}\psi_1\\ \psi_2\end{bmatrix}=\begin{bmatrix}-\frac{\hbar^2}{2m}\nabla^2+V-\frac{\hbar}{2}\frac{eB}{2m_ec}&0\\0&-\frac{\hbar^2}{2m}\nabla^2+V+\frac{\hbar}{2}\frac{eB}{2m_ec}\end{bmatrix}\begin{bmatrix}\psi_1\\ \psi_2\end{bmatrix} \end{align} \quad{\scriptsize (式26.27)}$

为了让这个方程更有“自旋”的味道,我们还可以将它拆一拆:

$\small \begin{align} \text i\hbar\frac{\partial }{\partial t}\begin{bmatrix}\psi_1\\ \psi_2\end{bmatrix}=\left(-\frac{\hbar^2}{2m}\nabla^2+V\right)\begin{bmatrix}1&0\\0&1\end{bmatrix}\begin{bmatrix}\psi_1\\ \psi_2\end{bmatrix} +\frac{\hbar}{2}\frac{-eB}{2m_ec}\begin{bmatrix}1&0\\0&-1\end{bmatrix}\begin{bmatrix}\psi_1\\ \psi_2\end{bmatrix} \end{align} \quad{\scriptsize (式26.28)}$

我们看到,右边第二项中的矩阵恰好就是自旋算符$ \small \hat S_z ($这当然不是巧合,我们其实只是把前面构造$ \small \hat S_z $的过程在薛定谔方程中重复了一遍而已)

于是方程可以写成算符形式:

$\small \begin{align} \text i\hbar\frac{\partial }{\partial t}|\psi,S\rangle=\left(\frac{\hat p^2}{2m}+\hat V+\frac{-eB}{2m_ec}\hat S\right)|\psi,S\rangle \end{align} \quad{\scriptsize (式26.29)}$

如果磁场方向是一般方向,右边括号中第三项就是磁场与自旋算符的内积:

$\small \begin{align} \text i\hbar\frac{\partial }{\partial t}|\psi,S\rangle&=\left(\frac{\hat p^2}{2m}+\hat V+\frac{-e}{2m_ec}\boldsymbol B\cdot\hat {\boldsymbol S}\right)|\psi,S\rangle \\ &={\scriptsize\left(-\frac{\hbar^2}{2m}\nabla^2+V\right)\begin{bmatrix}1&0\\0&1\end{bmatrix}\begin{bmatrix}\psi_1\\ \psi_2\end{bmatrix} +\frac{\hbar}{2}\frac{-e}{2m_ec}\begin{bmatrix}B_z&B_x-\text iB_y\\B_x+\text iB_y&-B_z\end{bmatrix}\begin{bmatrix}\psi_1\\ \psi_2\end{bmatrix}} \end{align} \quad{\scriptsize (式26.30)}$

这就是考虑了自旋的薛定谔方程,又称作“泡利方程”。

我们从这个方程的形式中可以看出,自旋信息是通过与外磁场的耦合产生的能量项体现出来的,假如没有外磁场,那么与自旋有关的项就变成了零,泡利方程就退化为:

$\small \begin{align} \text i\hbar\frac{\partial }{\partial t}\begin{bmatrix}\psi_1\\ \psi_2\end{bmatrix}=\left(-\frac{\hbar^2}{2m}\nabla^2+V\right)\begin{bmatrix}1&0\\0&1\end{bmatrix}\begin{bmatrix}\psi_1\\ \psi_2\end{bmatrix} \end{align} \quad{\scriptsize (式26.31)}$

也就是两个普通的、独立的薛定谔方程:

$\small \begin{cases} \text i\hbar\frac{\partial }{\partial t}\psi_1=-\frac{\hbar^2}{2m}\nabla^2\psi_1+V\psi_1\\ \text i\hbar\frac{\partial }{\partial t}\psi_2=-\frac{\hbar^2}{2m}\nabla^2\psi_2+V\psi_2 \end{cases} \quad{\scriptsize (式26.32)}$

这个时候,由于没有任何外场产生“测量”自旋的行为,自旋信息就变成了“我房间里有个会喷火的龙但我看不见它”,这种情形下,强行拆分成两个方程其实并不具有可测量的物理意义,本质上和无自旋的薛定谔方程也就没什么区别了。


5) 总结和预告

这节课里,我们介绍了三个坐标方向、以及任意方向的自旋的算符(泡利矩阵)和本征态:

$\small \begin{cases} \hat S_x=\frac{\hbar}{2}\begin{bmatrix}0&1\\1&0\end{bmatrix} &|x_+\rangle=\begin{bmatrix}\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}\end{bmatrix} &|x_-\rangle=\begin{bmatrix}-\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}\end{bmatrix} \\ \hat S_y=\frac{\hbar}{2}\begin{bmatrix}0&-\text i\\\text i&0\end{bmatrix}& |y_+\rangle=\begin{bmatrix}\frac{1}{\sqrt{2}}\\\frac{\text i}{\sqrt{2}}\end{bmatrix} & |y_-\rangle=\begin{bmatrix}-\frac{1}{\sqrt{2}}\\\frac{\text i}{\sqrt{2}}\end{bmatrix} \\\hat S_z=\frac{\hbar}{2}\begin{bmatrix}1&0\\0&-1\end{bmatrix} &|z_+\rangle=\begin{bmatrix}1\\0\end{bmatrix}&|z_-\rangle=\begin{bmatrix}0\\1\end{bmatrix}\\ {\scriptsize \hat S_{\boldsymbol n}=\begin{bmatrix}\cos\theta&\text e^{-\text i\varphi}\sin\theta\\\text e^{\text i\varphi}\sin\theta&-\cos\theta\end{bmatrix}}&{\scriptsize |n_+\rangle=\begin{bmatrix}\cos\frac{\theta}{2}\\\text e^{\text i\varphi}\sin\frac{\theta}{2}\end{bmatrix}}&{\scriptsize |n_-\rangle=\begin{bmatrix}-\sin\frac{\theta}{2}\\\text e^{\text i\varphi}\cos\frac{\theta}{2}\end{bmatrix}} \end{cases} \quad{\scriptsize (式26.33)}$

然后,我们通过将它们的对易关系与一般角动量算符的对易关系进行对照,确信了这样的构造方式是合理的。

接下来,我们就将自旋信息融入到波函数和薛定谔方程中,通过简单的直积运算构造了包含自旋信息的波函数:

$\small\begin{align}\left|\psi,S\right>=\begin{bmatrix}c_{+}\psi(\boldsymbol x,t)\\c_{-}\psi(\boldsymbol x,t)\end{bmatrix}\end{align} \quad{\scriptsize (式26.34)}$

然后通过在薛定谔方程中加入自旋与外磁场的耦合能,构造了包含自旋的薛定谔方程、也就是泡利方程:

$\small \begin{align} \text i\hbar\frac{\partial }{\partial t}|\psi,S\rangle&=\left(\frac{\hat p^2}{2m}+\hat V+\frac{-e}{2m_ec}\boldsymbol B\cdot\hat {\boldsymbol S}\right)|\psi,S\rangle \end{align} \quad{\scriptsize (式26.30)}$

这个方程其实隐含了自旋的发现过程:自旋信息并不是从无到有直接推导出来的,而是因为物理上测量到了它(自旋在外磁场作用下的能级分裂),然后将它与外场的耦合能作为修正项加进薛定谔方程,才将方程扩展成二维形式,并且形成了单独的自旋项。

而如果没有外场去“测量”自旋,那么耦合能那一项会变成零,方程又将退化为薛定谔方程,自旋也会变成冗余信息,而不会天然地包含在薛定谔方程中,薛定谔方程也完全没有写成矩阵形式的必要。

这一点对K-G方程而言也是一样的,它们都不会“天然地”将代表自旋算符的泡利矩阵包含进去。

那么,有没有什么方程“天然地”就包含了泡利矩阵呢?

联想到自旋在量级上和相对论之间的若有若无的联系,我们还是回到相对论性方程中去找。

而再联想到上节课我们提到,为了构造满足相对论协变对称性的一阶方程(以解决负概率问题),我们需要在没有根号的情况下对能量开平方,而这也要求开方后各项系数必须是矩阵,没错,又是矩阵。

那么接下来的事情就是水到渠成了,我们马上就要来见识量子力学初创时期最天才的想法,看看如何将泡利矩阵自然地引入到相对论性的能量本征方程中去。


编辑于 2023-01-25 22:09・IP 属地四川

从线性代数到量子力学(25):克莱因-高登方程:一次不完美的尝试

PeiLingX
物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》第25课。

了解本系列及本专栏其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

上节课我们回顾了相对论能量关系$ \small E^2=m^2c^4-p^2c^2 $的由来,并且在构造过程中看到,这个能量关系背后隐藏着一个“投影”关系:

$\small m^2c^4=E^2-p^2c^2\quad{\scriptsize(式25.1)}$

即总能量$ \small E $和动能项$ \small -p^2c^2 $可以分别看成一个不变量(即静能量$ \small m^2c^4 )$在“时间维度”和“空间维度”上的“投影”。

而这个能量关系式是在任意参考系中都成立的,这种不随参考系改变的性质,也是一种对称性,即相对论协变对称性。

这种协变对称性可以认为是狭义相对论的“灵魂”所在,它将决定我们用相对论能量关系建立新的量子力学方程时,采用什么样的形式。

从这节课开始,我们就要跟随前人的脚步,来探索符合相对论能量关系和协变对称性的新方程的形式,然后看看这次探索这会给带我们进入一个什么样的新世界。


1) 克莱因-高登方程

建立新的能量本征方程的第一步,自然在于我们怎么处理哈密顿量。

一种思路是将总能量开根号:

$\small E=\pm\sqrt{p^2c^2+m^2c^4} \quad{\scriptsize(式25.2)}$

就像我们在第23课中推导能量偏差项时所做的那样。

但这么做现实上不可操作,因为我们要把力学量、特别是动量转化为算符,而算符开根号在计算上是没办法处理的(比如我们没法直接定义$ \small \sqrt{\frac{\partial }{\partial x}} )$。

当然,我们可以继续将根号下的部分进行泰勒展开:

$\small \begin{align} E&=\pm\left(mc^2+\frac{p^2}{2m}-\frac{p^4}{8m^3c^2}+\cdots \right)\end{align} \quad{\scriptsize(式25.3)}$

这样一来,我们就可以将算符开根号转化成算符的幂函数,可以根据我们想要的精度保留动能项的阶数,最终建立一个高阶的线性微分方程。

但这种方式实际上已经破坏了原来的能量关系式中的“几何投影”的味道,也就破坏了能量关系背后蕴含的美妙的几何意义和协变对称性。

因此我们可以换第二种思路:不开根号,直接用能量平方关系来建立方程。

根据哈密顿算符与时间导数之间的关系:

$\small \hat H=\text i\hbar\frac{\partial }{\partial t} \quad{\scriptsize(式25.4)}$

我们可以求得:

$\small \hat H^2=-\hbar^2\frac{\partial^2 }{\partial t^2} \quad{\scriptsize(式25.5)}$

这就对应了能量关系等式左边的能量平方。

而能量关系右边的动量平方的算符自然也可以同理得到:

$\small \hat p^2=-\hbar^2\nabla^2 \quad{\scriptsize(式25.6)}$

代入相对论能量关系,可得:

$\small -\hbar^2\frac{\partial^2\psi}{\partial t^2}=-\hbar^2c^2\nabla^2\psi+m^2c^4\psi \quad{\scriptsize(式25.7)}$

这样,我们就得到了符合相对论的能量本征方程。

这个方程最早由瑞典物理学家克莱因(O. Klein)和德国物理学家高登(W. Gordon)各自独立发表,称为克莱因-高登方程,后文我们简称K-G方程。

我们可以看到,由于这个方程来源于相对论能量关系的算符化,而能量关系是在任意参考系中都成立,因此克莱因-高登方程也是在任意参考系中都成立、具有相同的形式,这就是我们想要保留的方程的协变对称性。

这个方程的解很简单,仍然是我们在第9课中见到过的复指数形式的平面波:

$\small \psi(t,x,y,z)=\text e^{\text i\left(k_xx+k_yy+k_zz-\omega t\right)}:=\text e^{\text i\left(\boldsymbol k\cdot \boldsymbol x-\omega t\right)} \quad{\scriptsize(式25.8)}$

其中,$ \small \boldsymbol k $是平面单色波的波矢量,$ \small \omega $是频率。

利用德布罗意关系:

$\small \boldsymbol k=\frac{\boldsymbol p}{\hbar},\omega =\frac{E}{\hbar} \quad{\scriptsize(式25.9)}$

我们可以将它写成能量和动量的函数:

$\small \psi(t,x,y,z)=\text e^{\frac{\text i}{\hbar}\left(\boldsymbol p\cdot \boldsymbol x-E t\right)} \quad{\scriptsize(式25.10)}$

这个解非常容易验证,只要将它代入克莱因$-$高登方程,我们就很自然地得到:

$\small E^2\psi=\left(p^2c^2+m^2c^4\right)\psi \quad{\scriptsize(式25.11)}$

到这里,我们似乎就完成了从方程建立到求解的全套过程,整个过程流畅得让人心旷神怡(当然,我们还没考虑有势场的情形,但这并不影响本质)。

但这个奇幻旅程真的这么快就结束了吗?

似乎事情不应该这么顺利,也不应该这么波澜不惊。实际上,如果我们对解的性质做一些更细致的考察,就会发现,它其实有几个地方并不符合我们对物理世界的美好期望。

我们先将这些“不符合美好期望”的问题列出来,然后一个一个去讨论它们:

  • 负能解问题
  • 负概率问题
  • 自旋信息问题

2) 负能解问题

不知道同学们有没有注意,我们前面的求解过程其实只完成了一半,因为在式25.11里面,我们得到的是能量平方的本征值,而不是能量本征值本身。

要求得能量本征值,我们仍然需要对等式右边进行开方。

而我们的初中数学老师告诉我们,开方会带来正负两个解:

$\small E=\pm\sqrt{p^2c^2+m^2c^4} \quad{\scriptsize(式25.2)}$

那么问题来了:负能量的解需要保留吗?

如果我们仅仅是在讨论狭义相对论,而没有涉及到量子力学,那么这个问题很简单:

负能解没有物理意义,直接舍去就行了。

但是现在我们要面临一个量子力学特有的问题:本征态组的完备性问题。

我们知道,所有的能量本征态构成一组完备基底,以保证任何一个态矢量都可以由这组基底线性表出。

这就意味着,不管能量是正还是负,只要它满足K-G方程,它对应的本征函数就一定是这组基底中必不可少的一个,如果缺了任意一个,这组基底就不完备,就不能表示出任意态矢量。

而我们看到,负能量解也满足K-G方程,对应的本征态也就必须纳入完备基底中,所以就不可能被舍去了。

那么现在问题来了:

第一,一个粒子具有“负能量”,有具体的物理意义吗?

第二,如果有负能级,那么粒子的能级岂不是可以一直往下跌?(哪怕是我大$A$股也有见底的时候吧……)

这个问题我们留到以后再讨论,现在我们来看K-G方程的另外一个问题:负概率问题。


3) 概率流守恒

讨论负概率问题之前,我们需要先来了解一个非常基本的守恒律:概率流守恒。

假如我们考虑某种流,比如水流、电流、热流等,那么我们会发现一个普遍的流守恒定律。

以电荷为例,如果我们考虑某个带电材料内部的某个空间区域,有电流通过这个区域的边界面流入流出,那么我们会发现,通过边界流出这个区域的总电流,等于这个区域内部电荷的减少率,也就是总的电荷守恒。

这句话写成公式就是:

$\small \oint_{S}\boldsymbol j\cdot \text d\boldsymbol \sigma=-\frac{\partial }{\partial t}\int_V\rho\text d\omega \quad{\scriptsize(式25.12)}$

左边的积分是电流密度$ \small \boldsymbol j $在区域$ \small V $的闭合边界面$ \small S $上的净流出量,右边的积分表示空间区域$ \small V $内部的总电荷(电荷密度的体积分),对时间的偏导表示总电荷的变化率$(($负号表示减少)。

接下来,我们将这个关系做一些处理,将它从积分的形式改写成写成微分的形式。

首先,右边对时间的偏导可以放到积分号内:

$\small \oint_{S}\boldsymbol j\cdot \text d\boldsymbol \sigma=-\int_V\frac{\partial \rho}{\partial t}\text d\omega \quad{\scriptsize(式25.13)}$

而对于左边,我们可以通过高斯积分公式将它也化为体积分:

$\small \oint_{S}\boldsymbol j\cdot \text d\boldsymbol \sigma=\int_V\boldsymbol \nabla\cdot \boldsymbol j\text d\omega \quad{\scriptsize(式25.14)}$

于是我们可以将守恒关系式化为:

$\small \int_V\boldsymbol \nabla\cdot \boldsymbol j\text d\omega=-\int_V\frac{\partial \rho}{\partial t}\text d\omega \quad{\scriptsize(式25.15)}$

由于积分区域$ \small V $是任意选取的,所以左右两边积分号内部的被积函数处处相等:

$\small \boldsymbol \nabla\cdot \boldsymbol j=-\frac{\partial \rho}{\partial t} \quad{\scriptsize(式25.16)}$

其实 $\small \boldsymbol j$ 的散度的物理意义本来就可以看作某个局部体积微元 $\small \text dV$ 的边界上 $\small \boldsymbol j$ 的净流出量除以 $\small \text dV$

这就是电流守恒、或者说电荷守恒的微分形式。

在量子力学中,我们也需要考虑一种流,就是粒子在空间中出现的概率流。

我们知道,根据波函数的统计诠释,波函数的模平方就是粒子在空间中某点出现的概率。

而在量子力学的观念中,粒子是不生不灭的,这就意味着,随着波函数的演化,如果粒子在某处出现的概率减少,那么这个减少的概率必然会随着某个概率流,流到别出去。

如果我们将粒子在某处出现的概率密度记为$ \small \rho $,那么我们也能找到一个概率流$ \small \boldsymbol j $,使它满足守恒方程(式25.16)。

而令人感到惊奇的是,在量子力学中,这个守恒律不用附加额外的条件,直接用薛定谔方程就能得到。

我们现在就来证明这一点。

首先,根据波函数的统计诠释,粒子在空间某处出现的概率密度为:

$\small \rho=\left|\psi\right|^2=\psi\psi^* \quad{\scriptsize(式25.17)}$

于是它的时间变化率为:

$\small \frac{\partial \rho}{\partial t}=\frac{\partial }{\partial t}\left(\psi\psi^*\right)=\psi^*\frac{\partial \psi}{\partial t}+\psi\frac{\partial \psi^*}{\partial t} \quad{\scriptsize(式25.18)}$

由于我们是要通过薛定谔方程来证明概率流守恒,因此我们可以在薛定谔方程中构造上面等式右边的两项。

首先,对薛定谔方程两边同时乘以$ \small \psi^* $,我们可以得到:

$\small \text i\hbar\psi^*\frac{\partial \psi}{\partial t}=-\frac{\hbar^2}{2m}\psi^*\nabla^2\psi+V\psi^*\psi \quad{\scriptsize(式25.19)}$

这样我们就构造出了第一项:$ \scriptsize \psi^*\frac{\partial \psi}{\partial t}$

而对于第二项,由于是对$ \small \psi $的复共轭$ \small \psi^* $求时间微分,因此我们可以先对薛定谔方程两边同时取复共轭:

$\small \left(\text i\hbar\frac{\partial \psi}{\partial t}\right)^*=\left(-\frac{\hbar^2}{2m}\nabla^2\psi+V\psi\right)^* \quad{\scriptsize(式25.20)}$

得到:

$\small -\text i\hbar\frac{\partial \psi^*}{\partial t}=-\frac{\hbar^2}{2m}\nabla^2\psi^*+V\psi^* \quad{\scriptsize(式25.21)}$

然后在两边同时乘以$ \small \psi $,得到:

$\small -\text i\hbar\psi\frac{\partial \psi^*}{\partial t}=-\frac{\hbar^2}{2m}\psi\nabla^2\psi^*+V\psi\psi^* \quad{\scriptsize(式25.22)}$

用式25.21减去式25.22,就得到:

$\small -\text i\hbar\left(\psi^*\frac{\partial \psi}{\partial t}+\psi\frac{\partial \psi^*}{\partial t}\right)=\frac{\hbar^2}{2m}\left(\psi^*\nabla^2\psi-\psi\nabla^2\psi^*\right) \quad{\scriptsize(式25.23)}$

这个新方程的左边就是概率密度随时间的变化率:

$\small \psi^*\frac{\partial \psi}{\partial t}+\psi\frac{\partial \psi^*}{\partial t}=\frac{\partial }{\partial t}\left(\psi\psi^*\right)=\frac{\partial \rho}{\partial t} \quad{\scriptsize(式25.24)}$

而它的右边括号中的项,可以进一步写成:

$\small \psi\nabla^2\psi^*-\psi^*\nabla^2\psi=\boldsymbol \nabla\cdot\left(\psi\boldsymbol \nabla \psi^*-\psi^*\boldsymbol \nabla \psi\right) \quad{\scriptsize(式25.25)}$

现在,我们令:

$\small \boldsymbol j=\frac{\text i\hbar}{2m}\left(\psi\boldsymbol \nabla \psi^*-\psi^*\boldsymbol \nabla \psi\right) \quad{\scriptsize(式25.26)}$

将式25.24和式25.26代入式25.23,我们就能从形式上写出守恒方程:

$\small -\frac{\partial \rho}{\partial t}=\boldsymbol \nabla\cdot \boldsymbol j \quad{\scriptsize(式25.27)}$

这里唯一遗留的问题就是式25.26给出的概率流定义:这个式子右边那一串奇怪的东西,看起来似乎只是为了凑一个守恒方程而强行规定的,它真的具有概率流的物理意义吗?

这一点其实可以被证明,但我们这里略过不提,有兴趣的同学可以参考张永德老师的书[1],现在我们只通过一个简单的算例来感受一下这个定义的合理性。

为了简单起见,我们考虑没有势场的自由粒子,它的能量本征函数就是平面单色波:

$\small \psi=\exp\left[\frac{\text i}{\hbar}\left(\boldsymbol p\cdot \boldsymbol x-Et\right)\right] \quad{\scriptsize(式25.28)}$

对这个波函数以及它的复共轭求梯度,就得到:

$\small \begin{cases} \boldsymbol \nabla\psi=\frac{\text i}{\hbar}\boldsymbol p\psi\\ \boldsymbol \nabla\psi^*=-\frac{\text i}{\hbar}\boldsymbol p\psi^* \end{cases} \quad{\scriptsize(式25.29)}$

将这个关系式代入概率流的定义式25.26里,我们就得到:

$\small \begin{align} \frac{\text i\hbar}{2m}\left(\psi\boldsymbol \nabla \psi^*-\psi^*\boldsymbol \nabla \psi\right)&=\frac{\text i\hbar}{2m}\left[-\frac{2\text i}{\hbar}\boldsymbol p\left(\psi\psi^*\right)\right]\\ &=\frac{\boldsymbol p}{m}\rho\\ &=\boldsymbol v\rho \end{align} \quad{\scriptsize(式25.30)}$

这里的概率密度乘以“速度”,就可以看成概率密度的“流动”,也就对应了概率流密度$ \small \boldsymbol j$

这样,我们就通过薛定谔方程导出了概率流守恒。

这也在某种意义上印证了量子力学更高的自洽性:通过薛定谔方程,我们不仅能还原出牛顿力学定律,还能得出经典力学不能直接得出的流守恒定律。

接下来,我们来看看,如何从K-G方程出发,构造概率流守恒方程。


4) 负概率问题

我们一开始的操作和对薛定谔方程的操作一样,也是分别在K-G方程和它的复共轭两边乘以$ \small \psi^* $和$ \small \psi $,然后两式相减,得到:

$\small -\hbar^2\left(\psi\frac{\partial^2 \psi^*}{\partial t^2}-\psi^*\frac{\partial^2 \psi}{\partial t^2}\right)=\hbar^2c^2\left(\psi\nabla^2\psi^*-\psi^*\nabla^2\psi\right) \quad{\scriptsize(式25.31)}$

为了量纲统一,我们把左右两边同时乘以和除以一些系数,变成:

$\small -\frac{\text i\hbar}{2mc^2}\left(\psi\frac{\partial^2 \psi^*}{\partial t^2}-\psi^*\frac{\partial^2 \psi}{\partial t^2}\right)=\frac{\text i\hbar}{2m}\left(\psi\nabla^2\psi^*-\psi^*\nabla^2\psi\right) \quad{\scriptsize(式25.32)}$

这个等式的右边,仍然是我们前面得出的概率流密度的散度$ \small \nabla\cdot\boldsymbol j $,问题在于怎么处理它的左边。

首先,我们可以将左边改写成:

$\small -\frac{\text i\hbar}{2mc^2}\left(\psi\frac{\partial^2 \psi^*}{\partial t^2}-\psi^*\frac{\partial^2 \psi}{\partial t^2}\right)=-\frac{\partial }{\partial t}\left[\frac{\text i\hbar}{2mc^2}\left(\psi\frac{\partial \psi^*}{\partial t}-\psi^*\frac{\partial \psi}{\partial t}\right)\right] \quad{\scriptsize(式25.33)}$

如果要凑出概率流守恒方程,我们就不得不将上式右边方括号中的内容定义为概率密度$ \small \rho $,也就是:

$\small \rho=\frac{\text i\hbar}{2mc^2}\left(\psi\frac{\partial \psi^*}{\partial t}-\psi^*\frac{\partial \psi}{\partial t}\right) \quad{\scriptsize(式25.34)}$

没错,这就是K-G方程语境下的概率密度的定义,虽然它看起来很奇怪,但这个定义满足概率流守恒,而守恒流是一个更基本的原则,所以我们在理智上必须接受这个定义。

当然,这只是在理智上接受。心理上,我们仍然会有不适感,仍然会忍不住质问:

这个定义是个啥玩意儿?那个简单直观又好看的$ \small \rho=\psi^*\psi $藏到哪里去了?

实际上,我们稍加推导,就能找到这个新定义和我们熟悉的旧定义之间的联系。

如果我们考察某个能量本征态$ \small \psi $以及它的共轭的时间导数,我们将得到:

$\small \begin{cases} \text i \hbar\frac{\partial \psi}{\partial t}=\hat H\psi=E\psi\\ -\text i \hbar\frac{\partial \psi^*}{\partial t}=\hat H^\dagger\psi^*=E\psi^* \end{cases} \quad{\scriptsize(式25.35)}$

将这两项代入式25.34,概率密度就变成了:

$\small \begin{align} \rho&=\frac{1}{2mc^2}\left(\psi E\psi^*-\psi^*E\psi\right)\\ &=\frac{E}{mc^2}\psi\psi^*\\ &=\pm\gamma\psi\psi^* \end{align} \quad{\scriptsize(式25.36)}$

于是我们看到,我们熟悉的那个概率密度又回来了,只不过多了一个相对论因子$ \scriptsize \gamma=\frac{1}{\sqrt{1-v^2/c^2}} ($前面加正负号是因为能量可能有负值),这也正好说明了,新定义具有某种相对论效应在里面。

而当粒子的速度$ \small v\ll c $时,如果对能量取正能解,就退化到了非相对论情况下的近似定义:

$\small \rho\simeq \psi\psi^* \quad{\scriptsize(式25.37)}$

这样,我们也从直观上看到了新定义的“合理性”,可以放心大胆地认为,它的确代表了K-G方程下的概率密度。

但接受这个定义后,我们马上会面临一个关键问题:新定义的概率密度可能出现负值。

我们可以从两个角度去理解这个事实:

首先,在我们刚刚推导出的关系式$ \scriptsize \begin{align} \rho&=\frac{E}{mc^2}\psi\psi^* \end{align} $中,我们已经发现,由于能量有正负两种解,因此这个概率密度也必然有正负两种可能;

这个理解方式很直观,但我们很难从中发现解决负概率问题的有效办法(因为我们后面会看到,在相对论性的量子力学方程中,负能解其实没有办法避免)。

另一种理解方式,需要回到$ \scriptsize \rho=\psi\frac{\partial \psi^*}{\partial t}-\psi^*\frac{\partial \psi}{\partial t} $这个定义中考虑:

由于K-G方程是一个对时间的二阶微分方程,需要用到$ \small \psi(0),\psi'_t(0) $两个初始条件信息,而这两个初始条件是任意的,因此不能保证$ \scriptsize \rho=\psi\frac{\partial \psi^*}{\partial t}-\psi^*\frac{\partial \psi}{\partial t} $一定为正。

如果我们能让方程变成对时间求一阶导,那么我们在构造概率流密度的时候,仍然可以像薛定谔方程一样,将概率流守恒方程左边构造成$ \scriptsize \frac{\partial }{\partial t}\left(\psi\psi^*\right) $的形式,这样,我们仍然能得到一个正的概率密度(因为$ \small \psi\psi^*=\left|\psi\right|^2 $必然是正数)

那么,该怎么构造一个对时间求一阶导的方程呢?我们先来探个路。


5) 构造新方程的思路

对时间求一阶导,也就意味着能量关系式中能量应该以一次方、而不是平方的形式出现。

这样一来,我们似乎又要回到老路上,给能量开平方:

$\small E=\pm\sqrt{p^2c^2+m^2c^4} \quad{\scriptsize(式25.2)}$

但我们在本课开头已经看到,这个方子既不好用也不好看。

那我们干脆异想天开一下,考虑有没有这种可能,存在系数$ \small A $和$ \small B $,使得:

$\small E=Amc^2+Bpc \quad{\scriptsize(式25.38)}$

且同时有:

$\small E^2=\left(Amc^2+Bpc\right)^2=m^2c^4+p^2c^2 \quad{\scriptsize(式25.39)}$

如果有这样的好事,我们既能得到一个一阶方程,又能避免开根号的麻烦,还能保持方程的协变对称性。

这看起来很荒谬,因为哪怕去问一个初中生,他都会一脸不屑地告诉我们,如果:

$\small m^2c^4+p^2c^2=\left(Amc^2+Bpc\right)^2=A^2m^2c^4+B^2p^2c^2+2AB mpc^3 \quad{\scriptsize(式25.40)}$

那么我们会得到$ \small A=B=1 $,从而发现最右边第三项(交叉项)无论如何都不可能消掉。

但问题是,我们已经不是初中生了,所以我们也许会找到更多的办法?

一位不世出的天才告诉我们:有。

他告诉我们:你们刚才算得太快了,省略了关键的一步,现在我帮你们补上吧:

$\small \left(A mc^2+B pc\right)^2=A^2m^2c^4+B^2p^2c^2+\left(\color{red}{AB +BA }\right)mpc^3 \quad{\scriptsize(式25.41)}$

如果$ \small A,B $是两个普通的复数,那么我们会有:

$\small AB+BA=2AB\neq 0 \quad{\scriptsize(式25.42)}$

但……如果它们是矩阵呢?

我们先把这个悬念放到后面,现在还是回头来看看K-G方程的最后一个问题。


6) 自旋信息问题

我们在第23课中看到,造成原子能级“天然”分裂的旋-轨耦合项,从数量级上看,似乎和相对论有着若有若无的联系。于是当时我们猜想,也许自旋的信息能从相对论性的量子力学方程中自然而然地冒出来。

而现在我们已经完成了相对论性的K-G方程的求解,却并没有发现自旋的信息在哪里。

但话又说回来,我们到现在为止,其实也并没有讨论过,一个包含了自旋信息的波函数和方程是什么样子。

下节课,我们就先来看看,如何将自旋信息加入到波函数和方程中去,这会对我们构造新方程产生一次神奇的助攻。


关于封面图:实在找不到恰当的、符合文章意境的配图,就随便用一张以前拍过的风景照吧。


参考

  1. 《量子力学(第四版)》张永德 著,P. 32 以及 P. 38 ~ P. 39

编辑于 2023-01-25 22:10・IP 属地四川