从线性代数到量子力学(24):相对论能量关系的“几何”意义

PeiLingX
物理学等2个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》第24课。

了解本系列及本专栏其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

从这节课开始,我们将进入一段新旅程,看看量子力学和狭义相对论结合之后产生的美丽新世界。

由于定态薛定谔方程是能量的本征方程,所以两者的结合点自然是能量关系。

也就是利用相对论能量关系:

$\small E^2=p^2c^2+m^2c^4 \quad{\scriptsize (式23.10)}$

代替牛顿力学的动能关系:

$\small T=\frac{p^2}{2m} \quad{\scriptsize (式8.11)}$

来建立新的能量本征方程。

(为了方便理解和推导,我们暂时不考虑势能项)

不过,在探索新方程之前,我们最好知道一下相对论能量关系是怎么来的,以及它背后有什么样的几何意义。


1) 两个关键词

如果抛开各种具体的物理关系不谈,我们其实可以将狭义相对论简单粗暴地概括成两个关键词:

对称性 + 时空的几何结构

同学们还记不记得中学物理课本提到的狭义相对论的两条基本假设:

第一条:

所有惯性系中,物理定律具有相同形式。

第二条:

所有惯性系中,真空中的光速都相同。

如果我们还记得第22课中对于对称性的定义:物理对象在变换下不变的性质,那么我们马上会意识到,第一条假设说的正好就是一种对称性;

而第二条看起来虽然更像是在描述一个物理现象,但我们其实可以通过它来窥探一个与时空有关的几何原理,后面几节课里与我们形影不离的相对论能量关系,其实都可以看成这个几何原理的延申。

我们这节课里,就主要来体会第二个关键词:时空的几何结构。

对称性在狭义相对论中其实更重要也更美妙,作者也非常努力地尝试过将它也放进这节课里一起展现,但一口气写了五千多字发现还刹不住车的时候,终于还是内心充满挣扎地放弃了,毕竟这部分不太会影响到我们后面的理解。对狭义相对论中物理定律的对称性有兴趣的同学可以读一读费曼的书[1],或者想快速入门的话也可以看看作者另一个系列的前14课。

我们先从回顾相对论时空观的来历开始。


2) 相对论时空观的来历

我们知道,麦克斯韦方程组经过一些简单的解耦运算后,可以得到电磁波的波动方程(也许有同学没见过这个方程具体的形式,但是从麦克斯韦方程种发现电磁波这件事情总是有所耳闻的):

$\small \begin{cases} \frac{\partial^2\boldsymbol E}{\partial x^2}-\frac{1}{\mu_0\epsilon_0}\frac{\partial^2\boldsymbol E}{\partial t^2}=0\ \frac{\partial^2\boldsymbol B}{\partial x^2}-\frac{1}{\mu_0\epsilon_0}\frac{\partial^2\boldsymbol B}{\partial t^2}=0 \end{cases} \quad{\scriptsize (式24.1)}$

(其中,$ \small \mu_0 $为真空中的磁导率,$ \small \epsilon_0 $为真空中的介电常数)

在这个方程中,$ \scriptsize \frac{1}{\mu_0\epsilon_0}=\frac{1}{c^2} $,代表的就是电磁波的波速、也就是光速的平方分之一。

于是两个问题紧接着就来了:

第一问:根据十九世纪物理学的政治正确,波动总是有个传播介质的,那么电磁波的传播介质是个啥?

物理学家们回答:不管它是什么样子,我们先将它叫做“以太”吧。

然后第二问就是:地球在自转和公转,我们在地球上运动方向始终在发生改变,那么我们总有一些运动方向是在相对“以太”运动的,不同方向上的相对运动是否会让我们观测到光速发生变化?

物理学家们又答:当然会,我们做个实验测量一下就知道了。

但他们很快就被(物理意义上的)光速打脸:在接下来的几年里,不同的实验物理学家设计了多个不同的实验方案,最后都测不出任何方向上的光速有任何变化[2]。

但物理学家们仍然不敢相信世界上有可以不依靠介质传播的波,因此他们还是不敢轻易请走“以太”这尊神。

只是几个实验结果摆在那里,总得给个解释吧。

对此,洛仑兹(没错,就是我们上节课提到的那位荷兰物理学家)提出了一种假设:

相对于“以太”运动的物体(这自然就包括了测量仪器)、在运动方向上会发生所谓的洛仑兹收缩,收缩的比例为:

$\small \beta=\sqrt{1-\frac{v^2}{c^2}} \quad{\scriptsize (式24.2)}$

(这可以看成“尺缩效应”的最早版本,虽然它的解释是错误的)

关于如何用洛仑兹收缩解释实验测量不到光速变化,我们这里不展开,有兴趣的同学可以随手找一本狭义相对论教材来看看[3]。

总之,在1905奇迹年之前,物理学界对于“以太”以及“光速不变”的实验结果的态度,就相当于是在说:

“我家里有个妖怪(以太),但是我们永远看不见它(实验测量不到相对于“以太”运动时的光速变化),因为它对我们实施了障眼法(测量仪器相对于“以太”运动时发生了洛仑兹收缩)。”

但常识告诉我们,如果有一个东西,我们没办法通过任何手段直接或者哪怕间接地测量到它,那么我们就应该大胆地认为它不存在。

而且,强行认为“以太”存在,那么“以太”所在的参考系就具有了某种特殊地位,这样会使得使物理定律在不同参考系中产生区别,破坏了我们前面提到的物理定律的对称性。

所以后来的事情我们也都知道了:

爱因斯坦敏锐地捕捉到了问题的关键,也就是对称性问题。他发现,如果去掉“以太”这个永远测量不到的虚无概念,也就去掉了具有特殊地位的“以太”参考系。那么电磁学定律的对称性又会回来,而且还会得到一个更加漂亮的时空体系,也就是相对论时空。

只不过,这个全新的时空观会带来一个非常反直觉的事实:光速在不同参考系中不变,而这个不变性会导致时间和空间尺度在不同参考系中都会发生变化,比如我们中学物理中熟悉的钟慢效应和尺缩效应。

但好在这种反直觉对我们来说其实只是暂时的,如果我们找到了隐藏在这些变化背后的某个不变的时空几何结构,一切就会显得非常自然。

我们接下来就以钟慢效应为例,回顾一下如何从光速不变导出不同参考系中时间尺度的变化,又如何从中挖掘出背后那个神秘的时空几何结构。


3) 钟慢效应

推导钟慢效应的物理情形是这样的:

假设张三站在河岸上静止不动,李四乘船从他面前匀速经过。

两人交会时,擦出了一团火花、发出耀眼光芒,其中一道光束直奔李四头顶上的一面镜子而去,这面镜子和船体相连,会随着李四一起运动,光打在镜子上,又反射回来,回到李四面前。

现在我们来计算,这道光束从交汇处出发、到回到李四面前这一段旅程所花费的时间。

我们将张三和李四的参考系分别记作$ \small S $系和$ \small S' $系。

对于李四而言,光束的轨迹就是一来一回两条重合的线段,假设镜子的高度为$ \small L $,那么相应的时间就是:

$\small \Delta t'=\frac{2L}{c} \quad{\scriptsize (式24.3)}$

而对于张三而言,假设这道光的传播时间为$ \small \Delta t $,那么由于光束是斜着上去又斜着下来的,两段路程加起来就是$ \small \sqrt{4L^2+v^2\Delta t^2} $,因此运动时间满足一个关于$ \small \Delta t $的简单的二次方程:

$\small \Delta t=\frac{\sqrt{4L^2+v^2\Delta t^2}}{c} \quad{\scriptsize (式24.4)}$

求解后就得到:

$\small \Delta t=\frac{2L}{\sqrt{c^2-v^2}}=\frac{1}{\sqrt{1-v^2/c^2}}\Delta t' \quad{\scriptsize (式24.5)}$

如果我们假设李四随身带了一个钟,用来测量光的传播时间$ \small \Delta t' $,那么我们看到,由于:

$\small \Delta t'=\sqrt{1-v^2/c^2}\Delta t<\Delta t \quad{\scriptsize (式24.6)}$

这看起来就像是李四的钟因为随着船运动而走得更慢了一些,这就是所谓的钟慢效应。

但是敏感的同学会马上发现上面这句话有个问题:

运动是相对的,没有哪个参考系可以被看成绝对静止的参考系,所以相对于李四而言,张三也在运动,为什么不是张三的钟走得更慢一些呢?

为了回答这个问题,我们其实可以假设另一个物理情形:

张三头顶上也有一面镜子,这个镜子固定在岸上,有另外一道光束打到镜子上又返回张三面前,那么这个时候如果我们按照上面的推导思路重新来一遍,就会发现这次两个参考系中光束的传播时间正好反过来,变成了:

$\small \Delta t'=\frac{1}{\sqrt{1-v^2/c^2}}\Delta t \quad{\scriptsize (式24.7)}$

所以,谁的钟走得更慢,根本就不取决于谁在运动(因为这本身就无法区分),而是取决于一些其他的因素。

我们来仔细看一看前面提到的两种情形:在第一种情形中,“光从李四面前出发”和“光回到李四面前”这两件事情,在李四参考系中发生在同一个地点,但在张三参考系中却不是;而第二种情形则正好相反。

这就提示我们:也许同一段过程在某个参考系中的时间间隔和空间间隔有关系?

这其实一点都不奇怪,中学物理课本就曾经告诉过我们:

相对论时空观认为,时间和空间不再相互独立,而是相互联系的一个整体。

现在,我们要来具体看看,它们是通过什么样的几何结构联系到一起的。


4) 时空间隔不变量

我们先忘记四维时空,来考虑一个位于平面上的线段,并且建立一个平面坐标系,然后将线段在两个坐标轴上的投影长度分别记为$ \small \Delta x $和$ \small \Delta y $,那么根据勾股定理,我们知道线段的长度为:

$\small \Delta l^2=\Delta x^2+\Delta y^2 \quad{\scriptsize (式24.8)}$

现在,我们将坐标系旋转某个角度,形成新的坐标系,那么线段在新的坐标轴上的投影会发生变化,但这些改变只是坐标系的变化引起的,线段本身的长度没变,如果我们将新的投影长度记为$ \small \Delta x',\Delta y' $,那么我们仍然有:

$\small \Delta l^2=\Delta {x'}^2+\Delta {y'}^2 \quad{\scriptsize (式24.9)}$

在这里,我们可以很直观地看到,不同坐标系中,$ \small x,y $投影的长度会发生一些此消彼长的变化,但是它们之间可以通过勾股定理联系在一起,并且这种联系对应了一个不随坐标系变化的东西:线段的长度。

我们将这种不随坐标系变化而改变的量称为不变量(Invariant)

实际上,在四维时空中,我们也可以将不同参考系类比为不同的坐标系,同时将同一段过程在不同参考系中的时间间隔和空间间隔的变化、类比为某个不变量在不同参考系中的“投影”变化。

这样的不变量叫做时空间隔不变量,我们将它记为$ \small \Delta s $,它和它的“投影”(也就是同一段过程在不同参考系中的时间和空间间隔)之间的几何关系长这样[4]:

$\small \Delta s^2=c^2\Delta t^2-\Delta x^2-\Delta y^2-\Delta z^2=c^2\Delta {t'}^2-\Delta {x'}^2-\Delta {y'}^2-\Delta {z'}^2 \quad{\scriptsize (式24.10)}$

也就是说,不同参考系中观察到的时间和空间间隔不同,都是因为这个不变的“长度”$ \small \Delta s $的“投影”在变化。

而我们也可以看到,这个不变量等式和勾股定理还是有一些形似的,两者之间唯一的、也是最本质的区别,就是四维时空的“勾股定理”中、空间项和时间项的正负号正好相反。

有时候我们也会采用另外一种定义:时间项前面是负号、空间项前面是负号,即:

$\small \Delta s^2=-c^2\Delta t^2+\Delta x^2+\Delta y^2+\Delta z^2=-c^2\Delta {t'}^2+\Delta {x'}^2+\Delta {y'}^2+\Delta {z'}^2 \quad{\scriptsize (式24.11)}$

但不管哪种定义,时间项和空间项总是反号的,这也是时间维度不同于空间维度的特殊之处。

现在,有了这个时空间隔不变量关系,我们可以不再借助光速不变原理,而是直接从时空几何的角度出发,用更清晰的几何图像来推导和理解一些物理事实,比如前面提到的钟慢效应。

我们假设,张三站在地面上,李四这次坐着飞行器从张三参考系的空间中的$A$点沿直线匀速飞到了$B$点。

这个过程中,李四在张三参考系中的移动距离为:

$\small \begin{align} \Delta l^2&=\Delta x^2+\Delta y^2+\Delta z^2\\ &=\left(x_B-x_A\right)^2+\left(y_B-y_A\right)^2+\left(z_B-z_A\right)^2 \end{align} \quad{\scriptsize (式24.12)}$

而对于李四自己而言,他并没有产生位移,因此他在自身参考系中的移动距离为零:

$\small \Delta {l'}^2=0 \quad{\scriptsize (式24.13)}$

假设这个过程在两个参考系中经历的时间分别为$ \small \Delta t $和$ \small \Delta t' $,那么我们可以利用不变量关系得出:

$\small c^2\Delta {t'}^2=c^2\Delta t^2-\Delta x^2-\Delta y^2-\Delta z^2=c^2\Delta t^2-\Delta l^2 \quad{\scriptsize (式24.14)}$

如果考虑到张三参考系中$ \small \Delta l=v\Delta t ( \small v $为李四相对于张三运动的速率),我们就可以轻松地得出钟慢效应公式。

但导出公式并不是我们现在的重点,我们重点是看看李四经历的时间在这个物理情形下的特殊之处。

我们不难知道,不管是站在地面上的张三、还是正在开车的王二麻子,只要他没有和李四同步运动,那么李四的运动必然在他们的参考系中产生一段距离$ \small \Delta l$

而根据式24.14我们可以看到,时间间隔和空间距离作为不变量的投影,是同时变大或变小的(这和二维平面上线段的两个投影之间此消彼长的关系正好相反),李四参考系中李四移动的距离为零,所以这段运动在其他参考系中持续的时间$ \small \Delta t $就必然大于李四自身经历的时间$ \small \Delta t'$

如果我们假设李四怀里始终抱着一个钟,那么其他任何参考系中的观察者都会看到,李四的时钟走过的时间比他们测到的时间都要短,这就造成了“运动的钟变慢”的结果。

换句话说,当我们考察一个物体的运动所经历的时间时,它自身所在参考系所测得的时间就是所有参考系中“投影”最短的那个。我们将这个最短时间称为固有时(Proper Time),记为$ \small \Delta \tau ( \small \tau $就是希腊字母tau)

它的特殊性将有助于我们接下来推导相对论能量关系。


5) 相对论能量关系

我们知道,在历史上,相对论能量关系是爱因斯坦改造改造牛顿力学时顺手得到的。他的动机也是解决旧的力学定律在新的相对论时空中不对称(不同参考系中不再具有相同形式)的问题,然后在改造过程中导出了新的能量关系。

但我们这里空白太小,没办法把整个相对论力学体系写下来,因此我们决定换一种方式,从前面给出的不变量以及它的“投影”变化的角度出发,用一种更具有几何味道的方法来构造出能量关系。

我们的思路是这样:

考虑一个做惯性运动的物体,那么它会在其他参考系中产生位移,而位移会联系到速度,速度又联系到动量,最后对动量求平方,就是能量了。

只不过,我们现在要构造的位移、速度、动量都是四维化的,它们都有一个共同特点,就是我们刚刚提到的不变量特质,准确地说就是,如果我们将它们都看作四维矢量,那么它们的模平方是不会随着参考系改变的,会改变的只是它们在不同参考系中的“投影”。

我们还是用李四相对于张三运动的例子,假设李四相对于张三运动的位移为:

$\small \Delta \boldsymbol l=(\Delta x,\Delta y,\Delta z) \quad{\scriptsize (式24.15)}$

这个位移只有空间项,现在我们给它加上时间项,构造一个四维位移:

$\small \Delta \boldsymbol s=(c\Delta t,\Delta x,\Delta y,\Delta z) \quad{\scriptsize (式24.16)}$

我们可以看到,这个四维位移的模平方,就是时空间隔不变量:

$\small \Delta s^2=c^2\Delta t^2-\Delta x^2-\Delta y^2-\Delta z^2 \quad{\scriptsize (式24.17)}$

(注意:在相对论语境下,模平方的空间部分是负号,而不再是勾股定理的正号)

现在,如果我们用四维位移除以这段运动所经历的时间,就能构造一个四维速度。

但这里问题来了:同样一段运动在不同参考系中经历的时间不同,我们该选取哪个参考系中的时间呢?

同学们,凭直觉选一个。

没错,我们就选所有参考系里最特殊的那个:固有时$ \small \Delta \tau $,也就是李四本身经历的时间。

(虽然我们暂时也看不出这么选的理由,但先用着吧,后面我们会看到这么选的合理性)

这样,用四维位移除以固有时,我们就构造出了李四的四维速度:

$\small \begin{align} \boldsymbol U=\frac{\Delta \boldsymbol s}{\Delta \tau}=\frac{1}{\Delta \tau}\left(c\Delta t,\Delta x,\Delta y,\Delta z\right) \end{align} \quad{\scriptsize (式24.18)}$

这个四维速度看起来是不是有点“不真实”?它的确不太真实,因为它看起来像是数学上定义出来的,而不是物理上测量出来的,但我们至少可以先出于好奇、找出它和“真实的速度”之间的关系。

考虑到$ \small \Delta t,\Delta x,\Delta y,\Delta z $都是其他任意参考系中测得的时间和位移,我们可以利用它们,算出任意参考系中测得的李四运动的“真实”速度:

$\small \begin{align} \boldsymbol v=\left(v_x,v_y,v_z\right)=\left(\frac{\Delta x}{\Delta t},\frac{\Delta y}{\Delta t},\frac{\Delta z}{\Delta t}\right)\ \end{align} \quad{\scriptsize (式24.19)}$

这个“真实测得的速度”和四维速度之间的关系就是:

$\small \begin{align} \boldsymbol U&=\frac{1}{\Delta \tau}\left(c\Delta t,\Delta x,\Delta y,\Delta z\right)\\ &=\frac{\Delta t}{\Delta \tau}\left(c,\frac{\Delta x}{\Delta t},\frac{\Delta y}{\Delta t},\frac{\Delta z}{\Delta t}\right)\\ &=\frac{\Delta t}{\Delta \tau}\left(c,v_x,v_y,v_z\right) \end{align} \quad{\scriptsize (式24.20)}$

而根据钟慢效应公式,我们又能进一步得到:

$\small \begin{align} \boldsymbol U&=\frac{1}{\sqrt{1-v^2/c^2}}\left(c,v_x,v_y,v_z\right)\ \end{align} \quad{\scriptsize (式24.21)}$

可以看到,四维速度在某个参考系中的空间分量和这个参考系中“观察到的相对速度”之间只差了一个系数$ \scriptsize \frac{1}{\sqrt{1-v^2/c^2}} $,后面我们将这个系数称为洛仑兹因子,并且简单记为$ \small \gamma $,于是:

$\small \begin{align} \boldsymbol U&=\gamma\left(c,v_x,v_y,v_z\right)\ \end{align} \quad{\scriptsize (式24.22)}$

这个关系我们先放着备用。

现在我们继续“不真实的”旅行,来构造四维动量。

速度和动量之间相差一个质量因子,于是我们很自然地就想到了物体的静质量$ \small m ($因为它与参考系无关),用它乘以四维速度,就构造出了四维动量:

$\small \begin{align} \boldsymbol P=m\boldsymbol U=m\frac{\Delta \boldsymbol s}{\Delta \tau}\end{align} \quad{\scriptsize (式24.23)}$

由于四维位移$ \small \Delta \boldsymbol s $的模平方是一个不变量,而四维动量中的$ \small m,\Delta \tau $都是与参考系无关的特定系数,于是我们可以想到,四维动量的模平方也是一个不变量,即:

$\small \begin{align} P^2=\frac{m^2}{\Delta \tau^2}\Delta s^2 \end{align} \quad{\scriptsize (式24.24)}$

但到此为止,我们也只是知道了四维动量有这么一个不变量的几何特质而已,这个四维动量对我们来说仍然像是一个生硬的数学定义,而缺乏具体的物理含义,或者说“不真实”。

所以接下来我们就要来回答两个重要问题:

这个不变量$ \small P^2 $等于什么?它的物理意义又是什么?

为了回答第一个问题,我们不妨先利用式24.22中的关系,将四维动量写成这样的形式:

$\small \begin{align} \boldsymbol P=m\boldsymbol U=\gamma m\left(c,v_x,v_y,v_z\right) \end{align} \quad{\scriptsize (式24.25)}$

然后对它取模平方:

$\small \begin{align} P^2=\frac{m^2}{1-v^2/c^2}\left(c^2-v^2\right)=m^2c^2 \end{align} \quad{\scriptsize (式24.26)}$

这样,我们就得到了四维动量不变量的具体值。

接下来,我们来看看它的物理意义。

不知道同学们在式24.25中有没有注意到一个似曾相识的东西:

$\small m'=\gamma m=\frac{m}{\sqrt{1-v^2/c^2}} \quad{\scriptsize (式24.27)}$

没错,这就是我们熟悉的所谓的动质量!

如果将它乘入四维动量的各个分量中,我们会得到:

$\small \begin{align} \boldsymbol P=\left(\gamma mc,\gamma mv_x,\gamma mv_y,\gamma mv_z\right) \end{align} \quad{\scriptsize (式24.28)}$

它的空间分量$ \small \left(\gamma mv_x,\gamma mv_y,\gamma mv_z\right) $,就是我们在某个参考系下“真实测得的”动量$ \small \boldsymbol p $,它相对于牛顿力学中的动量正好多了一个洛仑兹因子$ \small \gamma $,这也是我们所熟悉的物理事实。

如果说前面对于四维位移和四维速度的构造还只是某种意义上的数学游戏的话,那现在的四维动量就终于具有明确的物理意义了,而这也说明了我们前面看似没头没脑的构造其实是合理的。

需要注意的是,四维动量里的 $\small \gamma$ 其实是在推导四维速度的时候出现的,因此它应该被看成对四维速度的修正而不是对质量的修正。但由于我们实际测量到的速度还是 $\small \left(v_x,v_y,v_z\right)$ ,因此 $\small \gamma$ 看起来就像是质量在变化,这才有了“动质量”的概念。

所以严格来说“动质量”的提法并不是太合适,不过这些只是概念上的问题,并不影响物理本质。

接下来,我们将$ \small P^2 $也分解成时间部分和空间部分:

$\small m^2c^2=P^2={m'}^2c^2-p^2 \quad{\scriptsize (式24.29)}$

然后再在两边乘上光速平方,得到:

$\small m^2c^4={m'}^2c^4-p^2c^2 \quad{\scriptsize (式24.30)}$

是不是有点我们熟悉的味道了?

根据质能关系,我们知道,这个式子的左边就是物体的静能量,右边第一项是物体的总能量,第二项某种意义上可以看作动能项(差了一个质量因子)

而它的物理意义、或者说“几何”意义也就出来了:

  • 静能量$\small m^2c^4 $可以看作四维动量模平方不变量
  • 总能量$\small {m'}^2c^4 $可以看作静能量在时间维度上的“投影”
  • 动能项$\small p^2c^2 $可以看作静能量在空间维度上的“投影”

而如果将空间“投影”部分移到等式另一边,我们就得到:

$\small \begin{align} m'^2c^4&=p^2c^2+m^2c^4\end{align} \quad{\scriptsize (式24.31)}$

再令$ \small m'^2c^4=E^2 $,我们就得到了那个熟悉的能量关系:

$\small E^2=p^2c^2+m^2c^4 \quad{\scriptsize (式23.10)}$

到此为止,这个式子在我们眼里终于不再是一堆来历不明的物理关系,而变成了一组虽然抽象但图像清晰的“几何投影”关系。


6) 总结与预告

这节课里,我们从几何的视角,一步步导出了相对论能量关系,并且看到了它对应的几何图景。

我们先从熟悉的光速不变原理出发,回顾了钟慢效应的导出过程,并且在其中发现,一段运动过程在不同参考系中经历的时间和走过的距离相互关联。

接下来,我们用平面上的勾股定理做类比,导出了时间和距离之间的定量联系,它们对应着一个时空间隔不变量关系:

$\small \Delta s^2=c^2\Delta t^2-\Delta x^2-\Delta y^2-\Delta z^2=c^2\Delta {t'}^2-\Delta {x'}^2-\Delta {y'}^2-\Delta {z'}^2 \quad{\scriptsize (式24.10)}$

这个关系告诉我们,一段运动过程在各个空间中所经历的时间和空间间隔的不同,其实可以看成一个时空间隔不变量的“投影”的变化,就像一个线段在平面上不同坐标系中的投影变化一样。

有了这样的几何图景,我们继续往下延伸,将时空距离不变量看成一个运动物体的四维时空位移的模平方,然后引申出四维位移,并且通过它构造了四维速度和四维动量:

$\small \boldsymbol U=\frac{\Delta \boldsymbol s}{\Delta \tau}=\frac{1}{\Delta \tau}\left(c\Delta t,\Delta x,\Delta y,\Delta z\right) \quad{\scriptsize (式24.32)}$

$\small \boldsymbol P=\frac{m}{\Delta \tau}\Delta \boldsymbol s=\frac{m}{\Delta \tau}\left(c\Delta t,\Delta x,\Delta y,\Delta z\right) \quad{\scriptsize (式24.33)}$

然后我们看到,四维动量的模平方也是一个不变量,我们经过一段简单的推导,发现这个不变量为:

$\small P^2=m^2c^2 \quad{\scriptsize (式24.27)}$

而在推导过程中,我们还发现,这个不变量可以拆解为时间维度上的“投影”和空间维度上的“投影”:

$\small m^2c^2={m'}^2c^2-p^2 \quad{\scriptsize (式24.29)}$

如果在两边同时乘以光速平方$ \small c^2 $:

$\small m^2c^4={m'}^2c^4-p^2c^2=E^2-p^2c^2 \quad{\scriptsize (式24.34)}$

再结合质能关系,我们就发现,这个不变量对应的是运动物体的静能量,而它在不同参考系中的“时间投影”,对应的是物体在该参考系中的总能量,“空间投影”对应的是该参考系中的动能项。

而如果将$ \small p^2c^2 $移到等式的另一边,我们就得到了相对论能量关系:

$\small E^2=m^2c^4+p^2c^2 \quad{\scriptsize (式23.10)}$

而现在我们可以透过不明所以的物理关系的表象,看到其中各种能量之间的“几何投影关系”的本质。

顺便说一句,刚才提到的这些不变量性质,其实也可以看成是相对论时空中对称性的一个体现,毕竟它是某些物理量在参考系变换下保持不变,这完全符合我们对于对称性的理解。

而这个不变量的对称性,和我们前面提到但未介绍的各个物理定律的对称性,其实都是所谓“相对论协变对称性”的一种(在相对论中,它们都可以写成某种形式简洁的张量方程)。这种“协变对称性”是相对论中的基本审美情趣,并且也将影响到我们对能量本征方程的处理。

带着这种审美,我们就要来尝试着构造符合相对论协变对称性的能量本征方程了。

参考

  1. 《费曼讲物理:相对论》
  2. 有兴趣了解的同学可以翻阅《狭义相对论(第二版)》,刘辽 著,P. 6 ~ P. 12
  3. 比如《狭义相对论(第二版)》,刘辽 著,P. 12

从线性代数到量子力学(23):能级分裂与精细结构

PeiLingX
物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》第23课。

本系列及本专栏其他文章,建议收藏目录:

专栏文章总目录


0) 开篇语

从第17课到21课,我们筚路蓝缕,终于完成了氢原子薛定谔方程的求解过程,成功还原了玻尔的氢原子能级,又解释了玻尔模型所不能解释的更多现象,并且用量子力学的思维方式(而不是玻尔旧量子论的方式)理解了其中各个能级以及相应本征态的物理图像和对称性。

看起来,我们到此为止似乎就掌握了氢原子核外电子的全部能量信息。

然而令人遗憾的是,这个模型和真实的物理情形其实还有一些看起来很细微的差异。

也许有同学马上会猜测:这是不是因为真实的物理世界中有外场存在,这些外场造成了能量的扰动,导致了理想模型和真实物理世界之间的偏差。

的确,外场的存在会在理想库仑势的基础上加上一些能量扰动,使哈密顿算符发生变化,从而导致能级发生移动、或者简并能级发生分裂(这在可观测的物理现象上体现为:某条光谱线在原位置附近分裂为若干条新的谱线)。

但是,如果理想模型与现实之间的差异仅仅来自于外场,那么对我们而言,要做的事情无非也就是在理想氢原子模型的哈密顿算符里加上一些额外的势能项,然后通过稍微复杂一些的计算,来得到更精确、更符合实验结果的答案。

虽然这个过程会让我们习得量子力学中一些非常重要的近似计算方法,但整个物理模型和结果都会在意料之中,并不会让人感到耳目一新。

好在实际情况其实比我们想象的更有意思。

稍后我们会看到,即使排除了外场的影响,在理想的孤立体系中,实际能级还是会和薛定谔方程的计算结果有所差异,甚至也会出现反常的分裂,这种无法利用简单的氢原子模型以及外场解释的异常,才是更值得我们兴奋的地方。

这节课里,我们将先看看外场下的能谱会发生怎样的变化,然后和实际的能谱作比较,去看看来自氢原子(以及类氢原子)体系自身的、无法用外场的影响解释的细微偏差。

而在对这些细微偏差进行一些半定量的分析时,我们将发现,一段新的奇妙旅程正在前方等着我们。


1) 能级分裂

原子光谱在外场下发生分裂的现象其实早在1896年就发现了(这甚至比卢瑟福提出原子结构模型还早),是由荷兰物理学家塞曼(P. Zeeman)发现的,因此也叫做塞曼效应(Zeeman Effect)

这个效应说的是原子光谱在磁场中发生分裂的现象,最早的实验是用钠做的,塞曼发现,钠元素的某条谱线在磁场中会变宽,后来经过更精确的实验,发现是谱线分裂成了若干条。

对于这个效应最早的解释是塞曼的老师、一位同样来自荷兰、虽然算不上顶流、但又时不时地会在物理书上露个脸的著名物理学家洛仑兹(H. Lorentz )(后面我们还会去欣赏他的另外一个重要成果),他从经典电磁学的角度出发,引入了空间量子化的假设,给出了最早的解释(这甚至比普朗克的能量子假说还早)。

最终师徒二人也因此双双喜提1902年的炸药奖。

现在,我们要从薛定谔方程的解出发,来看看如何导出塞曼效应中能级分裂的结果。

我们知道,经典图像中,电子的绕核旋转会产生环形电流,从而产生一个垂直于旋转平面的磁矩。虽然量子力学中不再有轨道的概念,但是电子的平均角动量仍然会产生相同的效果。

现在,假设我们将氢原子放在一个匀强磁场中,并且取磁场所在的方向为$ \small z $方向。

那么,此时氢原子在$ \small z $方向的磁矩$ \small \mu_z $会和磁场相互作用,产生一项额外的能量:

$\small E_{B}\simeq\small \mu_zB=\frac{e}{2m_ec}L_{z}B \quad{\scriptsize(式23.1)}$

其中,$ \small B $为磁感应强度大小,$ \small L_{z} $为角动量$ \small z $分量,另外几个量同学们都熟悉,就不一一介绍了。

(其实这个能量中还有一项与$ \small x,y $坐标有关,但是由于数量级过小,所以我们这里直接忽略[1])

现在,我们将磁场产生的能量加到氢原子核外电子的总能量中:

$\small \begin{align} H&=\small \frac{p^2}{2m_e}+V+\frac{eB}{2m_ec}L_{z}\ &:=H_0+\frac{eB}{2m_ec}L_{z} \end{align} \quad{\scriptsize(式23.2)}$

然后轻车熟路地将它们算符化,形成新的薛定谔方程:

$\small \begin{align} \hat H\left|\psi\right>&=\left(\hat H_0+\frac{eB}{2m_ec}\hat L_z\right)\left|\psi\right>\end{align} \quad{\scriptsize(式23.3)}$

我们知道,当没有磁场存在的时候,氢原子方程的本征函数解序列$ \small \psi_{nlm} $可以由三个量子数$ \small n,l,m $来描述,它们分别对应能量、轨道角动量、轨道角动量$ \small z $分量这三个物理量的本征值。

而我们在第19课和第20课中知道,之所以选这三个物理量,是因为它们都是相互对易的,因此可以独立求解、最后构成一组完整的本征态基底。

这个对易性质为我们求解新的方程提供了非常大的便利。因为我们看到,抛开系数不谈,新的方程其实只多出了一个$ \small \hat L_{z} $算符,而它是和哈密顿算符、角动量算符对易的,因此原来的(无外场情形的)方程的本征函数解$ \small \psi_{nlm} $也是这个新方程的本征函数(当然,前提是球坐标的$ \small z $方向和磁场方向一致)。

这样事情就变得简单了,我们直接把本征函数代入式23.3,就可以利用本征值关系得到:

$\small \begin{align} \hat H\left|\psi_{nlm}\right>&=\left(\hat H_0+\frac{eB}{2m_ec}\hat L_z\right)\left|\psi_{nlm}\right>\\ &=\left(E_n+\frac{eB}{2m_ec}m\hbar\right)\left|\psi_{nlm}\right> \end{align} \quad{\scriptsize(式23.4)}$

相应地,新的能量本征值就近似为:

$\small E_{nlm}=E_n+\frac{eB}{2m_ec}m\hbar \quad{\scriptsize(式23.5)}$

这里顺便说一句,对于以碱金属为典型代表的所谓类氢原子而言,我们也能得到类似的结果,它们和氢原子唯一的区别在于,由于内层电子的屏蔽作用,最终“传递”给最外层电子的势场(称作“屏蔽库仑势”)会更加复杂。

这样带来的结果是不同角量子数的能级简并被消除(我们在第21课曾经提到过,角量子数的简并只在纯库仑势中出现),也就是说最终的能级和角量子数$ \small l $也有关,记作$ \small E_{nl} $,于是,它们在磁场中发生的能级分裂也相应地记为:

$\small E_{nlm}\simeq E_{nl}+\frac{ZeB}{2m_ec}m\hbar \quad{\scriptsize(式23.6)}$

我们看到,当加上磁场后,这个能级不再单纯是$ \small n,l $的函数,还与磁量子数$ \small m $有关(现在我们可以仔细品味一下为什么$ \small m $叫做“磁量子数”了),这意味着原来的简并能级$ \small E_{nl} $中关于磁量子数的简并被解除,分裂成了$ \small 2l+1 $个不同的能级(别忘了 $\small m $的取值范围)。

比如塞曼效应最经典的分裂,就是钠原子光谱的所谓D线(这里的D仅仅是光谱线的命名顺序,没有其他特别含义)的分裂,这个$D$线对应的是从$ \small \left|\psi_{nlm}\right>=\left|\psi_{31m}\right>$ (称为3p态)到$ \small \left|\psi_{nlm}\right>=\left|\psi_{300}\right> $(称为3s态)之间的跃迁放出的光子。

当没有外磁场时,我们知道,由于能级的简并,跃迁放出的光子频率为$ \scriptsize \nu=\frac{E_{31}-E_{30}}{h} $,与磁量子数$ \small m $无关。但当外场存在时,原来简并的3p能级$ \small E_{31} $就分裂为三个:

$\small \begin{cases} E_{3,1,-1}&=E_{31}-\frac{eB\hbar}{2m_ec}\\ E_{3,1,0}&=E_{31}\\ E_{3,1,1}&=E_{31}+\frac{eB\hbar}{2m_ec}\ \end{cases} \quad{\scriptsize(式23.7)}$

另一方面,由于3s态对应的角量子数$ \small l=0 $,不存在磁量子数的简并,因此能级仍然是一个,这样一来,从3p到3s之间的跃迁放出的光子频率也就分成了三个,于是我们就能看到,处在磁场中的钠原子原来的D谱线在原来的位置附近分裂成了三条新的谱线,这也与实验相符合[2]。

而除了磁场以外,我们自然还会合理猜想:外加电场时原子光谱也会发生分裂。这样的分裂也在实验上被观测到,叫做斯塔克效应(Stark Effect),由德国物理学家斯塔克(J. Stark)于1913年发现。

关于斯塔克效应的计算过程,我们这里不再详细介绍,同学们有兴趣可以自行了解一下,大部分量子力学教材都会讲[3],不过看懂这个过程的前提是要先了解一种叫做微扰论的近似计算的思想、以及相应的计算流程(我们会在整个系列末尾的补遗部分再来介绍)。

读到这里,也许有同学会想起我们在上节课留下了一个小伏笔:当物理上真实地规定了某个特殊方向的时候$($比如我们刚才讨论的加上某个方向的外场$ )$,氢原子的球对称性就会消失。这节课我们会来体会这一点,但这些讨论将会作为附录放到本课最后,现在为了不打乱节奏,我们还是回来关注塞曼效应。

我们前面对能级分裂进行了看似天衣无缝的计算,但遗憾的是,这个计算结果并不能完全解释磁场中所有的能级分裂现象,特别是当磁场比较弱时,人们发现原子光谱的分裂数量和距离都和利用薛定谔方程算出的结果对不上,这种现象被称为反常塞曼效应

此外,人们后来还发现,只要测量足够精确,即使没有外场存在,在氢原子和碱金属的光谱中,有的谱线(比如我们刚才提到的D线)也会在频率的理论值附近“天然地”分裂成两条。

当时的物理学家们马上意识到,事出反常必有妖。

名义上最早捉住这个“妖”的,又是两个荷兰物理学家,分别叫做乌伦贝克(G. Uhlenbeck)古德斯密特(S. Goudsmit),他们提出,这些现象背后包含着电子的一种全新的属性。

这个属性,就是在我们这个系列的第4课曾经露过一面、后来又久无音信的老朋友:自旋

顺便说一句,其实早在乌伦贝克他们之前,一位名叫克罗尼西(R. Kronig,有的书上译作克罗尼克,这里按照德语发音习惯翻译 )的德国物理学家也曾经提出过自旋的概念,但他的观点很快招来了两位大佬:泡利和海森堡的反对,因为当时对电子自旋的理解是经典意义上的自转,而计算表明,这个“自转”将会使电子表面速度达到137倍光速,这违反了相对论。于是克罗尼西同学只好心灰意冷地收回了他的论文,却在几个月后眼睁睁看着乌伦贝克他们成为自旋的名义发现者。所以,有时候被大佬过分关照真的未必是件好事……

接下来,我们就来简单、定性地解释一下,如何利用自旋解释能级的“天然”分裂。


2) 旋-轨耦合

在第4课中我们看到,自旋从效果上可以类比为一个物体的“自转”,它产生的角动量和磁矩,与一个旋转的带电小球产生的效果在某些方面完全一样(以后我们会讨论不一样的地方)。

而另一方面,电子绕核运动的轨道角动量会产生环形电流的效果,从而产生磁场,这个磁场与自旋磁矩的相互作用,会形成新的耦合能,叫做旋$-$轨耦合(Spin-Orbit Coupling)

它的抽象的算符形式是这样的[4]:

$\small \begin{align} \hat H_{LS}&=\frac{1}{2m_e^2c^2r}\frac{\text dV}{\text dr}\hat {\boldsymbol S}\cdot \hat {\boldsymbol L}\ \end{align} \quad{\scriptsize(式23.8)}$

(这一项又称为托马斯项(Thomas Term))

其中$ \small c $为真空中的光速,$\small \hat{\boldsymbol S} $为自旋角动量算符、$ \small \hat{\boldsymbol L} $为轨道角动量算符,而它们的内积$ \small \hat {\boldsymbol S}\cdot \hat {\boldsymbol L}$ (别忘了角动量是矢量)就非常直观地体现了旋( $\small \hat{\boldsymbol S} $)-轨( $\small \hat{\boldsymbol L} $)耦合

(当然,严格来说,$ \small V $$ \small r $都应该表示成算符形式)

而接下来我们会看到,能级的分裂,就来自于这项多出来的能量。

我们在第4、5课介绍自旋时,为了便于和实验结果联系起来,一直强调的是自旋产生的磁矩特性,但实际上,如果将自旋类比为自转,我们不难想象,自旋还具有角动量的特性。

只不过,与轨道角动量不同的是,它在某个给定方向上(比如 $\small z$ 方向)的自旋角动量本征值只有两个:$ \scriptsize \pm\frac{\hbar}{2}$ (这分别对应了向上的 $\small \left|z_+\right> $和向下的 $\small \left|z_-\right>$ 两个本征态)

而这一正一负两个本征值,正好会使旋$-$轨耦合对原来的能级产生一正一负两种扰动。

这两种扰动,就造成了原来简并的能级往高低两个方向分别产生移动,形成两个新的能级,而这两个新能级跃迁到其他能级上(特别是角量子数为0的能级上),就会形成两条(或者其他偶数条)不同频率的分裂光谱线。

这样,我们就定性地解释了,为什么没有任何外场干扰的情况下,氢原子和碱金属原子也会观察到奇怪的双线(历史上是碱金属原子、而不是氢原子最先被观察到这个现象,同学们可以思考一下为什么[5])。

这里我们要注意:刚才在式23.8中,我们只是给出了旋$-$轨耦合能量的算符形式,还并没有具体算出它在各个简并能级上造成的能级分裂的具体幅度。这个计算我们将放到以后,等到介绍微扰论时再作为算例具体给出。

(如果我们熟悉了微扰论、并且找到了正确的能量本征态,这个计算其实并不难,到时候作者会帮同学们把计算思路梳理得明明白白,但现在还不是时候,一是因为准备不足,二是因为放在这里会占用太多篇幅,打乱我们轻快的步伐)

我们现在至少定性地明白了氢原子(以及类氢原子)光谱中反常的双线的来源,那么接下来的问题就是:这个两次出现在我们的旅程中的自旋,是个什么来头?

要知道这个答案,我们还需要再耐心地再等待几节课的时间,但在这节课里,我们至少可以先挖出一条重要线索,这条线索将带我们走进一处新的风景,并且最终找到一个更自然的引出自旋的方式。


3) 精细结构

实际上,当我们将能量的测量和计算的近似度提升到旋$-$轨耦合这个级别时,我们会发现,氢原子能谱其实还存在着其他两项相同数量级的偏差,它们虽然不会造成能级分裂,但会使能级发生偏移。

这两项偏差和旋$-$轨耦合的偏差合到一起,被统称为氢原子(以及类氢原子)的精细结构

我们先来解释一下这两项偏差的来源。

先说第一项。

我们知道,薛定谔方程的哈密顿算符中,动能项源于牛顿力学模型(请回顾第8课中薛定谔方程的构造过程):

$\small \hat T=\frac{\hat p^2}{2m_e} \quad{\scriptsize(式23.9)}$

而更精确的能量关系,本应该由相对论力学给出(我们下节课会具体说说这个式子的来源和更深层次的几何意义):

$\small E^2=p^2c^2+m_e^2c^4 \quad{\scriptsize(式23.10)}$

(其中 $\small m_e$ 是电子的静质量)

相应地,动能应该是总能量减去静能量,即:

$\small T=\sqrt{p^2c^2+m_e^2c^4}-m_ec^2 \quad{\scriptsize(式23.11)}$

由于算符开根号实际上难于计算,因此我们可以将动能作为动量平方$ \small p^2 $的函数,然后在$ \small p^2=0 $附近泰勒展开:

$\small \begin{align} T(p^2)&=\left(m_ec^2+\frac{p^2}{2m_e}-\frac{p^4}{8m_e^3c^2}+\cdots\right)-m_ec^2\\ &=\frac{p^2}{2m_e}-\frac{p^4}{8m_e^3c^2}+\cdots \end{align} \quad{\scriptsize(式23.12)}$

忽略高阶项,新的动能与牛顿力学体系的动能就相差了一个$ \scriptsize -\frac{3p^4}{8m^3c^2} $,我们将它记为:

$\small H_{\text{Rel}}=-\frac{3p^4}{8m_e^3c^2} \quad{\scriptsize(式23.13)}$

这就是第一项偏差(当然,这只是算符层面的偏差,它在各能级上造成的能量本征值偏差还需具体计算,我们仍然放到将来介绍微扰论时再讨论)。

而第二项偏差,根据提出者的姓氏,被称为达尔文项(Darwin Term)

(这个达尔文是写《物种起源》那个达尔文的孙子,祖传学术基因了属于是)

它的来源,可以简单看作真空中的能量涨落对电子的随机扰动,这种扰动使电子位置产生的不确定性[6],这个不确定性的量级与电子的康普顿波长相当,这一项的具体形式和计算我们放到未来再说,现在我们暂时只需要知道它的存在就行了。

现在我们还是回头关注旋$-$轨耦合项,我们接下来要对它的量级做一个大致的评估,特别是要将它的量级和$ \small \hat H_{\text{Rel}} $的量级做一个对比,这将给我们带来一些新的线索。


4) 新的线索

相对比较严谨的量级估计,应该是先求出扰动项在各个能级本征态上的期望值表达式,然后进行估算。但现在,我们为了快速得到估算结果,不妨先参考张永德老师的书里的做法[7],直接利用算符对应的经典力学量之间的物理关系,用半经典的方法来估算(我们这里会将估算思路写得更详细一些)。

(这里顺便多说一句,虽然我们已经有了更严谨的求解本征值问题的方法,但有时候适当利用经典物理图像去进行一些半定量的估计,还是非常有用的$($毕竟算符的期望值与经典力学量的测量值是一一对应的$ )$,至少它能帮助我们跳过求解本征值问题的繁琐计算,直接对结果进行一些合理猜测)

我们的主要做法是:

先利用经典力学的关系,将能量偏差中各个力学量表示成更基础的力学量(比如位置和动量);

然后将它们化简成氢原子的库仑势(这代表了未经修正的氢原子能量)乘以一个系数的形式,这个系数就代表了能量偏差的量级。

具体到旋轨耦合项中,我们需要重点关注的自然就是两个角动量:$ \small \boldsymbol S $和$ \small \boldsymbol L$

根据我们在第$18$课中的讨论(或者经典力学的常识),轨道角动量$ \small \boldsymbol L $可以表示为:

$\small\boldsymbol L={\boldsymbol x}\times {\boldsymbol p} \quad{\scriptsize(式23.14)}$

如果我们回到经典图像,假想电子绕核做圆周运动,那么轨道角动量的大小相当于圆周运动的半径和动量的乘积:

$\small L=rp \quad{\scriptsize(式23.15)}$

我们接下来看看自旋。

虽然自旋是一个纯粹的量子现象,没有经典的物理图像,也不可能和位置、动量这些经典力学量产生什么物理关系,但估算一下它与$ \small r,p $的量级关系仍然是可能的。

这需要我们暂时回到量子世界中,先比较一下自旋角动量和轨道角动量的本征值的量级。

首先,我们知道,自旋角动量的本征值为$ \scriptsize \pm\frac{\hbar}{2} $,现在我们将它与角量子数的本征值量级而某个坐标方向上的轨道角动量本征值为$ \small m\hbar $,由于磁量子数$ \small m $存在上下限$( \small \pm l )$,因此它是一个有限的整数。于是,两个本征值$ \scriptsize \pm\frac{\hbar}{2} $和$ \small m\hbar $仅仅相差一些有限的倍数,在量级上可以认为是一致的。

另一方面,根据本征值和经典力学测量值之间的关系,我们可以大胆地相信:本征值在量级上的一致性,也可以对应到经典力学量本身在量级上的一致性。

于是,和轨道角动量类似,我们也可以估算出自旋角动量在量级上也满足类似关系:

$\small S\sim rp \quad{\scriptsize(式23.16)}$

(注意,这里的波浪线符号 $\small \sim$ 仅仅表示两者在量级上相当,并不代表两者相等,更不代表它们之间有任何真实的物理关系)

接下来,我们将两个角动量与位置和动量的量级关系代入旋-轨耦合项(式23.8)中,可以得到:

$\small H_{LS}\sim \frac{1}{2m_e^2c^2r}\frac{\text dV}{\text dr}r^2p^2 \quad{\scriptsize(式23.17)}$

而在氢原子的库仑势中,$ \scriptsize \frac{\text dV}{\text dr}=\frac{e^2}{r^2}$ (这里我们忽略了 $\scriptsize \frac{1}{4\pi\epsilon_0}$ 因子以图清净,后面也做相同处理),于是上式可以进一步化为:

$\small \begin{align} H_{LS}&\sim \frac{1}{2m_e^2c^2r}\frac{e^2}{r^2}r^2p^2\\ &\sim \frac{1}{2}\frac{e^2}{r}\frac{p^2}{m_e^2c^2}\\ &\sim V_{\text{C}}\frac{p^2}{m_e^2c^2} \end{align} \quad{\scriptsize(式23.18)}$

其中$ \small V_{\text C} $代表库仑势。

而如果我们还没有在量子世界中修炼得走火入魔,那么我们一定还记得动量的远古定义:$ \small p=mv$ (而不是我们现在更熟悉的 $\small \hat p=-\text i\hbar\boldsymbol\nabla$ ),将它代入式23.18,我们将会得到:

$\small \begin{align} E_{LS}&\sim V_{\text{C}}\frac{v^2}{c^2} \end{align} \quad{\scriptsize(式23.19)}$

接下来,我们将上面的量级与前面提到的动能偏差项$ \small H_{\text{Rel}} $做个对比。

我们先将$ \small H_{\text{Rel}} $的式23.13也做一些(中学生也会的)变形:

$\small \begin{align} H_{\text{Rel}}&=\frac{3p^4}{8m_e^3c^2}\\ &=\frac{3p^2}{8m_e}\frac{p^2}{m_e^2c^2}\\ &=\left(\frac{3}{8}m_ev^2\right)\frac{v^2}{c^2} \end{align} \quad{\scriptsize(式23.20)}$

而利用经典力学里库仑场中的圆周运动向心力关系:

$\small \begin{align} \frac{m_ev^2}{r}=\frac{e^2}{r^2} \end{align} \quad{\scriptsize(式23.21)}$

可得:

$\small \begin{align} m_ev^2=\frac{e^2}{r}= V_{\text{C}} \end{align} \quad{\scriptsize(式23.22)}$

于是:

$\small \begin{align} H_{\text{Rel}}&\sim V_{\text C}\frac{v^2}{c^2} \end{align} \quad{\scriptsize(式23.23)}$

这样,我们发现,旋$-$轨耦合产生的能量偏差$ \small H_{LS} $和动能的相对论偏差$ \small H_{\text{Rel}} $在数量级上是一样的(虽然我们目前仅仅是从经典图景中得到这个结论),都是在初始的库仑势(以及相同量级的动能)的基础上加上了$ \scriptsize \frac{v^2}{c^2} $这个相对大小的修正。

而且,如果同学们对相对论基础还有印象,一定会记得,$ \scriptsize \frac{v^2}{c^2} $这个因子在相对论中随处可见(比如钟慢、尺缩、以及前面给出的能量关系,我们下节课会再次提到)。

这不得不让人浮想联翩:难道自旋和相对论之间也有着扯不清道不明的关系

的确是这样,而且,除了旋轨耦合$ \small H_{LS} $以及本身就来自于相对论偏差的$ \small H_{\text{Rel}} $,那个由真空中的量子涨落产生的达尔文项也和相对论有关(我们这里仍然不详细讨论,有兴趣的同学还是推荐看张永德老师的书[8])。

所以,走到这里,我们其实已经不知不觉地来到了一个会合点:狭义相对论和量子力学的会合点。

接下来的路,将是一段新的奇妙旅程,我们将看看,当量子力学遇上狭义相对论时,会孕育出什么奇花异草(会开出一朵名叫“自旋”的奇花吗?)

下节课,我们就先来简单聊聊,相对论的中心思想都讲了些啥。

不过,结束本课之前,我们还要续上前面留下的一个小尾巴:简单说一说,外场如何破坏氢原子模型的球对称性。


附:对称性的消失

我们在上节课提到过,理想的氢原子方程解是具有球对称性的,虽然作为本征函数的球谐函数自身并不具有几何上的球对称性,但这仅仅是因为数学上规定了$ \small z $轴的取向,在在物理上,任何一个方向都可以成为$ \small z $轴,因此本征函数的方向其实是任意的。

但是,当我们真正通过物理方式(比如施加特定方向的磁场)给出了一个特殊的$ \small z $方向的时候,这种简并就被解除了,而球对称性也会随之消失(毕竟外场本身是不具有球对称性的)。

现在我们先来证明这一点。

在第20、21课中我们知道,数学上指定了$ \small z $轴、建立了球坐标之后,我们就能在这个球坐标的表象下求解薛定谔方程,得到一组本征态解$ \small \left|\psi_{nlm}\right>$

而在第22课关于球对称性的讨论中我们知道,如果对这些本征态进行空间旋转,那么旋转后得到的新的态仍然是同一简并能级$ \small E_{nl} $的本征态(这里写出角量子数 $\small l$ 是因为这些本征态的角量子数也相同)。

而由于旋转变换是线性的,因此我们不妨将旋转后的某个新的态矢量$ \small \left|\psi'\right> $表示为旋转前的本征态组$ \small \left|\psi_{nlm}\right> $的线性组合:

$\small \left|\psi'\right>=\sum_{k}c_k\left|\psi_{nlm_k}\right> \quad{\scriptsize(式23.24)}$

$( \small m_k$ 代表不同的磁量子数)

为了方便计算,我们不妨假设旋转后的态矢量为:

$\small \left|\psi'\right>=c_1\left|\psi_{nlm_1}\right>+c_2\left|\psi_{nlm_2}\right> \quad{\scriptsize(式23.25)}$

(虽然实际上简并态的个数是 $\small 2l+1$ ,但我们不妨只选取其中两个)

那么,哈密顿算符作用在上面,形式上就是:

$\small \hat H\left|\psi'\right>=c_1\hat H\left|\psi_{nlm_1}\right>+c_2\hat H\left|\psi_{nlm_2}\right> \quad{\scriptsize(式23.26)}$

当没有外场存在时,$ \small \left|\psi_{nlm_1}\right>,\left|\psi_{nlm_2}\right> $都是同一能级的能量本征态,于是:

$\small \begin{align} \hat H\left|\psi'\right>&=c_1\hat H\left|\psi_{nlm_1}\right>+c_2\hat H\left|\psi_{nlm_2}\right>\\ &=c_1E_{nl}\left|\psi_{nlm_1}\right>+c_2E_{nl}\left|\psi_{nlm_2}\right>\\ &=E_{nl}\left(c_1\left|\psi_{nlm_1}\right>+c_2\left|\psi_{nlm_2}\right>\right)\\ &=E_{nl}\left|\psi'\right> \end{align} \quad{\scriptsize(式23.27)}$

因此$ \small \left|\psi'\right> $仍然是$ \small \hat H $的本征态,本征态的取向具有任意的方向性、或者说球对称性。

但当我们加上了外场(比如说磁场)时,通过前面对塞曼效应计算给出结果(式23.7)可知,不同的磁量子数将对应不同的能级,此时:

$\small \begin{align} \hat H\left|\psi'\right>&=c_1\hat H'\left|\psi_{nlm_1}\right>+c_2\hat H'\left|\psi_{nlm_2}\right>\\ &=c_1E_{nlm_1}\left|\psi_{nlm_1}\right>+c_2E_{nlm_2}\left|\psi_{nlm_2}\right> \end{align} \quad{\scriptsize(式23.28)}$

除非$ \small c_1=0 $或$ \small c_2=0$ ,否则等式右边不再能合并成$ \small E_{nl}\left|\psi\right> $的形式,这说明能量本征态的取向具有了特殊的方向性,也就是球对称性从物理上被破坏了。

参考

  1. 关于被忽略的这一项,可参考:《量子力学(第二版)》,苏汝铿 著,P. 258
  2. 其实这里讨论的是能级分裂比较简单的一种情况,它的妙处在于$ \small 3lm$能级分裂的个数与观察到的谱线分裂条数正好一致,都是3条;而对于角量子数$ \small l$更大的一些其他能级分裂而言,最终观察到的谱线分裂条数与$\small 2l+1$并不一一对应,对这个现象有兴趣的同学可以翻阅《量子物理学(上册)》捷列文斯基 著,丁亦兵等 译,P.573~p.574
  3. 个人觉得讲得最清楚的是顾樵《量子力学 Ⅱ》P. 418~P. 421
  4. 推导过程可参考张永德《量子力学(第四版)》P. 193~P. 194
  5. 或者参考曾谨言《量子力学 卷Ⅰ(第四版)》P. 299
  6. 如果想对此有一个比较直观的物理图像,可参考《量子物理学(上册)》捷列文斯基 著,丁亦兵等译,P. 546~P. 547
  7. 张永德《量子力学(第四版)》, P .193 ~ P. 194, P. 204 ~ P. 205
  8. 张永德《量子力学(第四版)》, P. 204 ~ P. 205

编辑于 2022-10-25 12:17