从线性代数到量子力学(16):氢原子往事

PeiLingX
物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》的第16课。

本系列及本专栏其他文章,建议收藏目录:

专栏文章总目录


0) 开篇语

从本课开始,我们将进入这个系列的进阶篇。

在前15课里,我们其实只是交代了量子力学的一些最基本的理解方式,这些理解方式其实更偏重数学结构(毕竟我们是在线性代数的陪伴下进入量子力学大门的)、而较少涉及到具体的物理图景。

另外,前15课的讨论中,为了便于计算和理解,我们一直是在一维模型上讨论量子力学,但真实的物理世界的舞台是三维空间、甚至是四维时空。这些三维和四维模型,并不仅仅是一维模型的简单扩充,它们当中还蕴含着一维世界所不具有的优美对称性、并且能解释或预测一维模型所不能给出的新的物理现象。

为了在具体的物理图景中理解三维乃至四维世界中的美妙对称性和新现象,我们将从一个曾经让无数物理学家着迷的问题入手。

这就是氢原子问题、或者更准确地说、是氢原子的光谱问题。

在20世纪前五十年,它一直都是物理学界的热门话题之一。

因为围绕着氢原子光谱问题的几乎每一次新的发现和解释,都伴随着物理学、特别是量子理论的一次大的突破,这个过程从经典物理大厦瓦解开始、穿越整个(单粒子的)量子力学时代、直到量子场论初创时还在余音绕梁。

这节课,我们就先来追随前人的脚步,回顾一下前量子力学时代氢原子光谱的那段精彩不断的往事,也当是中途休息一下。


1) 原子光谱简史

对光谱的研究最早可以追溯到17世纪,牛顿通过三棱镜实验,发现太阳光可以在三棱镜的折射下发生色散,看起来连续而均匀地分解成各种颜色的单色光。但牛爵爷似乎并未对此进行过更深入的研究。

然后不知不觉一个多世纪过去了。

到了19世纪初,随着实验方法的改进(主要是让进入棱镜的光线更细),英国化学家沃拉斯顿(W. H. Wollaston)和德国物理学家夫琅禾费(Joseph. von Fraunhofer)先后发现,太阳光分解后的各个单色光的颜色其实并不连续,这个光谱中还夹杂着一些很细的暗线。

夫琅禾费对这些暗线进行了详细标记,于是后来就有了以他的名字命名的“夫琅禾费线(Fraunhofer Lines)”

但可惜的是,局限于当时对物理世界的认知,两个人都没对这些暗线的来源给出合理的解释。

时间来到了19世纪中期,终于有人解决了这个问题。

他们是一对来自德国的好基友:物理学家基尔霍夫(G. R. Kirchhoff我们可能更熟悉他的基尔霍夫定律)和化学家本生(R. W. Bunsen,也许你听说过他发明的本生灯)。

在那个年代,人们已经知道了金属盐在高温火焰中会发出各种特定颜色的光,也就是我们在中学化学里知道的焰色反应。这有助于人们确定一堆不明粉末的化学成分,以确定是否可以食用(后半句划掉)。

但这时候问题来了:如果一堆不同成分的试剂混在一起,它们的火焰颜色也会发生混合,难以分辨。

而且,总有一些元素非常善于C位抢镜,常常在焰色反应中发出过于耀眼的光芒,遮住其他元素的表演。

比如钠盐,一堆试剂里只要撒进一小撮毛毛盐,它就能喧宾夺主发出一道标志性的明晃晃的黄光,让真正的主角们黯然失色。

(也许你还能记得中学化学课本曾经告诉过我们:在焰色反应中观察钾盐美丽的紫色火焰时,需要隔着蓝色钴玻璃,过滤掉混进队伍的钠盐发出的讨厌的黄光,才能看得清楚)

为了解决这个问题,基尔霍夫和本生俩人想起了来自牛爵爷的古老智慧:利用棱镜的色散效果,将火焰里不同颜色的光分离出来。为此,他们进行了更精准的光路设计,制成了世间第一台光谱仪。

接下来,他们就凭借这个新发明,分离出了各类元素对应的特征谱线,并且惊奇地发现,一些谱线居然能和太阳光谱上暗线的位置对应起来。这让他们立即意识到两件事情:

  • 第一,太阳上也有这些谱线所对应的元素;
  • 第二,这些元素不仅能发射光,也能吸收相同谱线对应的光(这样就形成了暗线)。

这就解释了太阳光谱上暗线的由来,而他们的光谱仪也迅速变成了当时化学界人见人爱的神器。

但接下来,物理学界却不得不面对另一个困惑:

和太阳光谱的暗线一样,每种元素对应的特征谱线并不是一段连续的光谱,而是更像很多条离散的线。

当时没人能说得清楚这是为什么。

不过好在当时光的波动学说早就已经被广泛承认,人们可以用波长或者频率来定量描述谱线的位置,所以本着试一试的想法,有人开始尝试研究这些离散谱线对应的波长之间的数量关系,看看能不能从中发现点有意思的规律。

而所有的元素中,氢作为最简单的那一个,就成了最被关注的对象。


2) 氢光谱的数字游戏

第一个在氢元素的光谱上找到规律的,是一位瑞士的中学数学老师,名叫巴尔末(J. J. Balmer),他研究了可见光范围内的氢光谱波长后发现,这些波长可以归纳成这样的数列:

$\small \lambda_n=B\frac{n^2}{n^2-4}\quad (n=3,4,5,\cdots) \quad {\scriptsize(式16.1)}$

其中常数$ \small B=3.6456$×$10^{-7}\text{m}$

这个规律后来也被瑞典物理学家里德伯(J. R. Rydberg)独立发现,并且被改写成一个更具有启发性的形式:

$\small \frac{1}{\lambda_n}=R\left(\frac{1}{2^2}-\frac{1}{n^2}\right) \quad {\scriptsize(式16.2)}$

其中$ \small R=\frac{4}{B}=1.0973731569$×$10^7 \text{m}^{-1} $,称作里德伯常数

再后来,里德伯又将这个规律更进一步扩充,得到:

$\small \frac{1}{\lambda_{mn}}=R\left(\frac{1}{m^2}-\frac{1}{n^2}\right) \quad {\scriptsize(式16.3)}$

$\small \begin{cases}m=1,2,3,\cdots\\ n=m+1,m+2,m+3,\cdots\end{cases}$

并且发现这和可见光范围外的氢光谱也能符合地很好。

找到这样简明的数字规律的确令人兴奋,但是兴奋之余,研究光谱的物理学家们发现问题还是没解决:

为什么氢光谱的波长会呈现这样的特殊规律?

伴随着这种困惑,时间来到了二十世纪初。

接下来,当时丹麦男足国家队的一位替补门将就要上场了。

没错,就是他:


3) 玻尔氢原子模型

我们知道,1911年,新西兰物理学家卢瑟福(E. Rutherford)通过用α粒子暴力轰击金箔的著名散射实验,发现了原子的核式结构,并且提出了原子的行星模型,将一个原子想象成一群电子绕着原子核不停旋转的样子。

但这个模型明显违背了经典物理学常识:因为按照电动力学理论,做圆周运动的电子会产生周期变化的电场,从而激发出电磁波,随着这些电磁波不停辐射出去,最终电子会耗尽能量坠落在原子核中。

对应到宏观现象,这就意味着两件事情会发生:

  • 宏观物质不会稳定存在,而是会很快坍塌成一堆密度超高的不知道什么玩意儿(就像中子星一样)
  • 原子发出的光谱应该是一段连续谱而不是离散的谱线

但我们看到,这两个现象都没有发生,所以对于原子中发生的事情,还需要更大胆的解释。

1913年,玻尔来到了曼彻斯特大学,在卢瑟福的实验室给卢老板打工,并且当面告诉卢老板说,您那个行星模型槽点太多,得好好改一改。

卢瑟福高兴地表示了赞同,并且对玻尔说,重新建立原子模型理论的重任就交给你了,()()()()()。

所以后来的剧情就成了玻尔的SHOWTIME了。

我们来大致回顾一下他的思路:

第一:为了解释电子为什么没掉进原子核里,玻尔先假设,原子核外面可能存在着一些分立的稳定轨道,我们可以给它们编号为$ \small 1,2,\cdots,n,\cdots $,电子只有在这些轨道上运行时,才会稳定旋转而不会辐射电磁波,这样的状态称为定态;

第二:电子有可能从高能量的轨道跳到低能量的轨道(或者反过来),同时辐射(或吸收)电磁波,这个电磁波的能量等于两个定态轨道之间的能量之差。而分立轨道之间的跃迁也能和当时发现的原子分立光谱定性地关联起来(定量的好戏在后面),辐射电磁波时对应着焰色反应那种亮线,而吸收电磁波时对应着类似于太阳光谱那样的暗线。

但如果仅仅有前面这两条假设,我们其实也得不出什么有用的信息,更没法定量计算这些轨道的一些参数(比如半径、能量等),最后只能沦为玄学。所以接下来的一条才是玻尔真正的天才创想。

第三:微观世界和宏观世界不应该被割裂开,当微观世界中的物理条件接近宏观极限时,物理现象总是能过渡到经典宏观现象上去,这就是玻尔著名的“对应原理”。

比如,当轨道能量足够大的时候,电子跃迁到相邻的轨道时辐射出的电磁波频率,应该和经典电磁理论给出的值接近,这将是找出各条轨道能量的关键出发点。

接下来我们就来详细计算和欣赏一下这个伟大成果的诞生。

首先,我们将电子轨道从内到外编号,电子从第$ \small n $条轨道跃迁到相邻的第$ \small n-1 $条轨道时,放出的电磁波能量为$ \small E_{n,n-1}=E_n-E_{n-1} $,按照爱因斯坦的能量频率关系,相应的频率就应该为:

$\small \nu_{n,n-1}=\frac{E_{n,n-1}}{h}=\frac{E_n-E_{n-1}}{h} \quad {\scriptsize(式16.4)}$

而另一方面,按照经典电磁理论,电子绕核运动辐射电磁波的频率应该等于电子做绕核周期运动的频率本身。

这样,根据对应原理,$ \small n $足够大的时候,跃迁放出的电磁波频率和电子在第$ \small n $条轨道上的绕核周期运动频率就应该相等,即:

$\small \nu_{n,n-1}\simeq\nu_n \quad {\scriptsize(式16.5)}$

这里请注意区分等式左边的 $ \small \nu_{n,n-1} $是电子从第$ \small n $条轨道跃迁到第 $\small n-1 $条轨道时辐射出的电磁波频率,而右边的 $\small \nu_n $是电子在第$ \small n $条轨道上周期运动时的频率。

再代入式16.4,我们就得到第$ \small n $条轨道上的能量和频率的关系:

$\small h\nu_{n}=E_n-E_{n-1} \quad {\scriptsize(式16.6)}$

这里有三个未知量,却只有一个方程,显然没法算。

所以接下来还要继续补充信息。

我们可以从绕核运动的一些力学关系来考虑。

如果将电子的绕核运动类比为行星绕太阳的运动,那么根据开普勒第一定律,这些轨道应该是一个个椭圆,并且它们的绕核旋转的频率$ \small \nu_n $和能量$ \small E_n $之间还能找出一个定量关系来。

这个关系的严格推导可以参考[北大田光善老师量子力学视频第4讲]

而这里为了便于理解,我们接下来的推导将牺牲一点严谨性、对模型进行简化,仅仅从圆形轨道的特殊情形来得到$ \small \nu_n $和$ \small E_n $之间的关系,简单感受一下推导过程。

我们知道,匀速圆周运动的能量由动能和势能组成,在库仑力作用下就是:

$\small \begin{align} E_n&=E_{k,n}+E_{p,n}\\ &=\frac{1}{2}m_er_n^2\omega_n^2-\frac{1}{4\pi \varepsilon_0}\frac{e^2}{r_n} \end{align} \quad {\scriptsize(式16.7)}$

而我们还知道向心加速度与向心力之间满足关系:

$\small m_er_n\omega_n^2=\frac{1}{4\pi \varepsilon_0}\frac{e^2}{r_n^2} \quad {\scriptsize(式16.8)}$

通过这两个关系式,我们可以消去$ \small r_n $,得到单纯的角速度和能量之间的关系:

$\small \omega_n=\frac{8\pi \varepsilon_0}{e^2}\sqrt{\frac{2}{m_e}}(-E_n)^{\frac{3}{2}} \quad {\scriptsize(式16.9)}$

而频率$ \small \nu_n=\frac{\omega_n}{2\pi} $,于是:

$\small \nu_n=\frac{4 \varepsilon_0}{e^2}\sqrt{\frac{2}{m_e}}(-E_n)^{\frac{3}{2}} \quad {\scriptsize(式16.10)}$

这样,我们就得到了第二个等式关系。

将它代入前面的式16.6中,我们可以得到:

$\small \begin{align}E_n-E_{n-1}&=\frac{4 h\varepsilon_0}{e^2}\sqrt{\frac{2}{m_e}}(-E_n)^{\frac{3}{2}}\ \end{align} \quad {\scriptsize(式16.11)}$

由于前面一堆物理常数都和$ \small n $无关,为了图个清净,我们将它们缩写成一个常数$ \scriptsize A=\frac{4 h\varepsilon_0}{e^2}\sqrt{\frac{2}{m_e}}$

于是:

$\small \begin{align}E_n-E_{n-1}&=A(-E_n)^{\frac{3}{2}} \end{align} \quad {\scriptsize(式16.12)}$

这样我们就得到了只包含能量的一个递推式。

而如果仔细看这个式子,我们会发现,它其实就是一个差分方程,而且考虑到$ \small n-(n-1)=1 $,我们还可以将它写成:

$\small \begin{align}\frac{E_n-E_{n-1}}{n-(n-1)}=\frac{\Delta E_n}{\Delta n}=A(-E_n)^{\frac{3}{2}} \end{align} \quad {\scriptsize(式16.13)}$

如果再大胆一点,我们可以干脆将它写成一个微分方程:

$\small \begin{align}\frac{\text dE_n}{\text dn}&=A(-E_n)^{\frac{3}{2}} \end{align} \quad {\scriptsize(式16.14)}$

这个微分方程我们都轻车熟路了,直接分离变量求解,最后可以得到:

$\small \begin{align} E_n&=-\left[\frac{2}{A\left(n+C\right)}\right]^2\\ &=-\frac{m_e e^4}{8h^2\varepsilon_0^2}\frac{1}{\left(n+C\right)^2} \end{align} \quad {\scriptsize(式16.15)}$

这样,除了一个解微分方程时留下来的积分常数$ \small C $暂时无法确定之外,玻尔就得到了各个轨道上的能量表达式,也就是最早版本的玻尔能级公式

(注:田光善老师的量子力学视频里用的是另一种方法推导,且更忠实于历史真实,但结果是一样的,田老师推导的结果采用高斯单位制,写成:$ \scriptsize E_n=-\frac{\pi^2m_e e^4}{2h^2\left(-\frac{n}{2}+D\right)^2} $,和上述式16.15之间只差了一个省略的系数$ \small \left(\frac{1}{4\pi\varepsilon_0}\right)^2 $, $\small n $的系数和正负号都可以化成式16.15的形式)

这个式子的推导据说只用了玻尔一个月时间,算是提前完成了季度KPI(不存在的),卢老板也对此表示了认可。

但这一系列推导有个大问题,就是它从一开始就充满着各种来路不明的假设,而计算结果似乎也没有实验数据支持(当时卢瑟福和玻尔都不知道氢原子光谱的巴尔末公式和里德伯公式),这对物理学家来说算得上是致命缺陷。

而正当玻尔准备思考下一步行动计划时,他突然想起一件更重要的事:他的婚期快到了,该回家结婚了。

于是玻尔暂时告别了手头的工作与和蔼可亲的卢老板,()()()()地返回了丹麦。

也许是新婚的喜庆给玻尔带来了好运,当他度完蜜月再次投入工作时,一个大礼包突然不期而至。

有一天,玻尔遇到了一个老同学,名叫汉森(H. M. Hansen),好巧不巧,这位老兄正好是研究原子光谱的。

一番叙旧之后,两个学术圈的人自然要聊聊各自的研究工作。

玻尔话比较多,所以主要是玻尔在聊(前半句是真的,后半句是作者编的)。

当汉森默默听玻尔说完最新的进展和困难后,突然闪过一丝灵感,想起了光谱学里那个著名的巴尔末公式,于是赶紧写下来拿给玻尔看,问他能不能把这个经验公式和他的原子模型联系起来。

而玻尔一看到那个公式(可能主要是看到了那个$ \small n^2$ ),就立刻有了一种拨云见日的感觉:

巴尔末公式的背后隐含的,也许就是他的原子模型。

那么接下来就是令人期待又紧张的验证工作了。

现在我们直接从里德伯的公式(式16.3)出发来验证:

$\small \frac{1}{\lambda_{mn}}=R\left(\frac{1}{m^2}-\frac{1}{n^2}\right) \quad {\scriptsize(式16.3)}$

为了和玻尔的能级公式对应起来,我们利用能量关系$ \small E=h\nu=\frac{hc}{\lambda} $,将它改造成能量的形式:

$\small \begin{align} E_{mn}&=Rhc\left(\frac{1}{m^2}-\frac{1}{n^2}\right) \\ &=\left(-\frac{Rhc}{n^2}\right)-\left(-\frac{Rhc}{m^2}\right) \end{align} \quad {\scriptsize(式16.17)}$

这个形式就可以看成两条定态轨道之间的能量差了。

于是第$ \small n $条轨道的能量就是:

$\small \begin{align} E_{n}&=-\frac{Rhc}{n^2} \end{align} \quad {\scriptsize(式16.18)}$

如果玻尔的能级公式是正确的,那么这个式子将和玻尔的能级公式16.15相等,即:

$\small -\frac{m_e e^4}{8h^2\varepsilon_0^2}\frac{1}{\left(n+C\right)^2}=-\frac{Rhc}{n^2} \quad {\scriptsize(式16.19)}$

两边对比,我们首先能得出积分常数$ \small C=0 $的结论,这样能级公式就变成了:

$\small E_n=-\frac{1}{n^2}\frac{m_e e^4}{8h^2\varepsilon_0^2} \quad {\scriptsize(式16.20)}$

再对比式16.20和式16.18,我们就来到了最关键的一步:得出里德伯常数$ \small R $和几个基本物理常数之间的关系:

$\small R=\frac{m_ee^4}{8h^3c\varepsilon_0^2} \quad {\scriptsize(式16.21)}$

而由于里德伯常数是根据氢原子光谱得出来的经验值,代表着实验结果,所以,如果上面这个等式关系成立,那么玻尔理论就能和实验结果对应起来。

而简单算一下我们就会发现,根据式16.20右边已知的各个物理常数算出来的里德伯常数和实测值只差了$ \small 10^{-4} $的数量级(请同学们自行验算)。

这样的结果,也使得氢原子模型成了玻尔的封神之作,并且成了后来量子力学初创时验证各种理论正确与否的金标准。而其中的定态、能级等概念也被量子力学继承了下来,成为后来描述能量本征态的通用语言。

这里顺便说一句,得到氢原子能级公式后,玻尔又从中提取出了另外一个看起来“更自然”的等式关系:

$\small m_er_n^2\omega_n=nh \quad{\scriptsize{(式16.22)}}$

这个结果可以由式16.8、式16.9和式16.20出发得到,有兴趣的同学可以自己推导一下。

而仔细观察一下我们会发现,这个等式的左边其实就是电子在第$ \small n $条轨道上的角动量$ \small L_n $,即:

$\small L_n=n\hbar \quad\scriptsize{(式16.23)}$

这意味着电子的角动量是以(普朗克常数的)整数倍关系变化的,这被称作角动量的量子化条件。

在此基础上,德国物理学家索末菲(A. Sommerfeld)将它写成了一个动量沿轨道积分的形式:

$\small \oint p_n\text dq_n$=$nh \quad\scriptsize{(式16.24)}$

再后来,著名的官二代德布罗意(de Broglie)公子提出了物质波的设想,给出了动量和波数的关系$ \small p=\hbar k $,于是这个式子又被改造成了这个样子:

$\small \frac{1}{2\pi}\oint k_n\text dq_n=n \quad\scriptsize{(式16.25)}$

这个公式乍看起来看不出什么意义,但如果我们考虑圆轨道,那么左边的积分结果就是:

$\small \frac{2\pi r_n}{\lambda_n}=n \quad\scriptsize{(式16.26)}$

这意味着轨道的圆周长度是波长的整数倍,换句话说,就是电子波在轨道上形成了驻波。

这对我们有什么提示作用呢?

回想一下,我们在第10课中看到,一个波函数可以分解成无穷多个分离变量解的级数和,而我们当时提到,这些分离变量解的空间部分的物理意义其实就是驻波,而数学意义又是能量的本征态。

有了这层联想,上面的驻波条件就从侧面暗示我们,氢原子的能级分立背后隐含的本质,也是能量的本征值和本征态。

后面的课程里,我们就要来挖掘出这些本征态,而且到时候我们会发现,它们远比我们(还有旧量子时代的物理学家们)想象的更加复杂但也更加精妙。


4) 总结与预告

这节课里,我们简单回顾了从光谱学到旧量子时代关于原子光谱、特别是氢原子光谱的认识史,感受了量子力学诞生前物理学界的困惑和各种令人叹为观止的天才创想,其中尤为特别的是玻尔氢原子模型迈出的决定性的一步。

当然,也正如我们后来所知道的那样,玻尔理论还有很多问题,比如它保留了确定轨道这个经典假设,又比如它无法计算多电子原子的能级。

而除了这些以外,我们在以后的课程里更关心的是下面几个问题:

  • 玻尔模型没能继续解释,为什么核外电子会存在这样一系列分立的定态,虽然后来德布罗意的驻波条件某种程度上打开了神秘宫殿的一条门缝,但距离真相还是有一段不短的距离;
  • 按照玻尔的模型,当$ \small n=1 $时,电子处于最低能态$ \small E_1 $,称为基态,再往下就没有定态了(实际上也没有观察到过更低的能态)。玻尔模型没办法解释,为什么电子到了基态后就不会继续放出光子往下跳;
  • 氢原子(以及其他原子的)光谱在有外部电场或磁场作用时,会奇怪地分裂成几条(有兴趣的同学可以提前了解一下“塞曼效应”和“斯塔克效应”)。玻尔模型没法解释这种分裂,或者至少不能给出符合实验的结果。

第一个问题的答案,我们其实已经知道,它的本质是能量的本征态,后面我们会给出更多的细节、以及更清晰的物理意义。

第二个问题,等我们解出了氢原子的波函数,算出电子在各个位置的概率分布时,就一切都明朗了,这个我们会在第21课看到。

而对我们而言,更陌生、更难理解、但其实也更有意思的是第三个问题,因为它暗含了某种美妙对称性的破缺,这也是我们以后会用更多篇幅去理解和赏析的部分。

在未来的课程里,我们就要用我们在前15课中习得的量子力学理论框架,来重新推导和理解氢原子模型,并且通过上面的问题来理解真实物理世界背后的简单和对称。

不过,作为必要的准备,我们需要先了解一下三维世界中的量子力学模型(因为氢原子模型是处在三维世界中的),去看看它相比于一维模型多了些什么有意思的特质。


编辑于 2022-03-16 16:04

从线性代数到量子力学(15):半程回顾

PeiLingX
物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》的第15课,本课是对前半程(也就是我们这个系列的基础篇)的回顾和脉络梳理。

了解本系列及本专栏其他文章,请收藏目录:

专栏文章总目录


1) 回顾

在本系列的第1课里,我们开宗明义地提到:

量子力学中,描述一个物理对象所处状态的基本方式,不再是位置速度动量能量等经典力学量,而是态空间中抽象的态矢量,也就是我们通常所说的“量子态”。

  • 态矢量

一个态矢量,按狄拉克符号记法,分为左矢$ \left<\psi\right| $和右矢$ \left|\psi\right> $,可以类比为线性代数中互为共轭转置的一对行向量和列向量:

$\small \boldsymbol u^\dagger=(u_1^*,u_2^*,\cdots,u_n^*),\ \boldsymbol{u}= \begin{bmatrix} u_1\\ u_2\\ \vdots\\ u_n \end{bmatrix}$

通常情况下,我们用右矢表示一个态矢量。

为了理解态矢量,我们最初以“薛定谔的猫”思想实验为引子,用态矢量解释了“既生又死”的“叠加态”:将“活猫”和“死猫”两种确定状态看作一组基底,于是既生又死的叠加态就是这组基底的线性叠加:

$\small \left|\psi\right>=a_1\left|L\right>+a_2\left|D\right>$

两个系数的模方$ \small |a_1|^2,|a_2|^2 $分别代表打开盒子观察猫的状态时,观察到活猫和死猫的概率。

于是根据概率归一化条件,可知$ \small a_1,a_2 $满足:

$\small |a_1|^2+|a_2|^2=1$

而我们又提到,如果将“猫的死活”看成一个虚构的力学量,那么“死猫”和“活猫”两种确定状态就是这个力学量的本征态

  • 本征态

当我们对物理对象测量某个力学量$ \small F $时,物理对象将随机坍缩到某些由$ \small F $决定的特定状态上,这些态就是$ \small F $的本征态,记为$ \small \left|F_n\right> $。

比如我们在第4课和第5课中提到的电子在$ \small z $方向的自旋,就有两个本征态$ \small \left|z_+\right> $和$ \small \left|z_-\right> $,也就是说,当我们用Stern-Gerlach实验装置测量电子在$ \small z $方向的自旋时,只会随机得到$ \small \left|z_+\right> $和$ \small \left|z_-\right> $两个方向,而不会出现其他方向的结果。

又比如我们在第8课提到的定态薛定谔方程的解,就是能量的本征态。

一个物理对象的态矢量通常并不处于某个力学量的本征态上,而是本征态的线性叠加,这就是所谓的叠加态(就像黑盒子里的猫没被观察之前那个“既生又死”的状态一样)。

  • 叠加态

一个一般的态矢量,可以表示成某个力学量$ \small \hat{F} $的本征态的线性组合:

$\small \left|\psi\right>=\sum_n{c_n\left|F_n\right>}$

就像线性代数中一个向量可以表示成一组由矩阵特征向量构成的基底的线性叠加:

$\small \boldsymbol u=\sum_{k=1}^n{u_k\boldsymbol \alpha_k}$

但是量子力学中的分量系数还有一层重要的物理意义:测量结果的概率。

  • 量子力学中的测量

对处于一个一般状态状态$ \small \left|\psi\right>=\sum_n{c_n\left|F_n\right>} $的物理对象,如果去测量它的力学量$ \small F $,那么它的状态将随机坍缩到其中一个本征态$ \small \left|F_n\right> $,相应的概率是$ \small c_n $的模方$ \small |c_n|^2$

而到此为止,我们一直都在讨论抽象的量子态,而还没有说到经典力学量的测量值在量子力学中如何出现。而这就要提到本征值

  • 本征值

量子力学中,对物理对象测量某个物理量$ \small F $时,可能出现的值,就是该力学量的本征值。

而本征值和本征态是一一对应的。

当一个粒子的态矢量处于物理量$ \small F $的某个本征态$ \small \left|F_n\right> $时,它就具有确定的$ \small F $值,此时对它测量物理量$ \small F $,就会百分之百得到相应的本征值,记为$ \small F_n$

需要提一句的是,到此为止自,我们一直用$ \small n $作为下标,似乎意味着本征值总是离散的,但实际上本征值也可能是连续的,比如下面这个例子:

一维情形下一个粒子的位置坐标$ \small x$ (这是我们能想到的最简单的力学量)

我们将粒子位置的某个本征态记为$ \small \left|x_a\right>, x_a\in \mathbb {R}$

我们假设某个粒子处于状态:

$\small \left|\psi\right>=\sum_{x_a}{\psi(x_a)\left|x_a\right>}$

(由于$ \small x\in \mathbb R $,所以这里的求和其实是对$ \small x $积分,只是我们现在没给出它的具体形式)

对于这个粒子,如果我们去测量它的位置坐标,那么它的状态将随机坍缩到某个本征态$ \small \left|x_a\right> $,而作为测量的结果,我们会测得粒子的位置$ \small x=x_a $,这就是本征态$ \small \left|x_a\right> $对应的本征值,而我们得到这个结果的概率密度为$ \small \left|\psi(x_a)\right|^2$

而由于本征值和本征态可以分别类比为线性代数中矩阵的特征值和特征向量,因此,量子力学中,一个力学量也会对应一种类似矩阵的东西,这叫做力学量算符

  • 算符

力学量算符:一个经典力学量$ \small F $在量子力学中变成算符$ \small \hat{F} $,它可以类比为线性代数中的矩阵,而相应的本征值和本征态序列$ \small {F_n} $和$ \small {\left|F_n\right>} $就可以类比为矩阵的特征值和特征向量。

而在线性代数中我们知道,一个矩阵$ \small \boldsymbol A $与它的特征值$ \small \lambda_n $、特征向量$ \small \boldsymbol\alpha_n $之间满足:

$\small \boldsymbol A\boldsymbol\alpha_n=\lambda_n\boldsymbol\alpha_n$

作为类比,我们可以形式上写出算符的本征值关系:

$\small \hat{F}\left|F_a\right>=f_a\left|F_a\right>$

为了便于直观理解,我们可以将这个式子做一个不严谨的解释:

当一个粒子处于力学量$ \small F $的某个本征态$ \small \left|F_n\right> $时,对它测量$ \small F $本身(等式左边),会百分之百得到本征值$ \small f_n $的结果,并且测量后粒子仍然处于本征态$ \small \left|F_n\right>$ (等式右边)

对于可观测的力学量而言,它的本征值是实数,在量子力学中对应的算符称作厄米算符,不过我们现在还不用去了解厄米算符的具体定义。

另外,当我们关注的力学量是能量时,它的本征值关系会变成定态薛定谔方程。为了实现这一点,我们需要先将抽象的算符和态矢量“具象化”,这就要提到表象了。

  • 表象

在线性代数中我们知道,向量和矩阵的具体形式需要在具体的基底下写出。

以向量为例,同一个向量$ \small \boldsymbol a $在不同基底下会有不同的投影分量:

这些分量的值就构成了向量$ \small \boldsymbol a $在不同基底下的具体形式:

$\small (a_1,a_2,\cdots,a_n)^T $或$ \small (a'_1,a'_2,\cdots,a'_n)^T$

类似地,态矢量和算符也需要在具体的“表象”下写出,不同的表象下,态矢量和算符都会有不同的分量形式,而我们要讨论的最常见的表象是“坐标表象”。

  • 坐标表象

当我们使用坐标表象来表示一个物理对象的态矢量时,就等于选取了坐标的本征态$ \small \left|x_a\right> $作为基底,根据态矢量的线性叠加关系,我们知道:

$\small \left|\psi\right>=\sum_{x_a}{\psi(x_a)\left|x_a\right>}$

类比向量的分量形式,我们不难知道,这里与坐标$ \small x_a $有关的系数$ \small \psi(x_a) $其实就是态矢量$ \small\left|\psi\right> $在坐标表象下的具体形式,它也满足内积关系:

$\small\psi(x_a)=\left<x_a|\psi\right>=\int_{\mathbb R}{\delta(x-x_a)\psi(x)\text dx}$

其中$ \small \delta(x-x_a) $就是坐标的本征态$ \small \left|x_a\right> $在自身的表象、也就是坐标表象下的具体函数形式,类似于一组正交归一的向量$ \small \left\{\boldsymbol e_k\right\} $在自身为基底的坐标系中的分量为:

$\small \boldsymbol e_k=(0,0,\cdots,1_{(第k个分量)},0,\cdots,0)^T$

对式15,$x$取遍所有的$ \small x_a $,我们就还原了函数$ \small \psi(x) $,而如果再考虑到它会随着时间发生演化,我们还能将它写成$ \small \psi(x,t) $,这就是我们熟悉的波函数。

除了态矢量以外,各种力学量的算符在坐标表象下也有具体的形式,比如我们接下来要讨论的能量算符、也就是哈密顿算符$ \small \hat{H}$

  • 哈密顿算符

在牛顿力学中,一个运动物体的能量由动能和势能组成:

$\small E=E_k+E_p=\frac{p^2}{2m}+V$

其中$ \small p $是物体的动量,$ \small V $是物体所处位置的势能。

而在量子力学中,能量、动量、势能也有相应的算符,这些算符也满足相同的关系,即:

$\small \hat{H}=\frac{\hat{p}^2}{2m}+\hat{V}$

而动量算符和势能算符在坐标表象下具有简单的形式,分别为:

$\small \hat{p}=\text i\hbar\frac{\partial }{\partial x},\quad \hat{V}=V(x)$

(我们在第9课中看到,这可以在自由粒子的单色波函数中,通过德布罗意关系得到验证)

于是哈密顿算符在坐标表象下可以写成:

$\small \hat{H}=-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V(x)$

此时我们离量子力学中最重要的定态薛定谔方程就只有一步之遥了。

  • 定态薛定谔方程

能量本征值关系:

$\small \hat{H}\left|a\right>=E_a\left|a\right>$

哈密顿算符在坐标表象下为:

$\small \hat{H}=-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V(x)$

能量本征态$ \small \left|a\right> $作为态矢量,可以表示成一般的波函数形式$ \small \psi_a(x) $(不考虑时间变化的部分),这样,我们就得到了一个微分方程:

$\small -\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}\psi+V\psi=E\psi$

这就是定态薛定谔方程。

由于它是能量本征方程在坐标表象下的具体形式,因此我们可以很自然地想到,它的一系列解$ \small \psi_a(x) $就是能量本征态在坐标表象下的具体形式(在原子核外电子的薛定谔方程中,这就是代表电子在空间中概率分布的电子云),而等式右边相应的常数$ \small E_a $就是能量本征值。

特别地,在束缚态或周期势中,我们会得到离散的解$ \small \psi_n(x) $以及离散的能量本征值$ \small E_n $,这也是分立能级的来源(我们在第10课中对此进行了定性的解释)。

另外,我们知道,不同的势能会对应不同的哈密顿算符,也就会对应不同的能量本征值和本征态,这个常识将是我们在未来的课程中继续理解能级跃迁和能级分裂的基础。

但定态薛定谔方程只能看做薛定谔方程的空间部分,当我们关注量子态随时间的演化时,我们就会得到完整的薛定谔方程

  • 态的时间演化与薛定谔方程

我们直接给出了态的时间演化规律与哈密顿算符的关系:

$\small \frac{\partial }{\partial t}\left|\psi\right>=\frac{\hat{H}}{\text i\hbar}\left|\psi\right>$

也就是说,量子态的演化可以看作哈密顿量作用在态矢量上的结果。

如果我们将$ \small \text i\hbar $移到左边,然后将前面给出的坐标表象下哈密顿算符的具体形式,就得到一个新方程:

$\small \text i\hbar\frac{\partial }{\partial t}\psi(x,t)=\left(-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V\right)\psi(x,t)$

这就是薛定谔方程

到此为止,我们就梳理完了从态矢量到波函数、再到薛定谔方程、最后到分立能级这条主线。

接下来,我们来梳理基础篇中的另一条主线:不确定性原理。

  • 本征态“相互投影”与不确定性

在第3课的假想实验中,我们看到,两个不同力学量的本征态有可能是“不重合”的,也就是说,一个力学量$ \small A $的本征态可能会在另一个力学量$ \small B $的本征态上产生“投影”。

这种情况下,当物理对象处于力学量$ \small A $的本征态、即具有确定的$ \small A $值时,如果对它测量力学量$ \small B $,就不会得到一个确定的本征值,而是会随机落到$ \small B $的某个本征态$ \small \left|b_k\right> $上,同时随机得到一个本征值$ \small b_k$

从测量结果的角度来看,就是当力学量$ \small A $具有确定值时,力学量$ \small B $就变得不确定了。

这就是我们对不确定性原理的最粗浅的理解。

而这样的一对力学量的关系被称为是“不对易”的,这可以类比于线性代数中两个矩阵的不可交换性,即:

$\small AB-BA\neq 0$

而在第4课和第5课介绍的斯特恩$-$盖拉赫实验(后文简称SG实验)中我们看到了一个物理实例:电子在不同方向的自旋是无法同时确定、也就是不对易的。

而量子力学中最基础的一对不对易的力学量是坐标和同方向上的动量,比如$ \small x $坐标以及$ \small x $方向的动量$ \small p_x$

(我们在第14课中顺便提及过,它们之间的对易关系为:

$\small \left[\hat{x},\hat{p}\right]:=\hat x\hat p-\hat p\hat x=\text i\hbar$

我们在基础篇中并未太多用到这个关系,但进阶篇中我们会看到它的作用)

它们之间有一个著名的不确定性关系:

$\small \Delta x\Delta p_x\geq\frac{\hbar}{2}$

我们用了三节课内容讨论这个关系背后的线性代数本质和证明过程,其中用到了一个关键信息,就是坐标和动量之间的表象变换

  • 表象变换与不确定性关系的证明

由于坐标和动量的本征态都是在无穷维的函数空间中,不像有限维空间中基底之间的关系那么直观。

因此,我们专门用了一节课内容来导出它们的表象变换关系。

最后我们惊喜地发现这竟然就是傅里叶变换:

$\small \psi(x)=\frac{1}{\sqrt{2\pi \hbar}}\int{\phi(p)\text e^{\frac{\text i}{\hbar}px}\text dp}$

在此基础上,我们在第13课中借用泛函分析中柯西-施瓦茨不等式的一个推论,给出了不确定性关系的证明。

  • 量子与经典的连结

而作为基础篇的结尾,我们通过考察动量的期望值的时间变化,从薛定谔方程出发导出了牛顿第二定律,完成了一次量子世界与经典世界之间的连结。

现在,让我们回顾一下第1课开篇提到的那些初学者的疑惑,看看我们有了哪些新的理解。


2) 第1课的疑惑与解答

  • Q1:我们知道,原子核外的电子具有看起来不合常理的分立能级,也就是只能取一些不连续的特殊值。那么这些特殊值是怎么来的呢?

  • A1:能级与能态 = 薛定谔方程的基础解系=能量的本征值和本征态,分立能级对应着束缚态下分立的能量本征值。

  • Q2:电子在不同能级之间会“跳来跳去”进行跃迁,同时吸收或发射光子,这个跃迁是怎么发生的呢?

  • A2:这个和哈密顿算符的含时变化有关,我们还没有解释,但我们会在进阶篇中讨论。

  • Q3:又比如,我们知道微观粒子具有波粒二象性,物理课本告诉我们,微观粒子既是粒子又是波,但我们其实只是记住了这句话,这种奇怪的二重性质有没有更好的理解方式呢?

  • A3:我们在第12课中通过态矢量的动量表象和坐标表象理解了这样的双重性质。

  • Q4:而我们又知道,描述粒子波动性的是波函数,并且隐约知道所谓哥本哈根诠释:波函数可以用来计算粒子在某个位置出现的概率。那么这个奇怪的概率波要怎么和我们熟悉的经典物理量联系起来呢?

  • A4:波函数 = 态矢量在坐标表象下的具体函数形式,类似于向量在某一组基底下的具体分量形式,粒子在某个位置出现的概率就是它在该位置对应的坐标本征态上的“投影长度”的模平方。

  • Q5:而决定波函数行为的是一个叫作薛定谔方程的微分方程,我们知道它在量子力学中的地位如同牛顿第二定律在经典力学中的地位,那么薛定谔方程的物理意义是什么?它和经典力学定律之间是不是也能联系起来呢?

  • A5-a:定态薛定谔方程 = 能量的本征值关系在坐标表象下展现出的一个具体微分方程形式;

  • A5-b:薛定谔方程 = 量子态的时间演化规律在坐标表象下展现出的一个具体微分方程形式;

  • A5-c:薛定谔方程与牛顿第二定律之间可以通过本征值的期望值的时间演化来联系。

  • Q6:另外,我们听说过海森堡不确定性原理,它告诉我们,有些物理量会像一对冤家一样不能同时具有确定值,比如位置和动量,一个确定了,另一个就变得随机。那么,造成两者不能同时确定的更深层次原因是什么呢?

  • A6:不确定性 = 两个算符不对易,或者它们的本征态“不重合”,相互之间有“投影”。当一个力学量$\small A$处于确定的本征态时,“投影到”另一个与它不对易的力学量$\small B$的本征态组,就会产生多个非零的“投影分量”,也就是说$\small B$可能出现多个不同的测量结果,这就对应着$\small B$的不确定了。

  • Q7:最后,最让我们困惑的是,这一大堆现象和结论看起来完全是散装在一起的,表面上看不出任何联系,它们真的是来自同一个量子力学理论体系吗?

  • A7:我们看到,通过态矢量的叠加原理、算符-本征值-本征态的关系,我们将前面提到的现象都串了起来。

至此,除了第2个问题没有得到详细解释外,我们的疑惑基本上就都得到了解答。


3) 总结与预告

在基础篇里,我们借用与线性代数的类比,从零开始建立了量子力学最基础的理论框架,也解释了一些初学者常见的疑惑。

但是,我们的基础篇还是留了一些遗憾:

我们更侧重理论框架和数学上的类比,物理味道反而并不那么浓厚;

另外,我们在基础篇里讨论到的模型,其实都是比较简单的一维模型,一维世界的好处是从数学上容易理解,但它却少了很多真实三维世界的乐趣(比如对称性);

最后,我们直到现在讨论的量子力学,都是在都是牛顿力学的微观版本(因为我们的哈密顿算符是用经典能量关系 $\small \hat{H}=\frac{\hat{p}^2}{2m}+\hat{V}$ 表示的),我们还没看到,如果在相对论的时空关系中建立量子力学,会出现什么样意想不到的结果。

在接下来的进阶篇里,我们就要进入更真实的物理世界,在其中感受数学形式与物理图景的完美结合:


编辑于 2021-12-14 16:15