从线性代数到量子力学(22):氢原子模型的球对称性

PeiLingX
物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》第22课。

本系列及本专栏其他文章,建议收藏目录:

专栏文章总目录


0) 开篇语

在理论物理中,对称性始终是物理学家们所追求的终极美之一。

量子力学中的对称性,也是一条非常深刻又令人感到赏心悦目的主线,我们会在这个系列的最后部分去细细地品味。

不过,在此之前,我们可以先来做一个热身,观赏一下氢原子(以及一切球对称势的)薛定谔方程解的球对称性,因为这里埋伏了一个初学者经常会遇到的困惑。而在解开这个困惑的过程中,我们也可以提前体验一下,如何分别从物理直观上和从数学形式上去理解对称性。

我们先来梳理一下这个困惑。

我们知道,对于一个孤立的、没有任何其他外场存在的氢原子而言,它的原子核产生的库仑势$ \small V(r) $只与点到原子核的距离$ \small r $有关,而与方向无关。因此,物理直觉上,我们会很自然地推测:这种球对称的物理体系中的薛定谔方程解也应该具有某种球对称性。

但问题在于,这种球对称性会以什么形式存在呢?

回答这个问题之前,我们其实需要先来明确一件事情:什么是对称性?


1) 什么是对称性?

我们所能想到的最直观的对称,当然是几何图形的对称,比如当我们看到故宫太和殿、看到正方形、看到圆形的时候,都会知道它们蕴含了某种对称性。

而我们还知道,它们的“对称度”还有些区别:

太和殿的对称性只有1种:左右对称,也就是将它沿着中轴线左右翻转后,它的形状会保持不变,仍然与原来的图形重合;

正方形的对称性有7种:沿着两个中轴线翻转、沿着两个对角线翻转、绕着中心点旋转90°、180°、270°,它都能保持形状不变;

而圆形的对称性就有无穷多种了:沿着任意一条直径翻转、绕着圆心旋转任意角度,最后得到的仍然是原来那个圆。

当然,这些图形的“对称度”并不是我们现在关心的问题,我们关心的是如何定义对称性。

而从上面这些描述中,我们其实可以总结出一条关于几何图形对称性的共同的定义来:

一个图形在某种变换(比如前面提到的翻转、旋转等)下保持形状不变(与变换前的形状重合)的特性。

有了这句话,我们就可以来说一说物理模型的对称性了。

对于一个物理模型而言,对称性的描述其实也和几何图形一样,只不过描述对象从图形变成了物理对象而已:

一个物理对象在某种变换下保持不变的特性。

(这个所谓物理对象可以是物理量、物理方程、甚至某种物理性质)

那么现在问题又来了:几何上的图形和变换都能很直观地看到或者动手比划一下,但是物理上的变换应该怎么去描述呢?

如果只是对普通大众解释这种对称,我们其实可以尝试着用图形去类比(比如徐一鸿那本著名的《可畏的对称》),只不过这很难触及到物理意义上的对称性的“灵魂”,但好在我们和普通大众还是有一点区别的:我们手里有可以“触及灵魂”的工具:数学,我们将用它来真正理解物理学意义上的对称。

为了更好地体验从几何直观到数学抽象的转变,我们不妨先用几何图形的对称性来练练手:

比如,刚才讨论圆的对称性的时候,我们提到,让一个圆绕圆心旋转任意角度,它的形状都保持不变,现在,我们要将这个几何上的直观经验抽象成数学方程。

首先,我们写出一个单位圆的方程:

$\small x^2+y^2=1 \quad{\scriptsize (式22.1)}$

接下来,我们来寻找旋转变换的数学描述。

而我们很容易从几何上证明(请同学们自己试一下),平面上一个位于$ \small (x,y) $的点,绕着原点旋转$ \small \theta $角后,新的点的坐标为:

$\small \begin{bmatrix}x'\\y'\end{bmatrix}= \begin{bmatrix}\cos\theta&-\sin\theta\\sin\theta&\cos\theta\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}$

于是,在这样的变换下,我们不难证明:

$\small \begin{align} x'^2+y'^2&=\left(x\cos\theta-y\sin\theta\right)^2+\left(x\sin\theta+y\cos\theta\right)^2\ &=\cdots\quad {\scriptsize(请自行补充省略步骤)}\ &=x^2+y^2\ &=1 \end{align} \quad{\scriptsize (式22.2)}$

也就是说,圆经过旋转变换后,圆上的点从$ \small \left(x,y\right) $旋转到了$ \small \left(x',y'\right) $,但圆的方程仍然还是$ \small \begin{align} x'^2+y'^2=1 \end{align} $,方程的形式还是原来那个样子,而这在几何上就体现为:一个圆绕圆心旋转后,仍然与原来的圆重合。

(同学们有兴趣可以思考一下圆沿着某个直径翻转的变换矩阵怎么推导,并且以此证明圆的方程在翻转变换下也保持不变的几何性质)

现在,我们大致知道了如何将直观的几何对称性抽象为方程或函数形式的抽象对称性(即某个方程或函数在某种变换下保持某种形式或性质不变),就可以摆脱对直觉的依赖,来处理物理学意义上的对称性了。

我们还是回到具有球对称性的薛定谔方程中来感受这件事情。

刚才我们提到,物理意义上的对称性,是指某个物理对象在某种变换下保持形式不变的性质。再具体一点说,这个物理对象可以是某个函数、可以是某个物理方程或者物理定律、也可以是某种共同的物理性质。

对于球对称势场中的粒子(比如氢原子模型)而言,我们会很自然地期待它的本征函数解也具有某种球对称性,这就意味着,这些本征函数必然有某种性质与空间中的方向无关,也就是在空间旋转变换下保持不变。

根据几何上最直观的猜测,我们可能会首先想到,本征函数的球对称性也许意味着:它的函数形式(以及函数图像)在空间旋转变换下保持不变,也就是说,如果我们将函数图像绕着某个轴旋转某个角度,它也仍然是原来的图像。

现在我们来看看实际是不是这样。


2) 球对称性还在吗?

在上节课中我们知道,氢原子的本征函数由径向和角向两部分组成:

$\small \psi_{nlm}(r,\theta,\varphi)=R_{nl}(r)Y_{lm}(\theta,\varphi) \quad{\scriptsize (式21.9)}$

其中径向函数只与半径$ \small r $有关而与角度无关,具有天然的球对称性,所以我们主要是来看角向解,也就是球谐函数$ \small Y_{lm}(\theta,\varphi) $是否也具有球对称性。

不难想象,如果$ \small Y_{lm}(\theta,\varphi) $具有几何意义上的球对称性、即函数值与方向无关,那么它的函数图像一定是一个球面(这个球面的半径是$ \small Y_{lm}(\theta,\varphi) $的函数值而不是一个空间距离)

由于球谐函数是一个复变函数,无法直接画出图像来,所以我们不妨转而求它的模平方,也就是电子出现在各个方向上的概率密度,通过概率密度函数$ \small \begin{align} f_{lm}(\theta,\varphi)&=\left|Y_{lm}(\theta,\varphi)\right|^2 \end{align} $来看看函数图像是否是球形[1]:

然后我们震惊了:除了$ \small f_{00}=\left|Y_{00}(\theta,\varphi)\right|^2 $以外,其他几个$ \small f_{lm} $对应的图像都不具有球对称性。

是不是我们对本征函数球对称性的物理直觉错了?

实际上,如果我们仔细想一想,就会意识到一件事情:在建立薛定谔方程之前,我们已经先建立了一个球坐标系,并且在其中预先指定了北极方向(也就是 $\small z $轴方向),然后我们才建立了具体的薛定谔方程、得到了本征函数解。

换句话说,本征函数的“特殊方向性”是和$ \small z $轴的方向选取绑定在一起的,而这种方向选取只是一种数学上的操作,物理上并不能真实地区分。

这样一来,无论我们选取哪个方向作为$ \small z $轴,最终都能得到一组方向不同、但在各自坐标系下形式完全相同的球谐函数作为方程的解。

反过来说,这就意味着,即使我们将球谐函数进行任意转动,转动后得到的新函数(相当于转动后的坐标系下解得的球谐函数)虽然不再与原来的函数重合,但它们仍然是同一能级的本征函数。本征函数的这种空间取向的任意性就是一种球对称。

而只要我们不去测量电子的能量,不让它坍缩到某个具体的本征态上,这种取向的任意性、或者说球对称性就不会被破坏。

不过,上面的讨论还只是停留在一种模糊的文字描述上,接下来,我们需要将这个物理直觉转化为数学语言,因为这将让我们再次体验一下物理直觉、微分方程和线性代数之间的美妙联系,同时也能为我们将来理解更多的对称性做好数学上的铺垫。


3) 方程解的球对称性

我们先从方程的角度来理解这个对称性。

由于我们是在解定态薛定谔方程,因此我们提到球对称模型的时候,其实主要说的是哈密顿算符的球对称性。

我们先将球坐标下的薛定谔方程中的哈密顿算符提取出来:

$\small H=-\frac{\hbar^2}{2m_e}\left[\frac{1}{r^2}\frac{\partial }{\partial r}\left(r^2\frac{\partial }{\partial r}\right)+\frac{1}{r^2\sin\theta}\frac{\partial }{\partial \theta}\left(\sin\theta\frac{\partial }{\partial \theta}\right)+\frac{1}{r^2\sin^2\theta}\frac{\partial^2 }{\partial \varphi^2}\right]+V(r)\quad{\scriptsize (式22.3)}$

所谓球对称,其实就意味着,在空间转动下,哈密顿算符的形式保持不变。

直觉上我们知道,三维空间中并没有哪个方向是特殊的,所以无论我们选取哪个方向作为球坐标的北极方向$($也就是$ \small z $方向$)$,方括号中关于动能的部分(对角度的导数)都会有相同的形式,也就是说,哈密顿算符的动能项在坐标方向的变换(也就是空间旋转变换)下保持形式不变。

而方括号外的势能项$ \small V(r) $以及径向动能项(对半径的导数)也与方向无关,所以它们在空间旋转变换下也具有不变的形式。

动能与势能两部分一合起来,整个哈密顿算符也就在空间旋转变换下具有了不变的形式,无论我们怎么选取坐标方向,它都是式22.3那个形式。

这就是哈密顿算符的球对称性。

现在我们将它作用在某个态$ \small \left|\psi\right> $上,来看看球对称势场中定态薛定谔方程的对称性:

$\small -\frac{\hbar^2}{2m_e}\left[\frac{1}{r^2}\frac{\partial }{\partial r}\left(r^2\frac{\partial \psi}{\partial r}\right)+\frac{1}{r^2\sin\theta}\frac{\partial }{\partial \theta}\left(\sin\theta\frac{\partial \psi}{\partial \theta}\right)+\frac{1}{r^2\sin^2\theta}\frac{\partial^2 \psi}{\partial \varphi^2}\right]+V(r)\psi=E\psi \quad{\scriptsize (式18.7)}$

由于哈密顿算符在空间旋转变换下具有不变形式,因此薛定谔方程本身在空间旋转变换下也不会发生改变。

也就是说,假设我们重新选了一个$ \small z' $轴,得到新的$ \small \left(r',\theta',\varphi'\right) $坐标,由于$ \small V(r) $项不受$ \small \theta,\varphi $变换的影响,因此旋转后它仍然还是原来那个函数形式,于是薛定谔方程还是原来那个形式:

$\small -\frac{\hbar^2}{2m_e}\left[\frac{1}{r^2}\frac{\partial }{\partial r}\left(r^2\frac{\partial \psi'}{\partial r}\right)+\frac{1}{r^2\sin\theta'}\frac{\partial }{\partial \theta'}\left(\sin\theta'\frac{\partial \psi'}{\partial \theta'}\right)+\frac{1}{r^2\sin^2\theta'}\frac{\partial^2 \psi'}{\partial \varphi'^2}\right]+V(r)\psi'=E\psi' \quad{\scriptsize (式22.4)}$

这就是整个模型的球对称性。

接下来我们来理解相应的本征函数的球对称性。

我们知道,如果方程形式不变,那么经过变换后的新方程求解出来的本征函数自然也就具有与原来相同的形式,仍然是$ \small R_{nl}(r) $乘以球谐函数的形式:

$\small \begin{align} \psi'_{nlm}(\theta',\varphi')=R_{nl}(r)Y_{lm}(\theta',\varphi') \end{align} \quad{\scriptsize (式22.5)}$

其中$ \small R_{nl}(r) $具有天然的球对称性,不需要再考虑。

而对于球谐函数而言,不难想象的是,如果我们将这里新得到的$ \small Y_{lm}\left(\theta',\varphi'\right) $放回旋转变换前的坐标系$ \small (r,\theta,\varphi) $中,那么它的函数形式将变为原坐标系$ \small (r,\theta,\varphi) $中的本征函数$ \small Y_{lm}\left(\theta,\varphi\right) $旋转到$ \small z' $轴所得到的那个新函数,它们的函数图像也会完全重合。

换句话说,当我们对一个球谐函数进行空间旋转时,旋转后得到的新函数仍然是同一个能量本征值对应的本征态(如果让$ \small z $轴也跟着旋转,那么将再次得到球谐函数的形式),而这个性质就保证了相同形式的本征函数取向的任意性(也就对应了$ \small z $轴取向的任意性),这就是我们要寻找的那个隐藏的球对称性。

接下来,我们要从另外一个更抽象的、也更具有线性代数味道的方式来证明这一点,这将让我们再次体会到物理方程和线性代数之间的微妙联系,也将有助于我们将来深入理解更多的对称性。


4) 球对称性的抽象证明

我们先来回顾第17课中曾经提到过的一个简单的线性代数例子:

假设一个矩阵$ \small A $是一个单位矩阵的常数倍,即:

$\small A=aI \quad{\scriptsize(式17.26)}$

那么它的特征值就只有一个$ \small a $,而在这种情况下,它的特征向量可以是任意一组正交基。

比如对于一个$3$×$3$矩阵$ \scriptsize A=\begin{bmatrix}a&0&0\\0&a&0\\0&0&a\end{bmatrix} $而言,它的特征向量组既可以是$ \small \begin{align} \boldsymbol \alpha_1=\left(\begin{matrix}1,0,0\end{matrix}\right)\end{align} $、$ \small \begin{align} \boldsymbol \alpha_2=\left(\begin{matrix}0,1,0\end{matrix}\right) \end{align} $、$ \small \begin{align} \boldsymbol \alpha_3=\left(\begin{matrix}0,0,1\end{matrix}\right) \end{align} $这种特殊的基底,也可以是其他任意一组单位正交基底。

这就意味着,虽然某一组特征向量在空间中具有特殊的方向性,但特征向量的取向的可能性却遍布了空间中所有方向,这就蕴含了矩阵$ \small A $的特征向量解的球对称性(而这也和球对称模型中本征函数的球对称性有着异曲同工之妙)。

现在,我们来把这件看起来很显然的事情证明一遍。

首先,我们可以证明,矩阵$ \small A $在旋转变换下的相似矩阵仍然是它自身,即:

$\small \boldsymbol A'=\boldsymbol R\boldsymbol A\boldsymbol R^{-1}=a\boldsymbol R\boldsymbol I\boldsymbol R^{-1}=a\boldsymbol I=\boldsymbol A \quad{\scriptsize (式22.6)}$

(顺便说一句,这里的旋转矩阵由所谓罗德里格斯公式给出:

$\small \boldsymbol R=\boldsymbol I+\sin\theta\boldsymbol N+(1-\cos\theta)\boldsymbol N^2 \quad{\scriptsize (式22.7)}$

其中,$ \small \boldsymbol I $是单位矩阵,而矩阵$ \small \boldsymbol N $由旋转轴单位向量$ \scriptsize \boldsymbol n=\left(\begin{matrix}n_x\\n_y\\n_z\end{matrix}\right) $的分量构成:$ \scriptsize \boldsymbol N=\left(\begin{matrix}0&-n_z&n_y\\n_z&0&-n_x\\-n_y&n_x&0\end{matrix}\right) $,它的好处是可以将向量的叉乘$ \small \boldsymbol n\times \boldsymbol u $化为矩阵相乘的形式:$ \small \boldsymbol n\times \boldsymbol u=\boldsymbol N\boldsymbol u $,方便运算和推导。

虽然我们知不知道这个矩阵都不妨碍式22.6的证明,但我们最好还是了解一下三维向量空间中的旋转矩阵长什么样)

现在,假设某个$ \small \boldsymbol \alpha $是$ \small \boldsymbol A $的特征向量:

$\small \boldsymbol A\boldsymbol \alpha=a\boldsymbol \alpha \quad{\scriptsize (式22.8)}$

然后我们将证明,它经过旋转变换后,得到的新的向量$ \small \boldsymbol \alpha'=\boldsymbol R\boldsymbol \alpha $仍然是$ \small \boldsymbol A $的特征向量。

证明其实很简单,首先形式上写出:

$\small \boldsymbol A\boldsymbol \alpha'=\boldsymbol A\boldsymbol R\boldsymbol \alpha \quad{\scriptsize (式22.9)}$

然后利用$ \small \boldsymbol A=\boldsymbol A'=\boldsymbol R\boldsymbol A\boldsymbol R^{-1} $,可得:

$\small \boldsymbol A\boldsymbol \alpha'=\boldsymbol R\boldsymbol A\boldsymbol R^{-1}\boldsymbol R\boldsymbol \alpha=\boldsymbol R\boldsymbol A\boldsymbol \alpha=\boldsymbol Ra \boldsymbol \alpha=a \boldsymbol R\boldsymbol \alpha=a \boldsymbol \alpha' \quad{\scriptsize (式22.10)}$

这就说明,$ \small \boldsymbol \alpha'=\boldsymbol R\boldsymbol \alpha $仍然是同一个矩阵$ \small \boldsymbol A $的特征向量,对应的特征值自然也是$ \small a$

现在,我们把这个证明原封不动地搬运到量子力学的态空间中。

以前我们提到,经典力学量在量子力学中变成了算符,现在,我么要把算符的概念再扩充一下:作用在态矢量上的任意线性变换操作,我们都可以表示为一个算符。

比如对于旋转变换而言,我们就可以用一个线性算符$\small \hat R$ 来表示旋转,并且假设,将一个态矢量$ \small \left|\psi\right> $进行旋转变换后得到另一个态矢量$ \small \left|\psi'\right> $的过程,可以表示成这样的乘积形式:

$\small \left|\psi'\right>=\hat R\left|\psi\right> \quad{\scriptsize (式22.11)}$

(注意:态矢量是抽象的态空间中的向量,而旋转变换却是三维欧氏空间中的变换,当这个变换作用在三维欧氏空间中的向量上时,它就是前面提到的罗德里格斯公式给出的旋转矩阵 $\small \boldsymbol R $,但现在它要作用在抽象的态空间上,这会给我们带来一点困扰:作用在抽象的态空间上的旋转变换$ \small \hat R $具体是个什么样的形式?这一点我们后面会讨论)

同理,哈密顿算符作为一个类似于矩阵的东西,在旋转变换下也满足相似变换的规律:

$\small \hat H'=\hat R\hat H\hat R^{-1} \quad{\scriptsize (式22.12)}$

(这其实也是一种表象变换,是两个不同方向的球坐标表象之间的变换)

接下来,我们将前面例子中的矩阵$ \small \boldsymbol A $替换为哈密顿算符$ \small \hat H $,特征向量$ \small \boldsymbol \alpha $替换为能量本征态$ \small \left|\psi_{nlm}\right> $,然后证明就很简单了。

我们假设某个态$ \small \left|\psi_{nlm}\right> $是能量$ \small E_n $对应的本征态,即:

$\small \hat H\left|\psi_{nlm}\right>=E_n\left|\psi_{nlm}\right> \quad{\scriptsize (式22.13)}$

现在要证明的就是,旋转变换后得到的$ \small \left|\psi'_{nlm}\right>=\hat R\left|\psi_{nlm}\right> $仍然是能量$ \small E_n $对应的本征态,即:

$\small \hat H\left|\psi'_{nlm}\right>=\hat H\hat R\left|\psi_{nlm}\right>=E_n\hat R\left|\psi_{nlm}\right> \quad{\scriptsize (式22.14)}$

而我们从物理上(虽然我们还没有进行严格的数学证明)已经知道,哈密顿算符在旋转变换下具有不变性,即:

$\small \hat H=\hat R\hat H\hat R^{-1} \quad{\scriptsize (式22.15)}$

于是我们可以得到:

$\small \begin{align} \hat H\left|\psi'_{nlm}\right>&=\hat H\hat R\left|\psi_{nlm}\right>=\left(\hat R\hat H\hat R^{-1}\right)\hat R\left|\psi_{nlm}\right>=\hat R\hat H\left|\psi_{nlm}\right>\\&=\hat RE_n\left|\psi_{nlm}\right>=E_n\hat R\left|\psi_{nlm}\right>=E_n\left|\psi'_{nlm}\right> \end{align} \quad{\scriptsize (式22.16)}$

这样,我们就用代数方法证明了,$ \small \left|\psi_{nlm}\right> $经过旋转变换后得到的$ \small \left|\psi'_{nlm}\right>=\hat R\left|\psi_{nlm}\right> $仍然是相同能级对应的能量本征态。


5) 总结与预告

这节课里,我们解开了一个初学者常常会遇到的心结:

对于球对称的氢原子问题,它的本征函数解是否也具有球对称性?

然后我们分别通过微分方程和代数方法证明了:

一组本征函数在任意的空间旋转变换下得到的仍然是另一组本征函数,这就保证了本征函数在空间中取向的任意性,而这本身也就蕴含了一种球对称性(尽管由于坐标选取的特殊性导致每一组本征函数都有一个特殊取向)

而通过这两种证明路径,我们再一次看到了微分方程和线性代数之间的异曲同工之妙。

而这个结果使我们确信:即使本征函数解本身没有显示出几何直观上的球对称性,但它经过旋转变换后仍然构成了同一能级对应的本征函数,这就雨露均沾地保证了各个方向的$ \small R_{nl}(r)Y_{lm}(\theta,\varphi) $都可以作为一组本征函数(而与$ \small \theta,\varphi $的选取无关),这种“任意方向上成为本征函数的可能性”,就是一种球对称性。

这种意义下,我们其实可以认为,任意方向的$ \small z $轴以及相应的本征函数形式都只是数学选取的结果,而不具备“真实的”物理意义,因此物理上的对称性(也就是本征函数取向的可能性)并没有被破坏。

只有通过物理手段“真实地”规定了某个特殊方向,它的特殊性才会显现出来,而这个“真实地规定”的过程就必然会产生该方向上的能量扰动,同时对称性也就被破坏了。

比如后面我们将会看到,当我们给一个氢原子加上某个特定方向的外场时将会发生的事情。

不过,在进入后面的内容之前,我们其实还遗留了一个问题悬而未决:

前面我们给出了本征态或者本征函数在旋转作用下的式子:$ \small \left|\psi'_{nlm}\right>=\hat R\left|\psi_{nlm}\right> $,但这只是一个抽象的形式,而我们很好奇,作用在抽象的态空间或者具体的函数空间中上的旋转算符具体是个什么样子?(它显然不再是作用在三维向量空间中的那个罗德里格斯公式给出的矩阵)

这个问题本来是要放到将来正式讨论对称性的时候再回答,不过这里我们不妨先来一点剧透,有兴趣的同学可以先体验一下。


剧透:抽象空间中的变换形式

我们先来看看,对一个函数进行空间变换操作(这也就包括了我们本课提到的旋转变换)时,变换的算符具体是什么样子。

为了简单直观,我们先来考察一种最简单的空间变换:一元函数的平移变换,比如将一个一元函数$ \small f(x) $向右平移$ \small \Delta x $的距离,得到一个新的函数$ \small g(x) $:

从上面的图中可以看出这样的等式关系:

$\small g(x+\Delta x)=f(x) \quad{\scriptsize (式22.17)}$

反过来就是:

$\small g(x)=f(x-\Delta x) \quad{\scriptsize (式22.18)}$

于是我们找到了平移变换的简单规则。

不过事情到此还没了结,因为这个变换还是从函数的“内部”作用在自变量上面,而我们想看到的,是一个算符从“外部”作用在$ \small f(x) $上、得到$ \small g(x) $:

$\small g=\hat Tf \quad{\scriptsize (式22.19)}$

这似乎和$ \small g(x)=f(x-\Delta x) $这种形式完全搭不上界。

但实际上物理学家们还是挺有办法的。

我们马上就来欣赏一段让人目瞪口呆但又挑不出毛病的绝(liu)妙(mang)推导[2]。

我们先将$ \small g(x)=f(x-\Delta x) $做泰勒展开:

$\small \begin{align} g(x)&=f(x-\Delta x)\\ &=\sum_{n=0}^{\infty}\left(-\Delta x\right)^n\frac{1}{n!}f^{(n)}(x)\\ &=\sum_{n=0}^{\infty}\frac{1}{n!}\left(-\Delta x\right)^n\left(\frac{\text d}{\text dx}\right)^nf(x)\\ &=\left[\sum_{n=0}^{\infty}\frac{1}{n!}\left(-\Delta x\right)^n\left(\frac{\text d}{\text dx}\right)^n\right]f(x) \end{align} \quad{\scriptsize (式22.20)}$

然后我们会发现,方括号里的东西其实可以在形式上写成这样:

$\small \sum_{n=0}^{\infty}\frac{1}{n!}\left(-\Delta x\right)^n\left(\frac{\text d}{\text dx}\right)^n=\exp\left(-\Delta x\frac{\text d}{\text dx}\right) \quad{\scriptsize (式22.21)}$

只要我们假装$ \small \frac{\text d}{\text dx} $是一个数而不是一个算子,就能克服心理上的不适应了(在量子力学中很容易“假装它是一个数”,你先猜猜这是为啥,答案过两行就公布)。

于是,我们形式上得到了对函数的平移操作的线性算符:

$\small g=\hat Tf=\exp\left(-\Delta x\frac{\text d}{\text dx}\right)f \quad{\scriptsize (式22.22)}$

如果我们想起$ \small \hat p_x=-\text i\hbar\frac{\text d}{\text dx} $,那么我们就能把微分算子假装看作一个数(动量),于是上面的线性算子就可以更自然地写成:

$\small \sum_{n=0}^{\infty}\frac{\text i}{\hbar}\frac{1}{n!}\left(-\Delta x\right)^n\left(\hat p\right)^n=\exp\left(-\frac{\text i\Delta x}{\hbar}\hat p_x\right) \quad{\scriptsize (式22.23)}$

相应地,我们就能将平移变换写成:

$\small g=\hat Tf=\exp\left(-\frac{\text i\Delta x}{\hbar}\hat p_x\right)f \quad{\scriptsize (式22.24)}$

这就得到了我们所期待的、一个线性算子“从外部”作用在函数上的形式。

而对于转动变换而言,我们也有相同的思路,只是这个推导更加复杂,但好在我们是物理爱好者,有时候可以靠物理直觉来猜一个结果。

前面我们看到,空间平移的算子中包含了对位置的求导,而这个求导算子又和动量算符产生了联系,因此我们最终将平移变换表示成了动量算符的指数函数形式(还记得我们在第17课中曾经提到过的一个名词吗:动量算符是平移变换的“生成元(Generator)”,现在是不是对这个词有点感觉了?)。

那么,类比之下,空间旋转是不是也会和某个算符产生联系呢?这个其实也很容易猜到,与空间旋转相联系的,应该就是角动量算符,于是函数的空间旋转变换就可以在形式上写成:

$\small g=\hat Rf=\exp\left(-\frac{\text i\theta}{\hbar}\boldsymbol n\cdot\hat {\boldsymbol J}\right)f \quad{\scriptsize (式22.25)}$

(其中$ \small \boldsymbol n $是旋转轴对应的单位向量,它和角动量算符的内积就是$ \small \boldsymbol n\cdot\hat{\boldsymbol J}=n_x\hat{J}_x+n_y\hat{J}_y+n_z\hat{J}_z )$

如果写成具体的函数形式,一个函数$ \small f(\boldsymbol x) $在空间旋转算符的作用下,就会生成这样的变换:

$\small \hat Rf=f(\boldsymbol R^{-1}\boldsymbol x) \quad{\scriptsize (式22.26)}$

(注意:自变量是加粗的向量符号,即位矢$ \small \boldsymbol x=(x,y,z)^T )$

其中:$ \small \boldsymbol R $就是由罗德里格斯公式给出的旋转矩阵(同学们可以思考一下为什么括号里是它的逆矩阵)。

到此,我们就完成了作用在函数上的空间变换算符的引入,这些算符将在未来引导我们去游览一个抽象又迷人的对称世界。

顺便再说一句:我们在这里也看到,同样的空间变换算符,作用在不同空间上会有不同的形式,我们现在看到了它作用在欧氏空间和函数空间上的样子,以后我们还会看到它作用在其他奇怪的空间上,现在有了这个心理准备,我们将来看到其他奇怪的变换的时候,就不会觉得突兀了。


参考

  1. 这个链接有绘制球谐函数的MATLAB代码: https://blog.csdn.net/weixin_42524013/article/details/115846833
  2. 张永德, 《量子力学(第四版)》, P157~158

编辑于 2022-07-13 14:39

从线性代数到量子力学(21):氢原子薛定谔方程求解过程赏析(下)

PeiLingX
物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》第21课。

本系列及本专栏其他文章,建议收藏目录:

专栏文章总目录


0) 前情提要

上节课里,我们首先梳理了整个氢原子薛定谔方程的求解思路:分化瓦解、逐个击破。

我们根据$ \small \hat H,\hat L^2,\hat L_z $具有共同本征态的特点、以及各个偏导数与算符的球坐标表象之间的关系,可以将方程化为分别与$ \small \varphi,\theta,r $有关的三个层层嵌套的常微分方程,求解它们,我们就可以分别得到方程解中关于$ \small \varphi,\theta,r $的部分。

而在这个过程中我们看到,整个方程的解正好就是三个部分的乘积:

$\small \psi(r,\theta,\varphi)=R(r)\varTheta(\theta)\varPhi(\varphi) \quad{\scriptsize (式20.14)}$

而我们在上节课已经找出了角向的两个解$ \small \varTheta(\theta) $和$ \small \varPhi(\varphi) $,以及相应的角动量本征值,这节课,我们就来解决剩下的径向解,完成整个方程解的最后一块拼图,然后我们会简单体验一下方程解的一些物理意义。


1) 氢原子方程的径向解

上节课我们提到,薛定谔方程可以分解为径向和角向两部分:

$\small \begin{align} E\left|\psi\right>&=\left(\frac{1}{2m_e}\hat p_r^2+\hat V\right)\left|\psi\right>+\frac{1}{2m_er^2}\hat L^2\left|\psi\right> \end{align} \quad{\scriptsize (式20.1)}$

如果我们将$ \small \hat L^2 $的本征值$ \small \lambda$ (式20.10右边)作为已知条件代入总的薛定谔方程中,就能消去所有与$ \small \theta,\varphi $有关的项(因为它们都包含在角动量平方算符内)。

再将动量算符还原到球坐标表象下,那么我们就能将整个方程化为:

$\small -\frac{\hbar^2}{2m_e}\left[\frac{1}{r^2}\frac{\partial }{\partial r}\left(r^2\frac{\partial }{\partial r}\right)+\frac{\lambda}{r^2}\right]\psi+V(r)\psi=E\psi \quad{\scriptsize (式20.13)}$

而上节课我们已经求得,角动量平方的本征值为:

$\small \lambda=l(l+1)\hbar^2 \quad{\scriptsize (式20.27)}$

将它代入总的薛定谔方程中,就得到:

$\small -\frac{\hbar^2}{2m_e}\left[\frac{1}{r^2}\frac{\partial }{\partial r}\left(r^2\frac{\partial }{\partial r}\right)+\frac{l(l+1)}{r^2}\right]\psi+V(r)\psi=E\psi \quad{\scriptsize (式21.1)}$

这个方程的解和势函数的具体形式有关,我们将氢原子的库仑势代入,就得到:

$\small -\frac{\hbar^2}{2m_e}\left[\frac{1}{r^2}\frac{\partial }{\partial r}\left(r^2\frac{\partial }{\partial r}\right)+\frac{l(l+1)}{r^2}\right]\psi-\frac{1}{4\pi\epsilon_0}\frac{e^2}{r}\psi=E\psi \quad{\scriptsize (式21.2)}$

再考虑到分离变量函数$ \small \psi=R(r)\varTheta(\theta)\varPhi(\varphi) $中,$ \small \varTheta(\theta),\varPhi(\varphi) $都和$ \small r $无关,可以作为系数左右约掉,于是方程就正式变成了$ \small R(r) $的常微分方程:

$\small -\frac{\hbar^2}{2m_e}\left[\frac{1}{r^2}\frac{\text d }{\text d r}\left(r^2\frac{\text d }{\text d r}\right)+\frac{l(l+1)}{r^2}\right]R(r)-\frac{1}{4\pi\epsilon_0}\frac{e^2}{r}R(r)=ER(r) \quad{\scriptsize (式21.3)}$

这个方程看起来也不太友好,但仍然是可以求解的,只是求解过程更加繁琐一些,我们依然省略求解过程直接给出答案[1]:

$\small R(r) $的解具有这样的形式:

$\small R_{nl}(r)=N_{nl}\cdot r^l\cdot \exp\left({-\frac{1}{n}\frac{r}{\rho_B}}\right)\cdot \text F\left(-n+l+1,2l+2,\frac{2}{n}\frac{r}{\rho_B}\right) \quad{\scriptsize (式21.4)}$

这个式子里出现了很多陌生的符号和函数,我们一个个来解释:

  • 序号$ \small n $称作“主量子数”,它是整个能量本征值的序号(也就是玻尔能级的序号),我们等一下再讨论它;
  • $\small N_{nl} $是归一化系数(以使整个本征函数在全空间的概率积分等于1),展开写就是:

$\small N_{nl}=\left(\frac{2}{n\rho_B}\right)^l\cdot\sqrt{\frac{1}{\rho_B^3}\frac{(n+l)!}{(n-l-1)!}}\cdot\frac{2}{n^2(2l+1)!} \quad{\scriptsize (式21.5)}$

  • $\small \rho_B=\scriptsize \frac{4\pi\epsilon_0\hbar^2}{m_e e^2} $,称为玻尔半径,是一个具有长度量纲的常数,大小约为$ \small 0.53\ \text{A} $,我们在玻尔能级公式里其实看到过这个因子,它经常作为一个整体出现,并且尺度也和氢原子基态电子“轨道半径”相当,因此我们将它单独作为一个常数;
  • 出现在公式最后那一项的函数$ \small \text F $叫做合流超几何函数(Confluent Hypergeometric Function),它是这样一个幂级数:

$\small \text F(a,b,x)=\sum_{k=0}^{\infty}{C_k\frac{x^k}{k!}} \quad{\scriptsize (式21.6)}$

其中系数$ \small C_k $由下面的递推式给出:

$\small \left\{\begin{align} &C_{k+1}=\frac{a+k}{b+k}C_k\\ &C_0=1 \end{align}\right. \quad{\scriptsize (式21.7)}$

展开写就是:

$\small \text F(a,b,x)=1+\frac{a}{b}x+\frac{a(a+1)}{b(b+1)}\frac{x^2}{2!}+\frac{a(a+1)(a+2)}{b(b+1)(b+2)}\frac{x^3}{3!}+\cdots \quad{\scriptsize (式21.8)}$

而如果将径向本征函数解和角向解合并到一起,我们就得到了整个能量本征函数:

$\small \psi_{nlm}(r,\theta,\varphi)=R_{nl}(r)Y_{lm}(\theta,\varphi) \quad{\scriptsize (式21.9)}$

下面我们来看看各个本征函数对应的能量本征值。


2) 能量本征值与能级简并

在我们上面求解的关于$ \small r $的微分方程中,其实已经包含了构成总能量的所有项(只不过径向组仍然以算符形式存在,而角向组已经化成了本征值),因此求解这个方程得到的本征值也就是电子的能量本征值了。

毫无意外地,这个能量本征值就是玻尔能级公式(这也是为什么当年薛定谔方程一出场就惊艳了整个物理世界):

$\small E_n=-\frac{1}{n^2}\frac{m_e e^4}{8h^2\varepsilon_0^2} \quad {\scriptsize(式16.20)}$

但是等一等,如果仔细思考一下,我们会发现一个问题:

能量本征函数$ \small \psi_{nlm} $对应着三个量子数$ \small n,l,m $,而这里得到的能量本征值只与$ \small n $有关,与$ \small l,m $无关,这就意味着,同样的能级$ \small E_n $可能对应着不同的$ \small l,m $,也就是说,能级$ \small E_n $是简并的。

我们先来算一算它的简并度,然后简单聊一聊这背后的物理意义。

由于$ \small m $的信息是隐藏在$ \small l $当中的(对应着$ \small L^2 $的简并),因此计算能级简并度时,我们其实只需要知道:

一个$ \small n $最多可以对应多少个$ \small l $?

这个问题的答案,还是要回到本征函数的径向解中去寻找,具体地说,我们要从径向解的收敛性说起。

在这里,我们将省略详细的计算[2],只定性地介绍这个思路。

我们首先注意到,径向解中出现的合流超几何函数和指数函数$ \small e^x $的泰勒展开有点像(就多了个系数),并且,很容易看出,随着$ \small x\rightarrow \infty $,这个函数是发散的。

而在径向解$ \small R_{nl} $中,虽然$ \small \text F\scriptsize\left(-n+l+1,2l+2,\frac{2}{n}\frac{r}{\rho_B}\right) $前面乘了一个衰减的指数因子$ \small \exp\scriptsize\left({-\frac{1}{n}\frac{r}{\rho_B}}\right) $,但即使是这样,如果$ \small \text F $是一个最高次数没有限制的无穷级数,最终的乘积在$ \small r\rightarrow\infty $时仍然是发散的[3]。

而我们在第10课的讨论中曾经提到过,束缚态的能量本征函数在无穷远处是收敛的(也就是粒子出现在无穷远处的概率为0)。

从数学上来说,这就要求我们通过某些限制条件,将$ \small \text F $截断成一个有限的多项式,这样,当它乘以一个衰减的指数因子时,整个径向函数才能在无穷远处收敛。

具体怎么做呢?

我们看到,合流超几何函数中,第$ \small k $项的系数为:

$\small C_{k}=\frac{a(a+1)\cdots\left(a+k-1\right)}{b(b+1)\cdots\left(b+k-1\right)} \quad{\scriptsize (式21.10)}$

如果$ \small a $是$0$或某个负整数,比如我们记$ \small a=-n_r ( \small n_r=0,1,2\cdots )$,那么当$ \small k-1=n_r $的时候,$ \small C_k $以及更高次项系数的分子中,都会出现$ \small a+k-1=-n_r+n_r=0 $的因子,这将使$ \small C_k $以及更高次项的系数全部变成$0$。

这样,合流超几何函数就变成了一个只有$ \small n_r $项的有限多项式,如果再乘上衰减因子$ \scriptsize \exp\scriptsize\left({-\frac{1}{n}\frac{r}{\rho_B}}\right) $,就会随着$ \small x\rightarrow \infty $收敛到$0$,这也就使得径向函数具有了束缚态的意义。

回到$ \small \text F\scriptsize\left(-n+l+1,2l+2,\frac{2}{n}\frac{r}{\rho_B}\right) $中,就对应着:

$\small -n+l+1=-n_r\ \Rightarrow\ n_r=n-l-1 \quad{\scriptsize (式21.11)}$

这里定义的$ \small n_r $称为“径向量子数”,我们可以用它重新将合流超几何函数写为:

$\small \text F\scriptsize\left(-n+l+1,2l+2,\frac{2}{n}\frac{r}{\rho_B}\right) \ \rightarrow\ \text F\scriptsize\left(-n_r,2l+2,\frac{2}{n}\frac{r}{\rho_B}\right) \quad{\scriptsize (式21.12)}$

现在我们来看角量子数的取值范围。

根据上面的等式关系,我们可以知道:

$\small l=n-n_r-1 \quad{\scriptsize (式21.13)}$

由于$ \small n_r\geq 0 $,因此角量子数的取值范围就是:

$\small l=0,1,2,\cdots,n-1$

于是,同一个能级$ \small E_n $就包含着$ \small n-1 $重的角量子数。而再考虑到一个角量子数$ \small l $中还包含了$ \small 2l+1 $个磁量子数,因此整个能级$ \small E_n $的简并度就是:

$\small D_n=\sum_{l=0}^{n-1}\left(2l+1\right)=n^2 \quad{\scriptsize (式21.14)}$

读到这里,也许有同学会好奇,这个简并背后的物理意义是什么?

首先,我们需要知道的是,其实并不是所有的球对称势场中都存在能级简并。比如我们现在讨论的简并,其实就只会出现在形如$ \small V(r)=\scriptsize-\frac{k}{r} $的势函数中。

粗略地看起来,总能量的简并只是意味着某些径向能量值与角向能量值的组合恰好相等,这似乎只是$ \small V(r)=\scriptsize-\frac{k}{r} $这样的势函数导致的巧合而已。

但其实这个简并背后蕴含着更深层次的物理图景。

所谓更深层次的物理图景,与一个名叫拉普拉斯-龙格-楞次矢量(Laplace-Runge-Lenz Vector, LRL Vector)的守恒量有关,具体等我们未来正式讨论对称性的时候再来介绍[4]。

在本节课的最后,我们要来解决第16课曾经提到过的玻尔模型的缺陷:无法解释为什么氢原子核外电子不会从基态继续跌落到原子核中。


3) 永不跌落的电子

所谓“核外电子不会跌落到原子核中”,在量子力学中,其实就意味着一件事情:电子出现在原子核附近的概率为0,所以接下来的事情也很简单:只要我们能通过电子的波函数来算出这个概率就完事儿了。

我们以基态波函数为例来算一算。

基态意味着电子的主量子数为最小值1,而角量子数和磁量子数都是0,即:

$\small n=1,\ l=m=0$

将$ \small l,m $代入上节课的式20.24和式20.25,我们可以得到这个本征态对应的角向解为:

$\small Y_{00}(\theta,\varphi)=\sqrt{\frac{1}{4\pi}} \quad{\scriptsize (式21.15)}$

而将$ \small n,l $代入式21.4,可得径向解为:

$\small R_{10}(r)=\frac{2}{\sqrt{\rho_B^3}}\exp{\left(-\frac{r}{\rho_B}\right)} \quad{\scriptsize (式21.16)}$

于是波函数为:

$\small \psi_{100}=\frac{1}{\sqrt{\pi\rho_B^3}}\exp\left(-\frac{r}{\rho_B}\right) \quad{\scriptsize (式21.17)}$

于是相应的概率密度就是:

$\small \left|\psi_{100}\right|^2=\frac{1}{\pi\rho_B^3}\exp\left(-\frac{2r}{\rho_B}\right) \quad{\scriptsize (式21.18)}$

算到这一步,同学们是不是发现事情有点不对劲:

当$ \small r=0 $时,这个概率密度居然不是$0$,而是$ \small \frac{1}{\pi\rho_B^3} $,这是不是意味着电子出现在原子核处的概率不是0 (而且这个位置还是概率密度的最大值)?

别急,我们来认真理一理“电子出现在某处的概率”这个表述的真实含义:

由于氢原子模型是球对称的,因此当我们讨论电子出现在“某处”时,其实应该理解为电子出现在半径为某个$ \small r $附近的概率。

而“半径某个$ \small r $附近”可以理解为一个球壳,它与原子核的距离为$ \small r $、厚度为$ \small \text dr$

而电子出现在这个球壳中的概率就是:

$\small \text dP=\left|\psi_{100}\right|^2\cdot 4\pi r^2\text dr=4\left(\frac{r}{\rho_B}\right)^2\exp\left(-2\frac{r}{\rho_B}\right)\text d\left(\frac{r}{\rho_B}\right) \quad{\scriptsize (式21.19)}$

我们可以求出它对半径$ \small r $的概率密度分布函数:

$\small f(r)=\frac{\text dP}{\text dr}=\frac{4}{\rho_B}\left(\frac{r}{\rho_B}\right)^2\exp\left(-2\frac{r}{\rho_B}\right)\quad{\scriptsize (式21.20)}$

可以看出,当$ \small r=0 $时,$ \small f(0)=0 $,也就是电子出现在原子核附近的概率为0

(可以看出,只要概率密度函数不是$2$阶以上的无穷大,这个概率密度就必然会在$ \small r\rightarrow 0 $时收敛)

这就让我们相信,电子不会坠落到原子核中,因此我们身边的世界是稳定的。

不过,推导到这里,我们还可以再进一步,顺手完成另一件事情。

如果我们将$ \small f(r) $的图画出来:

横坐标为电子到原子核的距离$ ($单位:埃)

我们会发现,电子出现概率最大的地方是在$ \small r=\rho_B=0.53\ \text{A} $处、也就是玻尔半径附近的球壳里,这也就与玻尔的原子模型对上号了。

(关于这个极值点的数学证明也很简单,同学们自己试一下吧)

这样,我们就看到,通过求解氢原子方程,我们能得到玻尔模型所能得出的结论,也能解释玻尔模型不能解释的事情,这也是为什么薛定谔方程一面世就惊艳四座。


4) 总结与预告

这节课,我们完成了求解氢原子薛定谔方程的后半部分,得到了方程的径向解,并且顺手解释了玻尔氢原子模型所不能解释的问题:为什么电子不会坠落到原子核中。

而在求解过程中,我们发现,对于库仑势这种特殊的势场而言,电子的能级也存在着一种简并,这种简并看起来只是因为某些径向能量值与角向能量值的组合恰好相等,似乎是一种偶然的结果,但其实它的背后也蕴含着一种不那么明显的对称性。

关于这种对称性,我们放到以后再来介绍,而在下节课里,我们要先回到角向解,来体验一个物理图景相对比较直观的角向解的对称性。

我们在第18课中曾经提到:由于球坐标的定义问题,$ \small z $轴方向看起来要比其他方向更特殊一些,这会导致薛定谔方程的本征函数解也会展现出围绕$ \small z $轴的中心对称性(我们下节课会展示这一点)、但对于其他方向(比如$ \small x,y $方向)而言却并不对称,这使得解的球对称性看起来像是被破坏了。

但另一方面,在物理上我们凭直觉都能知道,球对称势下方程的解不应该存在任何方向上的不对称。

那么这种矛盾怎么解决呢?我们下节课就来聊一聊。

参考

  1. 求解过程仍然是几乎所有量子力学教材上都会记载,作者读过的书里感觉交待得比较清楚的是卢文发的《量子力学与统计力学》。
  2. 详细计算可参考钱伯初《量子力学》第181~182页
  3. 仍然推荐参考钱伯初《量子力学》第181~182页
  4. 想提前了解的同学,可以阅读樱井纯《现代量子力学(第2版)》中译本第194~198页的内容,不过这个矢量的物理图景以及背后的对称性都非常隐匿和抽象,即使看了书,我们也很难对它形成一个直观认识,所以如果看完觉得没看懂,不要怀疑自己,也不要责怪教材,这就不是一个能直观理解的对象。

编辑于 2022-06-08 12:19