从线性代数到量子力学(10):薛定谔方程解与分立能级

PeiLingX

物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》的第10课。

了解本系列其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

在第1课的开篇语中,我们曾经提到过,要从量子力学的数学本质的角度,来理解粒子在束缚条件下为什么会存在分立能级(这也正是“量子”一词的最初来源 )。

而在第6课中,我们又提到,分立能级的本质,就是(势场束缚下 )哈密顿算符对应的能量本征值,类比到线性代数中矩阵的特征值只能取到一些离散值而不是整个实数域,我们就能从一个抽象的角度理解分立能级的存在。

但这毕竟还只是一种类比的理解,而不是真正的推导和计算。本课里,我们将通过一个简单的例子,求解一遍薛定谔方程,算出这种分立的能级来。

准确地说,我们需要求解的,其实是薛定谔方程的“空间部分”,也就是我们在第8课见到的定态薛定谔方程

$\small \left[-\frac{\hbar^2}{2m}\nabla^2+V(x,y,z)\right]\psi=E\psi \quad\scriptsize{(式8.18)}$

因为它本质上就是能量的本征方程,所以从它出发得到能量的本征值以及本征态,是理所当然的事情。

(学过数学物理方程的同学不难想到,这个方程可以通过对薛定谔方程分离变量求解,不过不知道什么是分离变量法也没关系,我们以后会解释,它和常微分方程的分离变量法稍微有些不一样,但也还是比较容易理解的 )

这一课,我们就来体验一下这个求解过程。


1) 哈密顿算符与势能

首先,我们要再温习一下第9课中提到的一个常识:哈密顿算符是随着势能的变化的。

在第8课中,我们提到,定态薛定谔方程(式8.18 )左边括号中第一项是动能算符 $\small \hat{T}=\frac{\hat{p}^2}{2m}$ 在坐标表象下的具体形式,第二项是势能算符 $\small \hat{V}$ 在坐标表象下的具体形式。

我们在第9课中又顺便提到过,这两项中,动能项的函数形式是固定不变的(永远是 $\small \frac{\hat p^2}{2m} $),而第二项的函数式却会随着势能条件而改变,从而给出不同的哈密顿算符,最终也会得到不同的能量本征值和本征态序列(以波函数形式呈现,又叫本征函数 )。

比如,在氢原子的薛定谔方程中、势能函数为库仑势:

$\small V(x,y,z)=-\frac{1}{4\pi\varepsilon_0}\frac{e^2}{\sqrt{x^2+y^2+z^2}} \quad\scriptsize{(式10.1)}$

这个势能通常被写成球对称的形式:

$\small V(r)=-\frac{1}{4\pi\varepsilon_0}\frac{e^2}{r} \quad\scriptsize{(式10.2)}$

在这个势能条件下,我们将通过一段复杂的计算,得到一系列能量本质值和本征函数解(同时认识一大堆特殊函数 ),这些本征值看起来完全符合玻尔氢原子模型:

$\small E_n=-\frac{1}{n^2}\frac{m_e e^4}{8h^2\varepsilon_0^2} \quad {\scriptsize(式10.3)}$

但以后我们会知道,它们对应的本征函数还包含着波尔理论无法触及的更精妙的结构,不过这些内容需要单独展开介绍,我们将它放到本系列的进阶篇里(第16课以后 )去体会。

为了用更快的方式达到我们这节课的目的(感受求解薛定谔方程和分立能级来源的过程 ),我们将找一个最简单的势能模型(比真空中的球形鸡还简单 ),着手寻找分立能级,这个模型叫作“一维无限深势阱”。

它的好处在于,简单易懂的同时又能保持风味不减,在它的求解过程中,我们仍然能完整体会到求解薛定谔方程寻找分立能级的乐趣。

(也正因为如此,大部分量子力学教材都把它作为求解薛定谔方程的第一个案例 )

而且,还有一点很重要的是,它的本征函数形式也非常简单,简单到我们一眼就能认出来。


2) 一维无限深势阱

这个物理模型是这样的:

一个粒子被囚禁在一个宽度为 $\small L$ 的、两端“封闭”的一维势场内,这个势场内部势能为0,外部势能为无穷大,这样的情形下,粒子将没有任何可能从势场两端逃逸出。

为了有个物理直观,我们可以想象一段有限长导线内的一个电子,它在导线内可以自由移动,但到了导线边缘,就会被来自导线内部的强大库仑势束缚住,几乎无法逃逸出去。

我们将其中一端的坐标设为0,另一端坐标设为 $\small L$,那么势能函数为:

$\small V(x)=\begin{cases} 0 & x\in\left(0,L\right)\\ +\infty & \text{otherwise} \end{cases} \quad\scriptsize{(式10.4)}$

于是在粒子所在的势阱内,势能项变成0,方程简化为没有势能项的形式:

$\small -\frac{\hbar^2}{2m}\frac{\text d^2}{\text d x^2}\psi=E\psi \quad\scriptsize{(式10.5)}$

对于这样一个二阶线性微分方程,我们可以很快知道,它的解具有这样的形式:

$\small \psi(x)=A\sin{(kx)}+B\cos{(kx)} \quad\scriptsize{(式10.6)}$

其中 $\small k=\frac{\sqrt{2mE}}{\hbar}$ ,可以看出,它就是这个波的波数。

而根据这个物理情形的假设,粒子出现在势阱区域外的概率为0,结合波函数的概率诠释,这就意味着:

$\small |\psi(x)|^2\equiv 0\quad (x\notin(0,L)) \quad\scriptsize{(式10.8)}$

也就意味着:

$\small \psi(x)\equiv 0\quad (x\notin(0,L)) \quad\scriptsize{(式10.9)}$

而波函数在势阱内连续,不可能在边界发生突变,所以势阱两端边界上的波函数也一定为0,这样我们可以得到这个方程的两个边界条件:

$\small \psi(0)=0, \ \psi(L)=0 \quad\scriptsize{(式10.10)}$

根据第一个边界条件,我们可以得出 $\small B=0$ ,这样,波函数简化为:

$\small \psi(x)=A\sin{(kx)} \quad\scriptsize{(式10.11)}$

再根据第二个边界条件,我们有:

$\small A\sin{\left(kL\right)}=0 \quad\scriptsize{(式10.12)}$

这意味着 $\small A=0$ 或 $\small \sin{\left(kL\right)}=0$ ,而前者将导致整个波函数为0,变为平凡解,不符合物理事实,所以我们取:

$\small \sin{\left(kL\right)}=0 \quad\scriptsize{(式10.13)}$

这就意味着 $\small k$ 有多个解:

$\small k_n=\frac{n\pi}{L}\ (n=1,2,3,\cdots) \quad\scriptsize{(式10.14)}$

所以方程的特解为一个三角函数序列:

$\small \psi_n(x)=A\sin{\left(\frac{n\pi}{L}x\right)} \ (n=1,2,3,\cdots) \quad\scriptsize{(式10.15)}$

在这里,系数 $\small A$ 还未确定,但这并不是那么重要,我们等一下再想办法确定它,而现在对我们来说,最重要的是找出能量的本征值。

根据前面的定义,我们有:

$\small k^2=\frac{2mE}{\hbar^2} \quad\scriptsize{(式10.16)}$

于是我们可以得到:

$\small E=\frac{\hbar ^2k^2}{2m} \quad\scriptsize{(式10.17)}$

而由于 $\small k$ 只能取一些分立值 $\small k_n=\frac{n\pi}{L}$ ,这就意味着能量也只能取分立值:

$\small E_n=\frac{n^2\pi^2\hbar ^2}{2mL^2} \quad\scriptsize{(式10.18)}$

这样,我们就得到了分立的能量本征值。

有了本征值,我们自然会想到相应的本征态。

显然,在这个问题中,能量的本征态,在坐标表象下,就是波函数的特解序列本身:

$\small \psi_n(x)=A\sin{\left(\frac{n\pi}{L}x\right)} \quad\scriptsize{(式10.19)}$

因为它作为定态薛定谔方程的解,天然满足定态薛定谔方程(这是句废话 )、也就是能量的本征方程:

$\small \hat{H}\left|\psi_n\right>=E_n\left|\psi_n\right> \quad\scriptsize{(式10.20)}$

而且,如果注意到 $\small \psi_n(x)=A\sin{(\frac{n\pi}{L}x)}$ 其实就是一个傅里叶级数序列,那么根据第7课中提到的性质,我们还可以验证不同的本征态 $\small \left|\psi_m\right>,\left|\psi_n\right>$ 之间的正交关系:

$\small \left<\psi_m|\psi_n\right>=\int_0^L{\psi_m\psi_n\text dx}=0\ (m\neq n) \quad\scriptsize{(式10.21)}$

这也是符合本征态组成的正交基底性质的。

到此为止,我们就完整复现了物理量算符的本征值关系,并且再次看到线性代数、微分方程、量子力学三者之间美妙的相似之处。

接下来,我们来看看前面还没确定的系数 $\small A$ 的取值。


3) 本征函数的归一化

在第6课中,我们曾经提到过,作为坐标表象下的态矢量的具体形式,任意一个波函数 $\small \psi(x) $,其实就以模方 $\small \left|\psi(x)\right|^2$ 的形式直接给出了粒子出现在位置 $\small x $的概率密度。

作为能量本征函数的$ \small \psi_n(x) $,也是一组特殊的态矢量,处于这些状态的粒子具有确定的能量,却具有不确定的空间位置分布,对应的概率密度为 $\small |\psi_n(x)|^2$ 。

在这个意义下,我们就能先求出本征函数前面的系数$\small A$ 了。

我们知道,在一维无限深势阱模型中,粒子只能出现在势阱区域内,这就意味着,无论粒子处于什么样的状态,我们在整个势阱区域内找到它的概率都是1,这叫做波函数的归一化。

将上面这句话写成数学表达式,就是:

$\small \int_{0}^{L}{|\psi(x)|^2\text dx}=1 \quad\scriptsize{(式10.22)}$

对于能量本征态,这个结论当然也成立,于是我们有:

$\small \int_{0}^{L}{A^2\sin^2{\left(\frac{n\pi}{L}x\right)}\text dx} =\frac{A^2L}{2}=1 \quad\scriptsize{(式10.23)}$

最终解得:

$\small A=\sqrt{\frac{2}{L}} \quad\scriptsize{(式10.24)}$

于是本征函数为:

$\small \psi_n(x)=\sqrt{\frac{2}{L}}\sin{\left(\frac{n\pi}{L}x\right)} \quad\scriptsize{(式10.25)}$

这样,我们就能画出$ \small n$ 取不同值时粒子在势阱中的概率分布函数 $\small |\psi_n|^2 $:

当然,对于这种过于理想化的一维无限深势阱而言,这些粒子位置概率分布图像并没有什么太适合的物理对应,并且从美学的角度来说也显得过于朴实无华而枯燥。

不过没关系,我们以后会欣赏到物理内涵更丰富、也更富有对称美的氢原子能级和能量本征态,那将是一次绝妙的精神体验。

而这节课的最后,我们要来简单、定性地解释一下为什么能级会分立。

前面我们只是笼统地知道,这是求解薛定谔方程的结果,但实际上,并不是所有量子力学模型都对应着分立能级,我们需要知道,分立能级什么条件下会出现。


4) 束缚态与能级分立

刚才求解一维无限深势阱时,也许有同学已经注意到,在粒子所在的势阱内,势能项变成0,薛定谔方程简化为没有势能项的形式:

$\small -\frac{\hbar^2}{2m}\frac{\text d^2}{\text d x^2}\psi=E\psi \quad\scriptsize{(式10.5)}$

这和我们第9课中提到的自由粒子(没有势能存在的环境中的粒子 )的薛定谔方程在形式上一模一样。

两个模型唯一的区别是,自由粒子所处的空间中整个空间中的势能都是0,而一维无限深势阱模型中,势能不为0的仅仅是有限的一段区域。

对于后者,我们知道,它的波函数的取值被限制在一段有限区间内,而我们在高数课上知道,这样的函数可以表示成傅里叶级数的形式(当然,它同时还要满足所谓的Dilichlet条件,但我们不必去关注这一点,因为我们讨论的所有波函数都满足它 )。

而我们求解薛定谔方程的结果也发现,它的特解就是一系列正弦函数,于是作为通解的一般波函数,就可以表示为这些特解的线性和,这正好就是傅里叶级数(也就是作为基底的能量本征态的坐标表象 ):

$\small \begin{align} \psi(x)&=\sum_n c_n\psi_n(x)\\ &=\sum_n c_n \sqrt{\frac{2}{L}}\sin{\left(\frac{n\pi}{L}x\right)} \end{align} \quad\scriptsize{(式10.26)}$

(当然,这个傅里叶级数比较特殊的一点是,它的余弦项系数全部为0,我们知道这是由边界条件决定的,而从态矢量的角度来讲,这就意味着无限深势阱中的波函数可以仅仅由一部分基底线性表出,也就是这样的边界条件决定了,这些波函数构成的是所有能够傅里叶展开的函数空间的一个子空间 )

现在我们来看自由粒子。

对于自由粒子而言,我们同样可以用能量本征态(同时也是动量本征态,正如我们在第9课中讨论的一样 )来作为一组基底,但由于此时没有边界条件的束缚,它的波数以及频率的取值就没有取整的限制,可以是任意实数,相应的能级也就是连续的了。

所以,对于上面两个例子体现出来的一些规律,我们可以给出一个笼统的一般表述:

对于取值被“限制在一定空间范围内的”波函数、或者更准确说是在无穷远处收敛的波函数,即满足 $\small \psi(\infty)=0$ 的函数,它的能级是分立的,这样的状态叫做束缚态;

反之,对于无穷远处不收敛的波函数,能级则是连续的,这样的态叫做散射态。

此外,还有一类不属于上面两种情况的模型,就是满足所谓周期性边界条件的波函数,它们在无穷远处不收敛,但能级也可能是分立的。这其实比较好理解,因为周期函数是可以分解成离散的傅里叶级数和、而不是连续的傅里叶变换的 (某种意义上,氢原子分立能级的来源可以等效成这样的情形,此外,如果同学们有机会学习固体物理,会体会到这一点 )

但上面说到的也还只是个结论,接下来,我们就分别从数学和物理的角度,来定性地解释这种区别。

  • 数学上的定性解释

我们知道,定义在实轴上的所有函数可以构成一个无穷维的函数空间,而满足束缚态条件的波函数只是这些函数中的一个子集,而这个子集正好还构成了函数空间的一个子空间

而我们在线性代数中知道,一个线性空间的子空间可以由一组基底的其中一部分(而不是全部 )张成。

对应到波函数中,如果我们选取所有能量值对应的能量本征态作为基底,那么波函数只在某个子空间中取值,就意味着,表述这个波函数时,只需要用到所有能量本征态当中的一部分(而不是全部 ),而这一部分本征态恰好就是那组分立的本征态,相应的能级自然也就是分立能级了。

当然,这只是一种定性解释,真正严谨的解释需要涉及到泛函分析的内容,这超出了我们这个系列的讨论范围(也超出了作者的能力范围 )

  • 物理上的定性解释

我们先来看一个与量子力学无关的模型:一根具有弹性的弦。

如果将弦的两端固定,它就成了一根琴弦。

如果我们去了解一点音乐物理知识,我们会知道,拨动一根琴弦时,它发出的声音并不是一个单独的频率,而是一些不同频率的泛音的合成,但所有这些泛音的频率都是某个基频的整数倍。

这些泛音频率的倍数关系是怎么来的呢?

这就和我们的一维无限深势阱波函数很像了:

琴声中包含的每一个泛音频率,其实都一一对应了琴弦上的一个驻波模态。

我们知道,一段两端固定的琴弦上会形成驻波,而“两端固定”这个边界条件决定了,每个驻波模态的波长只能是琴弦长度的半整数分之一,而如果结合琴弦的波动方程,我们就能得到每个驻波模态的频率和波长的一一对应关系。

(对求解过程有兴趣的同学可以移步作者的这篇文章:律动的琴弦 )

对应到无限深势阱中的能级,我们其实就可以认为,是这样的边界条件导致波函数形成了驻波,这些驻波就是分立的能量本征态、而对应的频率就是能量的本征值、也就是能级本身了。


5) 结语与预告

本课里,我们动手求解了一种最简单的势能条件下的定态薛定谔方程,体验了如何通过求解方程找出能量本征值及本征态,并且定性解释了分立能级的来源,由此再次看到了微分方程、量子力学与线性代数之间的神似之处。

至此,我们关于薛定谔方程的这条主线就算介绍完了,接下来,我们要来解释第1课开篇中提到的另外一个让初学者很困惑的结论:不确定性原理

在第3课和第5课中我们对此已经有了一些体会,而接下来我们要做的,是讨论量子力学中最重要的一对不确定性关系:坐标和动量的不确定性关系。

我们将仍然从态矢量的角度来理解,看看态矢量如何将这条主线也串起来:


编辑于 2021-12-06 11:48

从线性代数到量子力学(9):动量、能量与微分算子

PeiLingX

物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》的第9课。

了解本系列其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

在第8课中,我们首先将能量的本征值关系化为坐标表象下的具体形式,得到了定态薛定谔方程(薛定谔方程不考虑时间变化时的情形 );然后,我们给出了态矢量的时间演化规律,并且也将它表示成坐标表象下的具体形式,最后得到了完整的薛定谔方程。

但在推导过程中,我们有两个结论是未加解释直接给出的:

一个是坐标表象下动量算符的具体形式:

$\small \hat{p}=-\text i\hbar\frac{\partial }{\partial x} \quad\scriptsize{(式8.15)}$

另一个是态矢量的演化规律:

$\small \frac{\partial }{\partial t}\left|\psi\right>=\frac{\hat{H}}{\text i\hbar}\left|\psi\right> \quad\scriptsize{(式8.19)}$

这节课,我们就来对此做一个简单的解释。

顺便说一句,这两个关系其实有更抽象同时更具美感的解释,但这需要一点很少的群论知识,我们以后再来介绍。

这节课里,我们将从一个不太严谨、但是更具有物理直观的角度来导出它们。


1) 动量与能量的本征态

前面我们提到,验证本课的两个等式关系,其实就是分别找出动量算符和能量算符在坐标表象下的具体形式。

而如果我们能找出一些同时具有确定动量和能量的量子态,这个事情就很容易了。

所幸在某些特殊的物理情形下,这样的量子态是存在的。

其中最简单的一个例子,就是没有势能的环境中的自由粒子,这种情形下能量只包含动能项,也就只和动量有关:

$\small E=\frac{p^2}{2m} \quad\scriptsize{(式9.1)}$

写成算符形式就是:

$\small \hat H=\frac{\hat p^2}{2m} \quad\scriptsize{(式9.2)}$

在这样的情形下,当粒子具有确定的动量时,它的能量也就完全确定了。

我们可以简单证明这一点:

假设某个态 $\small \left|p_a\right>$ 是动量的本征态,相应的本征值为 $\small p_a$ ,那么动量算符作用在上面时,有:

$\small \hat p\left|p_a\right>=p_a\left|p_a\right> \quad\scriptsize{(式9.3)}$

如果我们在它的左边再作用一次动量算符,就有:

$\small \hat p^2\left|p_a\right>=\hat p\left(p_a\left|p_a\right>\right)=p_a^2\left|p_a\right> \quad\scriptsize{(式9.4)}$

再同时在两边除以 $\small 2m$ ,就有:

$\small \frac{\hat p^2}{2m}\left|p_a\right>=\frac{p_a^2}{2m}\left|p_a\right> \quad\scriptsize{(式9.5)}$

而我们看到,这个式子的左边就是哈密顿算符,右边正好就是粒子的动能,即:

$\small \hat H\left|p_a\right>=E_a\left|p_a\right> \quad\scriptsize{(式9.6)}$

这也是能量的本征值关系,所以在没有势能存在的情况下,动量的本征态 $\small \left|p_a\right>$ 同时也是能量的本征态。

顺便说一句,如果有势能项、特别是势能不是常数(而是和空间位置有关 )的时候,那么上述关系通常不会再成立,因为此时的哈密顿算符作用在动量本征态上会得到:

$\small \hat H\left|p_a\right>=\frac{p_a^2}{2m}\left|p_a\right>+\hat V(\hat x)\left|p_a\right> \quad\scriptsize{(式9.7)}$

等式右边第一项是动能项,具有确定的值,因此我们需要重点关注第二项: $\small \hat V(\hat x)\left|p_a\right>$

对于这一项而言,由于势能是位置的函数(算符之间也可以有函数关系 ),而位置和动量不能同时确定(这似乎已经成了一个常识,不过我们这个系列还没严格证明过,未来我们会补上这个证明 ),这就意味着粒子处于动量本征态、也就是具有确定动量值时,位置以及势能是不确定的,因此右边第二项中的 $\small \hat V(\hat x)$ 不会变成一个确定的数,也就不满足本征值关系。

这样,总的能量也就不确定了,这就意味着不均匀的势能存在时,动量的本征态不再是能量的本征态。

写到这里,正好想提醒同学们注意一个初学者常常容易忽略的常识:随着势能发生变化,哈密顿算符本身、以及相应的能量本征值和本征态也会变化(未来我们解释能级跃迁和奇怪的能级分裂的时候也要用到这个常识 )。

现在我们继续回来讨论没有势能存在的自由粒子的动量本征态。

我们刚才已经看到,处于这个态的粒子会同时具有确定的动量和能量,如果我们能写出这个态在坐标表象下的波函数形式,那么我们就能验证本课要导出的两个关系式了。

这个波函数是什么样子呢?我们请来自法兰西王室某旁系的著名后裔德布罗意公子给我们讲一讲。


2) 德布罗意关系与单色波

在中学物理课上我们知道,德布罗意继承了爱因斯坦的衣钵,将波粒二象性的概念推广到了光子以外的其他粒子上,认为所有微观粒子都伴随着一个波,并且满足动量与波长、能量与频率之间的爱因斯坦关系式:

$\small \begin{cases} p=\frac{h}{\lambda}\\ E=h\nu \end{cases} \quad\scriptsize{(式9.8)}$

($\small h$ 即普朗克常数 )

这个关系式提醒我们,当一个粒子具有唯一确定的动量和能量时,它的波函数也就有了唯一的波长和频率(而不是一堆不同波长频率的波的叠加 ),这样的波被称为单色波,我们可以将它写成三角函数的形式,比如:

$\small \phi(x,t)=\cos{(\frac{2\pi}{\lambda}x-2\pi\nu t)} \quad\scriptsize{(式9.9)}$

为了方便后面的推导,我们还要对这个函数做一些改造。

首先,我们用 $\small k=\frac{2\pi}{\lambda},\omega=2\pi\nu$ 来代替波长 $\small \lambda$ 和频率 $\small \nu$

其中 $\small k$ 称为波数,它指的是一个 $\small 2\pi$ 长度的范围内的波的个数(不必为整数 );

而 $\small \omega$ 称为角频率。我们知道,在波的传播路径上,每个点都在做相同频率的简谐振动。而我们还知道,简谐振动可以看成圆周运动的投影,这里出现的角频率就可以理解为相应的圆周运动的角速度。

于是简谐波的波函数可以写成一个更加简洁的形式:

$\small \phi(x,t)=\cos{(kx-\omega t)} \quad\scriptsize{(式9.10)}$

而德布罗意关系也相应地改写为:

$\small \begin{cases} p=\hbar k\\ E=\hbar \omega \end{cases} \quad\scriptsize{(式9.11)}$

其中 $\small \hbar=\frac{h}{2\pi}$ ,称为约化普朗克常数。

接下来,我们要进行第二步改造。

在物理学中,为了运算方便(主要是为了求导和积分运算方便 ),我们通常会利用著名的欧拉公式:

$\small \text e^{\text i\theta}=\cos{\theta}+\text i\sin{\theta} \quad\scriptsize{(式9.12)}$

将波函数由三角函数形式改写为复指数形式:

$\small \phi(x,t)=\text e^{\text i(kx-\omega t)} \quad\scriptsize{(式9.13)}$

(而三角函数只需看成复指数在实轴和虚轴上的投影 )

而这就是我们要找的自由粒子的动量和能量的共同本征态在坐标表象下的形式了。

接下来我们就用它来导出我们要证明的两个等式:

动量算符的坐标表象和量子态的时间演化关系。


3) 动量算符的坐标表象

我们来整理一下刚才得到的结果:

对于一个处于动量本征态(同时也是能量本征态 ) $\small \left|p_a\right>$ 的自由粒子而言,这个本征态在坐标表象下的波函数为:

$\small \phi(x,t)=\text e^{\text i(k_ax-\omega_a t)} \quad\scriptsize{(式9.14)}$

此时粒子的动量和能量都具有确定的值,也就是 $\small \left|p_a\right>$ 相应的动量本征值和能量本征值,它们分别为:

$\small \begin{cases} p_a=\hbar k_a\\ E_a=\hbar \omega_a \end{cases} \quad\scriptsize{(式9.15)}$

这样,我们就能写出本征值关系:

$\small \begin{align} \hat p\text e^{\text i(k_ax-\omega_a t)}&=p_a \text e^{\text i(k_ax-\omega_a t)}\\ &=\hbar k_a \text e^{\text i(k_ax-\omega_a t)} \end{align} \quad\scriptsize{(式9.16)}$

现在,我们就要根据这个等式关系,找出动量算符 $\small \hat p$ 在坐标表象下的形式。

有同学可能会问:这个形式会不会就是等式最右边的系数 $\small \hbar k_a$ 本身呢?

很遗憾,并不是这样。因为我们要找的是 $\small \hat p$ 的坐标表象,那么它必然应该和坐标 $\small x$ 有关,而 $\small \hbar k_a$ 是 $\small k_a$ 的函数,它显然不是坐标表象(以后我们会看到,它其实是 $\small \hat p$ 的动量表象 )。

如果要和坐标有关,那么我们唯一能想到的,就是对 $\small x$ 求导了,因为指数函数具有天然的求导后形式不变的优良性质:

$\small \frac{\partial }{\partial x}\text e^{\text i(k_ax-\omega_a t)}=\text i k_a \text e^{\text i(k_ax-\omega_a t)} \quad\scriptsize{(式9.17)}$

如果再在两边同时乘以 $\small -\text i\hbar$ ,我们就得到:

$\small -\text i\hbar \frac{\partial }{\partial x}\text e^{\text i(k_ax-\omega_a t)}=\hbar k_a \text e^{\text i(k_ax-\omega_a t)} \quad\scriptsize{(式9.18)}$

将上式与式9.16对比,我们就得到了动量算符在坐标表象下的形式:

$\small \hat{p}=-\text i\hbar\frac{\partial }{\partial x} \quad\scriptsize{(式8.15)}$

接下来我们来看看量子态的演化。


4) 量子态的时间演化

量子态的时间演化更简单,我们直接求 $\small \left|p_a\right>$ 对时间的偏导就行了:

$\small \begin{align} \frac{\partial }{\partial t}\left|p_a\right>&=\frac{\partial }{\partial t}\text e^{\text i(k_ax-\omega_a t)}\\ &=-\text i\omega_a \text e^{\text i(k_ax-\omega_a t)}\\ &=\frac{E_a}{\text i\hbar}\text e^{\text i(k_ax-\omega_a t)}\\ &=\frac{E_a}{\text i\hbar}\left|p_a\right>\\ &=\frac{\hat H}{\text i\hbar}\left|p_a\right> \end{align} \quad\scriptsize{(式9.19)}$

这就是态的时间演化关系了。

不过需要注意的是,我们现在只是看到了这个关系对自由粒子的动量和能量的共同本征态成立,所以我们其实并没有严格证明它,而只是通过这个特例验证了一遍而已。

但这样的特例有助于我们对量子态的演化规律有一个物理上的直观认识,这才是我们的目的。


5) 总结与预告

本课中,我们通过德布罗意关系给出了自由粒子动量和能量的共同本征态的坐标表象,并且将它们化作复指数形式的波函数,然后通过微分算子和指数函数之间的关系,验证了动量算符的微分算子形式、以及哈密顿算符与态的时间演化的关系。

不过,需要再次提醒同学们注意的是,我们并没有严格证明这两个等式关系,而只是为它们找了一个例证。

实际上,这两个关系本身就可以看成一个基本的物理假设,所以并不能从数学上证明,我们这节课做的事情,只是通过特例来感受它们的物理直观、让它们变得不再那么突兀而已。

而在接受了这两个关系之后,我们将在下节课回到薛定谔方程的话题,通过一个简单的模型,感受一下求解薛定谔方程的过程,并且再次体会其中美妙的线性代数原理:

隐藏剧情:

正式结束本节课之前,作者其实还有一个话题想聊一聊,但因为这和我们的主线无关,所以就放在文末,作为一个彩蛋留给有兴趣的同学们。

事情原委是这样的:

作者第一次看到动量算符在坐标表象下的微分算子形式时,总有一些不自然的感觉:

虽然我们从形式上得到了以微分算子形式出现的动量算符及其本征值关系,并且看到了它与矩阵特征值关系的相似之处,但这毕竟还是一种抽象形式。不管怎么样,一个微分算子和一个矩阵,怎么看也很难让人相信,它们是同一个物种。

而且,量子力学科普书告诉过我们:薛定谔的波动力学和海森堡的矩阵力学本质上是相通的。所以我们不禁开始了遐想:如果能将微分算子“打扮”成矩阵的形式,让它们看起来更像是同一个爹妈生的,岂不是美事一桩?

为了回答这个问题,同时也为了呼应本系列的标题,让线性代数和量子力学一起实现生命的大和谐,作者做了一件一件纯属娱乐的事情:

将微分算子写成“矩阵形式”,并且“证明”(不是严格意义的证明 )这个“矩阵”的“特征向量”就是指数函数。

于是就有了接下来的彩蛋部分。


彩蛋:微分算子变身矩阵

声明:下面的内容仅仅是一种直观类比,并非严格的数学推导,请务必注意

首先,我们模仿第7课中的做法,将某个函数 $\small f(x)$ 在定义域上以间隔 $\small \Delta x$ 进行离散化,变成一个无穷维向量:

$\small (\cdots,f_{i-1},f_i,f_{i+1},\cdots)^T=(\cdots,f(x_{i-1}),f(x_i),f(x_{i+1}),\cdots)^T \quad\scriptsize{(式9.20)}$

其中:$\small x_{i+1}=x_i+\Delta x$

我们假设它的导函数为 $\small g(x)=\frac{\text d}{\text dx}f(x)$ ,那么导数运算在这里也就变成了差分运算:

$\small g_i=\frac{1}{2\Delta x}(f_{i+1}-f_{i-1}) \quad\scriptsize{(式9.21)}$

写到这里,也许有同学要问了:这里为什么用中心差分 $\small \frac{1}{2\Delta x}(f_{i+1}-f_{i-1})$ ,而不是向前差分 $\small \frac{1}{\Delta x}(f_{i+1}-f_{i})$ 或向后差分 $\small \frac{1}{\Delta x}(f_{i}-f_{i-1})$ ?

这是为了保证动量算符对应的矩阵的厄米性(Hermitian),有同学可能记得我们曾经在第6课中提到过这个词,后面我们会简单解释一下。

接下来,我们就要回到主线,来见证一个奇迹:将这个差分运算变成矩阵运算。

首先,我们定义一组矩阵元:

$\small D_{ij}= \begin{cases} \frac{1}{2\Delta x} & j=i+1\\ -\frac{1}{2\Delta x} & j=i-1\\ 0 & \text{otherwise}\ \end{cases} \quad\scriptsize{(式9.22)}$

根据这个定义,我们可以将 $\small g_i$ 的差分形式逐步改写:

$\small \begin{align} g_i&=\frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right) \\ &=\frac{1}{2\Delta x}f_{i+1}-\frac{1}{2\Delta x}f_{i-1}\\ &=D_{i,i+1}f_{i+1}+D_{i,i-1}f_{i-1}\\ &=\scriptsize{\cdots+0\cdot f_{i-2}+D_{i,i-1}f_{i-1}+0\cdot f_{i}+D_{i,i+1}f_{i+1}+0\cdot f_{i+2}+\cdots}\\ &=\sum_j{D_{ij}f_j}\ \end{align} \quad\scriptsize{(式9.23)}$

而当 $\small \Delta x\rightarrow 0$ 时,这可以看成无穷维矩阵 $\small \boldsymbol D=[D_{ij}]_{\infty\times \infty}$ 与向量 $\small \boldsymbol f=(\cdots,f_{i-1},f_i,f_{i+1},\cdots)^T$ 的乘法:

$\small \begin{bmatrix} \vdots\\g_i\\ \vdots \end{bmatrix} =\frac{1}{2\Delta x}\begin{bmatrix} \ddots &\ddots & \\ \ddots &\ddots &\ddots \\ &-1& 0& 1&\\ & &\ddots&\ddots&\ddots\\ &&&\ddots&\ddots\ \end{bmatrix} \begin{bmatrix} \vdots \\ f_{i-1}\\ f_i \\ f_{i+1} \\ \vdots \end{bmatrix} \quad\scriptsize{(式9.24)}$

于是,函数的求导过程经过离散化以后,就变成了(未经严格定义的 )矩阵乘法。

(有人明白作者为什么要用中心差分了吗? )

但我们的戏法还没结束,接下来,我们还要来“证明”:

差分矩阵的特征向量,就是离散化的指数函数 $\small f(x)=e^{kx}$

这里需要第二次声明:我们即将进行的并不是严格的数学证明,因为有限维情形下的一些定义、结论和运算,不能简单推广到无穷维上面。

但这并不妨碍我们直观理解微分算子和矩阵之间的美妙联系

我们这就开干吧。

首先,我们照例将指数函数 $\small f(x)=e^{kx}$ 进行离散化:

$\small (\cdots,f_{i-1},f_i,f_{i+1},\cdots)^T=\left(\cdots,e^{kx_{i-1}},e^{kx_i},e^{kx_{i+1}},\cdots\right)^T \quad\scriptsize{(式9.25)}$

于是有:

$\small \frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right) =\frac{1}{2\Delta x}\left[e^{kx_{i+1}}-e^{kx_{i-1}}\right] \quad\scriptsize{(式9.26)}$

将 $\small e^{kx_{i+1}} 和 \small e^{kx_{i-1}}$ 在 $\small x_i$ 附近进行泰勒展开,可以得到:

$\small \begin{align} e^{kx_{i+1}}&=e^{k(x_{i}+\Delta x)}\\ &=e^{kx_{i}}+k\Delta xe^{kx_{i}}+\frac{k^2}{2}\Delta x^2e^{kx_{i}}+\frac{k^3}{6}\Delta x^3e^{kx_{i}}+\cdots \end{align} \quad\scriptsize{(式9.27)}$

$\small \begin{align} e^{kx_{i-1}}&=e^{k(x_{i}-\Delta x)}\\ &=e^{kx_{i}}-k\Delta xe^{kx_{i}}+\frac{k^2}{2}\Delta x^2e^{kx_{i}}-\frac{k^3}{6}\Delta x^3e^{kx_{i}}+\cdots \end{align} \quad\scriptsize{(式9.28)}$

于是:

$\small \frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right)=ke^{kx_{i}}+k^3\frac{1}{6}\Delta x^2e^{kx_{i}}+\cdots \quad\scriptsize{(式9.29)}$

当 $\small \Delta x\rightarrow 0$ 时,可以忽略第二项及以后的所有项,于是:

$\small \small \frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right)\simeq ke^{kx_{i}}=kf_i \quad\scriptsize{(式9.30)}$

而根据前面的定义:

$\small \frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right)=\sum_j{D_{ij}f_j} \quad\scriptsize{(式9.31)}$

于是我们得到:

$\small \sum_j{D_{ij}f_j}=kf_i \quad\scriptsize{(式9.32)}$

写成“无穷维矩阵相乘”的形式,就是:

$\small \frac{1}{2\Delta x}\begin{bmatrix} \ddots &\ddots & \\ \ddots &\ddots &\ddots \\ &-1& 0& 1&\\ & &\ddots&\ddots&\ddots\\ &&&\ddots&\ddots\ \end{bmatrix} \begin{bmatrix} \vdots\\f_{i-1}\\f_i\\f_{i+1}\\ \vdots \end{bmatrix} = k \begin{bmatrix} \vdots\\f_{i-1}\\f_i\\f_{i+1}\\ \vdots \end{bmatrix} \quad\scriptsize{(式9.33)}$

写成抽象形式,就是:

$\small \boldsymbol D\boldsymbol f=k\boldsymbol f \quad\scriptsize{(式9.34)}$

这就意味着,函数 $\small f(x)=e^{kx}$ 对应的“向量” $\small \boldsymbol f$ ,是“微分算子矩阵” $\small \boldsymbol D$ 的“特征向量”,相应的特征值为 $\small k$ 。

到此为止,我们就将微分算子和矩阵联系了起来,虽然这和我们后面的内容并没有什么关系,但它可以让作者这样的强迫症感觉舒服一点,仅此而已。

对了,这里第三次声明:我们上面的计算只是对算子和矩阵进行了直观的类比,而不是严格的数学证明,因为有限维情形并不能简单推广到无限维上,请一定记住这一点。

最后,我们来解释前面留的一个尾巴:前面将微分变成差分的时候,为什么要用中心差分?

我们知道,前面我们给出了动量算符的坐标表象:

$\small \hat{p}=-\text i\hbar\frac{\partial }{\partial x} \quad\scriptsize{(式8.15)}$

现在我们将它写成差分矩阵的形式,就是:

$\small P=\frac{1}{2\Delta x}\begin{bmatrix} \ddots &\ddots & \\ \ddots &\ddots &\ddots \\ &\text i\hbar& 0& -\text i\hbar&\\ & &\ddots&\ddots&\ddots\\ &&&\ddots&\ddots\\ \end{bmatrix} \quad\scriptsize{(式9.35)}$

第6课中我们提到过一个概念,就是可观测的力学量的本征值都是实数,而相应的算符通常是所谓的厄米算符。

这类算符的定义我们有需要的时候再补充,但如果我们将这类算符写成矩阵形式,那么它们有一个非常容易记住的特质:

将它们转置后、再对矩阵元取复共轭,得到的还是原矩阵。

比如这样的矩阵:$\small \begin{bmatrix}1&1+\text i\\1-\text i&2\end{bmatrix}$ ,它转置后变成 $\small \begin{bmatrix}1&1-\text i\\1+\text i&2\end{bmatrix} $,再对所有矩阵元取复共轭,我们就又得到了 $\small \begin{bmatrix}1&1+\text i\\1-\text i&2\end{bmatrix}$ ,这就是一个厄米矩阵,我们容易验证它的本征值都是实数。

而动量作为一个可观测量,它的算符的“矩阵形式”当然也应该是厄米矩阵,即满足转置共轭条件,而中心差分对应的矩阵形式(式9.35 )正好就有这样的性质。

这里顺便再说一句,一个矩阵 $\small M$ 的转置共轭通常记作 $\small M^{\dagger}$ ,读作M-dagger (右上角那个符号像一把短剑,英文就是dagger,LaTex代码也是 \dagger )。

于是一个厄米矩阵 $\small H$ 的共轭转置条件就写作:

$\small H=H^{\dagger} \quad\scriptsize{(式9.36)}$


编辑于 2021-11-30 13:25