从线性代数到量子力学(9):动量、能量与微分算子

PeiLingX

物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》的第9课。

了解本系列其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

在第8课中,我们首先将能量的本征值关系化为坐标表象下的具体形式,得到了定态薛定谔方程(薛定谔方程不考虑时间变化时的情形 );然后,我们给出了态矢量的时间演化规律,并且也将它表示成坐标表象下的具体形式,最后得到了完整的薛定谔方程。

但在推导过程中,我们有两个结论是未加解释直接给出的:

一个是坐标表象下动量算符的具体形式:

$\small \hat{p}=-\text i\hbar\frac{\partial }{\partial x} \quad\scriptsize{(式8.15)}$

另一个是态矢量的演化规律:

$\small \frac{\partial }{\partial t}\left|\psi\right>=\frac{\hat{H}}{\text i\hbar}\left|\psi\right> \quad\scriptsize{(式8.19)}$

这节课,我们就来对此做一个简单的解释。

顺便说一句,这两个关系其实有更抽象同时更具美感的解释,但这需要一点很少的群论知识,我们以后再来介绍。

这节课里,我们将从一个不太严谨、但是更具有物理直观的角度来导出它们。


1) 动量与能量的本征态

前面我们提到,验证本课的两个等式关系,其实就是分别找出动量算符和能量算符在坐标表象下的具体形式。

而如果我们能找出一些同时具有确定动量和能量的量子态,这个事情就很容易了。

所幸在某些特殊的物理情形下,这样的量子态是存在的。

其中最简单的一个例子,就是没有势能的环境中的自由粒子,这种情形下能量只包含动能项,也就只和动量有关:

$\small E=\frac{p^2}{2m} \quad\scriptsize{(式9.1)}$

写成算符形式就是:

$\small \hat H=\frac{\hat p^2}{2m} \quad\scriptsize{(式9.2)}$

在这样的情形下,当粒子具有确定的动量时,它的能量也就完全确定了。

我们可以简单证明这一点:

假设某个态 $\small \left|p_a\right>$ 是动量的本征态,相应的本征值为 $\small p_a$ ,那么动量算符作用在上面时,有:

$\small \hat p\left|p_a\right>=p_a\left|p_a\right> \quad\scriptsize{(式9.3)}$

如果我们在它的左边再作用一次动量算符,就有:

$\small \hat p^2\left|p_a\right>=\hat p\left(p_a\left|p_a\right>\right)=p_a^2\left|p_a\right> \quad\scriptsize{(式9.4)}$

再同时在两边除以 $\small 2m$ ,就有:

$\small \frac{\hat p^2}{2m}\left|p_a\right>=\frac{p_a^2}{2m}\left|p_a\right> \quad\scriptsize{(式9.5)}$

而我们看到,这个式子的左边就是哈密顿算符,右边正好就是粒子的动能,即:

$\small \hat H\left|p_a\right>=E_a\left|p_a\right> \quad\scriptsize{(式9.6)}$

这也是能量的本征值关系,所以在没有势能存在的情况下,动量的本征态 $\small \left|p_a\right>$ 同时也是能量的本征态。

顺便说一句,如果有势能项、特别是势能不是常数(而是和空间位置有关 )的时候,那么上述关系通常不会再成立,因为此时的哈密顿算符作用在动量本征态上会得到:

$\small \hat H\left|p_a\right>=\frac{p_a^2}{2m}\left|p_a\right>+\hat V(\hat x)\left|p_a\right> \quad\scriptsize{(式9.7)}$

等式右边第一项是动能项,具有确定的值,因此我们需要重点关注第二项: $\small \hat V(\hat x)\left|p_a\right>$

对于这一项而言,由于势能是位置的函数(算符之间也可以有函数关系 ),而位置和动量不能同时确定(这似乎已经成了一个常识,不过我们这个系列还没严格证明过,未来我们会补上这个证明 ),这就意味着粒子处于动量本征态、也就是具有确定动量值时,位置以及势能是不确定的,因此右边第二项中的 $\small \hat V(\hat x)$ 不会变成一个确定的数,也就不满足本征值关系。

这样,总的能量也就不确定了,这就意味着不均匀的势能存在时,动量的本征态不再是能量的本征态。

写到这里,正好想提醒同学们注意一个初学者常常容易忽略的常识:随着势能发生变化,哈密顿算符本身、以及相应的能量本征值和本征态也会变化(未来我们解释能级跃迁和奇怪的能级分裂的时候也要用到这个常识 )。

现在我们继续回来讨论没有势能存在的自由粒子的动量本征态。

我们刚才已经看到,处于这个态的粒子会同时具有确定的动量和能量,如果我们能写出这个态在坐标表象下的波函数形式,那么我们就能验证本课要导出的两个关系式了。

这个波函数是什么样子呢?我们请来自法兰西王室某旁系的著名后裔德布罗意公子给我们讲一讲。


2) 德布罗意关系与单色波

在中学物理课上我们知道,德布罗意继承了爱因斯坦的衣钵,将波粒二象性的概念推广到了光子以外的其他粒子上,认为所有微观粒子都伴随着一个波,并且满足动量与波长、能量与频率之间的爱因斯坦关系式:

$\small \begin{cases} p=\frac{h}{\lambda}\\ E=h\nu \end{cases} \quad\scriptsize{(式9.8)}$

($\small h$ 即普朗克常数 )

这个关系式提醒我们,当一个粒子具有唯一确定的动量和能量时,它的波函数也就有了唯一的波长和频率(而不是一堆不同波长频率的波的叠加 ),这样的波被称为单色波,我们可以将它写成三角函数的形式,比如:

$\small \phi(x,t)=\cos{(\frac{2\pi}{\lambda}x-2\pi\nu t)} \quad\scriptsize{(式9.9)}$

为了方便后面的推导,我们还要对这个函数做一些改造。

首先,我们用 $\small k=\frac{2\pi}{\lambda},\omega=2\pi\nu$ 来代替波长 $\small \lambda$ 和频率 $\small \nu$

其中 $\small k$ 称为波数,它指的是一个 $\small 2\pi$ 长度的范围内的波的个数(不必为整数 );

而 $\small \omega$ 称为角频率。我们知道,在波的传播路径上,每个点都在做相同频率的简谐振动。而我们还知道,简谐振动可以看成圆周运动的投影,这里出现的角频率就可以理解为相应的圆周运动的角速度。

于是简谐波的波函数可以写成一个更加简洁的形式:

$\small \phi(x,t)=\cos{(kx-\omega t)} \quad\scriptsize{(式9.10)}$

而德布罗意关系也相应地改写为:

$\small \begin{cases} p=\hbar k\\ E=\hbar \omega \end{cases} \quad\scriptsize{(式9.11)}$

其中 $\small \hbar=\frac{h}{2\pi}$ ,称为约化普朗克常数。

接下来,我们要进行第二步改造。

在物理学中,为了运算方便(主要是为了求导和积分运算方便 ),我们通常会利用著名的欧拉公式:

$\small \text e^{\text i\theta}=\cos{\theta}+\text i\sin{\theta} \quad\scriptsize{(式9.12)}$

将波函数由三角函数形式改写为复指数形式:

$\small \phi(x,t)=\text e^{\text i(kx-\omega t)} \quad\scriptsize{(式9.13)}$

(而三角函数只需看成复指数在实轴和虚轴上的投影 )

而这就是我们要找的自由粒子的动量和能量的共同本征态在坐标表象下的形式了。

接下来我们就用它来导出我们要证明的两个等式:

动量算符的坐标表象和量子态的时间演化关系。


3) 动量算符的坐标表象

我们来整理一下刚才得到的结果:

对于一个处于动量本征态(同时也是能量本征态 ) $\small \left|p_a\right>$ 的自由粒子而言,这个本征态在坐标表象下的波函数为:

$\small \phi(x,t)=\text e^{\text i(k_ax-\omega_a t)} \quad\scriptsize{(式9.14)}$

此时粒子的动量和能量都具有确定的值,也就是 $\small \left|p_a\right>$ 相应的动量本征值和能量本征值,它们分别为:

$\small \begin{cases} p_a=\hbar k_a\\ E_a=\hbar \omega_a \end{cases} \quad\scriptsize{(式9.15)}$

这样,我们就能写出本征值关系:

$\small \begin{align} \hat p\text e^{\text i(k_ax-\omega_a t)}&=p_a \text e^{\text i(k_ax-\omega_a t)}\\ &=\hbar k_a \text e^{\text i(k_ax-\omega_a t)} \end{align} \quad\scriptsize{(式9.16)}$

现在,我们就要根据这个等式关系,找出动量算符 $\small \hat p$ 在坐标表象下的形式。

有同学可能会问:这个形式会不会就是等式最右边的系数 $\small \hbar k_a$ 本身呢?

很遗憾,并不是这样。因为我们要找的是 $\small \hat p$ 的坐标表象,那么它必然应该和坐标 $\small x$ 有关,而 $\small \hbar k_a$ 是 $\small k_a$ 的函数,它显然不是坐标表象(以后我们会看到,它其实是 $\small \hat p$ 的动量表象 )。

如果要和坐标有关,那么我们唯一能想到的,就是对 $\small x$ 求导了,因为指数函数具有天然的求导后形式不变的优良性质:

$\small \frac{\partial }{\partial x}\text e^{\text i(k_ax-\omega_a t)}=\text i k_a \text e^{\text i(k_ax-\omega_a t)} \quad\scriptsize{(式9.17)}$

如果再在两边同时乘以 $\small -\text i\hbar$ ,我们就得到:

$\small -\text i\hbar \frac{\partial }{\partial x}\text e^{\text i(k_ax-\omega_a t)}=\hbar k_a \text e^{\text i(k_ax-\omega_a t)} \quad\scriptsize{(式9.18)}$

将上式与式9.16对比,我们就得到了动量算符在坐标表象下的形式:

$\small \hat{p}=-\text i\hbar\frac{\partial }{\partial x} \quad\scriptsize{(式8.15)}$

接下来我们来看看量子态的演化。


4) 量子态的时间演化

量子态的时间演化更简单,我们直接求 $\small \left|p_a\right>$ 对时间的偏导就行了:

$\small \begin{align} \frac{\partial }{\partial t}\left|p_a\right>&=\frac{\partial }{\partial t}\text e^{\text i(k_ax-\omega_a t)}\\ &=-\text i\omega_a \text e^{\text i(k_ax-\omega_a t)}\\ &=\frac{E_a}{\text i\hbar}\text e^{\text i(k_ax-\omega_a t)}\\ &=\frac{E_a}{\text i\hbar}\left|p_a\right>\\ &=\frac{\hat H}{\text i\hbar}\left|p_a\right> \end{align} \quad\scriptsize{(式9.19)}$

这就是态的时间演化关系了。

不过需要注意的是,我们现在只是看到了这个关系对自由粒子的动量和能量的共同本征态成立,所以我们其实并没有严格证明它,而只是通过这个特例验证了一遍而已。

但这样的特例有助于我们对量子态的演化规律有一个物理上的直观认识,这才是我们的目的。


5) 总结与预告

本课中,我们通过德布罗意关系给出了自由粒子动量和能量的共同本征态的坐标表象,并且将它们化作复指数形式的波函数,然后通过微分算子和指数函数之间的关系,验证了动量算符的微分算子形式、以及哈密顿算符与态的时间演化的关系。

不过,需要再次提醒同学们注意的是,我们并没有严格证明这两个等式关系,而只是为它们找了一个例证。

实际上,这两个关系本身就可以看成一个基本的物理假设,所以并不能从数学上证明,我们这节课做的事情,只是通过特例来感受它们的物理直观、让它们变得不再那么突兀而已。

而在接受了这两个关系之后,我们将在下节课回到薛定谔方程的话题,通过一个简单的模型,感受一下求解薛定谔方程的过程,并且再次体会其中美妙的线性代数原理:

隐藏剧情:

正式结束本节课之前,作者其实还有一个话题想聊一聊,但因为这和我们的主线无关,所以就放在文末,作为一个彩蛋留给有兴趣的同学们。

事情原委是这样的:

作者第一次看到动量算符在坐标表象下的微分算子形式时,总有一些不自然的感觉:

虽然我们从形式上得到了以微分算子形式出现的动量算符及其本征值关系,并且看到了它与矩阵特征值关系的相似之处,但这毕竟还是一种抽象形式。不管怎么样,一个微分算子和一个矩阵,怎么看也很难让人相信,它们是同一个物种。

而且,量子力学科普书告诉过我们:薛定谔的波动力学和海森堡的矩阵力学本质上是相通的。所以我们不禁开始了遐想:如果能将微分算子“打扮”成矩阵的形式,让它们看起来更像是同一个爹妈生的,岂不是美事一桩?

为了回答这个问题,同时也为了呼应本系列的标题,让线性代数和量子力学一起实现生命的大和谐,作者做了一件一件纯属娱乐的事情:

将微分算子写成“矩阵形式”,并且“证明”(不是严格意义的证明 )这个“矩阵”的“特征向量”就是指数函数。

于是就有了接下来的彩蛋部分。


彩蛋:微分算子变身矩阵

声明:下面的内容仅仅是一种直观类比,并非严格的数学推导,请务必注意

首先,我们模仿第7课中的做法,将某个函数 $\small f(x)$ 在定义域上以间隔 $\small \Delta x$ 进行离散化,变成一个无穷维向量:

$\small (\cdots,f_{i-1},f_i,f_{i+1},\cdots)^T=(\cdots,f(x_{i-1}),f(x_i),f(x_{i+1}),\cdots)^T \quad\scriptsize{(式9.20)}$

其中:$\small x_{i+1}=x_i+\Delta x$

我们假设它的导函数为 $\small g(x)=\frac{\text d}{\text dx}f(x)$ ,那么导数运算在这里也就变成了差分运算:

$\small g_i=\frac{1}{2\Delta x}(f_{i+1}-f_{i-1}) \quad\scriptsize{(式9.21)}$

写到这里,也许有同学要问了:这里为什么用中心差分 $\small \frac{1}{2\Delta x}(f_{i+1}-f_{i-1})$ ,而不是向前差分 $\small \frac{1}{\Delta x}(f_{i+1}-f_{i})$ 或向后差分 $\small \frac{1}{\Delta x}(f_{i}-f_{i-1})$ ?

这是为了保证动量算符对应的矩阵的厄米性(Hermitian),有同学可能记得我们曾经在第6课中提到过这个词,后面我们会简单解释一下。

接下来,我们就要回到主线,来见证一个奇迹:将这个差分运算变成矩阵运算。

首先,我们定义一组矩阵元:

$\small D_{ij}= \begin{cases} \frac{1}{2\Delta x} & j=i+1\\ -\frac{1}{2\Delta x} & j=i-1\\ 0 & \text{otherwise}\ \end{cases} \quad\scriptsize{(式9.22)}$

根据这个定义,我们可以将 $\small g_i$ 的差分形式逐步改写:

$\small \begin{align} g_i&=\frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right) \\ &=\frac{1}{2\Delta x}f_{i+1}-\frac{1}{2\Delta x}f_{i-1}\\ &=D_{i,i+1}f_{i+1}+D_{i,i-1}f_{i-1}\\ &=\scriptsize{\cdots+0\cdot f_{i-2}+D_{i,i-1}f_{i-1}+0\cdot f_{i}+D_{i,i+1}f_{i+1}+0\cdot f_{i+2}+\cdots}\\ &=\sum_j{D_{ij}f_j}\ \end{align} \quad\scriptsize{(式9.23)}$

而当 $\small \Delta x\rightarrow 0$ 时,这可以看成无穷维矩阵 $\small \boldsymbol D=[D_{ij}]_{\infty\times \infty}$ 与向量 $\small \boldsymbol f=(\cdots,f_{i-1},f_i,f_{i+1},\cdots)^T$ 的乘法:

$\small \begin{bmatrix} \vdots\\g_i\\ \vdots \end{bmatrix} =\frac{1}{2\Delta x}\begin{bmatrix} \ddots &\ddots & \\ \ddots &\ddots &\ddots \\ &-1& 0& 1&\\ & &\ddots&\ddots&\ddots\\ &&&\ddots&\ddots\ \end{bmatrix} \begin{bmatrix} \vdots \\ f_{i-1}\\ f_i \\ f_{i+1} \\ \vdots \end{bmatrix} \quad\scriptsize{(式9.24)}$

于是,函数的求导过程经过离散化以后,就变成了(未经严格定义的 )矩阵乘法。

(有人明白作者为什么要用中心差分了吗? )

但我们的戏法还没结束,接下来,我们还要来“证明”:

差分矩阵的特征向量,就是离散化的指数函数 $\small f(x)=e^{kx}$

这里需要第二次声明:我们即将进行的并不是严格的数学证明,因为有限维情形下的一些定义、结论和运算,不能简单推广到无穷维上面。

但这并不妨碍我们直观理解微分算子和矩阵之间的美妙联系

我们这就开干吧。

首先,我们照例将指数函数 $\small f(x)=e^{kx}$ 进行离散化:

$\small (\cdots,f_{i-1},f_i,f_{i+1},\cdots)^T=\left(\cdots,e^{kx_{i-1}},e^{kx_i},e^{kx_{i+1}},\cdots\right)^T \quad\scriptsize{(式9.25)}$

于是有:

$\small \frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right) =\frac{1}{2\Delta x}\left[e^{kx_{i+1}}-e^{kx_{i-1}}\right] \quad\scriptsize{(式9.26)}$

将 $\small e^{kx_{i+1}} 和 \small e^{kx_{i-1}}$ 在 $\small x_i$ 附近进行泰勒展开,可以得到:

$\small \begin{align} e^{kx_{i+1}}&=e^{k(x_{i}+\Delta x)}\\ &=e^{kx_{i}}+k\Delta xe^{kx_{i}}+\frac{k^2}{2}\Delta x^2e^{kx_{i}}+\frac{k^3}{6}\Delta x^3e^{kx_{i}}+\cdots \end{align} \quad\scriptsize{(式9.27)}$

$\small \begin{align} e^{kx_{i-1}}&=e^{k(x_{i}-\Delta x)}\\ &=e^{kx_{i}}-k\Delta xe^{kx_{i}}+\frac{k^2}{2}\Delta x^2e^{kx_{i}}-\frac{k^3}{6}\Delta x^3e^{kx_{i}}+\cdots \end{align} \quad\scriptsize{(式9.28)}$

于是:

$\small \frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right)=ke^{kx_{i}}+k^3\frac{1}{6}\Delta x^2e^{kx_{i}}+\cdots \quad\scriptsize{(式9.29)}$

当 $\small \Delta x\rightarrow 0$ 时,可以忽略第二项及以后的所有项,于是:

$\small \small \frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right)\simeq ke^{kx_{i}}=kf_i \quad\scriptsize{(式9.30)}$

而根据前面的定义:

$\small \frac{1}{2\Delta x}\left(f_{i+1}-f_{i-1}\right)=\sum_j{D_{ij}f_j} \quad\scriptsize{(式9.31)}$

于是我们得到:

$\small \sum_j{D_{ij}f_j}=kf_i \quad\scriptsize{(式9.32)}$

写成“无穷维矩阵相乘”的形式,就是:

$\small \frac{1}{2\Delta x}\begin{bmatrix} \ddots &\ddots & \\ \ddots &\ddots &\ddots \\ &-1& 0& 1&\\ & &\ddots&\ddots&\ddots\\ &&&\ddots&\ddots\ \end{bmatrix} \begin{bmatrix} \vdots\\f_{i-1}\\f_i\\f_{i+1}\\ \vdots \end{bmatrix} = k \begin{bmatrix} \vdots\\f_{i-1}\\f_i\\f_{i+1}\\ \vdots \end{bmatrix} \quad\scriptsize{(式9.33)}$

写成抽象形式,就是:

$\small \boldsymbol D\boldsymbol f=k\boldsymbol f \quad\scriptsize{(式9.34)}$

这就意味着,函数 $\small f(x)=e^{kx}$ 对应的“向量” $\small \boldsymbol f$ ,是“微分算子矩阵” $\small \boldsymbol D$ 的“特征向量”,相应的特征值为 $\small k$ 。

到此为止,我们就将微分算子和矩阵联系了起来,虽然这和我们后面的内容并没有什么关系,但它可以让作者这样的强迫症感觉舒服一点,仅此而已。

对了,这里第三次声明:我们上面的计算只是对算子和矩阵进行了直观的类比,而不是严格的数学证明,因为有限维情形并不能简单推广到无限维上,请一定记住这一点。

最后,我们来解释前面留的一个尾巴:前面将微分变成差分的时候,为什么要用中心差分?

我们知道,前面我们给出了动量算符的坐标表象:

$\small \hat{p}=-\text i\hbar\frac{\partial }{\partial x} \quad\scriptsize{(式8.15)}$

现在我们将它写成差分矩阵的形式,就是:

$\small P=\frac{1}{2\Delta x}\begin{bmatrix} \ddots &\ddots & \\ \ddots &\ddots &\ddots \\ &\text i\hbar& 0& -\text i\hbar&\\ & &\ddots&\ddots&\ddots\\ &&&\ddots&\ddots\\ \end{bmatrix} \quad\scriptsize{(式9.35)}$

第6课中我们提到过一个概念,就是可观测的力学量的本征值都是实数,而相应的算符通常是所谓的厄米算符。

这类算符的定义我们有需要的时候再补充,但如果我们将这类算符写成矩阵形式,那么它们有一个非常容易记住的特质:

将它们转置后、再对矩阵元取复共轭,得到的还是原矩阵。

比如这样的矩阵:$\small \begin{bmatrix}1&1+\text i\\1-\text i&2\end{bmatrix}$ ,它转置后变成 $\small \begin{bmatrix}1&1-\text i\\1+\text i&2\end{bmatrix} $,再对所有矩阵元取复共轭,我们就又得到了 $\small \begin{bmatrix}1&1+\text i\\1-\text i&2\end{bmatrix}$ ,这就是一个厄米矩阵,我们容易验证它的本征值都是实数。

而动量作为一个可观测量,它的算符的“矩阵形式”当然也应该是厄米矩阵,即满足转置共轭条件,而中心差分对应的矩阵形式(式9.35 )正好就有这样的性质。

这里顺便再说一句,一个矩阵 $\small M$ 的转置共轭通常记作 $\small M^{\dagger}$ ,读作M-dagger (右上角那个符号像一把短剑,英文就是dagger,LaTex代码也是 \dagger )。

于是一个厄米矩阵 $\small H$ 的共轭转置条件就写作:

$\small H=H^{\dagger} \quad\scriptsize{(式9.36)}$


编辑于 2021-11-30 13:25

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注