从线性代数到量子力学(8): 主角登场: 波函数与薛定谔方程

PeiLingX
物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》的第8课。

了解本系列其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

在第1课到第6课中,我们通过对态矢量和特征值理论的理解,一点点体会到了量子力学的数学原理。

但那毕竟还只是在更接近数学的纯精神世界中寻求快感,而不是在真实的物理世界中真刀真枪实战。

而在第7课中,我们为顺利进入具体物理世界进行了一次铺垫,直观上感受了向量与函数的联系,为我们拜谒量子力学的主角做好了最后的准备。

接下来,我们就可以召唤量子力学中的两大主角:波函数 (Wave Function)和薛定谔方程 (Schrödinger Equation )隆重登场了。


1) 波函数与坐标表象

还记得我们在第1课开头就提到过的那条“量子力学描述物理世界的方式”吗:

相比于经典力学中用具体的力学量描述物理对象的状态,量子力学中,描述物理状态只需要一个态矢量,它包含了一个物理对象一切力学量的概率信息(而不仅仅是位置 )。

而态矢量的具体表现形式,就是描述“波粒二象性”中那个“波”的波函数。

根据我们对“波”的理解,它描述的是某种振动在空间中的传播。

由于振动牵涉到时间,而传播依赖于空间,所以一个波函数,通常可以描述为空间和时间的函数,我们将它记为:

$\small \psi(x,y,z,t)$

那么,抽象的态矢量是怎么和一个具体的函数联系起来的呢?

笼统地说,是一种“投影”关系将它们联系了起来

而这种投影关系,有一个听起来很高端、高端到可以用来忽悠无知小学妹的名字,叫做“坐标表象”。

接下来我们就先来具体解释一下,什么是“表象”。

在线性代数中我们知道,对于同一个向量,选择不同的基底,会得到不同的分量形式。

比如上面图中的向量 $\small \boldsymbol \alpha$ ,在基底 $\small {\boldsymbol e_1,\boldsymbol e_2}$ 下,分量形式为:

$\small \left(a_1,a_2\right)=\left(\frac{\sqrt{2}}{2},\frac{\sqrt{2}}{2}\right)^T \quad\scriptsize{(式8.1)}$

在基底 $\small {\boldsymbol e'_1,\boldsymbol e'_2}$ 下,分量形式为:

$\small \left(a'_1,a'_2\right)=\left(\frac{\sqrt{3}}{2},\frac{1}{2}\right)^T \quad\scriptsize{(式8.2)}$

而我们在第7课中,已经理解了如何将一个函数在各点的函数值类比为向量在各个基底上的分量

那么,现在将向量类比为态矢量,将向量的分量形式类比为函数形式,我们就能理解什么是表象了:

对于同一个抽象的态矢量 $\small \left|\psi\right>$ 而言,一个“表象”就对应一组基底。我们说的“某某表象”,就是态矢量在某个力学量的本征态基底下的“投影”组成的函数形式。

比如当我们关注坐标时,选取坐标的本征态作为基底,它就表现为我们熟悉的波函数形式 $\small \psi(x,y,z,t)$ ,这就叫作态矢量的“坐标表象”(Coordinate Representation);

(顺便说一句,在量子力学里,坐标的本征态在数学上并没有一个良好的定义,有兴趣可以看看这个链接中的讨论。但这里我们先不用理会数学上的严谨性,因为它不会影响我们的理解 )

而当我们关注动量时,选取动量的本征态作为基底,那么我们会得到另外一个波函数形式 $\small \phi(p_x,p_y,p_z,t) $,这就叫做态矢量的“动量表象”(Momentum Representation)。

这里顺便多说一句:

我们知道,在不同基底之间,同一个向量的分量形式存在某种变换关系,而态矢量的两种表象的波函数之间,也有一定的变换关系,叫做“表象变换”。

比如坐标表象和动量表象之间,就满足某个非常有名的变换关系,它是我们将来推导不确定性关系的核心。

各位不妨猜一猜这是什么变换,我们在以后讲表象变换时再来揭晓。

现在我们回到坐标表象下的波函数 $\small \psi(x,y,z,t)$

我们要来看看,如何由它得到一个物理对象的力学量的概率信息,以及如何引出本文的第二个主角:薛定谔方程。


2) 力学量的概率信息

为了便于理解,我们先忽略波函数随时间变化的情况,并且先只考虑坐标表象下的一维情形,此时波函数仅仅是 x 坐标的函数: $\small \psi(x)$

理论上,给定了具体的波函数,我们就能找出任意经典力学量的概率信息。

不管是位置(即坐标 )、动量还是能量……只要有足够的信息,我们都能找出它们的概率分布来。

比如,有这么一个结论,熟读量子力学科普、并且可能接触过一些量子力学教材的我们,大概都听说过:

按照哥本哈根诠释,波函数的模方 $\small \big|\psi(x)\big|^2 $代表一个物理对象在坐标为 x 的位置出现的概率密度

这里其实说的就是如何从波函数中得到一个物理对象的位置的概率分布信息。

只不过,在没有理解态矢量之前,我们只能将它看成一个不明所以的物理事实。

但现在我们有了态矢量的思维方式,就可以更进一步理解它的数学本质了。

首先,我们知道,位置作为一个力学量,会对应一个算符、以及一系列本征值本征态

我们将位置算符记作 $\small \hat{x}$ ,它的本征值,就是所有可能被我们测量到的坐标值 $\small x$ ,而相应的本征态记作 $\small \left|x\right>$

(虽然前面说了,坐标的本征态并没有一个良好的定义,但我们可以继续假装这个问题不存在 )

按照我们第2课中知道的性质,对于处于任意量子态(不一定是本征态 ) $\small \left|\psi\right>$ 的物理对象而言,当我们去测量它的位置坐标时,测到它位于某个位置 $\small x_a$ 处的概率为:

$\small f(x_a)=\big|\left<x_a|\psi\right>\big|^2 \quad\scriptsize{(式8.3)}$

(注意:由于空间坐标是连续的,所以这里的“概率”通常指的是概率密度 )

但这毕竟只是一个不可计算的抽象式,怎么把它转化成我们正在讨论的波函数形式呢?

首先,我们已经知道了,坐标表象下, $\small \left|\psi\right>$ 对应的波函数表示为 $\small \psi(x)$

而接下来,我们需要找到本征态 $\small \left<x_a\right|$ 对应的波函数。

在这里,有一点非常特殊的是:我们是在坐标表象下求坐标自身的本征态的函数形式。

这类比到线性代数中,其实就有点像向量空间中给定一组正交归一的基底后,求这些基底自身的分量形式。

而我们知道,如果以自身为基底,那么向量空间中的基向量就是这样的简单形式:

$\small\begin{cases} \boldsymbol e_1&=(1,0,\cdots,0)^T\\ \boldsymbol e_2&=(0,1,\cdots,0)^T\\ &\vdots\\ \boldsymbol e_n&=(0,0,\cdots,1)^T \end{cases} \quad\scriptsize{(式8.4)}$

也就是说,某个基向量 $\small \boldsymbol e_k$ 的分量中,只有第 $\small k$ 个分量等于1,在其他分量上都为0.

现在我们将它类比到函数空间上。

我们似乎有理由猜测,对于坐标表象下的坐标本征态、也就是基底 $\small \left<x_a\right| $本身而言,它应该是这样一个函数:

当 $\small x=x_a$ 时函数值为1,而当 $\small x\neq x_a$ 时函数值为0.

但我们很快会发现这样定义有问题,因为我们要求一个态矢量必须具有归一化条件,即函数在坐标空间上的积分为1,但上面定义的函数只在一个点上不为0,其余点上处处为0,那么它的积分显然是0.

但联系到前面提到的向量空间中的类比,无论如何,“当 $\small x\neq x_a$ 时函数值为0”这个条件是应该保留的,那么我们就需要找一个函数,它在 $\small x\neq x_a$ 时函数值处处为0,但在坐标空间中的积分为1.

实际上,这样的函数并不存在于我们熟悉的初等函数中。它是一种特殊函数,由狄拉克发明,名叫δ函数

它的定义就是我们刚才提到的两个条件:

  • $\small \delta(x-x_a)=0\quad (\text{if}\ x\neq x_a) \quad\scriptsize{(式8.5\text a)}$
  • $\small \int_{\mathbb{R}}\delta(x-x_a)\text dx=1 \quad\scriptsize{(式8.5\text b)}$

对于本征值 $\small x_a$ 对应的本征态 $\small \left|x_a\right> 和 \small \left<x_a\right|$ ,它们在坐标表象下的波函数都是同一个δ函数: $\small \delta(x-x_a)$

读到这里,细心的同学可能会发现,这个定义意味着δ函数在 $\small x=x_a $处为无穷大,即:

$\small \delta(x-x_a)=\begin{cases}\infty&x=x_a\\ 0&x\neq x_a\end{cases} \quad\scriptsize{(式8.6)}$

这里突然出现的无穷大,似乎让我们的计算变得困难起来(因为∞无法参与计算 ),但幸运的是,我们在实际运算中只需要用到它的积分性质,也就是δ函数定义的第二条:

$\small\int_\mathbb{R}\delta(x-x_a)\text dx=1 \quad\scriptsize{(式8.5\text b)}$

而在此基础上,我们还能得到δ函数的另外一个更加令人喜爱的性质,那就是δ函数和任意一个平方可积函数相乘后积分的结果

$\small \int_{-\infty}^{+\infty}{\delta(x-x_a)\psi(x)\text dx}=\psi(x_a) \quad\scriptsize{(式8.7)}$

而我们在第7课中已经知道,这正好就是两个函数的内积运算:

$\small \int_{-\infty}^{+\infty}{\delta(x-x_a)\psi(x)\text dx}=\left<x_a|\psi\right>=\psi(x_a) \quad\scriptsize{(式8.8)}$

这样, $\small\psi(x_a)$ 也就可以看成态矢量 $\small\left|\psi\right> $在位置本征态 $\small\left<x_a\right| $上的“投影”、也就是线性组合的系数。

将所有的 $\small x_a $上的“投影”、即 $\small\psi(x_a)$ 组合起来,就组成了波函数 $\small \psi(x)$

这就是为什么我们说波函数是态矢量的坐标表象了。

而根据波函数的“投影”性质,我们不难将它和物理对象的状态坍缩到坐标本征态 $\small \left<x_a\right|$ 、也就是物理对象出现在某个位置 $\small x_a$ 的概率联系起来:

$\small \begin{align} f(x_a)&=\big|\left<x_a|\psi\right>\big|^2\\ &=\bigg|\int_{-\infty}^{+\infty}{\delta(x-x_a)\psi(x)\text dx}\bigg|^2\\ &=\big|\psi(x_a)\big|^2 \end{align} \quad\scriptsize{(式8.9)}$

这就得到了哥本哈根解释里描述的那个样子。

(对于三维情形,物理对象在空间中某点 $\small (x,y,z)$ 出现的概率密度就是 $\small \big|\psi(x,y,z)\big|^2$ )

到这里,我们就对波函数以及它的概率诠释有了更加“几何化”的理解。

现在,说完了坐标,让我们将注意力转移到一个更重要的力学量上:能量


3) 能量与定态薛定谔方程

能量算得上是量子力学中最重要的力学量

(量子态当然更重要,但它并不是一个力学量 )

从理论和美学的角度来说,能量决定了量子态如何随时间演化(我们待会儿就会看到 ),也是我们将来理解量子力学中的对称性和守恒律的基础;

而从现实的角度来说,能量也是量子力学走向实用化的最关键信息:

比如对于某种元素或材料而言,讨论它在原子级别的能量概率分布,有助于我们推算元素和材料的宏观性质,这被称为第一性原理计算(First Principle Calculation)。它是将化学和材料科学从不断试错的“炼金术”升级为有章可循的科学计算的必经之路。

(关于这一点,我们将在另一个系列:身边的微分方程中介绍 )

而在前面的讨论中,我们可以看到,要计算物理对象出现在某个位置的概率密度,需要先找到这个位置对应的本征态的波函数形式。

同理,寻找能量概率分布的关键步骤,就是找到能量的本征值和相应本征态的波函数形式。

为了实现这一点,我们需要先从能量的算符说起。

在第6课中我们曾经介绍过,能量的算符叫作哈密顿算符,记作 $\small \hat{H}$ 。

(其实要写成 $\small \hat{E}$ 也无妨,但因为能量算符的性质与分析力学紧密相连,而分析力学中能量又被称作哈密顿量,所以能量算符也就称作哈密顿算符了,没学过分析力学的同学可以先忽略这点,以后我们需要的时候再来具体介绍 )

相应的能量本征值系列我们记为 $\small {E_a}$ ,本征态系列记为 $\small {\left|a\right>}$ 。

根据第6课中提到的能量算符的本征值关系,我们知道:

$\small \hat{H}\left|a\right>=E_a\left|a\right> \quad\scriptsize{(式6.10)}$

这个式子将是我们寻找能量本征态的关键,因为只要我们确定了哈密顿算符在某个表象(比如坐标表象 )中的具体形式,理论上,我们就能将上面的式子变成一个方程,然后求解出相应的能量本征值和本征态。

这里顺便说一句,和态矢量类似,一个算符在不同的表象下,也有不同的形式,就像线性代数中同一个线性变换,在不同基底下表现成不同的矩阵形式一样(这些矩阵互为相似矩阵 )。

所以,当我们要进行具体计算的时候,需要找出一个算符在某个表象下的具体形式,就像计算矩阵特征值的时候需要一个具体的矩阵一样。

那么,如何找到哈密顿算符的具体形式呢?这需要我们回到经典力学中寻找一些启发……

我们知道,在经典力学中,一个物体的总能量等于动能加势能:

$\small E=T+V \quad\scriptsize{(式8.10)}$

而动能为:

$\small T=\frac{p^2}{2m} \quad\scriptsize{(式8.11)}$

(不考虑转动的情形下 )

于是总能量就是:

$\small E=\frac{p^2}{2m}+V \quad\scriptsize{(式8.12)}$

到了量子力学中,这样的能量关系仍然被保留了下来。

只不过,经典力学中的能量、动量、势能,到了量子力学中都变成了算符,于是上面的关系式变成了:

$\small \hat{H}=\frac{\hat{p}^2}{2m}+\hat{V} \quad\scriptsize{(式8.13)}$

这样,哈密顿算符作用在态矢量上的形式就变成了:

$\small \hat{H}\left|\psi\right>= \left(\frac{\hat{p}^2}{2m}+\hat{V}\right) \left|\psi\right> \quad\scriptsize{(式8.14)}$

你也许要问了:这不就是把经典力学的量都换成算符了吗?我们还是没有算符的具体形式啊?

别着急,如果我们知道了动量算符和势能算符在坐标表象下的具体形式,再结合 $\small \left|\psi\right>$ 的波函数形式,问题就有谱了。

为了让表述简单化,我们仍然来考虑一维的、且系统不随时间变化的情况:

首先,在具体的物理场景中,势能的空间分布是一个已知量: $\small V(x)$ ,可以认为这就是坐标表象下势能算符 $\small \hat{V}$ 的具体形式 (三维情形下为 $\small V(x,y,z)$ )

而动量算符的形式有点反直觉,这里我们先不加解释(解释放到下节课 )、直接给出它的形式:

在一维情形的坐标表象下,动量算符是关于坐标的微分算子:

$\small \hat{p}=-\text i\hbar\frac{\partial }{\partial x} \quad\scriptsize{(式8.15)}$

不难想象,在三维情形的坐标表象下,动量算符是一个梯度算子:

$\small \hat{\boldsymbol p}=-\text i\hbar\boldsymbol\nabla=-\text i\hbar\left(\frac{\partial }{\partial x},\frac{\partial }{\partial y},\frac{\partial }{\partial z}\right) \quad\scriptsize{(式8.16)}$

再考虑到 $\small \left|\psi\right>=\psi(x)$ ,将三者代入算符版本的能量关系式,我们就得到了:

$\small \hat{H}\left|\psi\right>=\left(-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V\right)\psi(x) \quad\scriptsize{(式8.17)}$

相应的三维版本就是:

$\small \hat{H}\left|\psi\right>=\left(-\frac{\hbar^2}{2m}\nabla^2+V(x,y,z)\right)\psi(x,y,z) \quad\scriptsize{(式8.18)}$

如果将能量本征态的波函数形式记为 $\small \psi_a(x)$ ,那么根据算符与本征态的关系: $\small \hat{H}\left|a\right>=E_a\left|a\right>$ ,我们就能得到:

$\small \left(-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V\right)\psi_a(x)=E_a\psi_a(x) \quad\scriptsize{(式8.19)}$

看出来了吗?这是一个微分方程,准确说,是一个典型的定态薛定谔方程

(当然,它还不是我们更熟悉的那个薛定谔方程本尊,而只能算是薛定谔方程的空间部分 )

解出这个方程,我们就能得到物理对象的能量在相应物理情形下的本征值和本征态,从而利用态矢量与本征态的内积关系,求出物理对象处于某种状态时的能量概率分布。

但这牵涉到方程的求解,本课暂不讨论。

在这里,我们更愿意去庆贺一件事情,就是我们又一次看到了代数方程和微分方程、特征向量和本征态之间的异曲同工之妙。

不过,到此为止,我们这节课的任务还没结束,因为现在给出的定态薛定谔方程,还没有包含量子态的全部信息。

怎么理解这句话呢?

在经典力学中,我们知道,给定了一个物体当前的状态(位置、动量等 )以及周围的物理环境(势能分布或者力场分布 ),那么我们就能根据牛顿定律列出动力学方程,求解物体的状态未来随时间的演化。

量子力学中,我们也需要一个能够求解量子态随时间演化的方程。

而前面的定态薛定谔方程中没有包含时间,也就无法告诉我们量子态怎么随时间演化。

接下来,我们就要来补充量子态随时间演化的规律。


4) 量子态的演化

前面我们提到,量子态的演化和能量有关,说得再具体一点,其实是和哈密顿算符有关。

现在我们先不加解释地给出它的演化规律:

$\small \frac{\partial }{\partial t}\left|\psi\right>=\frac{\hat{H}}{\text i\hbar}\left|\psi\right> \quad\scriptsize{(式8.20)}$

也就是说,量子态的演化可以看作哈密顿量作用在态矢量上的结果。

同学们一定很好奇:这个关系是怎么来的?

这一点,我们会分两次来解释:

下节课中,我们会从一个著名的物理事实出发来得到,而未来我们还会从更抽象但也更具有对称性的角度来说明。

现在我们回到演化方程本身,看看它在坐标表象下的具体形式。

首先,我们将 $\small \text i\hbar$ 移到左边,然后将前面给出的坐标表象下哈密顿算符的具体形式、即式8.17代入演化方程(式8.19),我们就能得到一个新的微分方程:

$\small \text i\hbar\frac{\partial }{\partial t}\psi(x,t)=\left(-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V\right)\psi(x,t) \quad\scriptsize{(式8.20)}$

相应的三维版本就是:

$\small \text i\hbar\frac{\partial }{\partial t}\psi(x,t)=\left(-\frac{\hbar^2}{2m}\nabla^2+V(x,y,z)\right)\psi(x,y,z,t) \quad\scriptsize{(式8.21)}$

怎么样,熟悉这个式子吗?

没错,这就是我们在科普书或量子力学教材中屡次相见、却一直不明所以的薛定谔方程的本尊

神奇吗?我们并没有特意追寻前人步伐、去了解过任何量子力学发展史,而仅仅凭借几个简单的线性代数假设、和很少一点经典力学的知识,也能“不经意地”走到这个里程碑面前。


4) 总结与预告

到此为止,我们终于来到了量子力学的正殿,拜见了量子力学的两个重要主角。

但更重要的是我们见到它们的方式:通过从第1课开始一路的领悟,用富有“几何意义”的线性代数关系、自然而然地引出了他们。

此时相见,他们不再仅仅是一堆纷乱且反直觉的物理现象,而是蕴涵着深刻而优美的代数本质:

  • 波函数 = 态矢量在坐标表象下的具体函数形式,类似于向量在某一组基底下的具体分量形式;
  • 定态薛定谔方程 = 能量的本征值关系在坐标表象下展现出的一个具体微分方程形式;
  • 薛定谔方程 = 量子态的时间演化规律在坐标表象下展现出的一个具体微分方程形式

这些数学本质将有助于我们继续用这种“悠然见南山”的方式去“发现”和理解更多结论,这一点,我们将会在后面的课程中体会到。

而眼下,我们需要回头来交待前文遗留下来的两个问题:

  • 为什么坐标表象下的动量算符的形式为 $\small \hat{p}=-\text i\hbar\frac{\partial }{\partial x}$
  • 为什么态矢量的时间演化满足关系式 $\small \frac{\partial }{\partial t}\left|\psi\right>=\frac{\hat{H}}{\text i\hbar}\left|\psi\right>$

如果想偷懒的话,我们其实可以将这两个结论本身直接看成一个物理事实,只是这样的表述更不“自然”而已。

而导出这两个结论的更“自然”的方式有两种:一种是从一个我们熟知的物理事实出发来得到,另一种是从一个更抽象也更有美感的数学关系出发来得到。

第二种对于现在的我们来说理解起来还有点难度,所以下节课我们先用第一种方式出发来得到它:


编辑于 2021-11-30 13:24

从线性代数到量子力学(7):当函数变身向量

PeiLingX

物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》的第7课。

了解本系列其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

在第6课中,我们看到了量子力学原理的核心,简单说来,就是用矩阵的特征值和特征向量理论,来理解量子力学中物理量算符的本征值本征态

其中,本征值对应着可以被测量到的经典力学量的值,而本征态可以构成量子力学的研究对象态矢量的一组基底

而在第6课的最后,我们用本征值和本征态的理解方式,粗略理解了原子能级的线性代数含义,并且将本征值关系和我们将要在以后重点讨论的定态薛定谔方程联系了起来。

我们看到,如果将定态薛定谔方程写成狄拉克符号表示的抽象形式:

$\small \hat{H}\left|a\right>=E_a\left|a\right> \quad\scriptsize{(式6.10)}$

那么它就是能量的本征值关系,和矩阵的特征值关系 $\small A\boldsymbol\alpha_k=\lambda_k\boldsymbol\alpha_k $在形式上完全一样。

这正是我们理解作为量子力学核心的薛定谔方程的重要线索。

不过,正如我们在第6课中提到过的一样,在薛定谔方程中,态矢量 $\small \left|\psi\right> $是以波函数 $\small \psi(x,t)$ 的形式存在的。

而我们知道,本征态是特殊的态矢量,而波函数是一个函数。那么紧接着问题就来了:

一个函数怎么就变成向量了呢?

本课就专门来回答这个问题。


1) 我们要讨论什么?

还记得吗?我们从第1课开始引入态矢量的时候,其实就一直围绕着基底与线性组合内积与正交性……这些关于向量的代数运算和几何性质在讨论。

所以,讨论函数的向量性质时,我们也将从这几个概念着手去理解。

并且,以后我们会看到,它们不仅有助于我们理解波函数和薛定谔方程的物理和数学意义、还将有助于我们今后理解表象理论,理解傅里叶变换,并且进一步理解海森堡不确定性关系

不过这都是后话了,现在,我们还是把思绪收回来,先随作者回顾一段作者自身的美妙经历。

不知道同学们还记不记得,高数课学到傅里叶级数的时候,书上提到过正交函数的概念:

如果定义在区间 $\small [a,b]$ 上的函数 $\small f(x),g(x)$ 满足:
$\small \int_a^b{f(x)g(x)\text dx}=0 \quad\scriptsize{(式7.1)}$
则称 $\small f(x),g(x)$ 在区间 $\small [a,b] $上相互正交。

第一次见到这个定义时,我困惑了很久,毕竟我们很难把抽象的函数想象成可以画在纸面上的向量(虽然函数也有图像,但这里的正交性显然不是两个函数的图像正交 )。

直到后来,我在某个暑假“顿悟”到了一种不严谨但比较形象的理解方式……

经过那次“顿悟”之后,我不仅理解了函数的向量性质,并且惊奇地发现傅里叶级数原来也自带了一点“几何意义”,这让我愉悦地度过了一个美妙的夏天。

接下来,就来和同学们分享这段感悟。

不过,在此之前,我们要先回到线性代数中,复习整理一下前面的课里一直在讨论的向量的几个性质,然后再看看如何将它们推广到函数上。


2) 基底、线性组合与内积

我们知道,给定一组正交基底 $\small {\boldsymbol e_1,\boldsymbol e_2,\cdots,\boldsymbol e_n}$ 后,一个 $\small n $维向量 $\small \boldsymbol a$ 可以表示为它们的线性组合:

$\small \boldsymbol a=\sum_{i=1}^{n}{a_i\boldsymbol e_i} \quad\scriptsize{(式7.2)}$

其中,线性组合的系数 $\small a_i$ 可以由 $\small \boldsymbol a $与 $\small \boldsymbol e_i $的内积计算:

$\small a_i=\frac{\left<\boldsymbol a,\boldsymbol e_i\right>}{\left|\boldsymbol e_i\right|^2} \quad\scriptsize{(式7.3)}$

这可以很容易地从代数上证明:

首先,根据线性组合关系:
$\small\begin{align} \left<\boldsymbol a,\boldsymbol e_i\right>&=\left<\sum_{j=1}^{n}{a_j\boldsymbol e_j},\boldsymbol e_i\right>\\&=\sum_{j=1}^{n}{a_j\left<\boldsymbol e_j,\boldsymbol e_i\right>}\\&=a_1\left<\boldsymbol e_1,\boldsymbol e_i\right>+a_2\left<\boldsymbol e_2,\boldsymbol e_i\right>+\cdots+a_n\left<\boldsymbol e_n,\boldsymbol e_i\right> \end{align} \quad\scriptsize{(式7.4)}$
由于 $\small {\boldsymbol e_1,\boldsymbol e_2,\cdots,\boldsymbol e_n} $是单位正交基,所以:
$\small \left<\boldsymbol e_j,\boldsymbol e_i\right>=\left<\boldsymbol e_i,\boldsymbol e_i\right>\delta_{ij}=\begin{cases} \left|\boldsymbol e_i\right|^2& i=j\\ 0& i\neq j \end{cases} \quad\scriptsize{(式7.5)}$
因此,上面的求和式中,除了 $\small a_i\left<\boldsymbol e_i,\boldsymbol e_i\right>$ 项以外,其余都为0。
最终得:
$\small a_i=\frac{\left<\boldsymbol a,\boldsymbol e_i\right>}{\left|\boldsymbol e_i\right|^2} \quad\scriptsize{(式7.3)}$
Q.E.D.

而上式的几何意义也很明确(至少在实数域上如此 ):

内积 $\small \left<\boldsymbol a,\boldsymbol e_i\right>=\left|a\right|\left|e_i\right|\cos{\theta_i}$ ,其中 $\small \theta$ 是 $\small \boldsymbol a $在 $\small \boldsymbol e_i$的夹角,因此内积 $\small \left<\boldsymbol a,\boldsymbol e_i\right>$ 的意义,就是向量 $\small \boldsymbol a$ 在基底$ \small \boldsymbol e_i$ 上的投影长度 $\small |a|\cos{\theta_i}$ 乘以$\small \boldsymbol e_i$ 的长度 $\small \left|\boldsymbol e_i\right|$

而如果将基底 $\small \boldsymbol e_i $的长度 $\small \left|\boldsymbol e_i\right| $作为单位长度,那么 $\small \boldsymbol a $的分量 $\small a_i $的几何意义,正好又是 $\small \boldsymbol a $在 $\small \boldsymbol e_i $上的投影长度与单位长度 $\small \left|\boldsymbol e_i\right| $之比,即 $\small a_i=\frac{|a|\cos{\theta_i}}{|\boldsymbol e_i|}$ (就像我们中学做矢量的正交分解一样 )

二维平面上的例子

因此 $\small \left<\boldsymbol a,\boldsymbol e_i\right> $和$ \small a_i $是正比关系,两者相差一个系数 $\small \left|\boldsymbol e_i\right|^2$

接下来,我们就要将基底、线性组合、内积、正交这些概念推广到函数上。


3) 函数的向量性质

我们先看看,如何将一个函数从形式上变成向量。

让我们来考虑一个定义在区间 $\small [a,b]$ 上的函数 $\small f(x)$

将 $\small [a,b]$ 分成 $\small n$ 个等间隔的小区间,每个区间的长度记为$ \small \Delta x$ ,则:

$\small \Delta x=\frac{b-a}{n} \quad\scriptsize{(式7.6)}$

然后,让函数在相邻区间的节点上取值,就可以得到一个离散数组:

$\small \left(f_0,f_1,f_2,\cdots,f_n\right) :=\left(f(a),f(a+\Delta x),f(a+2\Delta x),\cdots,f(b)\right) \quad\scriptsize{(式7.7)}$

这是不是在形式上和向量 $\small (a_1,a_2,\cdots,a_n) $很像了?

但是这显然不够,因为向量是有内积运算、正交关系、线性组合关系等一系列性质的。

接下来,我们就先来抓住其中最关键的一条:内积

我们先把两个向量的内积再写一遍:

$\small \left<\boldsymbol a,\boldsymbol b\right>=\sum_{i=1}^{n}{a_ib_i} \quad\scriptsize{(式7.8)}$

上面是对于定义在实数域上的向量而言的,而由于量子力学是复数的天下,我们会频繁看到复数域上取值的态矢量,所以我们要将这个定义推广到复数域上:

$\small \left<\boldsymbol a,\boldsymbol b\right>=\sum_{i=1}^{n}{a^*_ib_i} \quad\scriptsize{(式7.9)}$

(其中 $\small a^*_i $表示分量 $\small a_i $ 的共轭复数,就像我们在第2课里看到过的那样 )

根据这个定义,我们可以形式上类比着写出两个经过离散化的函数 $\small f(x),g(x) $的内积:

$\small \left<f,g\right>:=\sum_{i=0}^{n}{f^*_ig_i} \quad\scriptsize{(式7.10)}$

由于函数是定义在连续的实数区间上的,我们可以把小区间的个数 $\small n$ 无限细分下去(这也暗示着函数作为向量时、所在的向量空间是“无穷维”的 ),这样就能对前面定义的内积取极限:

$\small \left<f,g\right>:=\lim_{n\rightarrow\infty}{\left(\sum_{i=0}^{n}{f^*(x_i)g(x_i)}\right)} \quad\scriptsize{(式7.11)}$

但问题来了:由于 $\small f(x),g(x)$ 会取遍 $\small [a,b] $区间上的所有点,所以这个极限是发散的。

怎么办?

答案其实不难:我们知道,小区间个数 $\small n$ 趋近无穷的同时,小区间长度 $\small \Delta x$ 会趋近于0,所以我们可以考虑在求和式的基础上乘以 $\small \Delta x$ ,变成:

$\small \left<f,g\right>=\lim_{\Delta x\rightarrow0}{\left(\Delta x\sum_{i=0}^{n}{f^*(x_i)g(x_i)}\right)} \quad\scriptsize{(式7.12)}$

等一下,这个极限式是不是在哪见过?

你没看错,我们的确见过它,它就是黎、曼、积、分

话说到这个份上,我们就不用再遮遮掩掩、可以直接给出函数内积的定义了:

$\small \left<f,g\right>=\int_{a}^{b}{f^*(x)g(x)\text dx} \quad\scriptsize{(式7.13)}$

而有了内积之后,函数的“正交性”也就呼之欲出:

当 $\small \int_a^b{f^*(x)g(x)\text dx}=0$ 时,函数 $\small f(x),g(x)$ 正交

对于定义在实数域上的函数而言, $\small f^*(x)=f(x) $,于是我们就得到了开篇语中提到的那个正交函数的定义:

$\small \int_a^b{f(x)g(x)\text dx}=0 \quad\scriptsize{(式7.1)}$

现在,明确了“正交”的概念,我们再来看看函数中的“正交基底”。

这些基底其实就是我们在高数课本里看到过的函数项级数,我们在以后解薛定谔方程的时候经常会遇到。

而“正交的”函数项级数中,我们最熟悉的例子就是傅里叶级数


4) 傅里叶级数的“几何意义”

我们知道,一个以 $\small 2T$ 为周期的、满足一定条件(高数课本上提到过的Dirichlet条件,这里不去深究 )的周期函数 $\small f(x)$ ,可以展开成三角函数的级数和,即傅里叶级数:

$\small f(x)=\frac{a_0}{2}+\sum_{k=1}^{\infty} {\left[ a_k\cos{\left(\frac{k\pi x}{T}\right)}+b_k\sin{\left(\frac{k\pi x}{T}\right)} \right]} \quad\scriptsize{(式7.14)}$

而高数课本还告诉我们,其中的三角函数序列$\scriptsize \left\{\cos{\left(\frac{k\pi x}{T}\right)},\sin{\left(\frac{k\pi x}{T}\right)}\right\} $在一个周期内满足两两正交的关系:

$\small \begin{cases} \int_{-T/2}^{T/2} {\cos{\left(\frac{m\pi x}{T}\right)}\cos{\left(\frac{n\pi x}{T}\right)}\text dx} =\begin{cases} T& m=n\\ 0& m\neq n \end{cases}\\ \int_{-T/2}^{T/2} {\sin{\left(\frac{m\pi x}{T}\right)}\sin{\left(\frac{n\pi x}{T}\right)}\text dx} =\begin{cases} T& m=n\\ 0& m\neq n \end{cases}\\ \int_{-T/2}^{T/2} {\cos{\left(\frac{m\pi x}{T}\right)}\sin{\left(\frac{n\pi x}{T}\right)}\text dx}=0 \end{cases} \quad\scriptsize{(式7.15)}$

现在,有了对函数内积的理解,我们就能明白,这个三角函数序列恰好构成了一组正交基底。

而函数 $\small f(x)$ 的傅里叶级数就可以看成这组基底的线性组合:

$\small \begin{align} f(x)&=a_0\cos{0}+b_0\sin{0}+a_1\cos{\left(\frac{\pi x}{T}\right)}+b_1\sin{\left(\frac{\pi x}{T}\right)}+\cdots\\&=a_0+a_1\cos{\left(\frac{\pi x}{T}\right)}+b_1\sin{\left(\frac{\pi x}{T}\right)}+\cdots \end{align} \quad\scriptsize{(式7.16)}$

(是不是发现这个式子和高数课本上的傅里叶级数不太一样?别担心,我们后面会把它变成我们熟悉的样子 )

而根据向量线性组合的系数公式 $\small a_i=\frac{\left<\boldsymbol a,\boldsymbol e_i\right>}{\left<\boldsymbol e_i,\boldsymbol e_i\right>}$ ,我们可以类比着写出:

$\small \begin{cases} a_k=\frac{\left<f(x),\cos{\left(\frac{k\pi x}{T}\right)}\right>}{\left<\cos{\left(\frac{k\pi x}{T}\right)},\cos{\left(\frac{k\pi x}{T}\right)}\right>}\\ b_k=\frac{\left<f(x),\sin{\left(\frac{k\pi x}{T}\right)}\right>}{\left<\sin{\left(\frac{k\pi x}{T}\right)},\sin{\left(\frac{k\pi x}{T}\right)}\right>} \end{cases} \quad\scriptsize{(式7.17)}$

再根据函数内积的定义,可以分别算得:

$\small \begin{cases} a_0=\frac{\int_{-T}^{T}{f(x)\cos{0}\text dx}}{\int_{-T}^{T}{\cos^2{0\text dx}}} =\frac{1}{2T}\int_{-T}^{T}{f(x)\text dx}\\ a_k=\frac{\int_{-T}^{T}{f(x)\cos{\left(\frac{k\pi x}{T}\right)\text dx}}}{\int_{-T}^{T}{\cos^2{\left(\frac{k\pi x}{T}\right)\text dx}}} =\frac{1}{T}\int_{-T}^{T}{f(x)\cos{\left(\frac{k\pi x}{T}\right)\text dx}}\\ b_k=\frac{\int_{-T}^{T}{f(x)\sin{\left(\frac{k\pi x}{T}\right)\text dx}}}{\int_{-T}^{T}{\sin^2{\left(\frac{k\pi x}{T}\right)\text dx}}} =\frac{1}{T}\int_{-T}^{T}{f(x)\sin{\left(\frac{k\pi x}{T}\right)\text dx}} \end{cases} \quad\scriptsize{(式7.18)}$

$\small (k=1,2,\cdots)$

而为了让 $\small a_0 $和 $\small a_k{\ }(k=1,2,\cdots) $具有相同的表达式,我们钦定:

$\small a_0=\frac{\int_{-T}^{T}{f(x)\text dx}}{T} \quad\scriptsize{(式7.19)}$

于是傅里叶级数就变成了我们熟悉的样子:

$\small f(x)=\frac{a_0}{2}+\sum_{k=1}^{\infty} {\left[ a_k\cos{(\frac{k\pi x}{T})}+b_k\sin{(\frac{k\pi x}{T})} \right]} \quad\scriptsize{(式7.20)}$

而此时系数 $\small a_k,b_k $的“几何意义”也变得很明确:

它们就是 $\small f(x) $在一系列正交的三角函数基底上的“投影”。

换句话说,$ \small f(x) $可以看成某个“无穷维”向量空间里的一个向量,而傅里叶级数中的三角函数序列,就是这个“无穷维”向量空间中的一组基底组合成 $\small f(x)$ 的过程。


5) 总结与预告

通过一种不太严谨但比较容易理解的方式,我们理解了函数内积,从而理解了函数的向量性质,并且通过傅里叶级数的例子感受了它们的“几何意义

将满足一定条件的周期函数 $\small f(x)$ 看成某个“无穷维”向量空间里的向量,傅里叶级数中的三角函数序列,就是这个“无穷维”向量空间中的一组基底,傅里叶级数也就是将 $\small f(x) $展开成这组基底的线性组合。

而在后面的课程里我们将会看到,量子力学中的波函数,也是某个“无穷维”向量空间中的向量,这也就是为什么我们将它称作“态矢量”了。

到时候我们还将看到:薛定谔方程的解,通常也能表示成某种级数形式,而级数中的各项,也正好构成了一组基底,并且,这组基底,又刚好对应着某个算符的一组本征态……

再联想到我们在第6课中看到的、定态薛定谔方程 $\small \hat{H}\left|\psi\right>=E\left|\psi\right> $与矩阵特征向量关系 $\small A\boldsymbol\alpha=\lambda\boldsymbol\alpha $在形式上的相似,我们似乎马上要见证一个Eureka Moment的到来了。

到那个时候,我们将会见证到,态矢量、波函数、算符、本征值、本征态……这一堆的名词,终将在线性代数的引领下,完美地汇集到薛定谔方程中,完成“生命的大和谐”。

我们将从下节课开始揭晓。


编辑于 2021-11-30 13:23