从线性代数到量子力学(12):表象变换

PeiLingX
物理学等 2 个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》的第12课。

了解本系列及本专栏其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

上节课中,我们用单缝衍射实验的结果定性地展现了不确定性原理的最典型的例子:

位置和动量的不确定性关系。

而我们知道,位置和动量之间的不确定性,可以用两者的标准差$ \small \Delta x,\Delta p $定量表示成这样一个著名的不等式:

$\small \Delta x\Delta p\geq\frac{\hbar}{2} \quad\scriptsize{(式11.1)}$

(为了方便理解,我们只讨论一维模型,因此动量符号$ \small p $下面不再标注下标)

这描述了位置和动量不确定度的此消彼长:一个分布越集中,另一个就越分散。

而在文章的最后,我们提到,这种“此消彼长”的关系背后,也暗藏着一个线性代数原理:基底变换,而量子力学中我们将它称作表象变换

理解了这种变换关系,我们就能找出一个物体的位置分布和动量分布之间的关系,最终理解不确定性原理的数学本质、并且导出那个著名的不确定性关系式。

为了更直观理解这种变换,我们还是先从二维平面的例子说起。


1) 表象:二维平面的直观例子

我们先假设,二维平面上分别有两组线性无关的基底:$ \small {\boldsymbol\alpha_1,\boldsymbol\alpha_2} $以及$ \small {\boldsymbol\beta_1,\boldsymbol\beta_2}$

现在给定一个向量$ \small \boldsymbol u $,那么它分别在以$ \small {\boldsymbol\alpha_1,\boldsymbol\alpha_2} $为基底和以$ \small {\boldsymbol\beta_1,\boldsymbol\beta_2} $为基底时,坐标分量(也就是在两组基底上的投影)是不同的:

我们不妨把这两种分量形式换成量子力学语言,分别叫做“$ \small \alpha $表象”和“$ \small \beta $表象”。

而现在,我们要关心的是,两种“表象”之间的变换关系。

在线性代数中我们知道,这可以从$ \small {\boldsymbol\alpha_1,\boldsymbol\alpha_2} $与$ \small {\boldsymbol\beta_1,\boldsymbol\beta_2} $本身之间的变换关系来得到。

我们这就来复习一遍。


2) 表象变换:二维平面的直观例子

为了方便理解,我们用不带上标的粗体字母、比如$ \small \boldsymbol u $、来代表向量本身,这与基底选取无关。而当我们在某个具体的表象下写出它的分量形式时,则加上与基底相应的上标,比如在“$ \small \alpha $表象”下,$ \small \boldsymbol u $的分量形式为:

$\small \boldsymbol u^{(\alpha)}=(u_1^{(\alpha)},u_2^{(\alpha)})^T \quad\scriptsize{(式12.1)}$

如果我们将$ \small \boldsymbol u^{(\alpha)} $当作已知条件,那么只要我们再给出基底$ \small {\boldsymbol\alpha_1,\boldsymbol\alpha_2} $在基底$ \small {\boldsymbol\beta_1,\boldsymbol\beta_2} $下的分量形式,我们就能求出$ \small \boldsymbol u $的“$ \small \beta $表象”、即$ \small \boldsymbol u^{(\beta)} $的分量形式了。这样我们就得到了$ \small \alpha $和$ \small \beta $两种“表象”(两个基底)的变换关系。

根据前面的约定,我们将基底$ \small {\boldsymbol\alpha_1,\boldsymbol\alpha_2} $的“$ \small \beta $表象”分别记为:

$\small \begin{cases} \boldsymbol\alpha_1^{(\beta)}&=\left( \matrix{a^{(\beta)}_{11} & a^{(\beta)}_{21}} \right)^T\\ \boldsymbol \alpha^{(\beta)}_2&=\left( \matrix{a^{(\beta)}_{12} & a^{(\beta)}_{22}} \right)^T \end{cases} \quad\scriptsize{(式12.2)}$

这里其实说明了两组基底之间的线性叠加关系:

$\small \begin{cases} \boldsymbol\alpha_1&=a^{(\beta)}_{11}\boldsymbol\beta_1+a^{(\beta)}_{21}\boldsymbol\beta_2\\ \boldsymbol\alpha_2&=a^{(\beta)}_{12}\boldsymbol\beta_1+a^{(\beta)}_{22}\boldsymbol\beta_2 \end{cases} \quad\scriptsize{(式12.3)}$

α1的“β表象”

有了这个关系,我们就能得到:

$\small \begin{align} \boldsymbol u&=u_1\boldsymbol\alpha_1+u_2\boldsymbol\alpha_2\\ &=a^{(\beta)}_{11}u_1\boldsymbol\beta_1+a^{(\beta)}_{21}u_1\boldsymbol\beta_2+a^{(\beta)}_{12}u_2\boldsymbol\beta_1+a^{(\beta)}_{22}u_2\boldsymbol\beta_2\\ &=\left(a^{(\beta)}_{11}u_1\boldsymbol+a^{(\beta)}_{12}u_2\right)\boldsymbol\beta_1+\left(a^{(\beta)}_{21}u_1\boldsymbol+a^{(\beta)}_{22}u_2\right)\boldsymbol\beta_2 \end{align} \quad\scriptsize{(式12.4)}$

写成矩阵形式,就是我们熟悉的基底变换关系:

$\small \begin{bmatrix} u^{(\beta)}_{1}\\u^{(\beta)}_{2} \end{bmatrix} =\begin{bmatrix} a^{(\beta)}_{11}&a^{(\beta)}_{12}\\ a^{(\beta)}_{21}&a^{(\beta)}_{22} \end{bmatrix}\begin{bmatrix} u^{(\alpha)}_{1}\\u^{(\alpha)}_{2} \end{bmatrix} \quad\scriptsize{(式12.5)}$

不过,为了方便后面讨论,我们还是将上式写成求和形式:

$\small u^{(\alpha)}_i\ \rightarrow \ u^{(\beta)}_i=\sum_j{a^{(\beta)}_{ij}u^{(\alpha)}_j} \quad\scriptsize{(式12.6)}$

也就是说,只要给出了两个信息:

  • 基底$ \small {\boldsymbol\alpha_j} $的“$ \small \beta $表象”、即$ \small a^{(\beta)}_{ij}$
  • 向量$ \small \boldsymbol u $的“$ \small \alpha $表象”、即$ \small u^{(\alpha)}_j$

我们就能找到任意向量在两个基底之间的变换$ \small u^{(\alpha)}_i\ \rightarrow \ u^{(\beta)}_i $,这也是我们在线性代数中已经熟知的内容。

现在,我们将这种关系推广到量子力学中去。


3) 表象变换:动量与坐标

在第8课中,我们提到过,一个态矢量或算符在力学量$ \small F $中的表象,就是它在$ \small F $的本征态构成的基底下的具体形式。

当我们用位置坐标的本征态作为基底,来表示一个态矢量的时候,得到的就是坐标表象,而用动量的本征态作为基底,就得到动量表象。

为了方便结合物理事实讨论,我们现在将一个态矢量的动量表象作为已知条件,然后利用线性代数基底变换的思路,来找出它的坐标表象,这样我们就能得到两个表象之间的变换关系。

我们先来考虑离散的情形,即动量的本征值是一个离散序列,记为$ \small {p_n} $,又将相应的本征态序列记为$ \small {\left|p_n\right>} $。那么任意态矢量$ \small \left|\psi\right> $都可以表示成相应的动量本征态的叠加,记为:

$\small \left|\psi\right>=\sum_n{\phi_n\left|p_n\right>} \quad\scriptsize{(式12.7)}$

这样,系数序列$ \small {\phi_n} $就构成$ \small \left|\psi\right> $的动量表象。

现在我们来找出$ \small \left|\psi\right> $的坐标表象。

仿照线性代数中基底变换的推导思路,我们不难得知:

在已知$ \small \left|\psi\right> $的动量表象的前提下,只要能找到动量本征态$ \small \left|p_n\right> $的坐标表象,我们就能找出$ \small \left|\psi\right> $的坐标表象。

首先,我们在第8课中知道,一个态矢量的坐标表象,就是通常意义上的波函数,这里我们将动量本征态的波函数记为$ \small \psi_{p_n}(x)$

而根据动量本征态的定义,我们又知道,当一个物体处于某个动量本征态$ \small \left|p_n\right> $时,它就具有确定的动量值。

根据德布罗意关系,这就意味着,它的波函数是一个具有确定波数$ \small k $的正弦波,我们用复指数形式,记为:

$\small \psi_{p_n}(x)=\text e^{\text i \frac{p_n}{\hbar}x} \quad\scriptsize{(式12.8)}$

这就正是动量本征态$ \small \left|p_n\right> $的坐标表象了。

现在,我们仿照上一节中给出的二维平面上的基底变换关系:

$\small u^{(\alpha)}_i\ \rightarrow \ u^{(\beta)}_i=\sum_j{a^{(\beta)}_{ij}u^{(\alpha)}_j} \quad\scriptsize{(式12.9)}$

将其中$ \small \boldsymbol u $的“$ \small \alpha $表象”$ \small u^{(\alpha)}_i $替换为$ \small \left|\psi\right> $的动量表象$ \small {\phi_n} $、将基底$ \small {\boldsymbol \alpha_1,\boldsymbol \alpha_2} $的“$ \small \beta $表象”$ \small a^{(\beta)}_{ij} $替换为动量本征态的坐标表象$ \small \text e^{\text i \frac{p_n}{\hbar}x} $,就能写出$ \small \left|\psi\right> $的坐标表象的表达式:

$\small \psi(x)=A\sum_n{\phi_n\text e^{\text i \frac{p_n}{\hbar}x}} \quad\scriptsize{(式12.10)}$

可以看出,这是一个由动量本征态的波函数构成的傅里叶级数。

接下来,我们将这个结论推广到连续情形。

不考虑严谨性的话,这个推广其实就很简单了:

连续情形下,动量本征值具有连续取值,于是态矢量$ \small \left|\psi\right> $的动量表象自然就是以动量为自变量的函数$ \small \phi(p)$ (相当于离散情形下的序列 $\small {\phi_n}$ )

而此时的动量表象$-$坐标表象的变换关系式,也就是将求和换成积分,同时在动量本征态的波函数(坐标表象)前面加一个归一化系数$ \scriptsize A=\frac{1}{\sqrt{2\pi \hbar}}$ (以保证全空间的概率积分为1),于是我们得到:

$\small \psi(x)=\frac{1}{\sqrt{2\pi \hbar}}\int{\phi(p)\text e^{\frac{\text i}{\hbar}px}\text dp} \quad\scriptsize{(式12.11)}$

这个积分是不是很熟悉?

对,你没看错,动量表象与坐标表象之间的变换关系,就是那个总会在我们意想不到的地方出现、带给我们惊喜的跨界大佬:傅里叶变换

下一课中,我们就要用这个变换关系来最终给出不确定性原理的那个重要关系式:

$\small \Delta x\Delta p_x\geq\frac{\hbar}{2} \quad\scriptsize{(式11.1)}$

不过,结束全文之前,我们还要来顺便完成另一件支线任务。


4) 波粒二象性

还记得我们第1课开篇中提到的几个疑惑中有一个关于波粒二象性的吗:

我们知道微观粒子具有波粒二象性,物理课本告诉我们,微观粒子既是粒子又是波,但我们其实只是记住了这句话,这种奇怪的二重性质有没有更好的理解方式呢?

现在我们可以从态矢量和表象的角度来理解它了:

当我们将一个粒子的态矢量$ \small \left|\psi\right> $放到动量表象下时,它就变成了动量本征态的线性叠加:

$\small \left|\psi\right>=\sum_a \phi(p_a)\left|p_a\right> \quad\scriptsize{(式12.12)}$

而根据德布罗意关系,一个动量本征值对应着一个单色波的波数$ \small k_a=\frac{p_a}{\hbar} $,于是这个时候态矢量就可以看成一系列单色波的叠加,这就可以理解为它的波动性质。

而如果我们将它放到坐标表象下,它就变成了坐标本征态的线性叠加:

$\small \left|\psi\right>=\sum_a \psi(x_a)\left|x_a\right> \quad\scriptsize{(式12.13)}$

特别是,当我们去测量它的位置时,它就会以概率$ \small \left|\psi(x_a)\right|^2 $随机坍缩到一个坐标本征态$ \small \left|x_a\right> $上,这时候我们就在$ \small x=x_a $这个位置上找到了它,它也就体现出了粒子的属性。


5) 结语与预告

本课中,我们用二维平面上的基底变换作为直观类比,结合德布罗意关系,推导了态矢量的动量表象和坐标表象之间的变换式,最后惊奇地发现,它竟然就是傅里叶变换。

这不仅暗示了傅里叶变换与量子力学的微妙联系,也暗示了傅里叶变换背后的线性代数本质。实际上,傅里叶变换本身,就是“无穷维”空间上一种最重要的基底变换之一。

而鉴于傅里叶变换的神光已经照耀了理工科的半壁江山,在进入下一课之前,我们不妨先开一个番外篇,来梳理一下傅里叶变换与线性代数基底变换的类比关系:

$($链接待更新$)$

想跳过这段支线剧情的同学,请直接进入下一课。


编辑于 2021-11-30 14:46

从线性代数到量子力学(11):不确定性原理再体验

PeiLingX
物理学等2个话题下的优秀答主


本文是深度科普系列《从线性代数到量子力学》的第11课。

了解本系列及本专栏其他文章,请收藏目录:

专栏文章总目录


0) 开篇语

在本系列第4课和第5课中,我们已经通过通过对斯特恩-盖拉赫实验的介绍,初次体会了电子在两个相互垂直的方向上的自旋之间的不确定性关系。

但这毕竟是还一个远离经典物理的例子,从本课开始,我们将关注一对非常典型的经典力学量:位置动量

我们将在它们身上更仔细地体验不确定性原理以及背后的线性代数的影子,并且最终导出那个我们见到过无数次、却不明所以的海森堡不确定性关系(考虑一维情形):

$\small \Delta x\Delta p_x\geq\frac{\hbar}{2} \quad\scriptsize{(式11.1)}$

而为了对这个式子预先有个直观体验,我们将借(Chao)鉴(Xi)顾樵先生的例子,从电子的单缝衍射实验说起。


1) 单缝衍射

在中学物理中我们知道,做光子或电子的单缝衍射实验时,有这样一个定性结论:

狭缝的宽度$ \small \Delta x $越窄,衍射范围越宽(这里指的是“中央主极大衍射范围”、也就是中央那个最大的衍射峰的宽度,如下图),这个范围通常用中央一级衍射角$ \small \theta $来表征:

暂借顾樵版《量子力学II》配图,稍后自己画图更换

而上述关系可以描述为:

$\small \sin \theta=\frac{\lambda}{\Delta x} \quad\scriptsize{(式11.2)}$

(其中 $\small \lambda$ 为波长)

在这里,我们首先可以很容易想到,狭缝的宽度$ \small \Delta x $可以表征通过狭缝的粒子在$ \small x $方向上的位置的不确定度。

那么剩下另一个问题就是:一级衍射角$ \small \theta $意味着什么?

我们从一个半经典的分析中寻找答案:

如果我们假设电子的动量大小为$ \small p $,并且假设电子从狭缝到衍射屏之间沿直线前进(虽然“电子路径”并不存在),那么到达主极大衍射范围上下两个边界的电子在$ \small x $方向的动量分量分别为$ \small p\sin\theta $和$ \small -p\sin\theta$

如果只考虑中央衍射峰,这就意味着电子在$ \small x $方向上动量的不确定度与衍射角相当:

$\small \Delta p_x \sim2p\sin\theta \quad\scriptsize{(式11.3)}$

(这里并不是严格的相等关系,因此用~代替等号)

代入式11.2,可知:

$\small \Delta x\Delta p_x\sim2p\lambda \quad\scriptsize{(式11.4)}$

而根据德布罗意关系:

$\small p=\frac{h}{\lambda} \quad\scriptsize{(式9.8)}$

我们就能得到一个半定性半定量的关系式:

$\small \Delta x\Delta p_x\sim2h \quad\scriptsize{(式11.5)}$

这就隐约有点海森堡那个不确定性关系式的风貌了。

而在这个实验背景下,这个关系式的物理意义也非常明确:

狭缝越窄、即通过狭缝的电子的$ \small x $坐标越精确,它的动量分量$ \small p_x $就会变得越不确定,衍射范围也就越宽。

虽然这里的不确定度还只是一种定性描述,但通过这段分析,我们从电子衍射宽度的简单规律中,的确体会到了一个粒子的位置坐标与它在同一方向上的动量分量之间的不确定关系。

有了这个可以确信的物理事实,我们就能安心地去追究它背后的数学根源,而不会觉得一切都是纯数学世界里的空中楼阁。

后面的课程里,我们就要来看看,如何从数学原理上理解这个物理事实的必然性。

不过在此之前,我们要先对“不确定度”$ \small \Delta x,\Delta p_x $的真正含义做一个说明。


2) 不确定度

我们首先假设,有个粒子处于某个状态$ \small \left|\psi\right> $,并且这个$ \small \left|\psi\right> $不是位置的本征态,也不是动量的本征态,那么当我们去测量它的位置或动量时时,测量结果必然是随机的。

而假如我们有大量处于状态$ \small \left|\psi\right> $的粒子、并且逐个测量这些粒子的位置或动量时,我们自然会得到不同的测量结果,而这些测量结果的波动可以用标准差来衡量,而这就是不确定度$ \small \Delta x,\Delta p_x $的意义。

这里不难想到的是,状态$ \small \left|\psi\right> $不同,测量结果的标准差也不同。

比如处在某个位置本征态的粒子,位置的标准差必然是0,而动量的标准差是无穷大;反过来,处于某个动量本征态的粒子,位置的标准差是无穷大,而动量的标准差是0.

所以,证明不确定性关系式的关键,就是要计算不同状态下,位置和动量两个标准差的“联动关系”。

到了这一步,看起来我们的画风已经转向了概率计算问题,与本系列的幕后大佬线性代数似乎没啥关系了。

但实际上,位置标准差和动量标准差之间的“联动关系”背后,仍然能看到线性代数的影子。

还记得我们在第$8$课提到的“表象”吗?

我们当时提到过,表象其实就是线性代数中的基底的量子版本,当我们用位置的本征态作为基底来表示态矢量的时候,得到的就是它的位置表象,用动量的本征态作为基底表示态矢量的时候,得到的就是它的动量表象。

而如果我们能像线性代数中的基底变换一样,找到位置表象和动量表象之间的表象变换关系,我们就能计算某个状态下这两者的标准差的联动关系了。

所以这个问题归根结底还是逃不出线性代数的掌心。

为了简单体会一下表象变换,我们再来回顾一遍第5课中的级联斯特恩-盖拉赫实验。


3) 回顾:级联斯特恩-盖拉赫实验

在第5课关于级联斯特恩-盖拉赫实验的讨论中,我们知道:

电子在某个方向、比如$ \small z $方向上的自旋处于确定状态($\small +z $方向或$ \small -z $方向)时,在其他方向上、比如$ \small y $方向上的自旋就处于不确定状态。

我们从态矢量的观点解释了这个现象:$ \small z $方向自旋(记为$ \small S_z$ )的两个本征态$ \small \left|z_+\right>,\left|z_-\right> $与$ \small y $方向自旋$ \small S_y $的本征态$ \small \left|y_+\right>,\left|y_-\right> $并不“重合”,而是它们的线性组合:

$\small \begin{cases} \left|z_+\right>&=\frac{1}{\sqrt{2}}\left|y_+\right>+\frac{1}{\sqrt{2}}\left|y_-\right>\\ \left|z_-\right>&=-\frac{1}{\sqrt{2}}\left|y_+\right>+\frac{1}{\sqrt{2}}\left|y_-\right> \end{cases} \quad\scriptsize{(式11.6)}$

任意一个状态$ \small \left|\psi\right> $,我们假设,以$ \small z $方向自旋(记为$\small S_z$ )的两个本征态$ \small \left|z_+\right>,\left|z_-\right> $为基底时,它的表达式为:

$\small \left|\psi\right>=a_1\left|z_+\right>+a_2\left|z_-\right> \quad\scriptsize{(式11.7)}$

那么$ \small \psi_z=(a_1,a_2)^T $就是这个态矢量$ \small \left|\psi\right> $的“$ \small z $自旋表象”

而如果将前面的$ \small \left|z_+\right>,\left|z_-\right> $与$ \small \left|y_+\right>,\left|y_-\right> $的变换关系代入“$ \small z $自旋表象”下$ \small \left|\psi\right> $的表达式,我们又能得到$ \small \left|\psi\right> $的“$ \small y $自旋表象”,即:

$\small \begin{align} \psi_y&=\frac{1}{\sqrt{2}}(a_1-a_2,a_1+a_2)^T\\ &=\begin{bmatrix}\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\ \frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix}\begin{bmatrix}a_1\\ a_2\end{bmatrix}\\ &=\begin{bmatrix}\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\ \frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix}\psi_z \end{align} \quad\scriptsize{(式11.8)}$

这样,我们找到了$ \small S_z $和$ \small S_y $两种自旋表象下的表象变换关系,即矩阵$ \small \begin{bmatrix}\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\ \frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{bmatrix}$

对于在线性代数中身经百战的同学们而言,这个变换理解起来并不会有什么困难。

而坐标表象和动量表象之间的转换,也就仅仅是计算更复杂一点、将上面的变换从2维情形推广到“无穷维”情形而已。

下节课,我们就来梳理这个问题。


4) 总结与预告

在这节课短短的篇幅里,我们先是通过单缝衍射实验中狭缝宽度与衍射范围之间的反比关系,体验到了著名的海森堡不确定关系式:

$\small \Delta x\Delta p_x\geq\frac{\hbar}{2} \quad\scriptsize{(式11.1)}$

然后,我们用标准差解释了不确定度$ \small \Delta x,\Delta p_x $的含义,将不确定关系式变成了一个可以计算的概率问题。

但我们同时看到,不确定性关系的背后,包含的是坐标和动量之间的“联动关系”的信息,也就是坐标表象和动量表象之间的表象变换。要证明这个关系式,就要先找出两者之间的表象变换。

为了对表象变换有一个直观印象,我们通过回顾级联斯特恩$-$盖拉赫实验,给出了$ \small S_z $和$ \small S_y $两个方向的自旋表象下的变换矩阵。

而坐标和动量之间的变换,就相当于是将有限维的情形推广到无限维的情形,只是这种变换不再是以矩阵的方式呈现。

那么它会是什么样的变换呢?

下节课,我们就来瞧一瞧。


编辑于 2021-11-30 13:26