听出鼓的形状
本文标题 “听出鼓的形状”, 来自 Mark Kac 于 1966 年发表的文章 Can One Hear the Shape of a Drum? 中提出的问题. 我们知道, 鼓面的形状 (也包括其大小), 决定了它能发出的声音, 而这篇文章所说的问题, 如其字面意思, 是我们能否通过鼓发出的声音反向得知鼓的形状.
笔者是在今年二月的一次讲座上了解到这一问题与相关的工作, 觉得实在是非常有趣, 于是决定写一篇博客记下自己的理解.
本文将从零开始, 用数学的语言说明我们的语境中的鼓和声音都是什么, 以规范问题的定义, 并给出问题的答案. 因为这并不是笔者的研究领域, 所以本文的内容并不深入, 但希望能为读者提供一个清晰的概念框架. 阅读本文需要一些基本的高等数学知识, 并要对微分方程有一定的了解.
鼓和声音
波动方程
波动方程是描述波动现象的偏微分方程, 在这里我们将讨论二维的情况. 但在开始之前, 笔者推荐先阅读文章: 为什么是「十二」平均律, 其中介绍了一维波动方程的情形, 或许能有助于理解.
与一维的弦类似, 我们考虑一个均匀的鼓膜, 它张紧在 $xy$ 平面上的一个区域 $\Omega \subset \mathbb{R}^2$ 上, 我们用 $u(x, y, t)$ 表示 $(x, y)$ 点处的鼓膜在时刻 $t$ 的位移.
我们对鼓膜上的一个微小矩形区域 $\Delta A = \Delta x \Delta y$ 进行受力分析. 假设鼓膜的张力为 $T$, 表面密度为 $\sigma$ (单位面积的质量).
类似于一维情况的推导, 垂直方向上的净恢复力为:
$$F_{net} \approx \left( T \frac{\partial^2 u}{\partial x^2} + T \frac{\partial^2 u}{\partial y^2} \right) \Delta x \Delta y = T \left( \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} \right) \Delta A.$$这个微元质量为 $m = \sigma \Delta A$, 其加速度为 $a = \frac{\partial^2 u}{\partial t^2}$. 根据牛顿第二定律 $F=ma$, 我们有:
$$T \left( \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} \right) \Delta A = (\sigma \Delta A) \frac{\partial^2 u}{\partial t^2},$$整理后, 我们得到二维波动方程:
$$\frac{\partial^2 u}{\partial t^2} = c^2 \left( \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} \right),$$其中 $c = \sqrt{T/\sigma}$ 是波在鼓膜上传播的速度. 使用 Laplace 算子 $\Delta = \frac{\partial^2}{\partial x^2} + \frac{\partial^2}{\partial y^2}$, 方程可以更简洁地写为:
$$\frac{\partial^2 u}{\partial t^2} = c^2 \Delta u$$边界条件与特征方程
鼓膜的边界是固定的, 因此我们需要在边界上施加 Dirichlet 边界条件:
$$u(x, y, t) = 0, \quad \forall (x, y) \in \partial\Omega.$$为了求解这个带有边界条件的偏微分方程, 我们再次使用分离变量法, 寻找驻波解. 假设解的形式为 $u(x, y, t) = \phi(x, y)T(t)$, 其中 $\phi(x, y)$ 只与空间位置有关, $T(t)$ 只与时间有关. 代入波动方程:
$$\phi(x, y) T''(t) = c^2 (\Delta \phi(x, y)) T(t),$$移项整理得到:
$$\frac{T''(t)}{c^2 T(t)} = \frac{\Delta \phi(x, y)}{\phi(x, y)}.$$由于等式左边只依赖于 $t$, 右边只依赖于 $(x, y)$, 它们必须等于同一个常数. 我们将这个常数记为 $-\lambda$. 这样, 原问题分解为两个独立的方程:
时间问题:
$$T''(t) + \lambda c^2 T(t) = 0$$空间问题:
$$\Delta \phi(x, y) + \lambda \phi(x, y) = 0$$
后者即为我们需要考虑的特征值问题, 它需要满足上述的 Dirichlet 边界条件, 即 $\phi(x, y) = 0$ 对所有 $(x, y) \in \partial\Omega$. 只有对于特定的 $\lambda$ 值, 方程才有非零解 $\phi(x, y)$.
- 这些特定的 $\lambda$ 值称为拉普拉斯算子在区域 $\Omega$ 上的特征值 (eigenvalues), 它们只与区域的形状和大小有关.
- 对应的非零解 $\phi(x, y)$ 称为特征函数 (eigenfunctions), 它们描述了鼓膜振动的基本模式 (模态), 即驻波的形状.
可以证明, 对于一个有界区域 $\Omega$, 其特征值是离散且大于零的, 我们可以将它们排序:
$$0 < \lambda_1 \le \lambda_2 \le \lambda_3 \le \dots$$其中等号表示可能存在重特征值 (即多个线性无关的特征函数对应同一个特征值).
鼓的声音与频谱
现在我们回到时间方程 $T''(t) + \lambda_n c^2 T(t) = 0$. 对每一个特征值 $\lambda_n$, 这个方程的解是我们最熟悉的简谐振动:
$$T_n(t) = A_n \cos(\omega_n t) + B_n \sin(\omega_n t),$$其中振动的角频率为 $\omega_n = c\sqrt{\lambda_n}$. 对应的物理频率为:
$$f_n = \frac{\omega_n}{2\pi} = \frac{c}{2\pi}\sqrt{\lambda_n}.$$于是鼓膜的任何振动都可以表示为这些基本模式的叠加:
$$u(x, y, t) = \sum_{n=1}^{\infty} \phi_n(x, y) \left( A_n \cos(\omega_n t) + B_n \sin(\omega_n t) \right),$$其中系数 $A_n$ 和 $B_n$ 由初始条件 (鼓被敲击的方式和位置) 决定.
因此, 我们耳朵听到的鼓声, 就是由这一系列离散的频率 $\{f_n\}_{n=1}^{\infty}$ 构成的. 这一组频率完全由特征值集合 $\{\lambda_n\}_{n=1}^{\infty}$ 决定. 我们称这个特征值的集合为鼓膜 $\Omega$ 的频谱 (spectrum).
至此, 我们可以用更精确的数学语言来重述我们最初的问题了:
“听声辩鼓” 这个问题, 说的就是: 区域 $\Omega$ 频谱 $\{\lambda_n\}_{n=1}^{\infty}$ 是否唯一地决定了 $\Omega$ 的大小和形状?
听出鼓的面积
在继续讨论二维的情形之前, 先考虑一维的情形能为我们带来一些启发. 对于一维的情形, 弦的长度唯一决定了它的频谱, 反之亦然. 那么很自然的想法是, 在二维的情形中, 鼓的面积与频谱之间也有某种关系. 事实上, 这个问题的答案是肯定的.
Kac 通过 Weyl 定理说明了, 可以通过计算 $\lambda_n$ 的增长速度来推断鼓的面积, 而且这一结果对任意维数都成立. 具体地, 我们定义 $N(R)$ 为小于 $R$ 的特征值的数量, 那么:
$$A = \omega_d^{-1} (2\pi)^d \lim_{R \to \infty} \frac{N(R)}{R^{d/2}},$$其中 $A$ 是区域 $\Omega$ 的面积, $d$ 是空间的维数, $\omega_d$ 是单位球的体积.
除此以外, Kac 还证明了, 可以通过频谱的渐进行为来推断鼓的周长, 并猜想可以推断鼓的拓扑 (也就是鼓面上的洞的数量, 并且也被后人证明). 然而, 这些结果还不足以精确确定鼓的形状, Kac 也并未对 “能否听出鼓的形状” 给出最终的 “是” 或 “否” 的答案.
听出鼓的形状
1992 年, Carolyn Gordon, David Webb 和 Scott Wolpert 发表了一篇论文 One Cannot Hear the Shape of a Drum, 对 Kac 的问题给出了否定的答案. 他们构造了如图所示的两个鼓面, 它们具有完全相同的频谱, 但形状却完全不同.

1996 年, S. J. Chapman 通过构造另一个反例进一步证明了这个结果.

Chapman 构造反例的方式很有意思. 如下图所示, 他定义了一种折叠鼓面的运算, 将鼓面沿着规定的折痕折叠后, 根据纸片的正反面加上或减去对应的函数值.
显然, 折叠操作能保持 Dirichlet 边界条件, 并且内部函数值也连续:
- 新产生的边界要么来自原鼓面的边界, 要么来自折痕;
- 原鼓面的边界折到内部后, 由于原本的边界条件, 在跨越它时也是 $C^0$ 连续的.
但是, 这样的折叠操作在折痕处引入了尖角, 导致函数的一阶导数不连续. 因此, 构造出的函数在折痕处不可导, 不满足作为特征函数所需的光滑性要求, 故并不是一个有效的驻波解 (此外, 鼓面的面积和周长也都改变了). 一个自然的想法是, 使用多个完全相同的初始鼓面, 将它们按照不同方式折叠后再叠加到一起, 以抵消导数的不连续性.
事实上, Chapman 通过下图中的方式, 取三张相同的鼓面, 构造出了上文所示的反例. 这一构造方式满足了:
- 所有的折痕都位于最终拼成的形状的外部边界上;
- 折到内部的原本鼓面的边界, 都恰好与另一张鼓面的边界镜像地重合.
通过这种精确地叠, 所有的导数不连续都被抚平了, 现在这两个鼓面的振动模式之间有一个一一映射, 因而它们有完全相同的频谱.

结论
所以, Kac 的问题 “能否听出鼓的形状” 的答案是, 对于许多形状来说, 人们无法完全 “听出” 鼓的形状. 然而, 仍然可以推断出一些信息. 另一方面, Steve Zelditch 证明了, 如果对具有解析边界的某些凸平面区域施加限制, 那么对 Kac 问题的答案是肯定的. 一个关键的开放性问题是, 是否存在两个非凸的解析区域, 它们具有相同的频谱.
参考文献
Kac, M. (1966). Can One Hear the Shape of a Drum?
Gordon, C., Webb, D. L., & Wolpert, S. (1992). One Cannot Hear the Shape of a Drum
Chapman, S. J. (1995). Drums That Sound the Same
Wikipedia. (n.d.). Hearing the shape of a drum
