目录

听出鼓的形状

本文标题 “听出鼓的形状”, 来自 Mark Kac 于 1966 年发表的文章 Can One Hear the Shape of a Drum? 中提出的问题. 我们知道, 鼓面的形状 (也包括其大小), 决定了它能发出的声音, 而这篇文章所说的问题, 如其字面意思, 是我们能否通过鼓发出的声音反向得知鼓的形状.

笔者是在今年二月的一次讲座上了解到这一问题与相关的工作, 觉得实在是非常有趣, 于是决定写一篇博客记下自己的理解.

本文将从零开始, 用数学的语言说明我们的语境中的鼓和声音都是什么, 以规范问题的定义, 并给出问题的答案. 因为这并不是笔者的研究领域, 所以本文的内容并不深入, 但希望能为读者提供一个清晰的概念框架. 阅读本文需要一些基本的高等数学知识, 并要对微分方程有一定的了解.

鼓和声音

波动方程

波动方程是描述波动现象的偏微分方程, 在这里我们将讨论二维的情况. 但在开始之前, 笔者推荐先阅读文章: 为什么是「十二」平均律, 其中介绍了一维波动方程的情形, 或许能有助于理解.

与一维的弦类似, 我们考虑一个均匀的鼓膜, 它张紧在 $xy$ 平面上的一个区域 $\Omega \subset \mathbb{R}^2$ 上, 我们用 $u(x, y, t)$ 表示 $(x, y)$ 点处的鼓膜在时刻 $t$ 的位移.

我们对鼓膜上的一个微小矩形区域 $\Delta A = \Delta x \Delta y$ 进行受力分析. 假设鼓膜的张力为 $T$, 表面密度为 $\sigma$ (单位面积的质量).

类似于一维情况的推导, 垂直方向上的净恢复力为:

$$F_{net} \approx \left( T \frac{\partial^2 u}{\partial x^2} + T \frac{\partial^2 u}{\partial y^2} \right) \Delta x \Delta y = T \left( \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} \right) \Delta A.$$

这个微元质量为 $m = \sigma \Delta A$, 其加速度为 $a = \frac{\partial^2 u}{\partial t^2}$. 根据牛顿第二定律 $F=ma$, 我们有:

$$T \left( \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} \right) \Delta A = (\sigma \Delta A) \frac{\partial^2 u}{\partial t^2},$$

整理后, 我们得到二维波动方程:

$$\frac{\partial^2 u}{\partial t^2} = c^2 \left( \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} \right),$$

其中 $c = \sqrt{T/\sigma}$ 是波在鼓膜上传播的速度. 使用 Laplace 算子 $\Delta = \frac{\partial^2}{\partial x^2} + \frac{\partial^2}{\partial y^2}$, 方程可以更简洁地写为:

$$\frac{\partial^2 u}{\partial t^2} = c^2 \Delta u$$

边界条件与特征方程

鼓膜的边界是固定的, 因此我们需要在边界上施加 Dirichlet 边界条件:

$$u(x, y, t) = 0, \quad \forall (x, y) \in \partial\Omega.$$

为了求解这个带有边界条件的偏微分方程, 我们再次使用分离变量法, 寻找驻波解. 假设解的形式为 $u(x, y, t) = \phi(x, y)T(t)$, 其中 $\phi(x, y)$ 只与空间位置有关, $T(t)$ 只与时间有关. 代入波动方程:

$$\phi(x, y) T''(t) = c^2 (\Delta \phi(x, y)) T(t),$$

移项整理得到:

$$\frac{T''(t)}{c^2 T(t)} = \frac{\Delta \phi(x, y)}{\phi(x, y)}.$$

由于等式左边只依赖于 $t$, 右边只依赖于 $(x, y)$, 它们必须等于同一个常数. 我们将这个常数记为 $-\lambda$. 这样, 原问题分解为两个独立的方程:

  • 时间问题:

    $$T''(t) + \lambda c^2 T(t) = 0$$
  • 空间问题:

    $$\Delta \phi(x, y) + \lambda \phi(x, y) = 0$$

后者即为我们需要考虑的特征值问题, 它需要满足上述的 Dirichlet 边界条件, 即 $\phi(x, y) = 0$ 对所有 $(x, y) \in \partial\Omega$. 只有对于特定的 $\lambda$ 值, 方程才有非零解 $\phi(x, y)$.

  • 这些特定的 $\lambda$ 值称为拉普拉斯算子在区域 $\Omega$ 上的特征值 (eigenvalues), 它们只与区域的形状和大小有关.
  • 对应的非零解 $\phi(x, y)$ 称为特征函数 (eigenfunctions), 它们描述了鼓膜振动的基本模式 (模态), 即驻波的形状.

可以证明, 对于一个有界区域 $\Omega$, 其特征值是离散且大于零的, 我们可以将它们排序:

$$0 < \lambda_1 \le \lambda_2 \le \lambda_3 \le \dots$$

其中等号表示可能存在重特征值 (即多个线性无关的特征函数对应同一个特征值).

鼓的声音与频谱

现在我们回到时间方程 $T''(t) + \lambda_n c^2 T(t) = 0$. 对每一个特征值 $\lambda_n$, 这个方程的解是我们最熟悉的简谐振动:

$$T_n(t) = A_n \cos(\omega_n t) + B_n \sin(\omega_n t),$$

其中振动的角频率为 $\omega_n = c\sqrt{\lambda_n}$. 对应的物理频率为:

$$f_n = \frac{\omega_n}{2\pi} = \frac{c}{2\pi}\sqrt{\lambda_n}.$$

于是鼓膜的任何振动都可以表示为这些基本模式的叠加:

$$u(x, y, t) = \sum_{n=1}^{\infty} \phi_n(x, y) \left( A_n \cos(\omega_n t) + B_n \sin(\omega_n t) \right),$$

其中系数 $A_n$ 和 $B_n$ 由初始条件 (鼓被敲击的方式和位置) 决定.

因此, 我们耳朵听到的鼓声, 就是由这一系列离散的频率 $\{f_n\}_{n=1}^{\infty}$ 构成的. 这一组频率完全由特征值集合 $\{\lambda_n\}_{n=1}^{\infty}$ 决定. 我们称这个特征值的集合为鼓膜 $\Omega$ 的频谱 (spectrum).

至此, 我们可以用更精确的数学语言来重述我们最初的问题了:

“听声辩鼓” 这个问题, 说的就是: 区域 $\Omega$ 频谱 $\{\lambda_n\}_{n=1}^{\infty}$ 是否唯一地决定了 $\Omega$ 的大小和形状?

听出鼓的面积

在继续讨论二维的情形之前, 先考虑一维的情形能为我们带来一些启发. 对于一维的情形, 弦的长度唯一决定了它的频谱, 反之亦然. 那么很自然的想法是, 在二维的情形中, 鼓的面积与频谱之间也有某种关系. 事实上, 这个问题的答案是肯定的.

Kac 通过 Weyl 定理说明了, 可以通过计算 $\lambda_n$ 的增长速度来推断鼓的面积, 而且这一结果对任意维数都成立. 具体地, 我们定义 $N(R)$ 为小于 $R$ 的特征值的数量, 那么:

$$A = \omega_d^{-1} (2\pi)^d \lim_{R \to \infty} \frac{N(R)}{R^{d/2}},$$

其中 $A$ 是区域 $\Omega$ 的面积, $d$ 是空间的维数, $\omega_d$ 是单位球的体积.

除此以外, Kac 还证明了, 可以通过频谱的渐进行为来推断鼓的周长, 并猜想可以推断鼓的拓扑 (也就是鼓面上的洞的数量, 并且也被后人证明). 然而, 这些结果还不足以精确确定鼓的形状, Kac 也并未对 “能否听出鼓的形状” 给出最终的 “是” 或 “否” 的答案.

听出鼓的形状

1992 年, Carolyn Gordon, David Webb 和 Scott Wolpert 发表了一篇论文 One Cannot Hear the Shape of a Drum, 对 Kac 的问题给出了否定的答案. 他们构造了如图所示的两个鼓面, 它们具有完全相同的频谱, 但形状却完全不同.

https://image.ne0.io/2025-07-31-15-14-50.png
Gordon-Webb-Wolpert 的反例

1996 年, S. J. Chapman 通过构造另一个反例进一步证明了这个结果.

https://image.ne0.io/2025-07-31-15-24-59.png
Chapman 的反例

Chapman 构造反例的方式很有意思. 如下图所示, 他定义了一种折叠鼓面的运算, 将鼓面沿着规定的折痕折叠后, 根据纸片的正反面加上或减去对应的函数值.

显然, 折叠操作能保持 Dirichlet 边界条件, 并且内部函数值也连续:

  • 新产生的边界要么来自原鼓面的边界, 要么来自折痕;
  • 原鼓面的边界折到内部后, 由于原本的边界条件, 在跨越它时也是 $C^0$ 连续的.

https://image.ne0.io/2025-08-01-03-13-20.png https://image.ne0.io/2025-08-01-03-13-50.png

但是, 这样的折叠操作在折痕处引入了尖角, 导致函数的一阶导数不连续. 因此, 构造出的函数在折痕处不可导, 不满足作为特征函数所需的光滑性要求, 故并不是一个有效的驻波解 (此外, 鼓面的面积和周长也都改变了). 一个自然的想法是, 使用多个完全相同的初始鼓面, 将它们按照不同方式折叠后再叠加到一起, 以抵消导数的不连续性.

事实上, Chapman 通过下图中的方式, 取三张相同的鼓面, 构造出了上文所示的反例. 这一构造方式满足了:

  • 所有的折痕都位于最终拼成的形状的外部边界上;
  • 折到内部的原本鼓面的边界, 都恰好与另一张鼓面的边界镜像地重合.

通过这种精确地叠, 所有的导数不连续都被抚平了, 现在这两个鼓面的振动模式之间有一个一一映射, 因而它们有完全相同的频谱.

https://image.ne0.io/2025-08-01-03-41-02.png

结论

所以, Kac 的问题 “能否听出鼓的形状” 的答案是, 对于许多形状来说, 人们无法完全 “听出” 鼓的形状. 然而, 仍然可以推断出一些信息. 另一方面, Steve Zelditch 证明了, 如果对具有解析边界的某些凸平面区域施加限制, 那么对 Kac 问题的答案是肯定的. 一个关键的开放性问题是, 是否存在两个非凸的解析区域, 它们具有相同的频谱.

参考文献