目录

为什么是「十二」平均律

引言

十二平均律, 是现代最主流的音乐律式, 指的是, 将一个八度平均地划分为 12 等分, 相邻的两个音高之间, 频率相差 $ 2^\frac{1}{12} $ 倍, 也称之为相差一个 半音.

平均律带来了转调的自由, 也为乐器的设计提供了便利, 但是, 为什么人们选择了 12 这个数字? 本文将尝试探讨原因.

音乐由节奏和音高组成, 后者的本质就是乐器震动的频谱, 而这是由它自身的材质和形状大小等属性内蕴地决定的. 我们将看到, 由于人类的所有以产生韵律为目的发展出的乐器, 都是一维的振动方式, 换言之是弦乐器, 所以产生了以八度划分音域的方式, 进而衍生出了基于十二平均律的乐理理论.

乐理中由于传统和翻译等等的问题, 许多名词中的数字都很不便于计算. 本文也无法完全免俗, 必须保持名词的一致性. 但在后文中, 我们约定所有以汉字书写的数字都是不参与 (或不应该参与) 计算的数字, 并用阿拉伯数字书写参与计算的数字, 例如 $ \text{十二平均律} \rightarrow \text{12 平均律} $, $ \text{八度} \rightarrow \text{八度} $ (不变).

为什么有「八度」

八度是钢琴上白键以 7 为周期的情况下, 模 7 同余的两个音, 从 1 到 8 称八度. 这两个音的频率恰好为 $1:2$. 我们将探讨 $1:2$ 的由来.

波动方程

假设有一根均匀的弦, 长度为 $ L $, 线密度为 $ \mu $, 张力为 $ T $. 设弦的横向位移为 $ u(x,t) $, 即 $ x $ 处弦在 $ t $ 时刻的垂直位移. 我们要分析 $ u(x, t) $ 的性质.

对弦上一小段 $ \Delta x $ 做受力分析, 其两端受张力 $ T $ 作用:

  • 在 $ x $ 处, 张力方向与水平夹角为 $ \theta(x) $.
  • 在 $ x+\Delta x $ 处, 夹角为 $ \theta(x+\Delta x) $.

由于振动幅度很小, 可以近似:

$$ \sin \theta \approx \tan \theta = \frac{\partial u}{\partial x}, \quad \cos \theta \approx 1, $$

于是横向 (垂直于弦的方向) 上的合力为:

$$ F_{\text{net}} = T \sin \theta(x+\Delta x) - T \sin \theta(x) \approx T \left( \frac{\partial u}{\partial x} \bigg|_{x+\Delta x} - \frac{\partial u}{\partial x} \bigg|_x \right) \approx T \frac{\partial^2 u}{\partial x^2} \Delta x. $$

小段 $ \Delta x $ 的质量为 $ \mu \Delta x $, 加速度为 $ \frac{\partial^2 u}{\partial t^2} $, 由牛顿第二定律, 我们得到

$$ T \frac{\partial^2 u}{\partial x^2} \Delta x = \mu \Delta x \frac{\partial^2 u}{\partial t^2}, $$

也就是 1 维的波动方程:

$$ \frac{\partial^2 u}{\partial t^2} = c^2 \frac{\partial^2 u}{\partial x^2}. $$

边界条件与特征方程

弦的两端是固定的, 因此我们有

$$ u(0,t) = 0, \quad u(L,t) = 0. $$

同时, 采用分离变量法来求解波动方程. 之所以能这么做, 是因为我们需要考虑的波是驻波.

假设解的形式为 $ u(x,t) = X(x)T(t) $, 代入波动方程:

$$ \frac{T''(t)}{c^2 T(t)} = \frac{X''(x)}{X(x)} = -\omega^2, $$

得到空间和时间上的两个常微分方程:

空间问题

$$ X''(x) + k^2 X(x) = 0, \quad k = \frac{\omega}{c}. $$

通解为:

$$ X(x) = A \sin(kx) + B \cos(kx). $$

由边界条件 $ X(0) = X(L) = 0 $:

  • $ X(0) = B = 0 $ ⇒ $ X(x) = A \sin(kx) $.
  • $ X(L) = A \sin(kL) = 0 $ ⇒ $ kL = n\pi $ ($ n \in \mathbb{Z}^+ $).

因此, 特征值 (波数) 和特征函数为:

$$ k_n = \frac{n\pi}{L}, \quad X_n(x) = \sin\left(\frac{n\pi x}{L}\right). $$

时间问题

$$ T''(t) + \omega_n^2 T(t) = 0, \quad \omega_n = c k_n = \frac{n\pi c}{L}. $$

通解为:

$$ T_n(t) = C_n \cos(\omega_n t) + D_n \sin(\omega_n t). $$

模态分析

叠加所有模态, 得到方程的解:

$$ u(x,t) = \sum_{n=1}^\infty \sin\left(\frac{n\pi x}{L}\right) \left[ C_n \cos\left(\frac{n\pi c t}{L}\right) + D_n \sin\left(\frac{n\pi c t}{L}\right) \right]. $$

我们可以看到, 空间方程决定了弦以什么频率震荡, 而时间方程反映实际的震荡行为.

从方程中, 我们也可以看到频谱的组成:

  • 第 $ n $ 阶模态:频率 $ f_n = \frac{\omega_n}{2\pi} = \frac{n c}{2L} = \frac{n}{2L} \sqrt{\frac{T}{\mu}} $.
  • 基频 ($ n=1 $):$ f_1 = \frac{1}{2L} \sqrt{\frac{T}{\mu}} $, 决定音高.
  • 泛音 ($ n \geq 2 $):$ f_n = n f_1 $, 构成频谱.

也就是说, 弦的震动是无数个频率的组合, 并且比基频 $ f_1 $ 更高的频率以 $ 2f_1, 3f_1, \dots$ 的规律出现.

于是我们发现, 跨一个八度后的音恰好是基频的两倍, 也就是 $ 2f_1 $. 这就是八度的由来.

此外我们还会认为, 跨八度的两个音同时按下时, 产生的声音更和谐: 因为频谱没有改变, 改变的是各个频率的响度的组合.

五度相生律

五度相生指的是, 在 12 平均律体系下, 对一个音升高完全五度 (也就是 7 个半音), 例如 Do 到 Sol. 实际上, 真正的五度相生并不应该是如此, 它指的是两个音的频率相差 1.5 倍的关系.

因为弦的频谱是 $ f_1, 2f_1, 3f_1, \dots $ 的模式, 第一个泛音是基频的 2 倍频率, 也就是跨一个八度, 而第二个泛音是第一个的 1.5 倍频率, 这就是上面所说的纯五度.

我们说真正的五度相生并是升高完全五度, 是因为这相当于对频率乘以 $2^{\frac{7}{12}} \approx 1.49831$, 与 $1.5$ 还存在误差. 但我们注意到, 因为 2 和 3 互质, 所以不存在整数 $ p $ 和 $ q $ 使得 $ 1.5^p = 2^q $, 也就是任何平均律都不可能完美地与五度相生律兼容.

但是我们可以计算误差: 对于每个正整数 $n$, 找到使得 $|\frac{m}{n} - \log_{2}{\frac{3}{2}}|$ 最小的 $m$ 时, 我们发现比 $\frac{7}{12}$ 误差更小的组合中, 下一个就是 $\frac{17}{29}$ 了, 可见选取 12 作为平均律的分母, 是在律制简洁性与音程和谐性之间取得的一个平衡.

nm误差
41240.000403353
29170.0012444
1270.00162917
46270.00199402
17100.00327279
34200.00327279
43250.00356715

总结

十二平均律将八度均分为 12 个半音, 相邻音高频率比为 $2^{\frac{1}{12}}$. 其核心源于弦乐器的物理本质:弦振动时, 波动方程的解表明基频 $f_1$ 与泛音 $nf_1$ 构成离散频谱, 八度对应频率倍增的和谐性. 通过五度相生律(频率比 $3/2$)与平均律(频率比为 $2^{7/12}$)的误差分析, 可发现 12 这一分母在简洁性与和谐性间达到最优平衡——更精确的分数如 $24/41$ 虽误差更小, 但 12 的简洁性使其成为实用选择. 由此, 人类对一维振动乐器的物理约束与数学权衡, 共同塑造了以 12 为基的现代音乐律式.