PDM是一种将模拟音频信号转换为数字信号的方法,与大家更熟知的PCM(Pulse Code Modulation,脉冲编码调制)是两种不同的数字化技术。

为了更好地理解PDM,我们先从它要解决的问题和它的基本思想说起。
核心思想:用“脉冲的密度”来代表“信号的幅度”
想象一下,你有一张黑白照片,现在你只能用两种颜色:纯黑和纯白,来模仿这张照片的灰度,你会怎么做?
- PCM的方式(类比):你会把照片分成很多很多个小格子(像素),对于每个格子,你根据它原本的灰度,分配一个8位、16位或更多的数值来精确表示这个格子的“黑”或“白”的程度,数值越大越白,越小越黑,这是一种直接量化每个点的方法。
- PDM的方式(类比):你仍然把照片分成同样的小格子,对于每个格子,你只用一个点:要么是黑点,要么是白点,那么如何表现灰度呢?答案是通过黑点出现的频率,如果某个区域应该是深灰色,你就让这个区域里黑点的数量多一些;如果应该是浅灰色,黑点的数量就少一些,黑点越密集,整体看起来就越“黑”;越稀疏,就越“白”,通过控制“黑点”的密度,你就能模拟出不同的灰度。
PDM音频技术就是采用了后者的思想。
- 输入:一个连续变化的模拟音频信号(电压)。
- 输出:一个由0和1组成的数字流,这个流中的1(或高电平脉冲)出现的密度,正比于输入模拟信号的瞬时幅度。
PDM的工作原理
PDM的实现过程通常涉及两个核心部分:调制器和滤波器。

调制器:将模拟信号转换为PDM流
调制器是PDM技术的“心脏”,它是一个负反馈系统,通常由一个比较器、一个积分器和一个1位DAC(数模转换器)构成,这个结构被称为Delta-Sigma调制器。
工作流程如下:
(这是一个简化的Delta-Sigma调制器框图)
- 求和点:输入的模拟信号
Vin与经过1位DAC转换回来的反馈信号Vfeedback相减,得到一个误差信号Verror = Vin - Vfeedback。 - 积分器:这个误差信号
Verror被送入一个积分器进行累加,积分器的作用是“过去的误差,使得系统对微小的信号变化也能做出反应。 - 比较器:积分器的输出被送入一个1位的比较器,这个比较器就像一个“决策者”,它有一个参考电平(通常是地,或Vdd/2)。
- 如果积分器输出 > 参考电平,比较器输出
1(高电平)。 - 如果积分器输出 < 参考电平,比较器输出
0(低电平)。
- 如果积分器输出 > 参考电平,比较器输出
- 1位DAC与反馈:比较器输出的1位数字信号(
1或0)被送入一个简单的1位DAC,这个DAC通常就是一个开关,当输入1时,输出一个正电压(如Vdd);当输入0时,输出一个负电压(如GND),这个输出电压Vfeedback被反馈到第一步的求和点,与原始输入信号Vin进行比较。
这个过程如何体现“脉冲密度”?

- 当输入信号
Vin是一个正电压时,Verror为正,积分器输出会不断上升,为了平衡,比较器会频繁地输出1,使得Vfeedback也为正,来抵消Vin。1脉冲的密度很高。 - 当输入信号
Vin是一个负电压时,Verror为负,积分器输出会不断下降,为了平衡,比较器会频繁地输出0,使得Vfeedback也为负。0脉冲的密度很高(或者说1脉冲的密度很低)。 - 当输入信号
Vin为零时,Verror也接近零,积分器输出会在参考电平附近小幅波动,比较器会随机地输出1和0,使得1和0的密度大致相等。
通过这个高速的负反馈循环,调制器最终产生了一个1位的数字流,其中1(或0)的密度精确地跟踪了输入模拟信号的幅度。
滤波器:从PDM流中重建模拟信号
直接得到的PDM流听起来会是刺耳的“嘶嘶”声(高频噪声),要听到清晰的音频,必须将其转换回模拟信号,这个转换过程非常简单,只需要一个低通滤波器。
- 原理:PDM流中包含了我们想要的音频频段信息(例如20Hz - 20kHz),但同时也包含了大量的、由调制过程产生的高频噪声(噪声分布在整个采样频率范围内)。
- 作用:低通滤波器就像一个筛子,它允许低频的音频信号通过,同时滤除高频的噪声。
- 结果:经过滤波器后,剩下的就是平滑的、高质量的模拟音频信号,可以驱动耳机或扬声器。
PDM vs. PCM:关键区别与优劣势
为了更直观地理解,我们用一个表格来对比PDM和PCM。
| 特性 | PDM (脉冲密度调制) | PCM (脉冲编码调制) |
|---|---|---|
| 数据格式 | 1位流,数据流只有0和1两种状态。 |
多比特流,每个采样点用N个比特(如16-bit, 24-bit)来表示幅度。 |
| 采样率 | 极高,通常在1MHz到6.4MHz甚至更高。 | 较低,标准为44.1kHz (CD), 48kHz (专业音频), 96kHz, 192kHz等。 |
| 量化位数 | 1位,理论上没有传统意义上的“位深度”。 | 多位,如16-bit, 24-bit, 32-bit,位深度越高,动态范围越大。 |
| 核心思想 | 通过脉冲的疏密来代表幅度。 | 通过直接编码每个采样点的幅度值。 |
| 实现复杂度 | 调制器复杂(需要高速Delta-Sigma电路),但DAC极简单(只需一个开关)。 | ADC和DAC相对复杂(需要高精度、高速度的电路),但数字处理简单。 |
| 抗干扰能力 | 对时钟抖动非常敏感。 | 相对不那么敏感。 |
| 主要优势 | 电路简单:1位DAC实现容易,成本低,失真小。 易于集成:非常适合在芯片内部实现,如手机SoC、蓝牙耳机芯片。 高频噪声:噪声频谱位于高频段,容易被数字滤波器滤除。 |
成熟标准:应用广泛,兼容性好。 直观理解:概念简单,易于处理和编辑。 位深度优势:高比特位深度提供了巨大的动态范围。 |
| 主要劣势 | 数据量大:极高的采样率导致原始数据流非常庞大,需要经过降采样处理。 处理复杂:需要专门的硬件(DSP)进行降采样和滤波。 理论限制:1位特性限制了其理论信噪比。 |
电路复杂:高精度ADC/DA设计难度大,成本高。 失真问题:元件的非线性可能导致失真。 |
PDM的实际应用
PDM技术之所以流行,主要是因为它的实现简单和易于集成。
-
现代数字麦克风:这是PDM最经典的应用,手机、笔记本电脑、智能音箱等设备上的内置麦克风,几乎都采用PDM技术,麦克风内部集成了一个PDM调制器,直接输出1位的高频数据流,主控芯片只需一个简单的数字滤波器就能将其转换为PCM信号进行处理,这大大简化了麦克风设计和电路板布局。
-
音频编解码器:许多手机SoC和蓝牙耳机芯片(如高通、联发科的芯片)内部都集成了PDM数字音频接口,它可以直接连接PDM数字麦克风,也可以用于数字音频的传输和播放。
-
高保真音频播放:一些高端的DAC芯片(如ESS Sabre系列)采用PDM技术进行内部处理,其内部工作在非常高的频率(如DSD,Direct Stream Digital,本质上是PDM的一种),然后通过芯片内部的数字滤波器降采样到标准的PCM格式输出,或者直接驱动PDM输出到外部的模拟滤波器。
PDM音频技术的原理可以概括为:
通过一个高速的Delta-Sigma调制器,将模拟信号的幅度信息编码到一个1位数字流的脉冲密度中,通过一个低通滤波器滤除高频噪声,从这个1位流中重建出高质量的模拟音频信号。
它的核心优势在于将复杂的模拟电路(高精度DAC)替换为简单的数字电路和模拟滤波器,从而极大地降低了成本和设计难度,使其成为现代消费电子产品中数字音频接口的理想选择。
