深度信念网络(DBN)是一种旨在用于无监督学习的人工神经网络,尽管它也可以适用于监督任务。它由多个随机或概率单元层堆叠而成,这些单元被称为受限玻尔兹曼机(RBMs)。每一层学习表示输入数据越来越抽象的特征。例如,在图像处理中,第一层可能检测边缘,下一层可能识别纹理,而更高层可能识别复杂形状。DBNs 的训练分两个阶段:一个用于初始化权重的无监督预训练步骤,随后是用于特定任务(如分类)的监督微调(例如,使用反向传播)。
DBNs 与传统神经网络在训练方式上有所不同。它们不是一次训练所有层,而是以“贪婪”的逐层方式顺序训练每个 RBM 层。在预训练期间,每个 RBM 学习重建其输入数据,在没有标记示例的情况下捕捉模式。这种方法通过在微调之前提供更好的初始权重,有助于减轻深度网络中常见的梯度消失问题。例如,在语音识别任务中,第一个 RBM 可能学习对原始音频频率进行建模,下一层可以捕捉类似音素的结构,而更高层可能形成词级别的表示。一旦预训练完成,可以使用标记数据对整个网络进行微调以优化准确性。
DBNs 在 2010 年代早期在特征提取和无监督预训练等任务中特别有影响力。它们在标记数据有限的场景中表现出色,因为无监督阶段减少了对标注的依赖。例如,开发人员可以使用 DBN 对医学影像数据进行预处理,在训练一个较小的标记数据集进行诊断之前提取肿瘤特征。然而,DBNs 在很大程度上被卷积神经网络(CNNs)和 Transformer 等架构所取代,这些架构对于大规模监督任务更高效。尽管如此,DBNs 在需要分层特征学习和无监督初始化的混合模型或小众应用中仍然有用,例如制造业传感器数据中的异常检测。它们的模块化设计也允许开发人员尝试不同的层配置,使其成为一种灵活的原型构建工具。