扩散模型中噪声调度方案的选择直接影响步数如何影响样本质量、训练稳定性和计算效率。噪声调度方案确定了在训练和采样过程中添加或移除噪声的速率。当与特定的步数结合使用时,它控制了模型在噪声级别之间平滑过渡的方式。例如,设计不良的调度方案可能需要更多步骤来避免噪声级别之间的突变,而精心调整的调度方案可以用更少的步骤实现类似的结果。这种相互作用取决于平衡逐步过渡(以实现稳定性)与步数效率。
线性噪声调度方案通常需要在多个步骤(例如,1,000+)中均匀地分配噪声,以避免伪影。这是因为每个步骤都应用了一个小的、固定的噪声变化,而更少的步骤会产生更大的跳跃,从而使模型的预测不太准确。相比之下,非线性调度方案(如余弦或学习调度方案)会将更多步骤分配给关键阶段(例如,细节出现的高噪声区域)。例如,DDIM 采样器使用非线性调度方案,在 50-100 步中实现与 DDPM 相当的质量,而不是 1,000 步。在此,调度方案的设计通过优先考虑模型预测最重要的步骤来补偿更少的步骤。
开发人员必须使噪声调度方案与他们的步数约束相一致。如果步数有限,则在关键阶段(例如,早期去噪)集中更新的调度方案将优于线性调度方案。诸如“渐进式蒸馏”或自适应调度器(例如,在 Stable Diffusion 中)之类的工具会根据步数动态调整噪声级别。测试至关重要:在不调整调度方案的情况下减少步数通常会降低质量,而优化两者可以保持性能。例如,从线性调度切换到余弦调度可能会减少 50% 的步数,同时保持输出保真度,从而节省计算时间而又不牺牲结果。