文章目录1. 前向过程(扩散过程)2. 反向过程(去燥过程)2.1 log_prob计算2.2 重要性采样2.3 PDMS 计算2.3.1 MetricCache2.3.2 PDMSimulator2.3.2.1 track_trajectory 函数讲解2.3.2.2 propagate_state 函数讲解2.3.2 PDMScorer2.3.2.1 功能介绍2.3.2.2 核心方法讲解2.4 组内advantages2.4.1 代码说明2.4.2. 调用 PDM 评分系统2.4.3 计算优势函数(Advantage)2.4.4 总结:2.5 IL loss + RL loss2.5.1 RL 损失计算2.5.2 IL 损失计算2.5.3 IL + RL 动态融合2.5.4 总结Diffusion 模型(扩散模型)是一种基于概率生成模型的深度学习架构,核心思想源于统计物理学中的 “扩散过程”—— 通过模拟“噪声逐渐加入”和“噪声逐步去除”的双向过程,学习数据的真实分布,最终实现从随机噪声中生成高质量数据(如图像、文本、音频等)。1. 前向过程(扩散过程)前向扩散是一个固定、可解析计算的过程(无需训练), 目的是将真实数据x 0 x_0x