Denoising diffusion implicit models 阅读笔记

2023-09-21 11:38:39

Denoising diffusion probabilistic models (DDPMs)从马尔科夫链中采样生成样本,需要迭代多次,速度较慢。Denoising diffusion implicit models (DDIMs)的提出是为了加速采样过程,减少迭代的次数,并且要求DDIM可以复用DDPM训练的网络。
加速采样的基本思路是,DDPM的生成过程需要从 [ T , ⋯   , 1 ] [T,\cdots,1] [T,,1]的序列逐步采样,DDIM则可以从 [ T , ⋯   , 1 ] [T,\cdots,1] [T,,1]的子序列采样来生成,通过跳步的方式减少采样的步数。

非马尔科夫的前向过程

DDPM中推理分布(inference distribution) q ( x 1 : T ∣ x 0 ) q(\mathbf x_{1:T}|\mathbf x_0) q(x1:Tx0)是固定的马尔科夫链。DDIM的作者考虑构造新的推理分布,该推理过程和DDPM优化相同的目标,但能产生新的生成过程。
在这里插入图片描述
考虑一个推理分布族Q,由实向量 σ ∈ R ≥ 0 T \sigma \in \mathbb{R}^T_{\ge 0} σR0T索引:
在这里插入图片描述
根据上面的定义有 q σ ( x t ∣ x 0 ) = N ( α t x 0 , ( 1 − α t ) I ) q_{\sigma}(\mathbf x_t | \mathbf x_0) = \mathcal{N}(\sqrt{\alpha_t}\mathbf x_0, (1-\alpha_t)I) qσ(xtx0)=N(αt x0,(1αt)I)
对应的前向过程也是高斯分布:
在这里插入图片描述
通过上面定义的推理过程,前向过程变成了非马尔科夫的,因为每一步都依赖 x 0 \mathbf x_0 x0
参数 σ \sigma σ控制前向过程的随机性,如果 σ → 0 \sigma \rightarrow 0 σ0,那么在已知 x 0 \mathbf x_0 x0和其中任一个 x t \mathbf x_t xt的情况下, x t − 1 \mathbf x_{t-1} xt1是固定的。

根据上面的推理过程,定义需要学习的生成过程为:
在这里插入图片描述
其中
在这里插入图片描述

根据上面的定义的推理过程和生成过程,优化的目标是
在这里插入图片描述
可以证明该优化目标和特定情况下DDPM的优化目标相同。

逆向生成过程的采样方法如下:
在这里插入图片描述
选择不同的 σ \sigma σ值会导致不同的生成过程,但它们使用相同的 ϵ θ \epsilon_{\theta} ϵθ模型。
如果 σ t = ( 1 − α t − 1 ) / ( 1 − α t ) ( 1 − α t ) / ( 1 − α t − 1 ) \sigma_t=\sqrt{(1-\alpha_{t-1})/(1-\alpha_{t})}\sqrt{(1-\alpha_{t})/(1-\alpha_{t-1})} σt=(1αt1)/(1αt) (1αt)/(1αt1) ,那么前向过程又变成了马尔科夫的,生成过程和DDPM一样。
如果 σ t = 0 \sigma_t=0 σt=0,那么随机噪声前的系数是0, x 0 \mathbf x_0 x0 x T \mathbf x_T xT之间的关系是固定的,这属于隐概率模型(implicit probabilistic model)。因此,作者把这种情况称为denoising diffusion implicit model (DDIM)。

加速

为了加速采样,作者考虑下面的推理过程:
在这里插入图片描述
其中 τ \tau τ是长度为S的 [ 1 , ⋯   , T ] [1,\cdots,T] [1,,T]的子序列, τ S = T \tau_S=T τS=T τ ‾ : = { 1 , … , T } \ τ \overline{\tau}:=\{1,\ldots,T \} \backslash \tau τ:={1,,T}\τ是除去子序列剩下的序号。
定义
在这里插入图片描述该推理分布对应的生成过程如下:
在这里插入图片描述
定义需要学习的概率为:
在这里插入图片描述
根据上面的定义的推理过程和生成过程,优化的目标是
在这里插入图片描述
可以证明该优化目标和特定情况下DDPM的优化目标相同。
因此,可以利用DDPM训练的网络,但是从子序列采样生成图像。

更多推荐

(Vue2)VueRouter

VueRouter修改地址栏路径时,切换显示匹配的组件使用5+2:1下载版本3.6.5(Vue3对应版本4.X)npmaddvue-router@3.6.52引入importVueRouterfrom'vue-router'3安装注册Vue.use(VueRouter)4创建路由对象constrouter=newVue

Vue3.2组件如何封装,以弹窗组件的封装为例

以前一直想,每次封装一个弹窗组件的时候,一直特别复杂,父传子,子传父,各种来回绕,来回修改。一直想如何才能更加简化,但是一直没时间,今天终于抽时间出来封装了一下本次封装简化了很多的代码,再也不用父传子,子传父,各种来回绕,来回修改了。实现功能如下://拆分了表格组件和弹窗组件//实现在父组件中,控制弹窗的显示与隐藏//

设计模式之代理模式

文章目录代理模式(Proxy)代理模式的基本介绍静态代理静态代码模式的基本介绍应用实例静态代理优缺点动态代理动态代理模式的基本介绍JDK中生成代理对象的API动态代理应用实例Cglib代理Cglib代理模式的基本介绍Cglib代理模式实现步骤Cglib代理模式应用实例几种常见的代理模式介绍—几种变体代理模式(Proxy

层次查询和分析函数(LAG、LEAD)在号段选取中的应用

1.问题的提出在实际工作中,我们常常会碰到号段选取的问题,例如:一组连续的数,去掉中间一些数,要求出剩下的数的区间(即号段)例如:一串数字为1,2,3,4,7,9,10,则号段为1-4,7-7,9-10知道号段的起止,要求出该号段内所有的数例如:号段为1-3,15-15,则号段内所有的数为1,2,3,15一组数,中间可

代码随想录 -- day51 --309.最佳买卖股票时机含冷冻期 、714.买卖股票的最佳时机含手续费

309.最佳买卖股票时机含冷冻期注意冷冻期只为1天状态一:持有股票状态(今天买入股票,或者是之前就买入了股票然后没有操作,一直持有)不持有股票状态,这里就有两种卖出股票状态状态二:保持卖出股票的状态(两天前就卖出了股票,度过一天冷冻期。或者是前一天就是卖出股票状态,一直没操作)状态三:今天卖出股票状态四:今天为冷冻期状

探索编程世界的魔力:浅析经典算法的奥秘

一个程序员一生中可能会邂逅各种各样的算法,但总有那么几种,是作为一个程序员一定会遇见且大概率需要掌握的算法。今天就来聊聊这些十分重要的“必抓!”算法吧~一:引言算法在计算机科学和编程中具有极其重要的地位,其重要性体现在以下几个方面:问题解决能力:算法是解决问题的关键工具。它们提供了一种方法来精确描述问题,分解问题为可管

Java 华为真题-选修课

需求:现有两门选修课,每门选修课都有一部分学生选修,每个学生都有选修课的成绩,需要你找出同时选修了两门选修课的学生,先按照班级进行划分,班级编号小的先输出,每个班级按照两门选修课成绩和的降序排序,成绩相同时按照学生的学号升序排序。输入描述第一行为第一门选修课学生的成绩第二行为第二门选修课学生的成绩,每行数据中学生之间以

区块链技术优势和应用

区块链技术是一种分布式账本技术,它具有去中心化、不可篡改、公开透明等优势,可以广泛应用于各个领域。以下是区块链技术的一些应用场景和优势:1、应用金融领域:区块链技术可以用于实现安全、高效、低成本的支付和结算,同时也可以进行身份认证和信用评级,可以有效地防止欺诈和洗钱等金融犯罪活动。物流领域:区块链技术可以实现全程追溯和

【Hash表】找出出现一次的数字-力扣 136

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。推荐:kuan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kaf

蓝蓝设计为教育行业提供软件UI交互设计服务

在教育行业,软件的用户体验设计对于提供优质教育体验至关重要。教育行业软件用户体验设计需要考虑到学生和教师的需求,以及教育环境的特殊性。为了确保设计的成功,选择一家专业的设计公司是至关重要的,而北京蓝蓝设计公司就是您的最佳选择。北京蓝蓝设计公司是一家在教育行业软件用户体验设计领域拥有丰富经验的专业团队。我们深知教育行业软

elasticsearch索引同步

通常项目中使用elasticsearch需要完成索引同步,索引同步的方法很多:#1、针对实时性非常高的场景需要满足数据的及时同步,可以同步调用,或使用Canal去实现。1)同步调用即在向MySQL写数据后远程调用搜索服务的接口写入索引,此方法简单但是耦合代码太高。2)可以使用一个中间的软件canal解决耦合性的问题,但

热文推荐