CIKM是人工智能領(lǐng)域的頂級(jí)國(guó)際會(huì)議,會(huì)議的目的是確定未來(lái)知識(shí)和信息系統(tǒng)發(fā)展面臨的挑戰(zhàn)性問(wèn)題,并通過(guò)征集和審查高質(zhì)量的應(yīng)用和理論研究成果來(lái)塑造未來(lái)的研究方向,在學(xué)術(shù)和工業(yè)界都有巨大的影響力。此次入選意味著阿里云人工智能平臺(tái) PAI自研的擴(kuò)散模型算法和框架達(dá)到了全球業(yè)界先進(jìn)水平,獲得了國(guó)際學(xué)者的認(rèn)可,展現(xiàn)了中國(guó)人工智能技術(shù)創(chuàng)新在國(guó)際上的競(jìng)爭(zhēng)力。
擴(kuò)散模型在圖像生成領(lǐng)域的成功我們有目共睹。從 Latent Diffusion 到 Stable Diffusion,從驚艷的 Midjourney 到百花齊放的 Diffusion 開源社區(qū),擴(kuò)散模型目前已然成為 AIGC 行業(yè)的最熱門研究方向之一。
圖 1:擴(kuò)散模型的精美生成效果
然而,擴(kuò)散模型生成精美圖像的代價(jià)是高昂的計(jì)算資源需求。與基于生成對(duì)抗網(wǎng)絡(luò)的方法不同,擴(kuò)散模型的生成過(guò)程是迭代式的,因此需要多次調(diào)用模型,逐步消除圖像中的噪聲?,F(xiàn)有的一些加速算法通過(guò)設(shè)計(jì)“調(diào)度機(jī)”,構(gòu)造完整生成過(guò)程的近似過(guò)程,減少迭代步數(shù),提高生成速度。
圖 2:調(diào)度機(jī)算法構(gòu)造的短步數(shù)近似過(guò)程
根據(jù)論文中的分析,調(diào)度機(jī)構(gòu)造的近似過(guò)程本質(zhì)上是線性子空間的擴(kuò)張過(guò)程,論文中也給出了其中的幾何解釋,DDIM 算法在二維線性子空間中尋找近似解,而論文中提出的 OLSS 算法旨在更高維的線性子空間中求解。
圖 3:OLSS 算法的直觀幾何解釋
此外,OLSS 還使用一個(gè)路徑規(guī)劃算法進(jìn)一步提升精度,在同等步數(shù)下,實(shí)現(xiàn)了更高的圖像質(zhì)量。
圖 4:OLSS 算法與其他方法生成的圖像對(duì)比
目前,阿里云人工智能平臺(tái) PAI已經(jīng)上線了多種擴(kuò)散模型的應(yīng)用,例如快速部署AIGC Stable Diffusion SDWebUI繪畫的AI-Web應(yīng)用及快速推理等。用戶可以登錄阿里云官網(wǎng)領(lǐng)取免費(fèi)試用資源,快速體驗(yàn)。
論文信息
論文標(biāo)題:Optimal Linear Subspace Search: Learning to Construct Fast and High-Quality Schedulers for Diffusion Models
論文作者:段忠杰、汪誠(chéng)愚、陳岑、黃俊、錢衛(wèi)寧
論文pdf鏈接:https://arxiv.org/abs/2305.14677