2026/4/17 20:03:03
网站建设
项目流程
建设一个门户网站需要多久,品牌设计模板,山东济南报备小程序,网站建设题库含答案摘要
本文提出的 HiWave 是一种使用预先训练的扩散模型生成超高分辨率#xff08;如 4096 x 4096#xff09;图像的方法#xff0c;无需额外的训练或架构修改。
虽然现有的基于补丁的方法可以增强局部细节#xff0c;但容易造成整体结构的破坏和重叠伪影。
HiWave 首先生成…摘要本文提出的 HiWave 是一种使用预先训练的扩散模型生成超高分辨率如 4096 x 4096图像的方法无需额外的训练或架构修改。虽然现有的基于补丁的方法可以增强局部细节但容易造成整体结构的破坏和重叠伪影。HiWave 首先生成低分辨率的基础图像然后将其放大到高分辨率并对每个补丁应用 DDIM 反变换来估计初始噪声。此外在频域中低频分量用于保存结构而高频分量则用于增加细节信息。在人体评估实验中发现所提出的方法比传统方法质量更高因此是高分辨率图像合成的一种新方法。建议的方法HiWave 包括三个阶段基础图像生成、片段式 DDIM 反转和基于小波的细节增强。首先使用预先训练好的扩散模型如 Stable Diffusion XL生成 1024 x 1024 的基础图像然后通过插值将图像空间放大到 4096 x 4096。然后将放大后的图像划分为多个补丁并对每个补丁进行 DDIM 反变换以获得反映原始图像结构的初始噪声。最后使用 DWT离散小波变换对低频成分进行约束以保留结构并根据 CFG无分类器引导对高频成分进行修正以增强细节。通过对每个频率应用不同的引导成功实现了整体图像的一致性和高细节增强。实验为了验证 HiWave 的有效性我们进行了与 Pixelsmith基于补丁和 HiDiffusion基于直接推理的对比实验。为了进行评估从 LAION2B-en-aesthetic 数据集中随机选取了 1,000 个提示每种方法都生成了 4096 x 4096 分辨率的图像。目测比较结果显示HiDiffusion 产生的图像结构破碎、纹理模糊而 Pixelsmith 则倾向于产生重复的对象。相比之下HiWave 在保持结构完整性的同时还具有较高的细节精确度并大大减少了伪影的产生。此外用户还进行了 A/B 测试在 81.2% 的情况下HiWave 比其他方法更受欢迎。这从定量和定性两方面证实了所提出方法的高质量和自然的高分辨率图像生成性能。