Emu & Emu-edit (Meta)

人工智能炼丹师
2023-11-25 / 0 评论 / 205 阅读 / 正在检测是否收录...

Emu: Enhancing Image Generation Models Using Photogenic Needles in a Haystack

Emu的主要发现: 采用少量的人工挑选标注数据(2k),即可大幅提升生成图像的美学质量。可能存在的问题:在少量数据集下Finetune需要严格控制训练steps,否则可能会出现过拟合问题、主体概念遗忘问题

Emu 训练测试流程

emu_pipeline

Emu 模型结构

emu_model
模型结构主要改进点:

  1. 文本Encoder集成 CLIP和T5-XXL两种不同类型特征

  2. 提升VAE编码的特征通道数,让有损压缩丢失的信息更少

  3. 参考之前工作,利用noise-offset & 分尺度多阶段训练方法。前期学习语义生成,后期提升生成细节。

Emu Edit: Precise Image Editing via Recognition and Generation Tasks

TODO

3

评论 (0)

取消
粤ICP备2021042327号