IT之家 8 月 23 日音书【BLK-212】kira★kira BLACK GAL レンタル痴女GAL-日焼け黒ギャルと24時間同棲性活- EMIRI,从应对媒体到臆造本质,个性化图像生成因其在各式诈欺中的后劲而日益受到存眷。传统形态时时需要针对每位用户进行多数舛误,从而司法了末端和可膨胀性,为此 Meta 公司立异提议了“Imagine Yourself” AI 模子。
传统个性化图像生成形态挑战现在的个性化图像生成形态时时依赖于为每个用户舛误模子,这种形态末端低下,何况短缺通用性。诚然较新的形态试图在不进行舛误的情况下收场个性化,但它们时时过度拟合,导致复制粘贴效应。
Imagine Yourself 立异Imagine Yourself 模子不需要针对特定用户微调,通过单一模式好像幽闲不同用户的需求。
该模子处理了现存形态的不及之处,如倾向于毫无变化地复制参考图像,从而为更通用、更便捷用户的图像生成经由铺平了说念路。
Imagine Yourself 在保安身份、视觉质料和实时对王人等要津畛域进展出色,大大优于之前的模子。
该模子的主要构成部分包括:
生成合成配对数据以荧惑各样性;
整合了三个文本编码器和一个可考查视觉编码器的全都并行细致力架构;
以及一个从粗到细的多阶段微调过程
这些立异技能使该模子好像生成高质料、各样化的图像,同期保抓巨大的身份保护和文本对王人功能。
Imagine Yourself 使用可考查的 CLIP 补丁编码器提真金不怕火身份信息,并通过并行交叉细致模块将其与文本教唆整合在沿途,准确保安身份信息并对复杂的教唆作念出反馈。
草榴网址该模子使用低阶适配器(LoRA)仅对架构的特定部分进行微调,从而保抓较高的视觉质料。
Imagine Yourself 的一个凸起功能是生成合成配对(SynPairs)数据。通过创建包含脸色、姿势和光照变化的高质料配对数据,该模子不错更有用地学习并产生各样化的输出末端。
值得细致的是,在处理复杂的教唆词方面,与起先进的模子比较,它在文本对王人方面收场了 +27.8% 的权贵蜕变。
酌量东说念主员使用一组 51 种不同身份和 65 个教唆对 Imagine Yourself 进行了定量评估,生成了 3315 幅图像供东说念主类评估。
该模子与起先进的(SOTA)adapter-based 模子和 control-based 模子进行了比对,重心存眷视觉眩惑力、身份保抓和教唆对王人等目标。
东说念主工疑望左证身份不异性、实时对王人和视觉眩惑力对生成的图像进行评分。与 adapter-based 模子比较,Imagine Yourself 在教唆对王人方面有了 45.1% 的权贵进步,与基于限制的模子比较有了 30.8% 的进步,再次解释了它的优胜性。
Imagine Yourself 模子是个性化图像生成畛域的一大超过。该模子无需针对特定对象进行舛误,并引入了合成配对数据生成和并行细致力架构等立异组件,从而处理了以往形态所濒临的要津挑战。
IT之家附上参考地址
Imagine yourself: Tuning-Free Personalized Image Generation
告白声明:文内含有的对外跳转畅通(包括不限于超畅通、二维码、口令等形态),用于传递更多信息,检朴甄选时辰,末端仅供参考【BLK-212】kira★kira BLACK GAL レンタル痴女GAL-日焼け黒ギャルと24時間同棲性活- EMIRI,IT之家所有这个词著作均包含本声明。