
拖动您的 GAN:生成图像流形上的基于点的交互式操作
合成满足用户需求的视觉内容,往往需要对生成对象的姿势、形状、表情和布局进行灵活、精确的可控性。现有方法通过手动注释的训练数据或先前的 3D 模型获得生成对抗网络 (GAN) 的可控性,这些模型通常缺乏灵活性、精度和通用性。在这项工作中,我们研究了一种强大但鲜为人知的控制GAN的方法,即“拖动”图像的任何点,以用户交互的方式精确到达目标点,如图1所示。为了实现这一目标,我们提出了DragGAN,它由两个主要组件组成,包括:1)基于特征的运动监督,驱动手柄点向目标位置移动,以及2)一种新的点跟踪方法,该方法利用判别GAN特征来保持定位手柄点的位置。通过 DragGAN,任何人都可以通过精确控制像素的去向来变形图像,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。由于这些操作是在GAN的学习生成图像流形上执行的,因此即使对于具有挑战性的场景,例如幻觉遮挡的内容和始终遵循对象刚性的变形形状,它们也倾向于产生逼真的输出。定性和定量比较都证明了DragGAN在图像处理和点跟踪任务中优于以前的方法。我们还展示了通过GAN反转对真实图像的处理。
数据统计
数据评估
关于(DragGAN)特别声明
本站商娱网提供的DragGAN都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由商娱网实际控制,在2023-07-01 14:15收录和巡查时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,商娱网不承担任何责任。
相关导航

多聊软件是一款支持在电脑上免费多开微信的PC端工具,可以同时维护多个微信窗口聚合显示。多聊同时支持最新版的企业微信多开电脑版,安全稳定。此外还支持消息提醒、批量添加、图文话术一键回复等功能,可有效提升微信使用者的效率。

Monit
Monit 一个用于展示各种信息的免费开源的桌面小组件,跨平台的桌面应用程序构建工具,适用于Mac、Windows、Linux等。

ImHex
ImHex -面向逆向工程师、程序员和凌晨3点工作时重视视网膜的人的十六进制编辑器。

IDM+
1DM+「原:IDM+」 号称是目前 Android 平台最快、最先进的下载管理器应用「支持通过Torrent下载」。

Babylon.js
Babylon.js是世界领先的基于WebGL的图形引擎之一。从新的视觉场景检查器、一流的基于物理的渲染、无数的性能优化等等,Babylon.js为网络上的每个人带来了强大、美观、简单和开放的3D。

Tickeys
tickeys是一款很强大的键盘音效软件。Tickeys 自带了四种声音效果方案,有打字机、冒泡、机械键盘、剑气等。每天都听着键盘声音是不是很烦闷,现在有了这款神器你就可以瞬间帮助自己的键盘加上逼格特效。

ScreeCapture
ScreeCapture 软件体积仅仅3M...

SophiApp
SophiApp 一款强大的 Windows 微调工具。这是一个用于微调 Windows 10 和 Windows 11 配置的调整器。它拥有现代化的操作界面,在保证系统稳定的前提下,提供了超过 130 种的调整选项。
暂无评论...