拖动您的 GAN:生成图像流形上的基于点的交互式操作
合成满足用户需求的视觉内容,往往需要对生成对象的姿势、形状、表情和布局进行灵活、精确的可控性。现有方法通过手动注释的训练数据或先前的 3D 模型获得生成对抗网络 (GAN) 的可控性,这些模型通常缺乏灵活性、精度和通用性。在这项工作中,我们研究了一种强大但鲜为人知的控制GAN的方法,即“拖动”图像的任何点,以用户交互的方式精确到达目标点,如图1所示。为了实现这一目标,我们提出了DragGAN,它由两个主要组件组成,包括:1)基于特征的运动监督,驱动手柄点向目标位置移动,以及2)一种新的点跟踪方法,该方法利用判别GAN特征来保持定位手柄点的位置。通过 DragGAN,任何人都可以通过精确控制像素的去向来变形图像,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。由于这些操作是在GAN的学习生成图像流形上执行的,因此即使对于具有挑战性的场景,例如幻觉遮挡的内容和始终遵循对象刚性的变形形状,它们也倾向于产生逼真的输出。定性和定量比较都证明了DragGAN在图像处理和点跟踪任务中优于以前的方法。我们还展示了通过GAN反转对真实图像的处理。
数据统计
数据评估
关于(DragGAN)特别声明
本站商娱网提供的DragGAN都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由商娱网实际控制,在2023-07-01 14:15收录和巡查时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,商娱网不承担任何责任。
相关导航
使用我们的免费电子邮箱转发服务保护收件箱免受垃圾邮件骚扰:我们的别名和临时电子邮件地址可以最大程度保护个人电子邮件地址的隐私。
异常教程
异常教程(www.exception.site)提供各类编程技术系列教程,让您能够学习并提高自己的编程技术。
ArcGIS
通过交互式地图,将人员、位置和数据连接起来。 使用智能数据驱动样式和直观分析工具。 与全世界或特定群组分享您的见解。

EasyTshark
EasyTshark - 专业的网络流量分析工具 强大的网络分析功能,满足各种场景需求,简化网络数据包分析,让网络调试变得轻松高效。
Visual Studio Code - Code Editing. Redefined
Visual Studio Code is a code editor redefined and optimized for building and debugging modern web and cloud applications. Visual Studio Code is free and available on your favorite platform - Linux, macOS, and Windows.
Cmd Markdown
Cmd Markdown 编辑阅读器,支持实时同步预览,区分写作和阅读模式,支持在线存储,分享文稿网址。

PixPin
PixPin是一款功能强大的免费截图工具,支持截图、录屏、长截图、OCR文字识别、屏幕贴图等功能。为设计师、开发者、办公人员提供高效的屏幕操作体验。
Joplin
Joplin - 注重隐私的笔记应用程序,具有适用于 Windows、macOS、Linux、Android 和 iOS 的同步功能。
暂无评论...
