
拖动您的 GAN:生成图像流形上的基于点的交互式操作
合成满足用户需求的视觉内容,往往需要对生成对象的姿势、形状、表情和布局进行灵活、精确的可控性。现有方法通过手动注释的训练数据或先前的 3D 模型获得生成对抗网络 (GAN) 的可控性,这些模型通常缺乏灵活性、精度和通用性。在这项工作中,我们研究了一种强大但鲜为人知的控制GAN的方法,即“拖动”图像的任何点,以用户交互的方式精确到达目标点,如图1所示。为了实现这一目标,我们提出了DragGAN,它由两个主要组件组成,包括:1)基于特征的运动监督,驱动手柄点向目标位置移动,以及2)一种新的点跟踪方法,该方法利用判别GAN特征来保持定位手柄点的位置。通过 DragGAN,任何人都可以通过精确控制像素的去向来变形图像,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。由于这些操作是在GAN的学习生成图像流形上执行的,因此即使对于具有挑战性的场景,例如幻觉遮挡的内容和始终遵循对象刚性的变形形状,它们也倾向于产生逼真的输出。定性和定量比较都证明了DragGAN在图像处理和点跟踪任务中优于以前的方法。我们还展示了通过GAN反转对真实图像的处理。
数据统计
数据评估
关于(DragGAN)特别声明
本站商娱网提供的DragGAN都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由商娱网实际控制,在2023-07-01 14:15收录和巡查时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,商娱网不承担任何责任。
相关导航

软件介绍 SoftCnKiller,一个...

FeHelper Awesome
FeHelper属于chrome浏览器插件,包含代码json串格式化、代码压缩、颜色转换、进制转换、网页性能检测、编码规范检测等web前端开发常用功能。

网易UU远程
网易UU远程(原GameViewer远程),是一款由网易出品的专业游戏串流远程控制软件,支持手机、平板、电脑、Mac、掌机远程控制电脑,不仅能满足你远程办公、远程协助等需求,超低延迟、高清高帧、操控自如、轻松拓展副屏、一键公网串流等特色功能更能给你带来极致的游戏串流体验!

coreidraw x7
coreidraw+x7

矢量自然风景素材
矢量自然风景素材

微信翻译
微信翻译网页版-支持翻译文字、图片以及文档内容,网页给人的感觉就是纯纯的极简风。

vivo办公套件
vivo 办公套件是集合 OriginOS 生产力应用的多端协作办公工具,支持 Windows、Mac 和网页版,轻松实现手机、平板与电脑间跨屏互动、键鼠协同、远程控制与文件传输管理,同时将原子笔记、日历、相册等多个应用聚合其中,为你提供更高效便捷的办公体验。

Babylonjs中文网
Babylon.js是一款基于WebGL的3D图形引擎,也是目前处于该领域世界领先水平的引擎之一。它架设在先进的视觉场景发生器之上,拥有基于物理引擎一流的渲染方法,全方位的性能调优手段,而这些都只是它众多功能中的冰山一角。Babylon.js这样一个强大、惊艳、易用、开源的3d引擎,将会为所有web技术从业者赋能。
暂无评论...