
拖动您的 GAN:生成图像流形上的基于点的交互式操作
合成满足用户需求的视觉内容,往往需要对生成对象的姿势、形状、表情和布局进行灵活、精确的可控性。现有方法通过手动注释的训练数据或先前的 3D 模型获得生成对抗网络 (GAN) 的可控性,这些模型通常缺乏灵活性、精度和通用性。在这项工作中,我们研究了一种强大但鲜为人知的控制GAN的方法,即“拖动”图像的任何点,以用户交互的方式精确到达目标点,如图1所示。为了实现这一目标,我们提出了DragGAN,它由两个主要组件组成,包括:1)基于特征的运动监督,驱动手柄点向目标位置移动,以及2)一种新的点跟踪方法,该方法利用判别GAN特征来保持定位手柄点的位置。通过 DragGAN,任何人都可以通过精确控制像素的去向来变形图像,从而操纵动物、汽车、人类、风景等不同类别的姿势、形状、表情和布局。由于这些操作是在GAN的学习生成图像流形上执行的,因此即使对于具有挑战性的场景,例如幻觉遮挡的内容和始终遵循对象刚性的变形形状,它们也倾向于产生逼真的输出。定性和定量比较都证明了DragGAN在图像处理和点跟踪任务中优于以前的方法。我们还展示了通过GAN反转对真实图像的处理。
数据统计
数据评估
关于(DragGAN)特别声明
本站商娱网提供的DragGAN都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由商娱网实际控制,在2023-07-01 14:15收录和巡查时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,商娱网不承担任何责任。
相关导航

截图 + 贴图,提高您的工作效率

微海鼠标自动点击器
微海鼠标自动点击器是一款简单的鼠标点击操作录制工具,用于处理一些重复性的操作,解放双手用的。省时省力,也提升了鼠标使用寿命,有需要的可以下载来使用。

Babylon.js
Babylon.js是世界领先的基于WebGL的图形引擎之一。从新的视觉场景检查器、一流的基于物理的渲染、无数的性能优化等等,Babylon.js为网络上的每个人带来了强大、美观、简单和开放的3D。

V2free
V2free 免费V2ray免费节点,科学上网、翻墙看世界解锁流媒体,多平台支持,手机、电脑同步使用!翻墙看视频、浏览网页,一键加速不卡顿。

VUEVlog 用 Vlog 记录生活,分享真实的你
VUE Vlog 是国内领先的视频拍摄和编辑工具以及原创的 Vlog 短视频平台。VUE Vlog 提供海量的音乐、贴纸、边框、字体、滤镜、转场等样式和素材,让你不费吹灰之力,就能作出媲美欧阳娜娜的 Vlog。并且已有数万 Vloggers 在 VUE Vlog 安家,如果你也喜欢看邻家小姐姐周末玩了什么、柴犬被主人骗去洗澡是什么表情、环球旅行家每天去哪里… 那就快上 VUE Vlog 看看。除了目不暇接的精彩视频,你还可以和这些优秀 Vloggers 交朋友。

Skyda
Skyda是一个您可以信任的消息传递平台,可以让您的对话完全保密。使您的邮件完全加密,并且只有您和您的收件人才能访问。

MediaGo
MediaGo-在线视频下载,简单易用,快速下载,简单易学,无需抓包,不需要安装插件。

Apowersoft 为您提供专业的音视频下载,转换,录屏软件和免费在线解决方案
视频编辑王现改名为蜜蜂剪辑,带给剪辑小白更好的视频剪辑体验,超简单的基础剪辑操作,提供业内前沿的语音文字互转、视频剪切、裁剪视频、视频去水印等功能。
暂无评论...