1. 当前位置:主页 > 热点资讯

DragNUWA :一个可以实现精细控制的视频生成模型

DragNUWA 是一种基于扩散算法的视频生成模型,DragNUWA 模型旨在解决视频生成中的精细控制问题。该模型通过引入文本、图像和轨迹信息,并从语义、空间和时间角度提供精细控制。

image.png

论文地址:https://arxiv.org/pdf/2308.08089.pdf

模型中的轨迹建模包括轨迹采样器(TS)、多尺度融合(MF)和自适应训练(AT)策略。实验证明 DragNUWA 模型在视频生成的精细控制方面表现出色。

核心功能:

  • DragNUWA 在语义、空间和时间维度上同时引入文本、图像和轨迹信息,提供了精细控制视频生成的能力。

  • 它采用轨迹采样器、多尺度融合和自适应训练策略,实现了开放域轨迹控制和生成连贯的视频。该模型在实验中展现出优越的细粒度控制性能。

声明:本网页内容为来源互联网,旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理,E-MAIL:320919107#qq.com。#改@

DragNUWA :一个可以实现精细控制的视频生成模型:http://www.shiyongwenba.com/fenxiang/165413.html