【资料图】
编程客栈()4月20日 消息:Nvidia公布了其基于Stable Diffusion 模型开发的文本转视频模型—— Nvidia Video LDM。Nvidia通过对现有模型的微调,大大减少了生成视频的过程和时间。
该模型增加了一个时间维度,可以在多个帧上实现时间对齐的图像合成。该团队训练了一个视频模型,以512x1024像素的分辨率生成几分钟的汽车行驶视频,在大多数基准测试中达到SOTA。
注:图片来自Nvidia Video LDM项目截图
除了这个与自动驾驶研究特别相关的演示之外,研究人员还展示了如何将现有的Standroidable Diffusion 型转换为视频模型。
该团队在微调步骤中用视频数据短时间训练Stable Diffusion,然后在网络中每个现有空间层后面添加额外的时间层,并用视频数据对其进行训练。此外,该团队还训练了时间稳定的放大器,以根据文本提示生成1,280x2,048分辨率的视频。
以 Stable Diffusion 作为视频模型的基础,团队无需从头开始训练新模型,可以从现有的能力和方法中获益。例如,尽管使用的 WebVid-10M 数据集仅包含真实世界的视gHflZh频,基于底编程层的Stable Diffusion模型,该模型也可以生成艺术视频。所有视频的长度都在3.8到4.7秒之间——具体取决于帧速率。
研究团队还该展示如何使用 Dreambooth 对视频模型进行个性化设置。,生成包含不属于原始训练数据的对象的视频。这为内容创作者开辟了新的可能性,他们可以使用 DreamBooth 进行视频创作。
注:Dreambooth 是对整个神经网络所有层权重进行调整,会将输入的图像训练进 Stable Diffusion 模型,它的本质是先复制了源模型,在源模型的基础上做了微调(fine编程客栈tunning)并独立形成了一个新模型。
Nvidia Video LDM项目页面上有更多示例,不过该模型目前尚未对外开放。
项目网址:https://research.nvidia.com/labs/toronto-ai/VideoLDM/
编程客栈()4月20日消息:Nvidia公布了其基于StableDiffusion模型开发的文本转视频模型——NvidiaVideoLDM。Nvid
4月19日,第二十四届中国(晋江)国际鞋业暨第七届国际体育产业博览会(以下简称“鞋博会”)在晋江市国际会...
“随着时间延长,新冠中和抗体在体内的滴度的确会慢慢降低。”4月17日,中国科学院微生物研究所研究员戴...
4月19日,自贡市自流井区南部生态农旅涵养片区综合党委会暨党建引领新型农村集体经济发展小组在舒坪街道拉
4月18日12时57分,北京市丰台区消防救援支队接警:北京长峰医院住院部东楼发生火情,接警后,消防、公安、
4月20日盘中消息11点21分沪电股份002463触及涨停板目前价格2607上涨100其所属行业元件目前上涨领涨股为本川
1905电影网讯动作大片《达荷美女战士》正在全国热映中,奥斯卡金像奖得主维奥拉戴维斯领衔全女子军团,实力
乘坐国际航班超过10小时的乘客可能会出现下肢肿胀和麻木的症状。这是因为飞机上狭小的空间限制了下肢的活动
中原网讯(记者刘梦琳通讯员闫茹)“寻根中原,拜祖轩辕”。为高品质营造癸卯年黄帝故里拜祖大典活动的良...
4月20日,观点新媒体获悉,根据地区生产总值统一核算结果,一季度,重庆全市实现地区生产总值6932 89亿元,
4月20日消息,湖北省政府办公厅近日正式印发《湖北省促进个体工商户发展若干措施》。据观点新媒体了解,35
海宁市水利勘测设计所有限责任公司面向社会公开招聘工作人员1名,经招聘单位考核、体检、考察,现确认拟聘用
最专业的流行服饰搭配、为您在一年四季穿衣搭配提供最时尚、最前沿的流行时尚资讯。女生私处如果不注意卫生
今天来聊聊关于荷兰语翻译,荷兰说什么语言的文章,现在就为大家来简单介绍下荷兰语翻译,荷兰说什么语言,
中新网黑龙江新闻4月20日电(记者王琳)为适应教育改革新需求,拥抱“大语文”时代,绥芬河市教育局深入推...
中国邮储银行河北雄安分行携手雄安新区改革发展局、中国人民银行雄安新区营业管理部,成功为6家当地企业发
一年为4万余家市场主体修复信用武汉市新洲区开设信用修复“快速通道”---武汉市新洲区开设信用修复“快...
家里换的大房子正在装修,就想把新家所有的家电都换了,现在家里用的43英寸的一直感觉还不错,无论是画质还
恒港科技2022年净利975 37万同比增长33 09%坏账准备计提比上年减少2023 4 1919:48:57挖贝网白莹挖贝网4月19日,恒港科
4月19日,吴兴区八里店镇中心幼儿园的老师带着孩子们在紫藤架下阅读。为迎接第28个世界读书日的到来,浙江
成都3宗宅地总收金20 36亿元,且全部“熔断”成交4月18日,成都集中供地再次开拍,本次共出让3宗宅地,...
每经AI快讯,有投资者在投资者互动平台提问:理想在上海车展期间推出800V超充解决方案,请问公司跟理想有相
在阿姐鼓游戏中恐怖的剧情解谜游戏,相信大家都玩过一些剧情关卡类游戏,现在都很喜欢玩一些恐怖类的解谜游
对此,英国《卫报》当地时间19日刊文指出,类似事件在其他发达国家是不可能发生的,只有美国人才会担心因为
第一次集齐了中杯、大杯、超大杯的华为nova系列,这一次在ID外观、影像、综合体验方面带来了更符合当下年
X 关闭
X 关闭