您的位置: 首页 > 实时讯息 >

生数科技发布高可控视频大模型Vidu Q1:可精准调整所有动作行为

0次浏览     发布时间:2025-03-29 18:02:00    

IT之家 3 月 29 日消息,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军今日发布了高可控视频大模型 Vidu Q1,官方宣称其为业内首个高可控 AI 视频大模型

IT之家从官方获悉,Vidu Q1 在多主体细节可控(特别是动作、布局可控)、音效同步可控、画质增强等方面均取得显著成效。以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1 支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整

其支持音效同步可控功能,可确保随着视频环境与画面转场,Vidu Q1 能够输出生成相应音效,并可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如 0-2s 风声、3-5s 雨声等

相关文章

任天堂因关税问题调整Switch 2美国预购时间,发售日及价格不变

IT之家 4 月 4 日消息,任天堂宣布,原定于 2025 年 4 月 9 日在美国启动的 Switch 2 预购计划将延期,以评估特朗普政府新关税政策及市场变化的影响。任天堂发言人 Eddie Garcia 向 The Verge 确认,该设备发售日期仍定于 2025 年 6 月 5 日,售价维持
2025-04-04 23:00:00

特斯拉德国汽车销量遭“腰斩”,2025Q1同比暴跌62%

IT之家 4 月 4 日消息,汽车媒体 eletric-vehicles 昨日(4 月 3 日)发布博文,报道称德国联邦交通管理局(KBA)数据显示,特斯拉 3 月在德国注册量仅 2229 辆,同比暴跌 42.5%;2025 年第 1 季度累计注册 4935 辆,同比下滑 62.2%。该媒体认为导致
2025-04-04 15:10:00

《新华每日电讯》关注青岛:人工智能赋能千行百业

新华每日电讯2025年4月3日5版新华社青岛4月1日电(记者 张武岳)在位于山东青岛崂山区人工智能产业园的自然语义(青岛)科技有限公司,工作人员向记者展示了最新研发的语言类大模型“欧拉”:在一台笔记本电脑上,未接入互联网的状态下,该大模型就可以进行与DeepSeek、ChatGPT等相似的“思考”过
2025-04-03 14:35:00

任天堂解释Switch 2游戏密钥卡:不含数据,必须先下载才能玩

IT之家 4 月 3 日消息,任天堂今日于其客户支持网站上公布了 Switch 2 游戏密钥卡的特性,称该卡带将不包含游戏数据,需要先联网下载才能游玩。根据任天堂官方描述,Switch 2 游戏密钥卡将在卡带包装上标明“游戏密钥卡”标志及所需存储空间,同时该卡带的使用流程如下:第一步:将卡带插入 S
2025-04-03 13:18:00

Adobe PR视频编辑软件将支持尼康N-RAW格式

IT之家 4 月 3 日消息,尼康今日官宣,Adobe 视频编辑软件 Premiere Pro 将支持尼康 N-RAW 视频格式。N-RAW 是尼康的高质量 RAW 视频格式,可提供大量影像数据,为用户在后期制作中带来更大的自由度与灵活性。Premiere Pro 对 N-RAW 格式的支持,是通过
2025-04-03 12:44:00

联想将推RTX 5060 Ti和5060显卡的台式机,搭Arrow Lake-HX

IT之家 4 月 3 日消息,联想在海外官网上更新了一款名为 Legion Tower 5i Gen 10 的台式机,该机将搭载尚未发布的英伟达 RTX 5060 Ti 和 5060 显卡,并将搭载移动端移植桌面端的 Arrow Lake-HX 平台处理器,目前该机处于“即将登场”的状态。根据联想官
2025-04-03 11:13:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5