您现在的位置: 首页 > 业界 > 正文

画质、音效齐飞,Vidu Q1新模型用实力成为动漫视频生成领域全球第一

2025-04-23 11:43:58 来源:互联网 编辑:ITCN
  • +1 你赞过了

4月21日,生数科技全新视频大模型Vidu Q1官宣全球上线,凭借性能提升与全新功能,该模型一经上线即引发行业高度关注,力证其用实力再次搅动市场风云。据视频生成模型权威测评基准VBench-1.0以及VBench-2.0刚刚发布的测评结果,Vidu Q1在VBench系列的两个榜单上都超越了Runway 、OpenAI Sora、快手的Kling等国内外顶尖模型,拿下文生视频赛道榜单双第一。

此外在国内权威大模型测评机构SuperCLUE的图生视频榜中 ,Vidu Q1也在动漫风格、写实风格上均斩获双榜单第一的亮眼成绩。

Vidu Q1在VBench-1.0的视频质量、视频语义一致性以及VBench-2.0常识推理、物理理解等综合维度上达到SOTA水平(即当前最先进的模型),成为全球视频生成效果最强模型。

实际上,在提升创作者生产力和创作力上,生数Vidu 技术和产品上一直引领全球。

此次发布的 Q1 是Vidu 的新一代高质量模型,“Q”代表着模型具备更高画面质感、更强语义理解。目前Vidu Q1已支持生成5秒、1080P高质量视频,不断推进AI视频走向商业化。

Vidu Q1刚一发布,就获得了海外内视频创作者的连连点赞。有海外创作者表示,一致性与 1080p 质量相结合,达到顶级一流水准。

据了解,此次上线的Vidu Q1在“极致高质量”上进行了全面升级:

电影级高清画质:Vidu Q1 文生视频和图生视频支持1080P视频直出,无论是宏大的科幻叙事还是人物特写的细微表情,都可以清晰呈现;

首尾帧更全能:只需两张图,即可生成大师级运镜,电影镜头感UP,镜头语言理解能力大幅提升,即使是复杂场景运镜也能稳稳hold 住;

动画风格更惊艳:Vidu Q1在动画风格的生成效果上再度升级,高动态的运动表现力,更加多元化的动画风格;

上线AI音效功能:一句话就能生成精准专属音效,还可实现多种音效叠加,让AI视频生成进入“有声时代”;

目前Vidu Q1已陆续上线 网页与 App 端,无需邀请码,打开 App和网页即可一键体验,真正做到“顶级模型,全民可用”,而且每秒生成价格最低仅需0.3元,真正的“性价比之王”。

音效功能:一句话生成专属音效,承包专业创作全流程

Vidu Q1 发布同时,还推出了文生音效模型。只需一句话,即可生成最长 10 秒的专属音效,AI视频从此进入“有声时代”。

音效是视频氛围和真实感的关键。过去,创作者需在音效库中寻找素材,但常常面临版权风险、同质化问题及与视频长度不匹配的困扰。Vidu 的 AI 音效完美解决这些问题,生成的音效既独特又个性化,且无需担心版权。

某海外用户在体验完后表示,Vidu的文生音效提升了整体的创作效率,生成的音效质感非常棒。

此次 Vidu 发布的 AI 音效在技术创新方面有诸多亮点。

首先,用户可以精准控制生成音效的时间,音效可以在 10 秒内的任意时间点开始生成。这也是目前为止业内商业领域首个支持精细化时间控制的文生音效系统。

其次,Vidu 的文生音效功能还支持多段音效叠加,并以一个完整的音频文件输出。例如,下面的示例中,通过多段音效的叠加,成功还原了火车经过的真实感。

尤为值得一提的是,相比于业内普遍只能生成 16KHz或者32KHz,Vidu 的音效已经可以做到48KHz的音乐级采样率和保真度,这也是文生音效在商业化领域中首家做到48KHz的高保真音效。

来听一听效果,这个蟋蟀声是不是有种“一声入夏”,仿佛走入原始森林的感觉。

Hz是评判音频质量的标准,你在耳机中听的QQ音乐一般都是48KHz,其在听觉上会比较流畅,而16KHz、32KHz会存在压缩失真问题。

当然你也可以用Vidu的文生音效功能探索更多玩法,比如生成一段爵士风格的即兴音乐

亦或者来一段中国风纯音乐,古筝、笛子等乐器营造出了古典的山水意境。

Vidu的文生音效功能,打通了视频创作的整个工作流,从视频生成到音效生成,一个平台就能搞定。

拒绝画饼!App、网页端直接体验

Vidu Q1已全球同步上线,无需排队,也不用再申请内测,上线即可立刻体验。目前 Vidu APP 已在安卓和iOS市场上线,用户打开手机APP,或者登陆Vidu 网站即可立刻体验最新Q1模型带来的极致高质体验。此外,据了解,Q1可控等相关重磅功能未来也将陆续上线,值得狠狠期待一波。

天赋从不是定义创作的边界,Vidu Q1让你成为天生导演。

相关文章
本周热门

今日话题