4月16日消息,在今日举办的第三届中国AIGC产业峰会上,生数科技产品副总裁、Vidu产品负责人廖谦透露,下周将全球发布即新的Vidu Q1模型,该大模型优化旨在大幅提升内容创作的可控性,尤其在位置控制、运动布局和音频生成上,以更贴近人类审美和自然法则。
廖谦表示,Vidu Q1模型将推动多模态大模型时代的变革,将极大增强个性化内容生成能力,对社交、游戏、VR/AR等领域产生深远影响。
生数科技(北京生数科技有限公司)成立于2023年3月,是一家专注于多模态生成式大模型与应用产品开发的高科技企业,核心团队来自清华大学人工智能研究院。
生数科技首创了基于Transformer的U-ViT架构,融合了Diffusion模型与Transformer的优势,支持多模态任务的统一建模。该架构在2023年开源的UniDiffuser模型中首次应用,成为全球首个基于Diffusion Transformer的多模态扩散模型,比Stable Diffusion 3采用的DiT架构领先一年。
基于U-ViT架构,生数科技2024年4月发布的视频大模型Vidu可一键生成16秒1080P高清视频,具备多镜头切换、高时空一致性和物理世界模拟能力,性能对标OpenAI的Sora。
- 启信宝2025奶茶趣味报告:奶茶企业5年激增140%,40万家共筑3500亿帝国
- 《黑神话:悟空》PS5国行版将于6月18日正式发售,建议零售价268元起
- 报告:2029年美国AI搜索广告支出将达260亿美元,占比13.6%
- 重塑内生安全体系 实现AI时代安全突围 ——2025北京网络安全大会(BCS)开幕
- 覆盖上百国家!启信慧眼全球供应链“风险地图”助力中企安全“出海”
- 门禁凭证技术进化简史:开启更加安全和便利的未来
- Google I/O 大会:科技盛宴,引领未来创新潮流
- 马蜂窝端午出行大数据:短途周边游是主流,非遗民俗关注度持续走高
- 微软裁员6000人原因揭晓 AI冲击首当其冲
- 腾讯音乐2025Q1业绩持续高质量增长:在线音乐服务收入达58亿元,同比增长15.9%
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。