百度推出蒸汽机2.0多人有声视频生成,全球首发

百度推出蒸汽机2.0多人有声视频生成模型,实现全球首发

2023年8月21日,百度宣布其蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,推出Turbo版、Lite版、Pro版及有声版,并全面开放使用。这一升级标志着百度在人工智能生成内容(AIGC)领域取得重要进展,首次在行业内实现多人有声音视频一体化生成。

百度蒸汽机2.0是全球首个中文音视频一体化生成的I2V(Image-to-Video)模型。该模型不仅支持环境音效,还能实现多角色语音的一体化生成,使AIGC视频创作彻底告别传统配音环节。用户仅需提供一张图像和文本提示词,即可生成具有完整视听效果的视频内容,大幅降低了视频制作的技术门槛和时间成本。

此次升级的核心在于五大技术突破。首先,百度蒸汽机首次实现多人有声音视频一体化生成,语音与唇形、表情、动作达到毫秒级精准对齐,即使在复杂场景下也能保持高度稳定性。其次,模型采用多模态潜在空间规划技术(Latent Multi-Modal Planner),能够自主协调多角色身份、情感与互动逻辑,确保电影级叙事连贯性。第三,针对中文场景的深度适配使语音细节与情感表达的还原度超过98%,显著提升了中文内容的生成质量。第四,通过端到端电影级画质生成技术和精准的主体动态刻画,模型能够呈现真实细腻的人物表现力。最后,内置的数十种专业镜头语言可精准响应文本指令,实现视觉细节与创意意图的高度一致。

在服务层面,百度蒸汽机平台针对不同用户需求提供了梯度会员服务,价格低至行业同类产品的70%。例如,生成一段5秒视频仅需1.4元,降低了企业和个人用户的使用成本。此外,新用户注册即可获得免费想象力值,平台还推出“狂欢星期四”抽奖活动,用户有机会获得高达18888点想象力值,进一步促进用户体验和参与度。平台每月还会发布基于特效能力的赛事活动,为用户提供赢得数万元奖金的机会。

目前,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验相关功能,企业用户则可通过千帆平台享受高性能视频生成服务。这一举措不仅丰富了百度在AIGC领域的布局,也为视频内容创作行业提供了新的工具和可能性。

百度蒸汽机2.0的推出,体现了人工智能技术在多媒体生成领域的快速进步,其技术特点和服务模式有望推动行业进一步向高效、低成本、高质量的方向发展。未来,随着模型的持续优化和应用场景的拓展,百度或将在全球AIGC市场中占据更重要的位置。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2025-08-21
百度推出蒸汽机2.0多人有声视频生成,全球首发
百度推出蒸汽机2.0多人有声视频生成模型,实现全球首发 2023年8月21日,百度宣布其蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,...

长按扫码 阅读全文