Soul端到端全双工语音通话大模型全面升级,突破传统AI交互模式

新型社交平台Soul App近日宣布,其自研端到端全双工语音通话大模型完成全面升级。此次升级打破了传统语音交互的“轮次对话”模式,赋予AI自主决策对话节奏的能力,为人机交互注入更多人情味儿,推动Soul在AI社交领域的体验革新。

IMG_6830.png

新升级的模型摒弃了依赖VAD机制与延迟控制逻辑的传统方式,让AI实现主动打破沉默、适时打断用户、边听边说等类真人交互行为。同时,模型具备多维度感知能力,能感知时间、环境、事件等信息,结合口语化表达和音色复刻技术,让AI的语气、情绪更贴近真人,大幅提升了交互的沉浸感。例如,AI在对话中会自然使用语气词、表现出情绪起伏,甚至有结巴、咳嗽等日常语音元素,使沟通更显真实。

在应用场景上,该模型即将开启站内内测,后续将落地于虚拟人实时通话、AI匹配等1V1互动场景。Soul AI团队还在探索多人互动场景的应用,让AI能在多人对话中精准把握时机,推动话题延展,助力多元关系网络构建。

Soul在AI技术领域的布局由来已久。自2016年上线后,平台便积极拥抱AI,2020年启动系统的AIGC技术研发,在智能对话、语音、3D虚拟人等方面积累深厚。2023年推出自研语言大模型Soul X后,陆续上线语音生成、通话、音乐生成等大模型能力,2024年升级为多模态端到端大模型,支持文字、语音等多形式交互。

基于这些技术积累,Soul围绕“AI辅助社交”和“AI与用户交朋友”两大方向,推出了“AI伴侣”“AI聊天辅助”等功能,受到用户欢迎。

Soul App CTO陶明表示,社交是情绪价值和信息价值交换的双向关系,Soul始终致力于以创新的技术和产品方案为用户提供更智能、更沉浸、更优质的交互体验,让天下没有孤独的人。

此次Soul全双工语音大模型的升级,正是对用户需求的精准回应。它通过提升AI的交互自然度和情感温度,让AI更好地融入社交关系网络,为用户提供情绪价值和信息价值。未来,Soul将继续探索新技术,致力于构建AI与人类共存的社交社区。


(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )