大模型+搜索:一盘跳棋和三位选手

我们都知道,大模型必须诞生应用才有价值。那么,哪种应用才能最快发挥出AI大模型的价值潜力,成为大模型落地的第一站?提起这个问题,很多人会首先回答:搜索。

这一方面是因为,在ChatGPT爆火之后,“大股东”微软首先就将其能力融入到Bing搜索中,并且一度宣布要凭借大模型优势,把行业老大哥谷歌挑落马下。那么在中国AI圈大规模复刻大模型的背景下,在应用侧也自然会想到首先推进搜索+大模型。

另一方面,搜索引擎天然有着与AI深度结合的优势。早在2014、2015年,百度和谷歌这些传统搜索引擎巨头就开始将深度学习、知识图谱等AI技术融入搜索当中,以此提升搜索引擎对用户指令的理解能力,增强搜索结果的内在关联性。

由此可见,大模型+搜索,可谓是天时地利人和。经过近一年时间的探索,中国AI行业的大模型+搜索应用也逐渐丰富了起来。虽然大模型带给搜索的改变并没有彻底浮现出来,但已经形成了较为多样化的探索思路。

为了能让大家更生动了解大模型+搜索的目前进展,理解不同思路的差异化。我们想了一个比喻:大模型+搜索,就像一盘跳棋。各位选手手里的棋子都是一样的,即大模型技术与搜索技术。而他们的最终目标是一致的,即孵化大模型时代的第一个爆款应用。

但在下棋的过程中,各自的棋路却有不同。目前来看,它们分为三个流派。

选手一:大模型作为搜索引擎的增强插件

搜索,是互联网时代人与信息之间最为频繁的接触场景。搜索引擎既需要理解用户意图,也需要理解海量信息。作为信息与人之间的枢纽,搜索引擎提升智能水平的需求是永无止境的。

而大模型为搜索引擎带来的差异在于,它不仅能够加强传统搜索引擎的体验,还能够通过AIGC模式带来各种对用户意图与搜索结果的内容生成能力。

举个例子,大模型不仅能够提高搜索精准度,还可以把搜索出的多个结果合并生成到一个内容框里,节省用户时间。这相当于在传统的搜索框架外,给用户了一些额外的搜索工具。

基于这种思路,业界开始探索大模型+搜索的第一种模式:把大模型能力,当做搜索引擎的增强插件。在国内市场上,这个流派的代表是百度。

搜索业务,可以说是百度通过文心大模型能力进行产品改造的第一站。目前阶段,百度已经在搜索引擎中添加了两种基于AIGC能力的“增强插件”。

首先,是在首条回答中进行信息聚合。

在AI技术与搜索结合的过程中,百度非常强调“首条搜索结果即满足用户需求”的理念。而大模型能力,可以将搜索结果进行关键信息的聚合,从而生成内容摘要。基于这种模式,百度在搜索引擎中更新了首条回答能力,其覆盖范围不仅是文字信息,还可以通过大模型对视频进行理解从而归纳摘要。在这种模式下,加入用户想要搜索的结果在视频内容中,用户就可以不再去观看视频,而是通过首条回答直接得到视频内容的总结归纳。

百度公布的数据显示,过去首条搜索满足率只有40%左右,而在加入大模型能力后,这一比率达到了70%。可见大模型能力作为搜索引擎插件,是收获正向反馈的。

另一种“增强插件”式的大模型结合搜索,是在搜索栏之外专门提供一个AI对话栏,也就是百度搜索在今年5月移动生态大会上推出的“AI伙伴”能力。

AI伙伴可以与用户进行AIGC问答,帮助用户在使用搜索引擎时完成诸如答案标记、提供信息来源、总结文档概要等能力,同时还支持其他工具和服务的调用。

也就是说,百度在搜索引擎界面内,以及搜索引擎之外,都提供了基于大模型能力的AIGC插件,从而让搜索引擎获得多个角度的大模型重构。无独有偶,这一思路与谷歌将Bard聊天机器人整合到搜索引擎中非常相似

可见具有搜索引擎传统优势的厂商,更倾向于将大模型作为增强插件,多角度融入传统搜索引擎这种“1+1大于2”的思路。

选手二:类ChatGPT的搜索应用

在增强传统搜索引擎能力之外,大模型还带来了另一个问题:是否有可能绕开传统搜索形态,直接基于AIGC能力产生新的搜索产品?

在这种可能性上也出现了一些探索。ChatGPT本身即具备语义理解、多轮问答、内容生成等能力,从某种程度上看,这也可以看作是一种“搜索”。只不过搜索的内容从关键词变成了提问和需求,搜索结果从网页变成了直接生成文字内容。

于是,中国AI行业中出现的一种新型搜索产品,可以被称为类ChatGPT搜索。其中具有代表性的“参赛选手”,是昆仑万维推出的天工AI搜索。

这种搜索引擎完全以AIGC作为产品核心逻辑。用户通过自然语言来表达需求意图,随后搜索界面反馈出相关答案,而不再像传统搜索引擎一样展现大量网页链接。

相对来看,天工AI搜索的一个创新点在于信源索引。在使用ChatGPT等AIGC平台时,我们经常会面临一个问题,就是AI回答内容的不确定性。极多问题大模型都无法给出正确答案,甚至会胡乱编造论据、文献出处、新闻源等,也就是广受吐槽的“AI一本正经地胡说八道”。

而天工AI搜索则强调了生成答案的同时给出参考信息源,从而确保用户能够追溯信息的可参考性,极大规避了AIGC平台的信任难题。并且其参考信息源也相对丰富,包含了新闻网站、知识问答平台、视频等。

但在目前阶段,类ChatGPT搜索与AIGC平台的界限还难以区分,用户对其认知还不明确。这种模式有待于进一步的市场普及与用户检验。

选手三:大模型落地垂类搜索

在搜索引擎格局相对稳定之后,曾经出现过这样一种产业思路:通用搜索机会不大之后,搜索引擎可以在垂直搜索领域发力,从而夯实对该领域有持续搜索需求的用户群。搜狗搜索、夸克,都曾经在垂直搜索领域发力。其中夸克凭借垂直搜索能力,在年轻用户群中获得了不错的成绩。

大模型+搜索的第三种思路,是将大模型率先落地在垂直搜索当中。以此强化具体搜索领域的自然语言理解能力与信息检索体验。在这个领域,目前的代表选手是夸克。11月14日,阿里巴巴智能信息事业群发布了夸克大模型。立足于自身的差异化定位,夸克大模型应用会优先落地在专业搜索等信息服务领域。而除了基础的大语言模型之外,夸克大模型还将衍生出医疗、教育等垂类模型,可见夸克对专用知识领域的重视程度。

目前来看,医疗、教育、人文社科,是大模型落地垂直搜索的几个主要方向。这几个方向都对信息源有着极强的要求,并且存在关键词模糊、有效信息较少、逻辑性较强等特点,相比于通用类搜索来说,更加适合大模型发挥出自己的特性。同时,优先将大模型与垂直搜索进行结合,也可以很好地降低产品成本,提升大模型的应用于搜索领域的整体效率。

事实上,还有一种垂类搜索与大模型结合的变体,就是各家网盘目前都在上线具备自然语言理解能力的搜索功能。可以通过模糊描述、形容词等关键信息来检索网盘资料,尤其是对图片、视频等内容进行搜索。

都是超级应用的跳板

那么问题来了,到底哪种模式才是大模型+搜索的正确解答呢?

不好意思,答案只能是虚席以待。

大模型+搜索,是一个在逻辑上非常具有前景的大模型落地场景。因此在ChatGPT刚刚开始爆火后,微软就将大模型能力打造为BingChat,并对谷歌搜索放出了诸多狠话。但时间过去了快一年,微软已经将很多AI能力剥离出了搜索业务,而谷歌的市场霸主地位也没有受到什么影响。可见这一场景从理论到实践,还有不断的路要走。

回望国内市场,会发现三种探索模式还各自为战,并没有产生太多交锋,在用户侧也没有掀起对大模型+搜索的普遍认知,甚至其落地程度远不如类ChatGPT的对话应用本身。究其原因,可以发现三点:

1.这三种大模型+搜索的尝试,都没有完成产品形态从0到1的突破。而生在此前的搜索引擎、AI对话产品上进行加强和补完,因此不具备非常引人关注的产品爆发点。

2.目前阶段,大模型对搜索体验的提升在大众用户端体验感不强。其更多只能作为学术、IT等领域的专业工具。

3.除此之外,大模型+搜索的商业化空间并不明晰。加入大模型技术之后,搜索产品的商业模式与商业化水平都没有发生较大的变化,因此受到资本市场的关注不足。

长远来看,大模型+搜索的最终目标,一定是形成大模型时代的超级应用。如同互联网时代搜索引擎的出现一样,彻底改变人们的信息获取与交互模式。

而如果以此为目标,今天的大模型+搜索探索必然还是棋子行进路上的跳板。也只有让棋子持续跳下去,未来某个节点才可能发生质变。

只要能让大模型和搜索互为动力,持续跳向前方,那么前景中的光明依然远大于黑暗。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。