文丨智能相对论
作者丨沈浪
“我想让人们知道,是我们(微软)让他们(谷歌)‘跳舞’。”
当加入ChatGPT功能的新一代Bing上线,微软CEO纳德拉就已经按耐不住向谷歌发起了挑战。他认为加入新一代人工智能对搜索是一次重新思考的变革,从现在开始,包括核心排名在内的几乎所有东西都可以重新想象。
微软CEO纳德拉与OpenAI创始人奥特曼
在AI大模型的加持下,搜索的游戏规则正面临颠覆性的改变,对应的市场的格局也要重塑。很显然,如果AI大模型能“上岸”,那么这第一剑大概率就先斩向传统的搜索巨头。
在AI大模型的推动下,微软和谷歌之间的战争已经打响,而国内的反应也同样激烈。
前不久,昆仑万维推出国内第一款融入大模型的搜索引擎——天工AI搜索,并宣称“传统搜索已到了奇点时刻,陈旧的体验需要被颠覆、被改变”。换句话来说,国内的传统搜索引擎同样面临着新技术的挑战,也迎来了第一位真正意义上的大模型+搜索产品。
天工AI搜索首页截图
事实上,在天工AI搜索之外,国内大多数大模型产品只是没有明确挑战传统搜索引擎,但实际上在做的事情基本都离不开对用户搜索模式的重塑。
「智能相对论」试用了目前市面上的大多数大模型产品,包括通义千问、讯飞星火、Baichuan-53B,还有文心一言等等。从体验来看,比起生成式AI,这些大模型产品更成熟的体验在于对用户获取信息模式的优化和升级,也就是搜索引擎一直在做的事情。
然而,以天工AI搜索为代表,融入大模型技术的AI+搜索引擎想要突围,取代传统的搜索引擎并没有那么容易,一方面且不说做大模型产品的厂商就不少,“百模大战”还在持续,另一方面融入大模型的搜索引擎能否力敌传统搜索引擎,还有待验证。天工AI搜索的征程才刚刚开始。
01、搜索增强
搜索增强,正在成为各家大模型厂商首要强化的目标,百度在做,百川智能也在做。
百度副总裁、搜索平台负责人肖阳认为,“ChatGPT要解决的问题很多就是搜索要解决的问题,它们的目标是一致的。”——什么目标?从目前趋势来看,应是搜索增强。
百川智能认为,搜索增强是解决模型时效性和幻觉的有效手段,将搜索技术与大语言模型能力结合实现了创新的模型优化,也提升了 AI 回答的可用性。
对此,百川大模型融合了多个模块,包括指令意图理解、智能搜索和结果增强等组件。该体系通过深入理解用户指令,精确驱动查询词的搜索,并结合大语言模型技术来优化模型结果生成的可靠性。
本应用在搜索引擎升级上的技术,比如动态超参数调整技术、智能化搜索词生成、高质量搜索结果筛选、RLHF 搜索结果增强等等,如今用在了大模型预训练上,由此结合大模型的产品表现,打造出了一个超越传统搜索引擎的AI搜索应用。
在「智能相对论」体验文心一言、天工AI搜索等大模型产品的过程中,发现其背后的搜索流程和结果输出基本都得到了不同程度的强化,带来不少令人惊艳的搜索体验。
比如,向文心一言提问“我10月份想去长沙旅游”,结果反馈给出了长沙的知名景点推荐。而在天工AI搜索上,除了景点推荐外,甚至还会给出10月份长沙的天气情况介绍、美食推荐等其他更详细的信息。
从这一结果来说,相比传统搜索引擎,大模型技术加持的智能搜索在两大方面实现了升级,一是对用户需求的理解,不再是关键词匹配,更多是一种对话式的交互和理解,觉得说得不够详细的,还可以进一步的追问,目前文心一言、天工AI搜索等大模型产品都支持。
二是对结果反馈的优化,省去用户查找和筛选信息的一大段过程,在大多数情况下AI都能给出相对客观且准确的答案。同时,文心一言、天工AI搜索等也都会标注相关信息的来源,便于用户二次确认信息的权威性与准确度。
尽管也会出现一些答非所问或是东拼西凑的回答,但是就现阶段的体验来说,搜索强化下的大模型产品相对传统搜索引擎,是有着实际性的进步的。
02、传统的桎梏
进步是有,不足也存在。
随着体验越深度,问的问题越多,越会发现当前的大模型产品在搜索上同样存在着诸多传统搜索引擎遇到的问题,比如信息的来源、知识的准确性等等。
在目前的搜索体验上,天工AI搜索会同步给出知识、信息的参考标注,以便用户进一步确认知识、信息的准确度和权威性。但,「智能相对论」也发现,给出的参考来源大多是知乎、搜狐、新浪财经的,同时根据问题的类别也会出现其他的来源,比如旅游相关会有马蜂窝、携程、本地宝的参考标注。
这些网站上的信息有问题吗?就体验来说似乎并没有问题,哪怕我们用传统搜索引擎,搜出来的结果也大抵如此。
但是,呈现在一个新的产品上,就有较大的问题了。如果新的AI搜索所带给用户的信息、知识还和传统搜索引擎呈现出来的结果差不多,都是些未经验证的、网友口口相传的泛泛之谈,那么搜索的结果还是没有得到改善,只是过程变了、形态变了。
百度搜索之所以能长期占据中文互联网搜索Top1,有着一个非常关键的产品在支撑着——百度百科,这个产品的上线很大程度上提高了百度搜索的权威性、准确度。
对于天工AI搜索以及其他大模型产品而言,实际上要建立的同样也是这种权威性、准确度。作为用户获取信息、知识的重要渠道,任何一个产品都需要让用户觉得自己的知识、信息是对的、准确的、权威的。
当前,市场上的大模型产品要么只给用户一个答案,要么像天工AI搜索那样给出一大堆第三方的来源标注。然而,这两种模式似乎都不能巩固用户对搜索结果的权威感、信任度。或许,在接下来的产品优化上,大模型产品还需要继续做用户教育,向用户证明自家AI给出的答案、知识、信息等是权威的,是科学的。
回过头来看,正对应肖阳的观点,ChatGPT和传统搜索引擎的目标是一致的。
03、新的可能
如果用搜索的视角来看大模型产品,很容易就能看到当前缺什么。那么反过来,如果用大模型的视角来做搜索,或许也会有新的发现——大模型+搜索,应该呈现给用户什么样的体验?
答案绝不会是传统的搜索引擎。
目前,通用人工智能的一大演进方向是多模态,而在大模型产品上,多模态就重塑了搜索的价值。日前,阿里云推出大规模视觉语言模型Qwen-VL,以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。
基于Qwen-VL,用户的搜索体验得到了升级。比如,一位不懂中文的外国游客到医院看病,不知怎么去往对应科室,他拍下楼层导览图问Qwen-VL“骨科在哪层”“耳鼻喉科去哪层”,Qwen-VL会根据图片信息给出文字回复。
这是用户获取准确信息的一个重要方式,也是搜索,但很显然,这不同于传统的搜索引擎。
如同天工AI搜索想实现的跨代际搜索体验,Qwen-VL正在呈现出新的搜索跨越。
可以想象,在未来的时间内,搜索不再是单一的,而是多模态的、多场景的,比如用户可以在旅游的过程中随手拍下一处景点,大模型产品就能给予相关的游玩建议、购票服务等,又或者是用户在旅游的某个瞬间听到一首民谣,录下来也能在大模型产品上搜到相应的歌曲等等。
基于这一趋势,大模型+搜索所带来的新体验将是颠覆的。那个时候,或许搜索的奇点才算是正式到来了。
传统的搜索引擎将黯然失色,而用户将在大模型产品的智能搜索下无时无刻不在获取新的信息、服务和体验。
*本文图片均来源于网络