首页 > 其他分享 >科技云报道:大模型“百团大战”,容联云的机会在哪里?

科技云报道:大模型“百团大战”,容联云的机会在哪里?

时间:2023-07-19 19:02:41浏览次数:33  
标签:智能 AI 客服 模型 容联云 百团大战 赤兔

科技云报道原创。

“大模型的迭代是一场‘暴力’填数据、拔规模而造就的‘美学盛宴’”,中金公司研究团队在“AI浪潮之巅”系列报告中如是说。

在大模型发展初期,大模型或许还称得上是“大厂的游戏”,但半年之后的今天,国内10亿参数规模以上的大模型已发布79个,大模型赛道迅速完成了从概念到落地的进程。

业内开始关注能够真正扎进行业、给企业带来生产力跃升的大模型产品。

而智能客服和营销领域,正是大模型改造落地的核心场景之一。

在近日举办的2023世界人工智能大会(WAIC 2023)上,容联云正式发布面向企业应用的垂直行业多层次大语言模型“赤兔大模型”,并发布了“生成式智能营销服一体化工作空间——机器猫”和“生成式一体化智能客服平台”,旨在推动企业营销和服务数智化转型。

科技云报道:大模型“百团大战”,容联云的机会在哪里?_垂直大模型

当大模型竞争的重点从通用大模型转向行业大模型,将为产业带来什么样的变化?

行业大模型 带来“沟通智能”

当下行业内达成的一个基本共识是,以ChatGPT为代表的大模型出现,标志着通用AI的起点和强AI的拐点,正在成为新时代数字化的“发电厂”。

利用大模型,以云服务的方式接入到干行百业,所有数字化系统和各个行业都值得重做一遍,更多人期望大模型能使企业数字化业务流程更快、更高效、更智能。

因此,作为大模型率先落地的智能客服和营销领域,正在迎来多方入局。

无论是互联网巨头、运营商,还是云、大数据、AI等技术公司,都纷纷发布大模型试图进军智能客服领域。然而聚焦到具体的行业应用,通用大模型却逐渐显出短板。

比如,内容的不可控性。在企业服务场景下,很多回答要求正确、严谨、合规,既希望大模型能够灵活的回答问题,又能够在专业内容上符合行业预期,但通用大模型开放式的生成内容,还不能实现行业化、场景化的适配。

随之而来的还有规模和落地的挑战。通用大模型的能力来源于规模大,但正是因为大,限制了企业应用中很多场景的落地,不仅对企业IT基础设施建设提出了更高的要求,同时也带来了更多的成本支出。

如何在通用与行业两个方向平衡,给企业客户带来实际的“降本增效”,成为了大模型厂商关注的问题。

很显然,大模型之路已经进入一个新阶段,即实打实地“扎”进行业,针对性地给出行业所独有的大模型解决方案。

发力行业模型,已成为各家共识。而在这一点上,在国内系统化公布行业大模型解决方案的容联云,率先为业界打了样。

在容联云AI研究院院长刘杰看来,过去的十年里,AI技术在赋能企业沟通智能上取得了一系列的成绩,但在复杂的沟通场景中仍会产生策略的缺位。

随着AI大模型的演进,展现出在语言能力、多任务处理和内容生成方面的高水平,使人们对AI能力的上限抱有更高的期望,沟通智能也迈向了从1.0到2.0的新时代。

但如何做出一个更精准、更能够满足企业多样化、灵活化的沟通场景的大模型,不仅仅是在AI基础能力上进行提升,还需围绕对话、沟通、交流,在会话洞察分析、对话能力提升、人机协同等方面都提供更好的能力,从而帮助企业重构智能客服和营销价值,完成从“降本增效”到“价值创造”的进化。

对此,刘杰表示,沟通智能2.0应具备“四大能力”:懂语言、有知识、会分析、能执行。

科技云报道:大模型“百团大战”,容联云的机会在哪里?_垂直大模型_02

首先,懂语言。满足沟通智能2.0的大模型,要能够在交流层面对对话进行多维度、细粒度的理解和分析,同时做更好内容上的生成和生产。

因此,容联云在赤兔大模型上非常关注会话洞察和业务话术生成两个层面。

会话洞察并不是特别新的概念,但有了赤兔大模型后,智能客服和营销场景在意见挖掘、情感分析、情绪分析、立场检测、主题检测等方面都具备了更好的能力。

借助这种洞察,企业可以在历史的会话当中更深刻、更动态化的理解用户,给用户生成动态化的画像,更好的动态匹配销售SOP,挖掘金牌话术以及做一些事后诊断。

在业务话术生成方面,赤兔大模型会在不同场景下对对话进行风格、内容的匹配,并保证业务话术的准确性、严谨性。

同时,还会通过赤兔大模型能力,以生成的方式分析文档,抽取标准化的问答,并自动生成知识库,从而降低人工的投入。

其次,有知识。虽然大模型通过大量语料的预训练已经嵌入了丰富的知识,但对于沟通智能2.0而言还不够。

模型还应当能够具备运用外部知识的能力,在模型内部的通用知识之外,还需要快速、灵活地运用外部信息进行复杂操作。

因此,容联云围绕文档向量库,用大模型检索非结构化的文档,回答专业的知识。

不仅搭建了一套流水线,还在文档的切片上以及问答的生成上,都做了垂直领域精准化、定制化模型具体场景的微调。这使得赤兔大模型在问题的回答上更加精准,在行业应用中已超越了大部分的大模型。

其次,容联云将大模型和结构化数据、数据库、知识图谱进行了更深度的融合,进一步提升了赤兔大模型对于业务数据的理解和分析。

尤其是将精准的行业知识图谱与大模型技术作为互补,使得大模型能够更好地构建行业知识。最终,通过赤兔大模型作为语言接口,企业能够快速地分析和获取结构化数据里的知识。

第三,会分析。在沟通过程中,沟通智能2.0的模型应该能够根据上下文和涉及的信息,对文本、图像、数值等数据进行合理分析和有效推理,并给出合理的决策。这对于智能营销和特定服务流程非常重要。

在大模型产生之前,容联云已有多年的技术探索,对结构化的分析和问答有着深刻的技术积累。

如今赤兔大模型基于这些场景进行深度的微调和预训练,从而得到了更好交互式的数值、数据的分析和理解能力。

比如,用户可以通过自然语言的交互生成一些数据分析代码,再通过这些代码的执行,得到可视化的分析,甚至是数据的自然语言查询;同时,还可以为这些数据提供文字性、专业性的解读和描述,从业务的角度给出更垂直化的展示和理解。

最后,能执行。沟通智能2.0不仅停留在理解和传递信息的层面,还具备像人类服务模式一样的执行能力。

在对话过程中,它能够根据客户需求连接外部系统,执行特定动作,以完成特定任务,满足客户的实际业务的办理需求。

基于赤兔大模型,容联云进一步重构了智能对话的技术框架。通过大模型的多轮对话管理,能够更灵活地完成对话应答,并根据交互内容完成业务的推荐、查询和办理等一系列操作。

与传统对话机器人不同的是,企业不再需要投入大量的时间和人力构建对话话术的流程图,赤兔大模型可以在历史数据中自动学习合理的话术流程。

同时基于大模型少样本的学习能力,赤兔大模型构建对话流程的能力,可以快速在不同的对话场景和业务中进行迁移。

企业只需通过一些指令,对任务的描述和信息的输入,就可以灵活的设置和修改对话流程的管理。

正如刘杰所说,赤兔大模型的应用带来了“单点能力升级、单点能力新增、流程逻辑革新”,这些能力将促成一个全面发展的沟通智能系统,为企业和用户提供更高水平的沟通和服务体验。

行业落地需要“务实”大模型

尽管大模型很火,但从入局到真正落地并推向市场,其间难度不小。

当厂商试图用大模型解决实际问题时,往往难以得到满意的答案。此次容联云基于赤兔大模型的产品发布,则真正在应用层面“秀出了肌肉”。

一是容联云“生成式智能营销服一体化工作空间——机器猫”,基于赤兔大模型重构了过去智能客服和营销里的各种服务功能,通过统一的平台/工作空间来设计新一代智能客服和营销产品,首批落地四大应用场景,包括客户联络、业务协作、AI辅助、智能洞察。

比如,在客户联络场景,借助大模型机器人,“机器猫”可以解决大部分服务场景,同时进一步降低机器人维护成本和客服数量,用户体验提升60%。

在业务协作方面,“机器猫”可以提供灵活集成、生成式策略推荐、智能填单、智能分配、智能标签提取等能力,进一步降低AI运营成本,降低客服服务时长和客诉数量,提升坐席效率。

在AI辅助方面,生成式智能应用赋能下的AI辅助,不再是CC的附加工具,而真正高效帮助企业解决管理难题,实现销售业绩提升。

在智能洞察方面,基于诸葛智能,“机器猫”平台可为用户提供各种分析模型、行业指标体系问询,也可以提供实践、经验分析,帮助企业快速成长为分析专家,对于数据报表与指标、用户标签与画像等分析结果,用户可以通过语音、文字等多种方式进行问答,并得到快速反馈,还可通过语音等驱动进行报表定制。

二是容联云“生成式一体化智能客服平台”,可以将知识生产效率提升70%,对话构建成本下降80%,100%提升客户服务效率,并为客服人员提供文档智能问答和抽取,用户语料、业务话术、流程类方案建议自动生成,销售优秀话术自动提炼等能力。

事实上,容联云充分考虑到业务场景中的营销和服务需求的多元化,在赤兔大模型底座上使用了APaaS平台,以提升功能模块的灵活性生成。

比如在以营销为主的场景里,企业可以通过拖拉拽的方式,迅速在营销场景中接入服务相关的功能模块;同样,在以服务为主的场景里,企业也可以快速引入营销的功能模块。这样企业就可以快速搭建自己的智能客服和数智化营销平台,拥有了一个能提供生成式智能应用的“万能口袋”。

在容联云COO熊谢刚看来,随着行业大模型应用精准性的提升,AIGC将完全替代40%传统客服的工作量,人工主导的客服工作量占比不超过30%,电话语音客服工作量占比不超过20%。

科技云报道:大模型“百团大战”,容联云的机会在哪里?_生成式_03

“对于呼叫中心这个发展了近60年的领域来说,大模型会带来一个很大的技术变革,很多东西会消亡掉,原有的产品都将被重构”,熊谢刚表示。

行业大模型的落地推进,除了更智能的表现,大模型的训练和运营成本、服务的边界等问题浮上水面,如何平衡多方面的要求进一步成为大模型落地行业的必考题。

目前,大模型在训练和使用过程中仍面临高昂的成本投入。对此刘杰表示,在实际的行业应用中,应提倡“务实”的大模型。在考虑模型规模时,不必执着于一个模型解决所有问题。

容联云的解法,是将模型划分为三个层次,并且让这三个层次互相形成闭环:首先有一个通用知识构造的模型底座,进而以它为基础,通过积累的领域数据做行业化、领域化的领域模型。

在领域模型的基础上进一步精进,具体到客户的业务当中,基于业务的逻辑和数据更精准的垂直化构建业务模型,指向业务明确的大模型应用。

这就好比人类在各种公司、各个组织中,会有专业领域的划分和层次的划分,所以模型也应该合理有效的进行大、中、小模型的层次划分,从而达到更好的配合,比较务实的完成行业服务和行业需求。

而在各行业普遍关心的数据安全合规方面,容联云则设定了服务的边界,通过合理的模型尺度,在企业客户内部私有化部署,内置相应的安全机制和规范等方式,以满足行业对于数据安全性的要求。

“要让行业客户通过大模型来认同你做的事情,除了前期的投入门槛,还有你做的大模型是不是足够完整全面,以及你的边界在哪里。

特别是服务这种注重体验的场景,或者一些交易类业务场景,大模型之下提供的服务精准性就变得很重要”,熊谢刚表示。

“行业认知”将拉开竞争差距

事实上,智能客服和营销领域作为一个百亿级的潜力市场,一直以来都是兵家必争之地。

但随着AI大模型的出现,为智能客服的升级提供了新的突破口,越来越多不同类型的厂商开始涌入这片热土,进一步加剧了赛道的竞争。

特别是一些通用大模型的开源,使得过去没有对话交互技术的厂商,也能够很快具备对话的通用能力,这给了容联云这类在智能客服领域深耕了十余年的厂商一场迎头痛击。

熊谢刚坦言,第一次接触ChatGPT以后,对智能客服这个领域的前景感到担忧。但随着容联云快速跟进大模型的研发,从通用基础模型进一步转向专注行业大模型,容联云内部的信心很快就回来了。

刘杰表示,大模型技术的确淘汰了过去的技术,这一刻所有厂商都站在了新的起点去赛跑,但各家在技术的理解、应用场景连接和对齐上仍存在差距。

在智能客服领域,企业客户要求的不仅仅是快速搭建应用,而是模型能力的行业垂直化,这就要求厂商要有技术积累和行业认知,才知道用什么样的数据,能够让模型具备什么样的能力,解决什么样的问题。

刘杰举例道,大模型体量的增大,对于数据样本的量和质都有了新的要求,如何收集高质量数据,如何用技术的手段去扩充数据,得到规模更大、质量更高的数据去训练大模型,对所有厂商的技术都是考验。

同时,大模型必须懂行业,在数据规模没有那么大的情况下,如何训练出行业需要的回答?比如有的行业回答要求精确度,有的要求合规,有的要求上下文保持答复的一致性,这就需要提供不同大模型的解决方案,对行业答复进行优化。

正因如此,刘杰认为,“在一般场景上,大家在通用能力上可能会拉平,初始差距并不大,但前行一段后,就会有相应差距出来”。

对于容联云而言,其AI团队早在ChatGPT出现之前就投入了AIGC关键技术的研发,在对话回复生成、问题自动生成、SQL语句生成方面都取得了突破,核心技术在权威竞赛和评测榜单中取得多个第一和Top名次。

在技术层面,容联云很快就适应了大模型的技术变革,并将过往的AI算法研发经验应用到大模型技术调优中。

而专注行业大模型,尤其是聚焦在金融行业,使得容联云能够充分发挥自身在金融行业的认知优势。

结合行业认知和知识积累,容联云进一步将大模型领域化、垂直化,这将极大拉开与同行的竞争差距。

不仅如此,熊谢刚还认为,基于大模型做好业务应用的创新,也将成为容联云未来的竞争力。

“回想iPhone作为划时代的产品,并不是淘汰、消灭了传统手机,而是它真正带来了移动互联网层出不穷的应用。

所以今天做大模型不是看改变了过去什么东西,而是用大模型能够创造什么新的应用,包括在细分的客服和营销场景,有什么新的应用出来”。

熊谢刚表示,“我们不怕大模型会对智能客服整个赛道做任何的改变,只要抓住了应用创新这个点,就可以拥抱这个改变”。

这种对于未来竞争的信心,也充分体现在容联云对大模型的命名中。赤兔作为“日行千里,夜走八百”的战马,一方面担负着信息加急传递的任务,另一方面更是实力强劲、能打胜仗的好马。

赤兔的寓意,代表着容联云对于大模型的定位和期望,希望能够在垂直领域上赋能沟通智能2.0,为整个行业的服务提供助力和支持,并在这场大模型的“百团大战”中冲出重围。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。


标签:智能,AI,客服,模型,容联云,百团大战,赤兔
From: https://blog.51cto.com/u_16125291/6779153

相关文章

  • AR模型定阶Python
    实现AR模型定阶Python1.概述在时间序列分析中,AR模型(自回归模型)是一种常用的预测方法。它基于过去一段时间内的数据,利用线性回归的方法来预测未来的值。AR模型的核心思想是当前时间点的值与过去若干时间点的值相关。在本文中,我们将介绍如何实现AR模型定阶的过程。AR模型定阶是指......
  • 通过任意脚本调用django的模型类
    通过任意脚本调用django的模型类需求:我想通过任意脚本,调用django的模型类,查询一下数据库的信息,或者新增数据库数据,而不需要通过启动django项目或者使用pythonmanage.pyshell这种方式来运行解决办法脚本中添加django项目的路径到sys.path环境变量中设置django项目的环境变量......
  • 大语言模型一览
      Model作者Size类型开源?LLaMaMetaAI7B-65BDecoderopenOPTMetaAI125M-175BDecoderopenT5Google220M-11BEncoder-DecoderopenmT5Google235M-13BEncoder-DecoderopenUL2Google20BEncoder-DecoderopenPaLMGoogle540BDecodernoL......
  • 大语言模型的预训练4:指示学习Instruction Learning详解以及和Prompt Learning,In-cont
    大语言模型的预训练[4]:指示学习InstructionLearning:Entailment-oriented、PLMoriented、human-oriented详解以及和PromptLearning,In-contentLearning区别1.指示学习的定义InstructionLearning让模型对题目/描述式的指令进行学习。针对每个任务,单独生成指示,通过在若干个......
  • 大语言模型的预训练[5]:语境学习、上下文学习In-Context Learning:精调LLM、Prompt设计
    大语言模型的预训练[5]:语境学习、上下文学习In-ContextLearning:精调LLM、Prompt设计和打分函数(ScoringFunction)设计以及ICL底层机制等原理详解1.In-ContextLearning背景与定义背景大规模预训练语言模型(LLM)如GPT-3是在大规模的互联网文本数据上训练,以给定的前缀来预测生......
  • 大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型
    大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解1.GPT模型1.1GPT模型简介在自然语言处理问题中,可从互联网上下载大量无标注数据,而针对具体问题的有标注数据却非常少,GPT是一种半监督学习方法,它致力于用大量......
  • 大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Mu
    大语言模型的预训练[3]之PromptLearning:PromptEngineering、Answerengineering、Multi-promptlearning、Trainingstrategy详解1.PromptLearning1.1PromptLearning的出现背景目前学术界一般将NLP任务的发展分为四个阶段,即NLP四范式::第一范式:传统机器学习模型的范......
  • 大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Mu
    大语言模型的预训练[3]之PromptLearning:PromptEngineering、Answerengineering、Multi-promptlearning、Trainingstrategy详解1.PromptLearning1.1PromptLearning的出现背景目前学术界一般将NLP任务的发展分为四个阶段,即NLP四范式::第一范式:传统机器学习模型的范......
  • 基于gitflow的通用分支管理模型
     TRANSLATEwithxEnglishArabicHebrewPolishBulgarianHindiPortugueseCatalanHmongDawRomanianChineseSimplifiedHungarianRussianChineseTraditionalIndonesianSlovakCzechItalianSlovenianDanishJapaneseSpanishDut......
  • 大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型
    大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解1.GPT模型1.1GPT模型简介在自然语言处理问题中,可从互联网上下载大量无标注数据,而针对具体问题的有标注数据却非常少,GPT是一种半监督学习方法,它致力于用大......