首页 > 其他分享 >中国大模型落地进展如何?

中国大模型落地进展如何?

时间:2024-07-24 11:26:48浏览次数:12  
标签:场景 落地 进展 模型 领域 应用 生成

在ChatGPT爆发之后,国内外科技赛道都被掀起了巨大波澜,随后在国内这段时间里,大量的大模型争先恐后地出现。那么截止到现在,大模型在国内土壤落地得怎么样了?一起来看看本文的解读。

如下

距离ChatGPT爆发的那一天,已经过去8个月了。

8个月的时间,中国诸多大模型拔地而起,以飞快的速度,不断向各个行业场景渗透。但就目前为止,并未出现真正被大模型颠覆的场景或行业。

统计数据显示,在大模型落地应用中,45%的企业处于观望阶段、39%的企业处于探索可研阶段、16%的企业处于试点应用阶段,而全面应用的企业为零。

一个值得被看见的问题是:如今在中国的土壤里,大模型的落地进展究竟如何?

大模型落地,金融、能源先行

“请帮我查一下我今年8月份的用电量,以及哪天用电最多?”“帮我检测一下这张图片有什么缺陷”……在南方人工智能创新平台上,通过语言交互,一项项数据清晰的被展现在眼前。

在这个平台上,电力行业工作人员可以向电力大模型发布指令,让其自动生成数据处理结果,准确识别缺陷场景的图像细节,帮助工作人员检索处理电力巡检过程中的数据。

目前,在南方电网客户服务领域,60%的高频问题都可通过电力大模型解决,在识别客户情绪波动方面,电力大模型的效果甚至优于人工。

此外,在输配电领域,电力大模型已具备每分钟处理100张问题图片的能力,还能同时识别20类缺陷,识别效率是传统AI算法的10倍。

而在电力调度领域,电力大模型能够协助调度部门针对电网异常情况快速自动化生成处置预案,及时响应电力市场调节要求,使预案更加安全、高效,成本更低。

这是大模型在能源领域落地的一个缩影。

据了解,部分能源头部厂商已经开启了与科技公司在大模型应用方面的合作,尤其在电网与矿山领域,形成了一些初步试点示范,如电网调度、缺陷/故障查询、煤矿作业监测等场景。

除了能源领域,金融领域也是目前大模型最大落地场景之一。

一份来自爱分析的报告中,也将能源、银行列为了大模型落地进展最快的两大行业。

在金融领域的落地之广,从大模型的数量和企业动态也可见一斑。一组数据显示,截止8月,国内参数在10亿规模以上的大模型数量高达116个,其中金融行业大模型约18个。

此外,在半年报中,工商银行、农业银行、中国银行、交通银行、招商银行、中信银行、兴业银行、华夏银行、浙商银行等9家银行明确提出在探索大模型的应用。

在大模型厂商侧,一些密集的行业模型发布也反映出金融场景落地的火热程度。

例如5月下旬,度小满发布了千亿级中文大模型「轩辕」;6月份,腾讯云携手神州信息开展金融大模型的合作,中国农业银行推出类ChatGPT的大模型应用ChatABC,中国工商银行发布了基于昇腾AI的金融行业通用模型。

7-8月,随着《生成式人工智能服务管理暂行办法》正式实施,包括腾讯、百度、科大讯飞、华为、字节跳动等多家公司,又相继释放了最新的大模型进展;9月,蚂蚁集团也正式发布了金融大模型,并开源生成式AI编程平台CodeFuse。

金融领域,无疑是大模型落地的最多场景之一。

无论是能源领域还是金融领域,之所以能够实现大模型的领先落地,都源于这两个行业的一些共性。

首先 ,能源和银行业都是高度数据化的行业,具有较好的数据基础和数字化环境,这为大模型的训练和应用提供了有利条件。

其次,两大行业均有大量的数据处理和决策需求,而大模型的机器学习和深度学习技术可以帮助行业解决这些难题,提高决策效率和准确度。

再有,能源和银行业的业务模式相对比较成熟,具有较高的商业价值,因此这些行业对大模型技术的需求也比较大,从而推动了大模型的落地应用。

可见,能源和银行两大行业在大模型落地进展中相对较快,主要是由于其数据基础好、技术需求大、商业价值高等多方面因素的综合作用。

值得注意的是:即使在金融、能源这两个落地场景中,大模型仍有一些目前难以跨越的难题。

达不到预期的场景价值

在金融行业,营销、风控、运营三个方向是诸多银行关注较多的大模型应用方向。

其中,智能问答助手、智能客服、营销图片自动生成、贷后报告撰写是当下银行等金融机构积极布局的细分场景。但就目前而言,生成类场景如智能问答助手、智能客服、营销图片自动生成等场景价值与预期相差无几,但在如沉睡客户唤醒、数字营业厅这类决策、原生类应用场景,大模型落地的预期和实际效果仍有差距。

例如在智能客服场景,过去智能陪练题库少,缺少针对性。如今基于大模型生产个性化题库,可以缩短培训周期上;在营销图片自动生成场景,过去设计师在素材库中选取并设计,如今可以利用Midjourney自动生成,可以降低版权成本和人力成本。

而在沉睡客户唤醒和数字营业厅场景价值预期中,前者利用大模型自动生成策略,可实现端到端的策略改善唤醒效果;后者大模型支持的数字人帮助客户办理业务、推荐产品完成交易,可实现独立于APP之外的新渠道。

然而,就目前来看,这两个场景的实际应用价值都尚未可知。

能源行业的大模型落地应用亦相似之处。

在能源行业,设备运检知识助手、智能客服等生成类应用,场景价值与预期相差无几。但在如检修文档、设备故障维修、电力负荷预测等场景,场景实际价值仍未可知。

具体来看,在设备运检知识助手场景,过去是基于NLP技术构建结构化知识库,在大模型的加持下,可利用大模型构建运检助手,改善效率;在智能客服场景,过去是基于Bert模型的智能客服,如今利用大模型改善智能客服的用户体验,可实现意图理解更准确、语言更拟人化,用户体验得到改善。

检修文档生成、设备故障维修、电力负荷预测场景中,大模型落地可带来的价值分别是,快速自动生成文档实现效率提升;大模型快速定位故障原因,提供检修建议和方案;纳入更多影响因素实时预测负荷,提高预测准确率。

然而,就目前来看,这些场景中大模型带来的价值都尚未可知,仍需时间不断探索。可以发现无论是金融行业还是能源行业,生成类场景落地速度快,应用较多,决策类场景落地速度较慢且难度较大,应用较少。

“生成场景>决策场景”:难转化的生产力

就目前而言,大模型的落地仍处于试点应用阶段,并非全面上线。

正如上文所言,金融行业的智能问答、智能客服、数字营业厅、贷后报告生成、沉睡客户唤醒、金融产品推荐等AI大模型应用已经逐渐落地;能源行业的智能客服、设备运检知识助手、检修文档生成、电力系统仿真平台、电力负荷预测等已经试点应用。

然而,消费品零售、证劵、媒体还处于探索阶段,此外制造业、药企还处于观望阶段。

由此可见,大模型落地虽广度上较为乐观,但深度上却较为艰难。

大模型落地的深度取决于其能力、规模、计算资源、数据质量、领域知识等。然而,对于当下的国内大模型而言,处于发展初期,很多设施和能力还在逐步完善。

受限于模型能力、应用效果等因素,当前落地应用以生成场景为主。

与决策大模型不同,生成式大模型主要应用于文本生成、对话系统、语言翻译等领域,通过分析大量文本数据,学习文本的生成规律和内在语义关系,从而能够生成高质量的文本输出。生成式大模型的代表模型包括OpenAI的GPT系列和百度文心一言等。

而决策大模型主要应用于推荐系统、强化学习等领域,需要处理的数据通常包含连续的数值变量,而且需要做出决策或预测未来的行为。决策大模型的代表模型包括DeepMind的AlphaZero系列和OpenAI的Dota2 AI等。

相比决策大模型,生成式大模型首先在在文本生成和对话系统中,数据可以通过大量的文本语料库进行收集和整理,而在推荐系统和强化学习中,数据通常需要人工设计和构造,相对较为复杂。

其次文本生成和对话系统等领域的研究已经比较成熟,有许多现成的算法和框架可以使用,而推荐系统和强化学习等领域则需要更多的探索和研究。

再有文本生成和对话系统等领域的应用场景非常广泛,如搜索引擎、聊天机器人、自动写作等,而推荐系统和强化学习等领域则主要应用于电商、广告、游戏等领域。

一个事实是,虽然生成类场景应用较广,但预测类决策场景是未来高价值场景。无论是大模型供应商,还是企业,想要基于大模型能力实现业务价值的提升,后者才是发力的方向。

行业场景中,再看AI大模型

大模型落地首先需要选择合适的领域和场景。该领域场景有着较强的数字化能力和数字化基础。

例如,在智能客服领域,可以考虑将大模型应用于FAQ问答系统和聊天机器人等场景;在广告推荐领域,可以将其应用于电商平台的个性化推荐等场景;在舆情监测领域,可以将其应用于新闻媒体的内容分类和情感分析等场景。

其次要具备较高的模型能力、应用效果等。而从当前企业用户落地大模型的主要路径来看,集团企业重点是大模型能力建设,一般企业/部门重点是应用场景探索。大模型能力建设分成三个层面:基础设施建设、大模型训练和大模型应用,当前以基础设施建设和大模型训练为主,大模型应用较少。

值得注意的是,目前大模型应用方向主要分为两种,一是小模型为主,大模型提升小模型的开发效率;二是大模型与小模型级联,小模型连接应用,大模型增强小模型能力。

而这种落地路径使得模型能力受限。

想要推动大模型落地深度,大模型供应商、企业需要在能力、合作模式上不断探索。

一些深化大模型落地的路径逐渐清晰。

未来,随着大模型技术的不断发展和普及,模型级联的应用将会越来越广泛。

例如,可以将多个大模型进行组合和级联,实现更复杂、更精准的语音识别、图像识别、自然语言处理等应用场景。同时,也可以将大模型和小模型进行级联,充分发挥各自的优势,提高模型的性能和泛化能力。

基于此,扩展大模型落地的应用深度,加速各领域决策类场景应用落地。

其次,不同行业有着不同的特定需求,未来大模型需要朝着更加定制化的方向发展。通过对行业特定语料库的训练,大模型可以更好地适应不同行业的实际应用场景。

其次,为了更好地满足实际应用中的效率和资源需求,大模型需要朝着更加轻量级化的方向发展。通过模型压缩和剪枝等技术,可以在保证模型性能的同时,降低模型的大小和计算资源消耗。

此外,随着数据隐私保护问题的日益突出,大模型需要更加注重数据的安全性和隐私保护。

模型的定制化、轻量化、数据安全化成为其落地的重要因素。

中国AI大模型的落地应用在智能客服、广告推荐、舆情监测等领域取得了一系列的成果。然而,在落地过程中也面临着诸多困局。 未来,随着行业定制化、模型轻量级化和数据安全化等技术的发展,AI大模型的落地应用将迎来更加广阔的发展空间。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

标签:场景,落地,进展,模型,领域,应用,生成
From: https://blog.csdn.net/xiangxueerfei/article/details/140657820

相关文章

  • 开源大模型正在重塑企业AI应用,16个案例看看它们如何落地
    企业运作新引擎:开源大模型。各种性能优异的大模型横空出世,开源大型语言模型在企业界的应用也逐渐引起广泛关注。不过,这也使新的问题浮出水面,企业应该怎样有效地部署和应用这些模型来发挥它们最大的价值呢?图灵奖得主YannLeCun在X上向大家分享了一篇VentureBeat的......
  • 蛙跳扩散模型轨迹预测
    扩散模型轨迹预测文章目录扩散模型轨迹预测1.问题定义2.方法论2.1前向扩散2.2逆过程2.3蛙跳扩散模型的步骤2.4蛙跳初始化器2.5去噪模块3.实践3.1训练3.2推理阶段3.3源码3.4问题记录参考论文《LeapfrogDiffusionModelforStochasticTrajectoryPr......
  • 龙哥量化:股票调整结构模型:矩形调整形态(图解)
    如果您需要代写技术指标公式,请联系我。龙哥QQ:591438821龙哥微信:Long622889矩形是股价在两条水平的直线之间运动的形态。股价上升到某个水平价位时遇到阻力回落,回落到某一水平价位时受到支撑开始反弹,当反弹到上次同一价位附近时再次回落,回落到上次同一价位附近时再次反弹,如......
  • 抓住机遇,迈向高薪:大模型工程师职业指南_大模型工程师的职业规划
    从ChatGPT到新近的GPT-4,GPT模型的发展表明,AI正在向着“类⼈化”⽅向迅速发展。GPT-4具备深度阅读和识图能⼒,能够出⾊地通过专业考试并完成复杂指令,向⼈类引以为傲的“创造⼒”发起挑战。现有的就业结构即将发⽣重⼤变化,社会⽣产⼒的快速提升将催⽣新的⾏业和岗位机会。如......
  • 24年最新AI 大模型面试指南(含答案)大放送!
    前言AI大模型技术经过2023年的狂飙,2024年必将迎来应用的落地,对IT同学来讲,这里蕴含着大量的技术机会,越来越多的企业开始招聘AI大模型岗位,本文梳理了AI大模型开发技术的面试之道,从AI大模型基础面、AI大模型进阶面、LangChain开发框架面、向量数据库面等不同知识维......
  • 编程与大语言模型的冷知识,你知道几个?
    目录1.ASCII中的“Hello,World!”2.Python的缩进规则3.JavaScript的“undefined”与“null”4.C++中的“this”指针5.PHP的魔术方法6.Go语言的并发模型7.最早的编程“虫子”8.Hello,World!的起源9.goto语句争议10.Python的命名11.隐藏的彩蛋12.最古老的编程语......
  • pytorch模型迁移介绍
    迁移的基本流程 第一步:算子满足度分析方法一 在pytorchprofiler在GPU上提取算子方法二使用CANN分析迁移工具 第二步:配置相关硬件环境,在pytorch的基础上安装pytorchadapt;模型迁移-手工迁移(单Device代码迁移)导入NPU相关库(pyTORCH1.8)将device类型修改为npu将训......
  • 大语言模型对时间序列预测真的有用吗?
    我们已经看到了语言模型的巨大进步,但时间序列任务,如预测呢?今天我们推荐一篇论文,对现有的语言模型和时间序列做了深入的研究。将探讨了是否可以从大型语言模型(LLMs)中获益于时间序列(TS)预测。时间序列时间序列是机器学习中最具挑战性的工作领域之一,解决时间序列任务,如异常检测、时......
  • SQLAlchemy AttributeError:“表”对象在以前运行的模型中没有属性“id”
    我有一个烧瓶应用程序工厂应用程序,其中包含大量模型和视图。一切都工作正常,直到我将某些模块更改为backref以跟上时代的步伐。突然,应用程序无法工作,因为我在不同的模块中收到sqlalchemy属性错误,甚至在用户模块中,而这些模块根本没有被触及。(见下文。)back_populat......
  • 如何使用 Python API 获取每个模型的活跃用户列表、最后登录信息
    我想通过PythonAPI获取我的dbt项目的所有模型中的活动或非活动用户列表。这可能吗?我尝试列出模型,但无法获取用户信息,如用户名、项目、以及上次活动或上次登录。不幸的是,dbt本身并不跟踪你所寻找的用户活动数据(最后登录、活跃用户等)。dbt的主要功能是转换数据,而不......