首页 > 其他分享 >大模型在企业落地的三大阻力

大模型在企业落地的三大阻力

时间:2024-11-21 20:19:19浏览次数:3  
标签:场景 落地 阻力 模型 业务 学习 数据 三大

关注我的朋友应该看到了,上个月我作为助教参加了公司新一期的AICA首席架构师培养计划,在三天的学习里我和来自不同的企业学员们做了很多交流,发现大模型要想在企业真正落地,还有很多坎儿需要迈,很多块硬骨头需要啃。

前排提示,文末有大模型AGI-CSDN独家资料包哦!

今天就想结合这段时间的观察,把我看到的落地困难以及或许可行的策略建议做一个梳理分享,如果你有共鸣,欢迎点赞评论转发,如果你认为哪里不正确,也欢迎评论与我交流你的想法。enjoy~

1.缺领导支持,大模型落是一把手工程,需要有创新精神且懂业务的领导亲自带队

在AICA学习陪跑时,我组学员来自的公司有几类,有全球五百强排TOP5的行业老大哥,也有中外合资的公司,还有服务全球头部企业的技术&方案兼备的垂类行业老兵。在和他们交流行业落地的问题时,伙伴们提到要么就是申请算力很难,领导不批;要么就是领导不给人支持,团队缺人手;要么就是领导觉得大模型能力有限,现在很难落地……

大家的问题都剑指企业的灵魂人物,就是一把手领头羊。在任何新的科技革命来临时,都会经历Hype Cycle,在技术萌芽期,很多事情都还是一个概念,需要经历突破和产品发布,之后才是热门关注期。大模型从我目前的认知里,还是一个技术萌芽期阶段,许多人是看不懂或者半信半疑的,如果大模型在企业内部的落地不是一把手工程,那么在大算力大数据高质量人才的必备条件下,就真的很难启动,也就更难到落地。一把手,需要有创新精神,勇于探索和拥抱新技术,同时他还精通业务,能看到从哪个业务视角切入最合适,具备这些条件,就比较好推进了。

2.缺数据,严格意义上讲是缺少能直接拿来就用的数据,同时也缺能处理数据的人

我们组的学员在评估企业落地课题项目时,仅有一家企业存在数据问题。但是从我这一年多大量走访来看,大多数公司还是缺少数据的,这个数据指的是拿来即可喂给大模型可以用且有价值的数据。即使有些公司有数据,但是在解决具体业务场景问题时,还是需要数据工程师,能够在预训练环节把大模型结构做收敛,或者在大模型监督微调时引入垂类数据,再或者在基于人类反馈的强化学习阶段来用人工精标的高质量数据做对齐,这样就可以帮助大模型更好理解人类从而生成人类可用的内容。

我曾和一个做健康医疗行业的CEO聊天时了解到,他们在做一个项目时,用了一个团队的数据PM花费四个月才完成数据的治理工作。还有一位投资人告诉我有一个创业者靠数据标注也发了家,而他们能够卷过同行的优势就是有几年的研发积累,开发出了一个自动化数据标注的工具。

许多企业在大模型应用业务场景时,会涉及到想通过指令控制模型的表达方式和输出格式,或者是强化已经存在的能力效果(强调模型已经具备的知识),或者是在模型具备完成子任务的前提下去完成更复杂的组合任务,这就需要数据工程师在大模型的SFT阶段来构建数据。

我自己本人也在和公司申请,想要尝试一下在大模型时代如何去标注数据,如何去做数据治理,如何去准备语料数据,我相信这一定不会是一个简单的工作,不然也不会存在数据的挑战。

3.缺具体的需求,公司的业务很复杂,大场景很难切入,业务越垂越小越好尝试用大模型落地

最后一点也是我在企业调研时发现的一个共性问题。那就是业务场景切入点。许多人都经历了这个过程“我去大模型太无敌了——模型好像不太行,好像也解决不了我的问题——把问题定义清楚了好像模型也还行”。这里面的关键就是在做产品功能定义时,一部分会把一个大命题交给模型去解决,往往发现根本无法解决问题,而当业务问题被拆解的更细,大场景变成小的业务问题时,就发现大模型能发挥出作用。

比如一个用大模型辅助专业合同审查的问题,基于目前大模型能力的限制,其实需要把任务进行拆解,并把理解和分析类的子任务抽取出来分别处理才可以解决业务问题。

虽然大家都寄希望于agent智能体是终局,但是但凡做过agent的人都知道,在一些业务场景下,agent很难同时解决多个任务,agent不是天兵神将,目前的技术还很难把复杂业务场景的问题靠一个agent都解决。所以说要想去把大模型落地,可以先选择稍微简单些的小场景业务,积累过程中的经验,伴随技术的发展再逐渐落地复杂的场景来提升效率。

结语

以上就是我观察到的一些问题和挑战,我相信这些问题随着时间沉淀都会逐渐解决,就像是我“PUA”一些客户/伙伴说的话,尽管目前存在各种各样的问题,但企业还是应该要大胆去尝试,去实践,就算早期要踩不少坑,可那也至少是敢在别人前面去经历问题,从而才能为超越对手积累下宝贵经验。如果一开始就落后,后面想要赶超就只能靠更多的资源来支撑了。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

标签:场景,落地,阻力,模型,业务,学习,数据,三大
From: https://blog.csdn.net/a2875254060/article/details/143954037

相关文章

  • 以数据为中心的大模型落地方法论与实践
    引言大模型落地到当前这个阶段,核心关注点还是领域大模型,而领域大模型落地的前提在于两点:需求端,对当前应用的降本增效以及新应用的探索;供给端,训练技术已经有较高的成熟度。前排提示,文末有大模型AGI-CSDN独家资料包哦!降本增效方面,以机器学习团队的构成为例,滴普科技Deepexi......
  • 中国大模型落地应用案例集(2023),119页pdf
    来源:中国信通院华东分院近日,中国信通院联合上海人工智能实验室成立的大模型测试验证与协同创新中心牵头,首次面向全国范围征集全行业优秀应用实践,并形成《2023大模型落地应用案例集》(以下简称“《案例集》”)。前排提示,文末有大模型AGI-CSDN独家资料包哦!作为首部聚焦落地应......
  • 详解线程的三大特性:原子性、可见性和有序性
    在多线程编程中,理解线程的原子性、可见性和有序性是构建正确并发程序的基础。以下是它们的详细解释:1.原子性(Atomicity)定义原子性指的是操作不可被中断,要么全部执行完成,要么完全不执行。特性原子性操作在执行时不会被其他线程干扰。如果多个线程同时访问共享资......
  • 大模型之争深水期,企业如何真正实现产业级落地?
    大模型之争,已经进入了深层阶段。前排提示,文末有大模型AGI-CSDN独家资料包哦!随着"百模大战"逐渐平息,整个模型市场步入了一个更为冷静的时期。但表面的宁静下,实则暗流涌动,竞争已经从单一的模型能力转向了更为复杂的生态系统建设。真正的较量在于谁能将模型的力量转化为实际......
  • 开源模型应用落地-LangChain实用小技巧-检索器-集成多种检索器(十八)
    一、前言   在LangChain中,检索器是一个重要模块,主要用于从数据源中检索与查询相关的文档或片段。它能高效进行信息检索,通过快速筛选和语义理解从大规模文本数据中找到相关内容,支持复杂应用场景如检索增强生成和多源数据整合,还具有可定制性和灵活性,可选择不同嵌入模型和索......
  • OpenCV三大经典项目实战:车辆检测、人脸识别、图像拼接与文字识别
    OpenCV三大经典项目实战:车辆检测、人脸识别、图像拼接与文字识别OpenCV(OpenSourceComputerVisionLibrary)作为计算机视觉领域的核心库之一,提供了丰富的功能和高效的算法,广泛应用于车辆检测、人脸识别、图像拼接和文字识别等多个领域。本文将详细介绍如何使用OpenCV进行这三大......
  • TensorFlow + CNN 实战 AI 图像处理:计算机视觉 + 落地应用
    TensorFlow+CNN实战AI图像处理:计算机视觉+落地应用一、引言随着人工智能技术的飞速发展,计算机视觉领域取得了令人瞩目的成就,在诸多行业中都展现出了巨大的应用潜力。而卷积神经网络(ConvolutionalNeuralNetwork,CNN)作为计算机视觉的核心技术之一,结合强大的深度学习框架T......
  • 昊星新品发布会以三大主张、四大新品开创实验室安全新纪元
    【2024年11月19日,上海】    珠海昊星自动化系统有限公司(以下简称“昊星”)在2024年慕尼黑上海分析生化展上成功举办新品发布会。本次发布会深入展示了昊星在“匠心、创新、智慧化”方面的融合实践,彰显了昊星在实验室气流控制领域的技术实力和产品优势。多位行业专家出席......
  • Agent 任务编排系统:从设计到落地
    为什么需要任务编排?想象一下这个场景:用户要求Agent完成一篇市场调研报告。这个任务需要:收集市场数据分析竞争对手生成图表撰写报告这就是一个典型的需要任务编排的场景。核心架构设计1.任务分解策略使用LLM进行智能任务分解:fromtypingimportList,Dictimport......
  • 数据库的三大范式
    数据库的三大范式是规范化数据库设计的基本原则,旨在减少数据冗余并确保数据一致性。以下是三大范式的核心内容:1.第一范式(1NF)定义:第一范式要求数据库表中的每个字段都是原子的,即每个字段只能包含一个值,不能有重复的列。要求:表中的每个列都是不可分割的原子数据。每个字段的......