关注我的朋友应该看到了,上个月我作为助教参加了公司新一期的AICA首席架构师培养计划,在三天的学习里我和来自不同的企业学员们做了很多交流,发现大模型要想在企业真正落地,还有很多坎儿需要迈,很多块硬骨头需要啃。
前排提示,文末有大模型AGI-CSDN独家资料包哦!
今天就想结合这段时间的观察,把我看到的落地困难以及或许可行的策略建议做一个梳理分享,如果你有共鸣,欢迎点赞评论转发,如果你认为哪里不正确,也欢迎评论与我交流你的想法。enjoy~
1.缺领导支持,大模型落是一把手工程,需要有创新精神且懂业务的领导亲自带队
在AICA学习陪跑时,我组学员来自的公司有几类,有全球五百强排TOP5的行业老大哥,也有中外合资的公司,还有服务全球头部企业的技术&方案兼备的垂类行业老兵。在和他们交流行业落地的问题时,伙伴们提到要么就是申请算力很难,领导不批;要么就是领导不给人支持,团队缺人手;要么就是领导觉得大模型能力有限,现在很难落地……
大家的问题都剑指企业的灵魂人物,就是一把手领头羊。在任何新的科技革命来临时,都会经历Hype Cycle,在技术萌芽期,很多事情都还是一个概念,需要经历突破和产品发布,之后才是热门关注期。大模型从我目前的认知里,还是一个技术萌芽期阶段,许多人是看不懂或者半信半疑的,如果大模型在企业内部的落地不是一把手工程,那么在大算力大数据高质量人才的必备条件下,就真的很难启动,也就更难到落地。一把手,需要有创新精神,勇于探索和拥抱新技术,同时他还精通业务,能看到从哪个业务视角切入最合适,具备这些条件,就比较好推进了。
2.缺数据,严格意义上讲是缺少能直接拿来就用的数据,同时也缺能处理数据的人
我们组的学员在评估企业落地课题项目时,仅有一家企业存在数据问题。但是从我这一年多大量走访来看,大多数公司还是缺少数据的,这个数据指的是拿来即可喂给大模型可以用且有价值的数据。即使有些公司有数据,但是在解决具体业务场景问题时,还是需要数据工程师,能够在预训练环节把大模型结构做收敛,或者在大模型监督微调时引入垂类数据,再或者在基于人类反馈的强化学习阶段来用人工精标的高质量数据做对齐,这样就可以帮助大模型更好理解人类从而生成人类可用的内容。
我曾和一个做健康医疗行业的CEO聊天时了解到,他们在做一个项目时,用了一个团队的数据PM花费四个月才完成数据的治理工作。还有一位投资人告诉我有一个创业者靠数据标注也发了家,而他们能够卷过同行的优势就是有几年的研发积累,开发出了一个自动化数据标注的工具。
许多企业在大模型应用业务场景时,会涉及到想通过指令控制模型的表达方式和输出格式,或者是强化已经存在的能力效果(强调模型已经具备的知识),或者是在模型具备完成子任务的前提下去完成更复杂的组合任务,这就需要数据工程师在大模型的SFT阶段来构建数据。
我自己本人也在和公司申请,想要尝试一下在大模型时代如何去标注数据,如何去做数据治理,如何去准备语料数据,我相信这一定不会是一个简单的工作,不然也不会存在数据的挑战。
3.缺具体的需求,公司的业务很复杂,大场景很难切入,业务越垂越小越好尝试用大模型落地
最后一点也是我在企业调研时发现的一个共性问题。那就是业务场景切入点。许多人都经历了这个过程“我去大模型太无敌了——模型好像不太行,好像也解决不了我的问题——把问题定义清楚了好像模型也还行”。这里面的关键就是在做产品功能定义时,一部分会把一个大命题交给模型去解决,往往发现根本无法解决问题,而当业务问题被拆解的更细,大场景变成小的业务问题时,就发现大模型能发挥出作用。
比如一个用大模型辅助专业合同审查的问题,基于目前大模型能力的限制,其实需要把任务进行拆解,并把理解和分析类的子任务抽取出来分别处理才可以解决业务问题。
虽然大家都寄希望于agent智能体是终局,但是但凡做过agent的人都知道,在一些业务场景下,agent很难同时解决多个任务,agent不是天兵神将,目前的技术还很难把复杂业务场景的问题靠一个agent都解决。所以说要想去把大模型落地,可以先选择稍微简单些的小场景业务,积累过程中的经验,伴随技术的发展再逐渐落地复杂的场景来提升效率。
结语
以上就是我观察到的一些问题和挑战,我相信这些问题随着时间沉淀都会逐渐解决,就像是我“PUA”一些客户/伙伴说的话,尽管目前存在各种各样的问题,但企业还是应该要大胆去尝试,去实践,就算早期要踩不少坑,可那也至少是敢在别人前面去经历问题,从而才能为超越对手积累下宝贵经验。如果一开始就落后,后面想要赶超就只能靠更多的资源来支撑了。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
标签:场景,落地,阻力,模型,业务,学习,数据,三大 From: https://blog.csdn.net/a2875254060/article/details/143954037