文 | 卖萌酱
"这不是无脑吹,也不是鸡汤。她让中国AI落地变得切实有解了。"
AI泡沫破了吗?AI能落地了吗?AI不是PPT问题吗?AI终究只是梦一场?
面对行外的人,每当卖萌酱说起自己是做AI的,都经常收到以上“灵魂拷问”。做AI的这几年里,卖萌酱也常常为AI技术的落地感到迷茫,有时甚至觉得无解。
AI最应该落到哪里去?
是互联网老牌业务搜推广吗?还是激进的新型业务比如自动驾驶?还是...传统行业?
诚然,AI在互联网老牌业务上率先取得突破,提升了一众互联网企业的流量分发效率和商业营收;在自动驾驶这种新型业务上也取得了一些不错的里程碑,但这些成果相比人们最初对AI的期待,似乎少了些什么。
都说AI是解放社会生产力,提升行业生产效率的利器,国家近几年也在大力号召“智能制造”,要实现“产业升级”等。而社会运转是一台极其复杂的机器,这种宏大的目标,一定是建立在千行百业革新的基础上才可能实现的,仅靠互联网传统业务和充满不确定的新型业务,是一定无法充分释放AI技术的潜力。
要颠覆,就要像20年前为千行百业引入计算机一样引入AI技术,实现巨大的社会生产力提升,这才是AI技术真正的使命和价值。
为什么为传统行业引入AI技术会这么难?
都说AI落地太难,有人说是模型效果还是没那么好,有人说是模型部署起来难度高,成本大,利润薄的传统行业玩不转也用不起。
其实这些都只是部分原因,而且都不是不可解的问题。
回想一下,20年前的传统行业,大家普遍通过纸、笔和计算器完成各行各业的数字统计和数值计算,效率极低、容易出错还不容易数据共享。计算机作为当时的高科技产品,单单是会熟练打字(五笔输入法、智能ABC了解一下)、用word排版、用excel制作表格完成数据汇总和计算,在传统行业里面就是大家眼里的“计算机大佬”了。要是还会重装系统、搭建网站,那就是走起路来都带风的人物。
直到后面出现了若干“智能输入法”,且windows系统、office等各类平台软件都变得更加简单易用后,让传统行业接受计算机才不是那么困难的事情了。
今天的AI,很像20年前的计算机。IT行内人知道它可以大幅提升生产效率,玩好了就是神器,但行外人眼里,这就是个复杂无比的高科技产品,非“我等凡夫俗子”能驾驭的住的东西。
所以卖萌酱认为,若要在传统行业现象级的引入AI技术,关键点有二:
第一, 破圈。对传统行业进行观念+案例疏导,让传统行业相信这是一场值得尝试的变革,告诉大家“这螃蟹虽然长得丑,但是可以吃,而且很好吃。”
第二, 有谱。提供面向传统行业小白的系统级解决方案+持续的易用性提升方案
先来谈谈破圈。
要破圈,让传统行业像互联网行业一样相信AI,关键的一步是在各个行业打造出成功案例。但这有点“鸡生蛋,蛋生鸡”了,如果每个客户都在蹲这么一个成功范例,那肯定最终全行业都一直蹲着了。所以要打破僵局,就需要有一个在中国公认的AI技术领头人下场号召传统行业吃第一批螃蟹,打造出一批各行各业的成功范例库。有了范例库,便会有更多的人愿意尝试吃螃蟹,进而出现滚雪球效应。这便是破圈的一个关键点。
但因此诞生了一个问题:
谁来做?范例库做成了吗?
再来聊聊有谱。
要解决本章开头提到的两个局部问题点,其实都不算难,甚至国内任何一家互联网大厂多投入点AI人才,在具体的场景下可能都能搞定。但落地困难的地方在于把这两个问题解决了,把AI框架、模型等丢给传统行业,对方依然会一脸懵逼。这就是因为对传统行业来说,需要的是一整套能让小白上手打怪的解决方案,而不是零散的工具。
下面来做一个直观的对比。
在互联网行业,用AI技术创造业务价值有哪些要素?
- 硬件:有支持模型训练的硬件设备和支持部署的硬件设备
- 传统行业无
数字化:数字化系统,实现自动化的数据采集与处理
- 传统行业经常无
数据:有标注数据和标注人力
- 传统行业无
部署:有成熟的模型部署方案
- 传统行业无
迭代:有专业的算法工程师做持续的模型优化和系统维护
- 传统行业无
而传统行业AI落地,就是要把以上要素系统级的消灭掉,让传统行业小白也能轻松无负担的把AI创造价值的全流程打通。
这真的太考验一个企业的AI顶层设计能力和底层细节优化了。
要同时实现“破圈”和“有谱”的问题,着实是一件难度极高的事情。
她要扛起大旗
直到卖萌酱参加了上周五的Wave Summit 2022深度学习开发者峰会,才发现原来AI在传统行业的落地可能真的有解了!
打开大模型在传统行业的想象力
在前文提到的五点AI技术创造业务价值的要素中,数据问题与模型问题无疑是阻碍AI在传统行业落地的重要因素,但本届wave summit之后,现在似乎出现了一种可行的解法——面向行业的AI大模型。
为什么这里要突出“面向行业”呢?
以NLP为例,无论是BERT、RoBERTa还是GPT-3,归根结底都属于学术意义上的“通用”大模型,它们都致力于理解人类语言,但不一定具备很好的行业知识,懂得“行业语言”。导致学术层面的通用AI大模型直接应用于传统行业时表现往往没有想象中的惊艳。
而百度在本次峰会上一口气发布了10个AI大模型,不仅包含通用大模型,还包括任务大模型和业内首次发行的行业大模型,甚至为大模型配套了专业的工具平台使得基于大模型的AI应用开发门槛得到进一步降低。
这里重点说说行业大模型。
在互联网上采集到的数据往往与传统行业相去甚远。例如车间中的某种零件质检时的缺陷件图片,几乎无法在互联网中获取到;在法律文书、病历等传统行业文案中也常常存在大量在互联网上很少见到的“专业术语”。
因此,这里的行业大模型的核心特色便是做了 “行业知识增强”,先基于通用的文心大模型挖掘各行各业的知识,而后结合实际行业的数据、知识以及百度文心技术团队设计的特有训练算法来进行大规模无监督联合训练。
如此打造的大模型便可具备强大的零样本学习能力和效果提升可观的少样本学习能力,在模型效果和数据依赖方面可谓一举两得。
百度集团副总裁吴甜介绍,在能源电力和金融领域,百度文心联合国家电网研发了知识增强的电力行业NLP大模型国网-百度·文心,联合浦发银行研发了知识增强的金融行业NLP大模型浦发-百度·文心,目前已在电力、金融相关任务上取得显著的效果提升。
除了行业大模型外,此次还发布文心基础大模型和任务大模型共八个,包括:
- 融合任务相关知识的千亿大模型ERNIE 3.0 Zeus
- 多任务视觉表征学习VIMER-UFO 2.0
- 商品图文搜索表征学习VIMER-UMS
- 文档图像表征学习VIMER-StrucTexT 2.0
- 语音-语言跨模态大模型ERNIE-SAT
- 地理-语言跨模态大模型ERNIE-GeoL
- 面向生物计算领域的化合物表征学习HELIX-GEM
- 蛋白质结构分析HELIX-Fold。
本次全新发布的融合任务相关知识的千亿大模型ERNIE 3.0 Zeus,在学习海量数据和知识的基础上,进一步学习了百余种不同形式的任务知识,增强了模型的效果。
另一方面,ERNIE 3.0 Zeus通过融合层次化提示的预训练,更好地建模不同任务的共性与特性,再通过将不同的任务组织成统一的自然语言形式,统一建模增强模型的泛化能力。
相对其他模型,ERNIE 3.0 Zeus在各类NLP任务上表现出了更强的零样本和小样本学习能力。
与GPT-3这类基于语言模型训练目标的千亿大模型不同的是,ERNIE 3.0 Zeus在训练过程中融合了100多个层次化的Prompt和相应的训练任务,大类任务涵盖了问答、信息抽取、文本分类、情感分析、语义匹配、摘要、对话、创作、文本纠错等,使得大模型的优化目标更加逼近应用时的下游任务,因此ERNIE 3.0 Zeus相比学术界流行的BERT、RoBERTa等开源模型具备显著更优的下游任务零样本和小样本学习能力。这不仅提升了模型的下游任务表现,而且大大缓解了模型对下游任务样本量的依赖,直击传统行业的落地痛点。
值得注意的是,本次发布会还打造了一个基于文心大模型的创意社区——旸谷大模型创意与探索社区,可以提供最新大模型的API试用,零距离感受大模型在千行百业落地的潜力。
可以预期的是,大模型作为人工智能的“新一代基础设施”,让AI在传统行业的落地变得愈加容易完成场景扩展、愈加有效提升应用效果并减少落地成本,是推动产业智能化升级的重要组件。
基于飞桨大航海计划2.0的三大共创计划
在本次峰会上,百度飞桨还基于飞桨大航海计划2.0,发布三大共创计划,包含飞桨产业实践范例库共创计划、飞桨AI for Science共创计划和飞桨硬件生态共创计划。其中AI for Science计划可以推动基础科学领域的科研创新与产业赋能,而硬件生态共创计划和产业实践范例库共创计划则与AI的传统行业落地密切相关。
在前文中提过,范例库是实现AI技术破圈必不可少的关键成分,一方面可以引导传统行业自发的拥抱AI,另一方面可以为AI在传统行业的落地提供切实的指导。
卖萌酱留意到,本次发布会提及的产业实践范例库中的产业范例已经多达 47 个,每个范例都覆盖了任务解析、算法选择、模型训练及优化、推理部署及结果可视化等产业落地全流程,有完整的代码实现。
这份范例库无疑将成为AI技术破圈的强有力技术支撑。
而围绕硬件发起的硬件生态共创计划则致力于解决部署难题——传统行业的硬件环境复杂多变。
截至2021年底,已经有20个硬件厂家、30种+的芯片适配了飞桨,而本次发布会上,飞桨与硬件伙伴联合推出了厂商版本飞桨框架,让飞桨的硬件适配变得更加简单、高效、标准化,让产业落地不再受困于“硬件未适配”。
一份让落地变得有谱的导航图与工具链
如前文所述,缺乏系统级解决方案是传统行业开发者面对AI时无处下手的关键因素,即使给予了先进的模型、海量的数据和强大的AI框架,传统行业开发者也往往缺乏清晰的思路来解决具体业务场景中的问题。
对此,飞桨发布了一份源于产业实践经验的“训推一体导航图”。
导航图就像一棵树根发达、树叶丰茂的大树。这棵树从树根到顶部分别描绘了各个任务场景的训练、推理、部署的路径。比如,树干的部分是各种各样的模型以及支持的训练模式,树冠的部分是该模型支持在怎样的硬件上做部署。可以说,找到业务环境与业务目标对应的树叶和树根,就可以找到一条路径来完成全流程的训练推理和部署。
与训推一体导航图配套的还有训推一体工具链。不但可以方便的基于飞桨生态完成模型的高性能训练、模型压缩、部署乃至前端展示全流程,而且支持将其他框架下研发的模型通过X2Paddle
工具完成到该工具链的接入,实现了对不同来源模型做统一的软硬件环境兼容。
而在飞桨最新发布的v2.3版本中,更是实现了自动调优的更性能训练、自动压缩与高性能推理部署,让落地的全流程都得到了极大的简化,降低了开发者的学习和使用门槛。而得益于训推的自动化,飞桨充分发挥了软硬一体化的优势,实现了在训练的关键环节感知硬件特性自动调优,开发者无需了解硬件特性,即可获得与专家级手工优化水平相当的性能;在推理部署的关键环节,可以感知硬件延时,自动选择最优压缩方案,压缩精度与手工方法相当,代码量减少 50% 以上。
可以说,无论是行业大模型、行业范例库、导航图、工具链还是框架v2.3的新特征,都从不同的维度上有力的缓解了AI在传统行业落地的痛点。而点连成线,就是AI迸发真正社会价值的时刻。
她叫百度飞桨,她要扛起中国AI落地的大旗。
标签:大旗,扛起,落地,AI,模型,飞桨,行业,传统 From: https://blog.51cto.com/xixiaoyao/6846917