首页 > 其他分享 >构建AI应用的几种范式思考

构建AI应用的几种范式思考

时间:2023-05-30 22:12:31浏览次数:36  
标签:范式 embedding AI 模型 Prompt 构建 LLM prompt

一、基础LLM模型的局限与对应的研发范式

单纯的LLM多轮交互更多面向C端消费场景,而B端应用场景需要LLM进行更多的被集成工作

更抽象、更本质地看,LLM充当的是物理世界人类语言—>信息世界比特信息的翻译者的角色,它带来的是一种新的人机交互方式的改变。

基于这种范式改变,传统的所有B端应用都有希望被重新定义和重构一遍。 

只有思考的”大脑“,而缺少行动的”手脚“,无法在LLM模型之外的真实世界开展行动

不论是

  • 搜索网页
  • 调用外部第三方 API
  • 查找数据库
  • 执行代码数理计算逻辑
  • 执行操作系统指令
  • ....

这些能力都无法被基础的LLM模型提供。

关于“手臂”的探索也有很多,

  • OpenAI 的 WebGPT 给模型注入了使用网页信息的能力
  • Adept 训练的 ACT-1 则能自己去网站和使用 Excel、Salesforce 等软件
  • PaLM 的 SayCan 和 PaLM-E 尝试让 LLM 和机器人结合
  • Meta 的 Toolformer 探索让 LLM 自行调用 API
  • 普林斯顿的 Shunyu Yao 做出的 ReAct 工作通过结合思维链 prompting 和这种“手臂”的理念让 LLM 能够搜索和使用维基百科的信息
  • ChatGPT 可以运行Python编译器处理上传或下载的代码、文件。ChatGPT支持用户将文件上传至会话工作区、可以执行Python编译器运行代码,并在会话中持续存在供后续调用。该功能能够协助程序员提升工作流程效率,在用户实际使用中能够解决定量和定性的数学问题,进行数据分析和可视化,转换文件格式。
  • ……

有很多迹象表明,xxxGPT Plugins有望成为AI时代的核心入口,从大模型技术赋能者转向平台经济重要生态入口卡位,

  • 一方面可以接入应用、赋能应用
  • 一方面可以调用应用、操作应用,以大模型兼具“操作系统”角色,加速海外生态中与其他应用层的精细化分工。 

LLM的参数空间维度十分巨大,生成内容的质量(helpful、honest、harmless)强依赖输入的质量

大语言模型在预训练阶段就已习得大部分知识,如果想要LLM产生针对特定任务的高质量内容,有三种技术方向:

  • instruction-align对齐,使模型对特定任务的输入具备更好地向量化编码与特征提取能力,这对prompt-tune语料的质量有一定要求。
  • few-shot prompt,通过prompt注入更多的上下文知识,从而构造出更高质量的输入向量,但是这往往受限于 token 数量。
  • embedding search,通过对输入进行embedding search,从而获得contextful prompt,降低了prompt engineering的难度和门槛。

不管是instruction-aling对齐、few-shot prompt,还是embedding search,都需要为模型注入 Context 并进行一定的 Prompt Engineering。正确的 Prompt 可以激发出 LLM 的能力,这在 GPT-3.5 以前的时代更为重要。

将 Context 注入 LLM 实际上在 Prompt Engineering 的上游,把知识告诉 LLM,Prompt 只是中间桥梁。前 Stitch Fix 的 ML 总监 John McDonnell 画的这幅图很好地展示出了二者的关系: 

LLM模型的参数在训练阶段结束后就完全固定,只具备知识/逻辑推理能力,缺少对历史经验和知识的强记忆能力

基础大模型的能力来自于在训练阶段喂入的海量、丰富、多维度的训练语料,这让模型只能根据自己的”记忆“尝试进行推理,并且经常给出与事实相悖的答案。

基础LLM模型无法精确地”搜索“已经存在于历史数据库中的事实性信息,也无法从自己以往的生成中”提取记忆“。事实上,LLM模型每次的内容生成都是一次全新地从零开始的知识推理。这是 GPT-3 和 ChatGPT 刚刚出现时最初被体验的能力 —— 让 ChatGPT 写首诗,你可以接受它的上述不完美。

针对这个问题,embedding database(向量数据库)提供了一种良好的基础设施,我们需要将embedding database和LLM进行有机的结合,创造出一种新的LLM+embedding vector的新范式。

LLM模型对输入token存在最大长度的限制

针对这个问题,Map Reduce 是目前业内比较主流的技术应对方向。

参考链接:

https://mp.weixin.qq.com/s?__biz=Mzg2OTY0MDk0NQ==&mid=2247501117&idx=1&sn=e860ac5e259a969f62b05d080bf42d14&chksm=ce9b7aa3f9ecf3b503656e9a09b55210fdba0844b54bd6a5714f5fc8c57b8c3570acbe2d342f&scene=21#wechat_redirect

 

二、海外前沿场景及国内对标梳理

参考链接:

https://wallstreetcn.com/articles/3685072
https://www.geekpark.net/news/319478
https://www.infoq.cn/article/kxARbquFMCbx39KPoTxY 

 

标签:范式,embedding,AI,模型,Prompt,构建,LLM,prompt
From: https://www.cnblogs.com/LittleHann/p/17441900.html

相关文章

  • AI demo framework
     importpickleimportmatplotlib.pyplotaspltfromsklearnimportdatasetsfromsklearn.model_selectionimporttrain_test_splitfromsklearn.neighborsimportKNeighborsClassifierfromsklearn.model_selectionimportcross_val_scorefromsklearnimportm......
  • tflearn Training Step每次 We will run it for 10 epochs (t
    TrainingTFLearnprovidesamodelwrapper'DNN'thatcanautomaticallyperformsaneuralnetworkclassifiertasks,suchastraining,prediction,save/restore,etc...Wewillrunitfor10epochs(thenetworkwillseealldata10times)withabat......
  • 即时设计—小组项目原型示例(附AI功能)
    (官网:js.design)即时设计——可云端编辑的专业级设计工具更简单高级的功能,支持多人实时协作,颠覆传统软件的设计形态。特点简介:即时设计是中国版的Figma,适用于团队合作和远程协作。它具有强大的实时协作功能,多人可以同时编辑和评论设计文件。它还具有内置的原型设计功能,可以创......
  • go 执行ssh 报错ssh: handshake failed: read tcp xxx:->xxx:22: read: connection re
    需求:解决报错go执行ssh报错ssh:handshakefailed:readtcpxxx:->xxx:22:read:connectionresetbypeer 10个以内,没有问题。10以上就报错解决:我的远程(192.168.49.171)服务器ssh默认最大限制10解除限制,下面的操作都是在49.171上操作的。1.编辑sshd_confi......
  • install baidunetdisk-bin
    yay-Sbaidunetdisk-binAURExplicit(1):baidunetdisk-bin-4.17.7-1::(1/1)下载了PKGBUILD:baidunetdisk-bin1baidunetdisk-bin(构建文件已存在)==>清理哪些软件包的构建文件?==>[N]没有[A]全部[Ab]中止[I]已安装[No]未安装或(123,......
  • 聚焦AIGC--2023首届人工智能生成内容国际会议将于8月在上海举办
    2023年8月25-26日,首届人工智能生成内容国际会议(2023The1stInternationalConferenceonAI-generatedContent(AIGC2023))将在中国上海举行。本次会议得到了复旦大学、中国科技大学、同济大学、上海交通大学、上海人工智能实验室、香港中文大学等知名院校和研究机构的大力支......
  • 解决右键没有vscode打开选项的问题 AHAI AHAI
    问题点击鼠标右键没有‘使用vscode打开’的选项。原因在安装时没有勾选相关选项解决办法先声明亲测有效。1.新建文本文件夹2.输入以下文本WindowsRegistryEditorVersion5.00[HKEY_CLASSES_ROOT\*\shell\VSCode]@="OpenwithCode""Icon"="D:\\Mic......
  • 范式关系模式
    第一NF---消除部分依赖-->第二NF--消除传递依赖-->第三NF-->决定因素(关系中左边的)要包含主码-->BCNF举例1.AB->D,B->D存在D对主码AB的部分依赖,不符合第二范式,为第一范式改为第三范式:R1(A,B,D)R2(B,D)2.AB->C,AB->D,AD->E,不存在部分依赖,但存在E对主码AB的传递依赖吗,不符合第三......
  • Kali内置代理工具Proxychains的简单使用
    1.介绍Kali中内置了ProxyChains开源代理工具,通过使用这个工具,可以让我们隐藏真实ip实现攻击、代理上网等使用ProxyChains,用户可以在KaliLinux中配置不同类型的代理服务器,包括HTTP、SOCKS4和SOCKS5代理。此外,用户还可以为不同的目标指定不同的代理服务器,以确保他们的行为不被检......
  • AI入门纯干货系列课程目录
    第一课、AI导论 (已更)第二课、机器学习导论(已更)第三课、特征工程(已更)第四课、KNN最近邻算法(已更)第五课、朴素贝叶斯算法(已更)第六课、决策树/随机森林第七课、常用机器学习算法性能对比第八课、SVD分解及PCA第九课、集成学习第十课、深度学习导论第十一课、计......