首页 > 其他分享 >前言 —— CHATGPT原理与应用开发

前言 —— CHATGPT原理与应用开发

时间:2024-04-14 23:14:09浏览次数:20  
标签:NLP 前言 AI 模型 读者 应用 原理 ChatGPT CHATGPT

前言

写作背景

  从去年年底ChatGPT的发布以来,作为自然语言处理(natural language processing,NLP)一线从业人员,我本人已经感受到了巨大压力,甚至觉得NLP工程师这个职位以后一定会消亡。当时在见识了ChatGPT的各种强大能力后,不少NLP一线从业人员很自然地就会想到,以后开发人员只要借助ChatGPT,就可以做到现在大部分NLP工程师在做的事,比如文本分类、实体抽取、推理等。甚至随着大语言模型(large language model,LLM)能力的不断提升,可能做的比NLP工程是都要好。既然这是迟早会发生的事,干脆我们就再点把火,写一本书告诉开发人员或有一些编程能力的人去利用大语言模型做一些NLP任务或服务,让变革来的更猛烈些。

  于是,就有了现在这本关于大语言模型的开发指南,它主要面向非算法、有一定编程基础、对AI和ChatGPT(或类似大语言模型)感兴趣,并乐意使用大语言模型接口开发相关应用的读者。当然部分内容不需要任何编程经验也可以学习,算法工程师也可能从中受益。我们期望通过本书能进一步降低大模型的使用门槛,让更多对AI和大语言模型感兴趣的非自然语言处理或算法专业人士能够无障碍使用大语言模型创造价值。希望新的技术突破能够更多地改善我们所处的世界。

  NLP工程师未来会不会存在现在犹未可知(就像没有公司有office工程师一样),但如果每个企业,尤其是中小企业都能自由地使用大语言模型的能力创造AI服务或应用,这不正是自己这些年的理想吗?我曾在几家小公司呆过,深刻知晓和理解小企业对AI的“情”,那种想用但又无力的矛盾。他们大多非常珍惜AI人才,但又不能大量投入。类似ChatGPT这样的大语言模型让他们异常兴奋。我们就是想要架起这么一座桥梁,让没有任何算法背景的开发人员能够尽量无缝、顺滑地对接起算法工作。我们期望授人以渔,把方法传播给更多人,也算是对这个行业的一点贡献吧。

内容设计

  本书内容聚焦于如何使用大语言模型开发新的功能和应用,一共有七章内容,分别如下:

  • 第1章 基础知识——大语言模型背后。本章主要介绍了和ChatGPT相关的一些NLP领域的基础知识和原理,具体包括:历史沿革、Token和Embedding、LM(language model)、Transformer、GPT(generative pre-trained transformer)和RLHF(reinforcement learning from human feedback)等。掌握了这部分知识就能大概知道ChatGPT或其他大语言模型是怎么回事。
  • 第2章 相似匹配——万物皆可Embedding。本章主要介绍了文本表示,以及和文本匹配相关的任务和应用。这是NLP领域(还有其他一些算法领域)最常用的技术。具体内容包括:相似匹配基础、接口使用,以及QA任务、聚类任务和推荐应用。
  • 第3章 句词分类——句子Token都是类别。本章主要介绍了NLP领域最常见的任务——分类,这其实也是人类最基本的认知方式(比如用男女、老少、勤奋、乐于助人等简单的标签化方式具象化一个个体)。具体内容包括:句词分类基础、接口使用,以及文档问答任务、分类与实体识别微调任务和智能对话应用。
  • 第4章 文本生成——超越理解更智能。本章主要介绍了和文本生成技术相关的任务,具体内容包括文本摘要、文本纠错和机器翻译。生成技术在实际场景中使用会相对少一些,也相对独立一些。
  • 第5章 文本推理——让模型更加像人。本章主要介绍如何使用大语言模型做复杂的逻辑推理任务,这一块内容在实际中应用很少,但在新的产品形态上却有很多想象空间。
  • 第6章 工程实践——真实场景大不同。本章主要介绍如何在真实业务上使用大语言模型,这一章内容不再是要构建一个简单的Demo,而是要真正用在产品开发上,我们会给出一些需要特别注意的事项,以帮助读者更高效地构建应用。
  • 第7章 局限不足——工具不是万能的。本章主要介绍ChatGPT(或类LLM)的缺陷或不擅长的地方,包括:事实错误、实时更新、资源耗费等。我们在畅想和利用ChatGPT或大模型做各种AI应用时,也应该了解它不擅长的地方。一方面是对其有更加全面的认识;另一方面反向思维有时候也能想象出一些好的应用或服务。
  • 第8章 商业应用——LLM的星辰大海。本章可以当作一篇调研报告来阅读,主要针对工具应用和行业应用两个大的方面展开,期望能够给读者更多启迪,帮助大家构思更好的应用或服务。

  本书有两个基本的设计理念:

  • 各章节相对独立,彼此没有直接明显的前后依赖关系。这体现在内容上,也体现在设计上。读者可以灵活选取自己感兴趣的章节进行阅读。
  • 以“任务”为核心。我们始终强调“任务”多于“工具”,ChatGPT是目前AI大语言模型领域总体效果最好的,但未来一定会有其他大语言模型服务出现。不过只要我们理解了要做的事情,理解了系统设计,工具就能为我所用。

  此外,本书还有比较详细的示例代码,大部分的代码都可稍作修改后用于生产环境。我们也会着重强调构建实际应用需要注意的细节。写代码容易,写好代码很不容易;做Demo简单,提供一个稳定可靠的服务很不简单。读者在应用到实际产品时务必要仔细斟酌权衡。

阅读建议

  通过上面的介绍,相信读者应该对本书有了初步了解。我们这里主要从创作者的角度简单谈一下如何更好地使用本书。

  首先,我们期望读者能够亲自动手完成一个应用或服务的Demo。光看不做在编程领域是绝对不行的,实践出真知,脑子想、嘴说和亲自干完全不一样。而且,万事开头难,做了第一个,后面再做类似的会相对容易。

  其次,我们期望读者能在学习过程中多思考,可以和自己工作的实际业务相结合,也可以天马行空地构想。我们非常期待读者能分享自己的想法,众人拾柴火焰高,个体能想到的太少了,但这么多人一起想,也许能够改变一个行业。

  第三,我们期望读者能对NLP领域常见任务有个基本的认识,了解一些基本概念。我们不是要读者都成为NLP工程师,阅读本书也不会让你成为NLP算法工程师。但我们期望读者能够利用ChatGPT或其他大语言模型提供的接口来完成NLP的任务,提供相关服务,期望读者在阅读完本书后都具备这样的能力。

  第四,洛克菲勒说过:“真正重要的不在于有多少知识,而在于如何使用现有的知识。知识只是潜在的力量,只有将其付诸应用,而且是建设性的应用,才会显示出它的威力”。由于教程围绕着任务展开,很多设计思路和细节其实可以应用在多个领域。我们再次强调,期望读者能够多多实践,多多应用,尤其是和自己的工作多结合。

  最后,由于创作团队精力有限,本书难免有些疏漏甚至错误,我们期望读者在学习的同时,也能积极给我们建议,我们将不胜感激。

  ChatGPT火爆背后蕴含着一个基本事实:AI能力得到了极大突破——大模型,尤其是大语言模型的能力有目共睹,未来只会变得更强。这世界唯一不变的就是变。适应变化、拥抱变化、喜欢变化。天行健君子以自强不息。我们相信未来会有越来越多的大模型出现。AI正在逐渐平民化,将来每个人都可以利用大模型轻松地做出自己的AI产品。我们相信我们正在经历一个伟大的时代,我们相信这是一个值得每个人全身心拥抱的时代,我们更加相信这个世界必将会因此而变得更加美好。

标签:NLP,前言,AI,模型,读者,应用,原理,ChatGPT,CHATGPT
From: https://www.cnblogs.com/3cH0-Nu1L/p/18134805

相关文章

  • 深入理解DES算法:原理、实现与应用
    title:深入理解DES算法:原理、实现与应用date:2024/4/1421:30:21updated:2024/4/1421:30:21tags:DES加密对称加密分组密码密钥管理S盒P盒安全性分析替代算法DES算法简介历史DES(DataEncryptionStandard)算法是由IBM研发,并于1977年被美国国家标准局(NBS,现NIST......
  • 万字长文深入理解Docker镜像分层原理、容器数据卷、网络通信架构(Docker系列第2章,共3章
    镜像分层的简单直观体现在执行dockerpull时,会发现多个Pullcomplete字样,就能体现分层,如果是一个文件,只会有一个Pullcomplete。dockerpullredisUsingdefaulttag:latestlatest:Pullingfromlibrary/redisa2abf6c4d29d:Alreadyexistsc7a4e4382001:Pullcomplete......
  • 幸福的原理
    一、塞利格曼幸福公式H=S+C+V持久的幸福=幸福的范围+生活条件+可控因素H代表的是持久的幸福,或者说幸福的持久度。为什么塞利格曼在定义“幸福”的时候要特别强调“持久”这个维度呢?这是因为只有持久的幸福才能反映幸福的真实水平。你可以把幸福想象成一条河流,持久......
  • Mask实现原理(兼模板测试小结)
    前言虽然说网上已经有不少优秀的总结,但为了让知识停留在脑海里,我还是决定自己总结一份笔记。大概思路Mask会修改Graph组件的材质为StencilMaterial,该材质的作用是给每个不透明的像素标记,将标记结果存入模板缓冲区中。当子级UI进行模板测试时,如果通过就渲染,没通过就不渲染。......
  • redis自学(33)哨兵的作用和工作原理
    新建sentinel.conf文件。输入下面的内容  1是端口号2是sentinel声明的ip3是sentinel监控的master的ip和端口号,mymaster是集群的名字,也可以理解成给主节点起的名字,可以任意起名字。Slave的信息是从master得到的。2是选举master时的quorum值4是slave与master断开的最长超时......
  • 实测ChatGPT、Bing、文心一言
    这两天高考逐渐落下了帷幕,对于普通人来说,高考仍然是为数不多的,可以改变命运的机会。想起自己的高考,已经是好多年前,那时候一个人去市里面参加考试,第一次睡在不熟悉的床上,痒了一晚上,实在是小姐身子丫鬟命。当时觉得考试很苦,在想若干年后应该不用考试了,现在看来,由于资源的有限性和需......
  • 深入理解中文编码:原理、应用与实践
    第一章:引言编码的基本概念与作用编码是将信息转换为特定格式以便存储、传输或处理的过程。在计算机科学中,编码通常指的是将文本、图像、音频等数据转换为数字形式的过程。编码的作用在于统一数据格式、提高数据传输效率、确保数据安全性等方面发挥着重要作用。中文编码的特殊......
  • SpringBoot starter 原理及如何自定义 starter
     前言项目的开发要求是不断进化的,而随着时间以及技术的推移,在项目中除了基本的编程语言外,还需要进行大量的应用服务整合。例如,在项目中使用MySQL数据库进行持久化存储,同时会利用Redis作为缓存存储,以及使用RocketMQ实现异构系统整合服务等。但在早先使用Spring开发的......
  • Kalman滤波器的原理与实现
    Kalman滤波器的原理与实现卡尔曼滤波器(KalmanFilter)是一个十分强大滤波器,虽然叫做滤波器,卡尔曼滤波器其实可以起到到两个作用,即预测与更新,这与我们在其运行时所关注的环节有关。当我们关注预测状态量这一步时,我们可以通过卡尔曼滤波器获取状态量的超前预测值,预测的值取决于......
  • CAS 操作原理
    CAS(CompareandSwap)是一种原子操作,用于实现乐观锁的一种方式。CAS操作包括三个参数:内存地址(或变量),期望值和新值。CAS操作会先比较内存地址处的值和期望值是否相等,如果相等,则将该内存地址的值更新为新值;如果不相等,则不做任何操作。CAS操作是一种无锁算法,可以保证操作的原子性。......