一. 整体说明
## 1. 限制说明
(1).在官网上Web页面聊天
gpt-4: 3个小时内只能问25个问题 !!!
gpt3.5: 没有限制
(2). 调用api
gpt3.5: 免费的账号里面有5$ 额度的token数量值,并且有到期时间限制;充值比较麻烦,只能重新申请账号了, 详见图01
gpt4: 40k TPM and 200 RPM.
## 2. 速率限制(Rate limits)
两个指标: TPM (tokens per minute) RPM (requests per minute)
以免费版本的gpt3.5为例,不同模型限制如下:https://platform.openai.com/account/rate-limits
详见图:02
## 3. 创建Api key用于开发
创建api key用于开发,详见图03
## 4. 一些概念
(1).tokens:按照一定的规则进行拆分,比如hamburger,被认为是3个token,分别是:ham、bur、ger;另外一个汉字是2个token。
Most models have a context length of 2048 tokens[提问+结果] (except for the newest models, which support 4096(大约3000个words)).
ps:通过这个网址来测试内容有多少个token,https://platform.openai.com/tokenizer
(2).models:Api的调用是基于不同模型的不同能力 和 价格来进行的。比如:gpt-4是最新的模型, GPT-3.5-Turbo是支持chatgpt的,并且针对对话进行了优化
更多的模型概念详见 下面的: xxxx ??
(3).prompt: 提示、提示性语言 (一般用作chatgpt提问的内容)
(4).a text completion: 文本补全 (一般用作chatgpt返回的结果)
(5).temperature: 精确值、精确度。一般介于0-1之间,当为0,答案更加准确风险更小,大于0的时候,答案将更加多样化
(6).Fine-tuning: 微调,指的是调整模型
(7).retrieve : 检索、找回
## 5. 价格
对于新账号而言,3个月内赠送5美元的额度。
以后的价格,以 gpt-3.5-turbo为例,$0.002 / 1K tokens, (即1000个token,0.002美元)
更多价格详见:https://openai.com/pricing#language-models
## 6. 类库
支持多种语言,详见:https://platform.openai.com/docs/libraries/community-libraries
以.Net为例,主要有三个包
OpenAI https://github.com/OkGoDoIt/OpenAI-API-dotnet
Betalgo.OpenAI https://github.com/betalgo/openai
OpenAI-DotNet https://github.com/RageAgainstThePixel/OpenAI-DotNet
其中Betalgo.OpenAI的stars最多1.9k,OpenAI下载次数最多9w,这里先以OpenAI这个为主,研究样例
## 7. 模型-models
(1) 什么是模型?
OpenAi下的所有api都是基于不同模型进行,不同的模型具备不同的能力 和 价格。
(详见:https://platform.openai.com/docs/models/overview)
(2).常见的模型有哪些?
GPT-4 :截至目前位置最强大的ai模型,使用是有限制的,当前
GPT-3.5 :免费的最新的模型,训练数据时间截至21年9月,可以满足绝大多数场景
DALL·E (Beta):用于生成和编辑图像的模型
Whisper (Beta):用于将音频转换成文本的模型
Embeddings:将文本转换成数字的模型
Moderation:监测文本是否敏感和安全的模型(比如是否包含:暴力、黄色、仇恨、自我伤害等)
GPT-3: 现在已经被GPT-3.5取代了
Codex (Deprecated):已经废弃了
(3).不同模型下的细分类,以gpt-3.5为例,具体包含:
gpt-3.5-turbo、gpt-3.5-turbo-0301、text-davinci-003、text-davinci-002、code-davinci-002 其中:
gpt-3.5-turbo是一个正式版本, 也是我们推荐使用的版本
gpt-3.5-turbo-0301:是一个快照版本,快照于2023年3月,当新版本出来以后,该版本将在三个月后废弃
注: 推荐使用 text-davinci-003 和 GPT-3.5-Turbo,具有更低的延迟和更好的结果。 更强大的可以使用 gpt4模型
(4).请求地址兼容性
详见图04
## 8. chatpgt的用途
(1). 各种问题的提问,类似百度、google
(2). 生成各种代码,调试代码错误
(3). 翻译各国语言
(4). 生成文案,比如广告语、论文、合同 等等
(5). 训练格式,生成想要的格式答案
(6). 聊天机器人, 比如:情感机器人
(7). 文字转换成 emoj 图片
(8). 生成excel表格形式的文案,直接拷贝到excel中,再调整下格式
(9). 制作思维导图:利用gpt生成markdown格式,然后用xmind导入md文件生成即可。
## 9. 局限性
(1). gpt3.5训练到202109,实时问题回答不了,比如:今天天气如何。
二. 功能介绍
## 1.Text completion (如何生成和操作文本)
(1). 翻译各国语言
(2). 文字转换成 emoj 图片
(3). 聊天机器人
(4). 判断文案是积极、消极、或是 中立的
(5). 写总结,对一篇文章进行简要总结
(6). 代码补全, 比如:一个react组件的代码补全
(7). 文本补全
(8). 编辑文本
## 2.Chat completions (完成聊天)
(使用chat api,基于gpt-3.5-turbo 或 gpt-4 模型进行如下操作)
(1).作用
起草一封电子邮件或其他写作
编写Python代码
回答一组问题
创建会话代理
给你的软件一个自然语言接口
辅导各种科目
翻译语言
模拟人物的视频游戏和更多
(2).对比
由于gpt-3.5-turbo的性能与text-davinci-003相似,但每个token的价格是其10%,因此我们建议在大多数用例中使用gpt-3.5-turbo。
## 3.Image generation (如何生成和操作图片)
(使用 DALL·E 模型)
(1). 作用
A.基于输入内容从零开始创建图像
B.基于新的文本内容创建对现有图像的编辑
C.创建已有图像的变体
注:每个图像将以url或base64的形式返回,url将在一小时后过期
## 4.Fine-tuning (如何为应用程序定制模型,自己准备数据训练模型)
(1). fine-tuning(微调)有什么好处?
比提示更高质量的结果、能训练出更多的例子、节省tokens数量、更低延迟的请求
(2). 哪些模型可以微调?
davinci, curie, babbage, and ada (这些都是gpt3的模型)
## 5.Embeddings(测量字符串文本的相关性)
(1).作用
搜索(根据与查询字符串的相关性对结果进行排序)
聚类(其中文本字符串按相似性分组)
推荐(推荐带有相关文本字符串的项)
异常检测(识别相关性很小的异常值)
多样性测量(分析相似性分布)
分类(按最相似的标签对文本字符串进行分类)
## 6.Speech to text(如何将音频转换成文本)
(1). 作用
A.将音频转录成任何语言的音频
B.将音频翻译成英文
## 7.Moderation
(1). 作用
判断输入内容是否隶属于以下类别:
hate、hate/threatening、self-harm、sexual、sexual/minors、violence、violence/graphic
## 8.Rate limits(单位时间内访问服务器次数的限制)
(1). 两个指标
TPM (tokens per minute) RPM (requests per minute)
比如gpt4的限制:40k TPM and 200 RPM.
!
- 作 者 : Yaopengfei(姚鹏飞)
- 博客地址 : http://www.cnblogs.com/yaopengfei/
- 声 明1 : 如有错误,欢迎讨论,请勿谩骂^_^。
- 声 明2 : 原创博客请在转载时保留原文链接或在文章开头加上本人博客地址,否则保留追究法律责任的权利。