首页 > 其他分享 >类 ChatGPT 开源软件,开发者用的上吗?

类 ChatGPT 开源软件,开发者用的上吗?

时间:2023-03-28 14:37:31浏览次数:34  
标签:训练 模型 RLHF 开源 PaLM 开发者 ChatGPT

声明:本文是 Preethi Cheguri 所著文章《ChatGPT Equivalent Is Open-Source, But it Is of No Use to Developers》的中文译文。

原文链接:https://www.analyticsinsight.net/chatgpt-equivalent-is-open-source-but-it-is-of-no-use-to-developers/


类似于 ChatGPT 的软件现已开源,但这似乎对开发者们来说无用

第一个类似于 ChatGPT 的开源软件已经出现:这是一款基于谷歌 5,400 亿个参数的语言大模型 PaLM 架构,以及使用 RLHF(Reinforcement Learning from Human Feedback,即:使用强化学习的方法,利用人类反馈信号直接优化语言模型)的应用程序。“PaLM + RLHF” 复刻了 ChatGPT,并且现在已经开源,它是由负责逆向工程闭源 AI 系统(比如 Meta 发布的 Make-A-Video)的开发者,开发出来的一个功能类似于 ChatGPT 的文本生成模型。为了构建一个几乎可以完成 ChatGPT 任何任务的系统,包括起草电子邮件和代码提示,该系统结合了谷歌的语言大模型 PaLM 以及人类反馈强化学习(RLHF)的方法。

为什么这个“开源 ChatGPT”对开发人员没有用?

“PaLM + RLHF” 未经过预训练,换句话说:系统还没有接受网络上示例数据的必要训练,使其真正发挥作用。下载 “PaLM + RLHF” 后的体验感和使用 ChatGPT 时并不一致,“PaLM + RLHF” 需要生成该模型可以学习的千兆字节文本,然后找到能够处理训练需求的硬件。这是一个非常昂贵的过程,除非有资金雄厚的企业(或个人)专门去研究并供公众使用,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。

好消息是,复刻 ChatGPT 的其他几个项目发展迅速,包括研究团队 CarperAI 运营的项目。CarperAI 将与 OpenAI 研究小组 EleutherAI、初创公司 Scale AI 和 Hugging Face 合作,发布第一个由人类反馈训练的 “类-ChatGPT 即用型 AI 模型”。非营利组织 LAION 率先开展了一个使用最新的机器学习方法来复刻 ChatGPT 的项目,LAION 也为训练 Stable Diffusion 提供了初始数据集。那么使用了 RLHF 的 PaLM 应用程序能够做些什么?随着模型规模的扩大,跨活动的性能不断提高,新的机会也将出现。PaLM 可扩展到 5,400 亿个参数,相比之下,GPT-3 大约只有 1,750 亿个参数。

“ChatGPT” 与 “PaLM + RLHF”

带有人类反馈的强化学习是一种旨在更好地将语言模型与用户期望的目标保持一致的方法,同时也是 ChatGPT 与 “PaLM + RLHF” 都拥有的秘密武器。RLHF 需要使用包含提示的数据集微调语言模型,且该提示与人类志愿者预期模型将要表达的内容相匹配,例如:提示 “向 6 岁孩子解释机器学习”;回答 “机器学习是 AI 的一种形式……”。

“PaLM + RLHF” 中使用了 PaLM 语言模型。在反馈上述提示到改进后的模型中,由此生成多个回应,志愿者将每个回应由好到差进行排名,然后使用该排名来训练 “奖励模型”,此模型采用原始模型的回应并按偏好顺序对它们进行排序,然后过滤出给定提示的最佳答案。收集训练数据这个过程非常昂贵。

此外,训练过程也不便宜。PaLM 有 5,400 亿参数/语言模型组件,这些都是从训练数据中所习得的。而 2020 年的一项研究表明,开发一个只有 15 亿个参数的文本生成模型的费用可能高达 160 万美元。耗时三个月,训练了拥有 1,760 亿个参数的开源模型 Bloom,用了 384 个 Nvidia A100 GPU(每一个需要数千美金)。而运行 “PaLM + RLHF” 大小的训练模型同样也不简单。Bloom 需要配备装有大约八个 A100 GPU 的专用 PC。每年估计在单个的亚马逊网站服务实例上,运行 OpenAI 的文本生成 GPT-3(包含超过 1,750亿 个参数)的成本约为 87,000 美元。

结论:除非有资金雄厚的企业(或个人)投入训练,并公之于众,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。


免责声明:本文提供的信息仅代表作者/广告商的意见,而非投资建议——仅用于教育目的。通过阅读本文,文中信息并不构成 Analytics Insight 及团队的任何投资或财务建议。投资者应该寻求自己的独立财务或专业建议。在做出任何投资决定之前,请与财务顾问一起进行独立研究。Analytics Insight 和团队不对本文中提供的投资观点负责。


开源雨林围绕开源通识、开源使用、开源贡献三大方面构建知识体系,愿把长期积累的经验系统化分享给企业,在团队、机制、项目三方面提供合作,推动各企业更高效地使用开源、贡献开源,提升全行业开源技术与应用水平。 开源雨林的内容已开源,并托管在 https://github.com/opensource-rainforest ,欢迎通过 Pull Request 的形式贡献内容,通过 Issue 的形式展开讨论,共同维护开源雨林的内容。 欢迎关注“开源雨林”公众号,获取最新、最全的消息。

标签:训练,模型,RLHF,开源,PaLM,开发者,ChatGPT
From: https://blog.51cto.com/u_15708880/6154762

相关文章

  • Google Bard初步评测:与ChatGPT的性能、设计和功能对比分析
    谷歌Bard,搜索巨头对ChatGPT的回应,终于来了。但这值得等待吗?它与网络上涌现的许多其他人工智能聊天机器人相比如何嗯,第一个很容易回答。根据我们的初步印象,谷歌决定在它......
  • ChatGPT在编程方面的应用
    ChatGPT是一种强大的自然语言处理技术,可以让计算机理解和生成自然语言。在编程方面,ChatGPT可以用于各种任务,例如代码自动生成、自然语言查询接口、代码注释和文档生成、代......
  • NLP 开源形近字算法之相似字列表(番外篇)
    创作目的国内对于文本的相似度计算,开源的工具是比较丰富的。但是对于两个汉字之间的相似度计算,国内基本一片空白。国内的参考的资料少的可怜,国外相关文档也是如此。本项......
  • ChatGPT4.0
    Bingnewbing整合了最新的ChatGPT4.0注册:https://www.bing.com/new绘画:https://www.bing.com/createChatGPT插件ChatGPTforGoogleWebChatGPTForGoogleYouTube......
  • C# 富文本内容生成PDF,用开源免费的类库
    要使用C#生成PDF文件,可以使用iTextSharp这个免费开源的类库。iTextSharp提供了丰富的API,可以用来生成PDF文档、表格、图表、图片等内容。以下是一个简单的示例代码,用于将......
  • ChatGPT与码农的机会
    之前一篇博客已经写了有关AI在博客编写方面的优势与对未来博客的编写方面的思考。这篇文档我继续分享一个我在开发中的一个案例和相关的感想。事件还原我发现ChatGPT也可......
  • chatgpt的prompts
    https://github.com/f/awesome-chatgpt-promptsjavascript学习Let’sroleplay.YouareanonlineJavaScriptcourse.Yourtaskistoquicklyassessthestudent’s......
  • 开源的识别图片中文字
    https://blog.csdn.net/weixin_38809962/article/details/126966598importloggingfromaipimportAipOcrimporteasyocrimportcv2importnumpyasnplogger=logging.......
  • 又发现一个开源商城项目,谷粒商城外又多了个选择
    官网地址:https://magestack.cn刚果商城是个从零到一的C端商城项目,包含商城核心业务和基础架构两大模块。参照商城系统原型,推出用户、消息、商品、订单、优惠券、支付、......
  • 赞!Mozilla针对开源的大力支持突显!
    2016年Q3,Mozilla开源支持计划向四个开源项目捐赠了30万美元;Mozilla同时宣布完成了两个开源项目的安全审查.2016年Q3,Mozilla开源支持计划向四个开源项目捐赠了30万......