首页 > 其他分享 >ChatGPT 火了,一大批开源平替也来了

ChatGPT 火了,一大批开源平替也来了

时间:2023-04-19 17:47:47浏览次数:45  
标签:平替 AI 模型 开源 聊天 GPT ChatGPT

ChatGPT 凭一己之力让全球为 AI 沸腾,引发了科技巨头之间的聊天机器人军备竞赛。   众所周知,ChatGPT 的背后技术是 GPT(Generative Pre-trained Transformer)模型。GPT 是一种基于 Transformer 模型的自然语言处理模型,由 OpenAI 公司开发。它可以通过学习大量的自然语言数据来生成自然流畅的文本,例如文章、对话等。   2019 年 11 月,OpenAI 开源了 GPT-2 语言模型的完整版本(有 15 亿个参数)。GPT-2 是作为 OpenAI 2018 年 GPT 模型的 "直接扩展" 而创建的,其参数和训练数据集的大小都增加了 10 倍。   在 GPT-2 之后,OpenAI 又推出了 1750 亿个参数的 GPT-3,只是其源代码从未被公开。OpenAI 认为 GPT-3 可能被滥用,因此不应开源。包括后来的 GPT-3.5、GPT-4 都没有开源。目前,公开免费版 ChatGPT 仍然基于 GPT-3.5,不过按月订阅 “ChatGPT Plus” 的用户能够试用由 GPT-4 提供支持的更新版本的 ChatGPT。   尽管 ChatGPT 没有开源,但趁着这波热度,还是有不少类似的开源项目出现,GitHub 已经有人做个了 替代 ChatGPT 的开源项目列表

lucidrains/PaLM-rlhf-pytorch

这是一个类似于 ChatGPT 的模型,但使用的是 PaLM 架构。在 PaLM 架构之上实现了 RLHF(人类反馈强化学习)。

注:只有源代码,没有数据,没有模型权重,没有聊天系统。

togethercomputer/OpenChatKit

OpenChatKit 提供了一个强大的开源基础,可以为各种应用程序创建专用和通用聊天机器人。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

oobabooga/text-generation-webui

它是一个用于运行 GPT-J 6B、OPT、GALACTICA、LLaMA 和 Pygmalion 等大型语言模型的 gradio web UI。其目标是成为文本生成领域的 AUTOMATIC1111/stable-diffusion-webui

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

KoboldAI/KoboldAI-Client

这是一个基于浏览器的前端,用于使用多个本地和远程 AI 模型进行 AI 辅助写作。它提供一系列标准工具,包括内存、作者笔记、世界信息、保存和加载、可调整的 AI 设置、格式化选项,以及导入现有 AI Dungeon 冒险的能力。您还可以打开冒险模式并像 AI Dungeon Unleashed 一样玩游戏。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

LAION-AI/Open-Assistant

OpenAssistant 是一个基于聊天的助手,可以理解任务,可以与第三方系统交互,并为此动态检索信息。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

tatsu-lab/stanford_alpaca

这是 Stanford Alpaca 项目的 repo,该项目旨在构建和共享指令遵循的 LLaMA 模型。

注:半开源、非真正开源、基于封闭模型等...

BlinkDL/ChatRWKV

ChatRWKV 类似于 ChatGPT,但由 RWKV(100% RNN)语言模型提供支持,并且是开源的。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

THUDM/ChatGLM-6B

ChatGLM-6B 是一个基于通用语言模型(GLM)框架的开放式双语语言模型,拥有 62 亿个参数。借助量化技术,用户可以在消费级显卡上进行本地部署(INT4 量化级别仅需 6GB GPU 显存)。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

bigscience-workshop/xmtf

此存储库概述了用于创建 BLOOMZ & mT0 和 xP3 的所有组件,这些组件在通过多任务微调进行跨语言泛化一文中介绍。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

carperai/trlx

这是一个用于通过人类反馈(RLHF)进行语言模型分布式训练的代码库,用于微调 GPT 模型以生成聊天文本的工具,支持在线 RL 训练多达 20 亿个参数的模型,以及离线 RL 训练更大的模型。

注:注:只有源代码,没有数据,没有模型权重,没有聊天系统。

databrickslabs/dolly

该模型基于 pythia-12b 进行训练,使用了约 15,000 条指令 / 响应微调记录,这些记录是由 Databricks 员工在 InstructGPT 论文的能力领域中生成的 databricks-dolly-15k。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

LianjiaTech/BELLE

本项目的目标是推动中文大型会话模型开源社区的发展。该项目在原有的 Stanford Alpaca 基础上优化了中文性能。模型微调仅使用通过 ChatGPT 生成的数据(没有其他数据)。此 repo 包含 175 个用于生成数据的中文种子任务、用于生成数据的代码、用于微调模型的 0.5M 生成数据等等。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

ethanyanjiali/minChatGPT

这个示例演示了如何使用 RLHF 技术对齐语言模型,使其能够生成类似于 ChatGPT 的聊天文本。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

cerebras/Cerebras-GPT

7 个开源 GPT-3 样式模型,参数范围从 1.11 亿到 130 亿,使用 Chinchilla 公式 训练。模型权重已在宽松许可下发布(特别是 Apache 2.0 许可)。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

TavernAI/TavernAI

一款主题风格是冒险和探险的聊天机器人,默认 AI 语言模型是 Pygmalion,还包括其他语言模型,比如 KoboldAI、ChatGPT、GPT-4 等。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

Cohee1207/SillyTavern

SillyTavern 是 TavernAI 1.2.8 的一个分支,目前正在积极开发中,并添加了许多主要功能。现在,它们可以被视为完全独立的程序。Tavern 是一个用户界面,它需要与一个 AI 系统后端配合使用,才能发挥作用。有多种支持的后端可供选择,包括 OpenAPI API(GPT)、KoboldAI(可以在本地运行或在 Google Colab 上运行)等。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

ChatGPT 这阵风刮得这么猛,GOTC 2023 怎会错过?   5 月 27 日至 28 日,GOTC 2023 将在上海召开, AIGC (AI Generated Content,AI 生成内容) 将成为本次大会的重头戏。尤其是在 “AI is Everywhere” 分论坛上,诸多 AI 专家将深入探讨 AIGC 背后的技术。     全球开源技术峰会(Global Open-source Technology Conference),简称 GOTC,是由开放原子开源基金会、 Linux 基金会亚太区、上海浦东软件园和开源中国联合发起的,面向全球开发者的一场盛大开源技术盛宴。 5 月 27 日至 28 日,GOTC 2023 将于上海举办为期 2 天的开源行业盛会。大会将以行业展览、主题发言、特别论坛、分论坛的形式展现,与会者将一起探讨元宇宙、3D 与游戏、eBPF、Web3.0、区块链等热门技术主题,以及开源社区、AIGC、汽车软件、开源商业化、开源教育培训、云原生等热门话题,探讨开源未来,助力开源发展。   GOTC 2023   报名通道现已开启,诚邀全球各技术领域开源爱好者共襄盛举!   参会报名,请访问:   https://www.bagevent.com/event/8387611

标签:平替,AI,模型,开源,聊天,GPT,ChatGPT
From: https://www.cnblogs.com/lzhdim/p/17334085.html

相关文章

  • 最新 chatGPT如何接收验证码?亲测秒到!
    写在前面:提示滥用问题是应为代理不干净的原因,更换代理即可!注册sms-activate账号首先进去官网:传送门主页大概长这样,不知道后期会不会更新!进去之后点击右上角注册账号!这种操作比较简单通过QQ邮箱即可注册,这里有一点就是QQ邮箱可能会拦截该网站的验证信息:在验证过程中如果......
  • 剑指chatGPT,马斯克:你们暂停一下,我追赶追赶
    前言近期,马斯克被曝出购买了大约1万个GPU,并从DeepMind处招募到AI人才,打算开发自己的大语言模型(LLM)项目。啥是GPU,就是图形处理器。一般用于构建大型语言模型所需。GPU价格不菲,以英伟达为例,其为大型AI模型生产的GPU价格高达1万美元。有趣的是,马斯克还多次抱怨推特财务状况不稳定......
  • DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍
    DeepSpeedChat:一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍1.概述近日来,ChatGPT及类似模型引发了人工智能(AI)领域的一场风潮。这场风潮对数字世界产生了革命性影响。ChatGPT类模型具有惊人的泛用性,能够执行归纳、编程、翻译等任务,其结果与人类专家相当甚至更优。为......
  • PDFsam basic免费开源pdf编辑器
    PDFtk、PDFsam可以根据PDF中的信息分割合并PDF,免费版本就可以做到!由于PDFtk只提供了安装包,PDFsam有便携免安装的版本,basic免费,enhanced版本收费。https://github.com/torakiki/pdfsam/releasesPDFsam官网:(https://pdfsam.org/)基础版的下载页面:(https://pdfsam.org/download......
  • 《花雕学AI》人工智能ChatGPT一共帮我优化出了二十四个标题备选,你帮忙看看,我到底该选
    今天准备测试AI绘画,使用几个不同的AI平台来生成猫娘图片,以此具体学习绘图的AI咒语。这篇博客用什么标题好呢?于是,我开始关心如何优化标题,还是老办法,不懂就问ChatGPT(没有正式账号,找了几个国内镜像站来做实验,呵呵,这样也简单些)。下面是测试实验的记录:我给出的问题是:“设计ChatGPT优化......
  • 认识Claude:与ChatGPT竞争的免费且不限量的聊天机器人
    免费、支持中文、无需注册、不用骚操作直接可用的类ChatGPT产品Claude,它来了!(此等好事必须第一时间和家人们分享)毫不意外的,目前它的热度已经被炒到不行:而且已经有一波网友抢先体验了一番,铺天盖地的一致好评。例如微博博主“Simon_阿文”就给出了这样的评价:是我目前......
  • 你不要错过的一款无网络限制的ChatGPT替代软件:Claude
    Claude简介一款由Anthropic研发的人工智能语言助手。具有以下主要功能: 自然语言理解:可以理解您使用的自然语言,并作出符合语境的回复。 知识问答:具有广泛的常识知识,可以回答各类常见知识问答。 任务完成:可以根据您的指示完成查找信息、设置提醒等简单任务。 情感连贯性:回复会在......
  • ChatGPT会如何改变制造业?
    来源|SmartIndustryEdgenesis编译ChatGPT最新版本的发布成为热门头条。OpenAI表示该版本的ChatGPT能够在多个专业测试中达到“人类水平”的表现,例如司法考试和SAT考试。不过,在工业领域中,ChatGPT能够发挥怎样的作用呢?SmartIndustry采访了Rootstrap的数据科学负责人MikaelaPisan......
  • 分享一个开源的windows安卓投屏工具,scrcpy
    看到scrcpy可能很多人会以为是大名鼎鼎的Scrcpy(一个十分强大的多线路爬虫框架),sorry今天分享的主角不是他,而是他:github地址:https://github.com/Genymobile/scrcpy废话不多说,下载windows版本开搞,推荐选择64位下载完毕后解压,然后双击scrcpy.exe然后不出意外的话,你就可以看到这......
  • 开源的ChatGPT项目
    自从ChatGPT、StableDiffusion发布以来,各种相关开源项目百花齐放,着实让人应接不暇。今天,我将着重挑选几个优质的开源项目,对我们的日常工作、学习生活,都会有很大的帮助。今天整理分享给大家,希望对你有所帮助。一、VisualChatGPT这个是微软开源的项目,一周多的时间,就斩获了2......