首页 > 其他分享 >开源中文大型语言模型(资源汇总

开源中文大型语言模型(资源汇总

时间:2023-07-06 17:56:34浏览次数:66  
标签:中文 github Chinese 模型 汇总 地址 开源 https com

随时更新!汇总2023年开源的大型中文大规模语言模型,入选标准:

  1. 对中文支持能力强
  2. 模型规模 ≥ 1B
  3. 公布模型权重、推理代码
  4. 公布模型训练细节

Chinese-Vicuna

项目地址:https://github.com/Facico/Chinese-Vicuna

  • 基座模型:LLaMA 7B
  • 特点:提供了非常详细的训练指南!量化工具、C++推理、huggingface - Meta转化。
  • 友好度:colab推理&微调代码点击运行,中文文档,社区回复很活跃。
  • 效果:实测效果…有点一言难尽,没有面向多轮对话进行优化

Chinese-LLaMA-Alpaca

项目地址:https://github.com/ymcui/Chinese-LLaMA-Alpaca

  • 基座模型:LLaMA 7B/13B
  • 特点:扩充中文词典,CPU/GPU部署支持,huggingface推理接口
  • 效果:issue中反馈来看,性能中规中矩,但相比于原生LLaMA中文能力已经大幅度提升了 https://github.com/ymcui/Chines

 

Luotuo-Chinese-LLM

项目地址:https://github.com/LC1332/Luotuo-Chinese-LLM

 

ChatGLM-6B

  • 项目地址:https://github.com/THUDM/ChatGLM-6B
  • 试玩地址:无
  • 特点:huaggingface 集成,面向对话优化,有完善的部署和finetune方案
  • 效果:等GPU空闲再测试,看官方案例还不错

Chinese-ChatLLaMA

项目地址:https://github.com/ydli-ai/Chinese-ChatLLaMA

  • 基座模型:完整训练
  • 试玩地址:无
  • 特点:huggingface 集成,完整训练,有完善的部署和finetune方案
  • 效果:

RWKV-LM

项目地址:https://github.com/BlinkDL/RWKV-LM

  • 基座模型:RNN
  • 特点:参考Transformer设计的RNN语言模型(类似convnext与ViT的关系)
  • 效果:等GPU空闲再测试

随时更新欢迎关注收藏。

相关资源

数据

标签:中文,github,Chinese,模型,汇总,地址,开源,https,com
From: https://www.cnblogs.com/Im-Victor/p/17532893.html

相关文章

  • 脱发秘籍:前端Chrome调试技巧汇总
    Chrome浏览器调试工具的核心功能:......
  • 开源大语言模型是否可以商用的调查报告
     开源大语言模型是否可以商用的调查报告0.背景1.调查结果1.1基础大模型(LLM)1.2对话大模型(ChatLLM)1.3多模态对话大模型(MultiModal-ChatLLM)2.可商用开源模型总结2.1基础大模型(LLM)2.2对话大模型(ChatLLM) 0.背景ChatGPT火起来了,很多企业......
  • Zabbix“专家坐诊”第198期问答汇总
    问题一 Q:请问一下,自带的思科SNMP交换机模板,怎么不监控down的接口?A1:这种一般在自动发现规则里加个过滤器,过滤出IFSTATUS匹配(1|3)的就能实现只发现up的端口了。A2:1. 在“Items”页面,找到“Interface status”监控项,打开“Latest data”选项。2.在监控项的“Preprocessing......
  • 杭州网易面试题___整理汇总
    2023-5-8   网易面试 1.自我介绍 2.项目介绍 3.项目流程,工作负责的内容 4.项目出现风险导致测试时间被压测怎么处理 5.接口测试怎么做的 6.测试环境怎么部署的 7.postman里面的断言有哪些,postman里面的环境变量是个什么概念,postman里面的runner有用过吗 8.有做过压测吗......
  • Python怎么调中文 这个问题怎么解决?
    Python怎么调中文在使用Python处理中文文本时,我们常常会遇到一些编码和字符处理的问题。本文将介绍如何通过一些常用的方法和工具来解决这些问题,并提供代码示例来帮助读者更好地理解。问题描述假设我们有一个文本文件,其中包含了一些中文文本,我们想要对这些文本进行处理,例如统计......
  • 给 Helm 提一个 PR,重温开源项目参与过程
    目录逛社区领任务复现Bug用GPT-4来准备Bug复现材料对着GPT-4给的命令复现Bug定位Bug修复思路编写代码测试提PR逛社区酒足饭饱,闲来无事,打开Helm项目的issues列表,咦,这个issue看起来眉清目秀呀:其实一点都不“眉清目秀”,这段issue描述太冗长了,没有任何排版,看起......
  • Github | 制作您的第一个开源合并请求
    Github|制作您的第一个开源合并请求文章目录Github|制作您的第一个开源合并请求1.背景2.前提3.上手贡献开源1.背景开源软件是原始源代码可免费获得并可重新分发和修改的软件。作为一名程序员,我们更感兴趣的是如何为他们的代码库做出贡献。许多新手发现开源是可怕和令人生......
  • [最新开源推荐]免费可商用的开源培训平台,发布三个月1000star!
    项目简介PlayEdu是一款用于内部培训的开源系统,功能强大,界面美观,致力于搭建私有化内部培训平台。 项目地址Github地址:https://github.com/PlayEdu/PlayEduGItee地址:https://gitee.com/playeduxyz/playedu 技术栈基于Java+MySQL开发,采用前后端分离模式,前台采用Reac......
  • Vscode设置中文方法
    Vscode怎么设置成中文呢?具体要怎么操作?下面小编就为大家分享一下Vscode设置成中文的方法,有需要的可以来了解了解哦。  Vscode怎么设置中文?Vscode设置中文方法  1、首先打开安装好的Vscode软件,可以看到页面上显示的是英文效果。如图 2、然后按住键盘上......
  • sqlsugar 使用汇总 (大数据写入、更新,大数据更新 ORM, db.Fastest文档)
     https://www.donet5.com/Home/Doc?typeId=2404  大数据写入、更新,大数据更新ORM,db.Fastest文档//插入100万10秒不到db.Fastest<RealmAuctionDatum>().BulkCopy(GetList());//性能比现有任何Bulkcopy都要快30%//如果数据库现有数据比较多出现比较慢,这个时候可以试试......