首页 > 其他分享 >大语言模型资料汇总

大语言模型资料汇总

时间:2024-03-24 22:11:30浏览次数:31  
标签:github 语言 34B 模型 汇总 Llama2 https com 7B

社区/模型下载

ModelScope 魔搭社区
Hugging Face

微调

https://github.com/modelscope/swift
https://github.com/hiyouga/LLaMA-Factory
https://huggingface.co/docs/peft/index

模型部署

https://github.com/xorbitsai/inference

模型分发

https://github.com/songquanpeng/one-api

工具调用

https://www.llamaindex.ai/open-source

聊天平台

https://github.com/labring/FastGPT

教程

Open source — LlamaIndex, Data Framework for LLM Applications
生成式AI导论-李宏毅

大模型评分

Model Size MMLU BBH C-Eval CMMLU Gaokao CR RC Code Math GSM8k Human-Eval pass@1 MBPP pass@1
GPT-4 - 83.0 86.7 69.9 71.0 72.3 89.3 - 65.3 66.1 92.0 67.0 63.6
GPT-3.5 - 69.1 70.1 52.5 55.5 51.1 83.1 - 54.8 35.6 57.1 48.1 61.4
Qwen 14B 66.7 53.4 72.1 71.0 62.5 74.2 72.5 40.6 43.1 - - -
Llama2 34B 62.6 44.1 - - - 71.1 68.9 27.8 24.2 - - -
Baichuan-2 13B 55.0 49.0 59.0 61.97 45.6 66.3 62.4 23.4 16.1 - - -
InternLM 20B 62.1 52.5 58.8 59.0 45.5 78.3 - 34.8 30.26 - - -
Skywork 13B 62.1 41.7 60.6 61.8 68.1 72.4 61.4 64.9 18.1 - - -
Falcon 180B 70.4 54.0 57.8 58.0 59.0 74.4 - - - 54.4 0.61 47.0
Yi 6B 63.2 42.8 72.0 75.5 72.2 72.2 68.7 21.1 18.6 - - -
Yi 34B 76.3 54.3 81.4 83.7 82.8 80.7 76.5 32.1 40.8 - - -
Mistral 7B - - - - - - - - - 47.5 30.5 47.5
Llama2-7B 7B 46.8 38.2 32.5 31.8 - - - - 3.3 16.7 12.8 14.8
Llama2-13B 13B 55.0 45.6 41.4 38.4 - - - - 5.0 29.6 18.9 30.3
Llama2-34B 34B 62.6 44.1 - - - - - - 6.2 42.2 22.6 33.0
Llama2-70B 70B 69.8 58.4 50.1 53.6 - - - - 10.6 54.4 23.7 37.7
Mixtral-8x7B - 70.6 - - - - - - - 28.4 74.4 40.2 60.7
Qwen1.5-7B 7B 61.0 40.2 74.1 73.1 - - - - 20.3 62.5 36.0 37.4
Qwen1.5-14B 14B 67.6 53.7 78.7 77.6 - - - - 29.2 70.1 37.8 44.0
Qwen1.5-72B 72B 77.5 65.5 84.1 83.5 - - - - 34.1 79.5 41.5 53.4

标签:github,语言,34B,模型,汇总,Llama2,https,com,7B
From: https://www.cnblogs.com/AlwaysSui/p/18093195

相关文章

  • c语言程序设计--实验报告二
    实验项目名称:实验报告2数据描述实验项目类型:验证性实验日期:2024年3月21日一、实验目的1、掌握C语言数据类型,熟悉如何定义一个整型、字符型和实型的变量,以及对它们赋值的方法。2、掌握不同数据类型之间赋值的规律。3、学会使用C的有关算术运算符,以及包含这些运算符的表......
  • c语言程序设计——实验报告一
    实验项目名称:实验一熟悉C语言运行环境实验项目类型:验证性实验日期:2023年3月14日一、实验目的下载安装Devc6.0程序。了解在该系统上如何进行编辑、编译、连接和运行一个C程序。通过运行简单的C程序了解C程序的特点。二、实验硬、软件环境Windows计算机、Devc6.0三、......
  • C语言 04 基本数据类型
    整数整数就是不包含小数点的数字,整数包含以下几种类型:short:占用2个字节,16个bit位。int:占用4个字节,32个bit位,能够表示-2^32到2^32之间的数字,默认使用这种类型。long:占用8个字节,64个bit位。浮点浮点类型一般用于保存小数。为啥不叫小数类型而是浮点类......
  • Java语言程序设计实验题目:编写Java程序统计一篇英文文档中各单词出现的次数,并按单词出
    题目描述编写Java程序统计一篇英文文档中各单词出现的次数,并按单词出现的频率由高到低进行输出。例如:文档“HellowordHello”的统计结果为: Hello:2次 word:1次思路分析1.处理文档:先用nextLine()将文段输入,存储在字符串file,再调用split()方法将字符串分割成一个......
  • 计算机网络参考模型
    一、分层思想1.含义:将复杂的流程分解为几个功能相对单一的子过程。使整个流程更加清晰,复杂问题简单化;更容易发现问题并针对性的解决问题二、OSI参考模型1.OSI7层网络模型        应用层:为应用程序提供交互服务,网络服务与最终用户的一个接口。人机交互窗口,把人......
  • C语言整型提升
    C语言中整形算术运算总是至少以缺省整型类型的精度来进行的,为了获得这个精度,表达式中的字符和短整型操作数在使用之前被转换为普通整型,这种转换称为整型提升。就是说表达式中各种长度可能小于int长度的整型值,都必须先转换为int或者unsignedint,然后才能送去CPU去执行运算。如......
  • C语言动态内存管理(重点)
    目录1、为什么要有动态内存分配2、malloc和free2.1malloc函数2.2 free函数3、calloc和realloc3.1  calloc函数 3.2 realloc函数3.3  realloc和malloc区别3.4 realloc函数存在的问题4、常见的动态内存的错误5、动态内存经典笔试题分析6、柔性数......
  • 增强现实与虚拟现实中的大模型应用:沉浸式体验的创新
    增强现实与虚拟现实中的大模型应用:沉浸式体验的创新1.背景介绍随着技术的进步,增强现实(AR)和虚拟现实(VR)正在成为越来越受欢迎的沉浸式体验方式。大模型,如神经网络和深度学习模型,在AR和VR中的应用正在推动这些技术的发展,为用户带来更加真实和沉浸式的体验。2.核心概念与联......
  • 使用AI技术(单张图片或文字)生产3D模型 —— Ai生成3D模型的时代来了
    地址:https://www.bilibili.com/video/BV1A2421P7pH/视频用到的工具voxcraft体验地址:https://voxcraft.ai/......
  • Go语言进阶:深入理解深拷贝与浅拷贝
    Go语言进阶:深入理解深拷贝与浅拷贝原创 lipeilun 海天二路搬砖工 2024-03-1719:01 福建 听全文一、引言在Go语言的编程实践中,内存管理和数据复制是经常遇到的问题。特别是在处理复杂数据结构或自定义类型时,如何正确、高效地复制数据变得尤为重要。深拷贝与浅拷贝是......