首页 > 其他分享 >Stable LM Zephyr 3B:手机上的强大LLM助手

Stable LM Zephyr 3B:手机上的强大LLM助手

时间:2023-12-17 21:06:17浏览次数:33  
标签:Zephyr 模型 LM zephyr https Stable GPT 3B

概览

最近,Stability.ai宣布开源了Stable LM Zephyr 3B,这是一个30亿参数的大语言模型(LLM),专为手机、笔记本等移动设备设计。其突出的特点是参数较小、性能强大且算力消耗低,能够自动生成文本、总结摘要等,与70亿、130亿参数的模型相媲美。

Stable LM Zephyr 3B:手机上的强大LLM助手_数据集

核心架构

Zephyr 3B的核心架构来源于Zephyr 7B,后者是基于Mistral AI的Mistral-7B模型微调而成。Zephyr 3B在训练数据集和人工智能反馈方面利用了GPT系列模型,从而拥有强大的ChatGPT基因。

监督学习优化

通过OpenAI的GPT-3.5模型生成的大规模对话数据集“UltraChat”,Zephyr 3B经历了严格的监督学习优化。这个过程通过自动生成的高质量数据,最大限度地降低了“交叉熵”误差,优化了模型的训练效率。

Stable LM Zephyr 3B:手机上的强大LLM助手_数据集_02

人工智能反馈

研究团队使用第二个数据集“UltraFeedback”,对不同主题下的大语言模型回复进行打分评价。这一过程涉及到GPT-4模型的深度参与,进一步提升了Zephyr 3B的文本生成和理解精准度。

直觉优化指导学习

使用“UltraFeedback”收集的样本和GPT-4的质量评价,Zephyr 3B采用直觉优化指导学习(dDPO)方法。这种方法通过反向传播优化模型参数,高效地微调模型结构。

Stable LM Zephyr 3B:手机上的强大LLM助手_自动生成_03

测试与性能

Stability.ai指出,Zephyr 3B在MT Bench、AlpacaEval等平台上展示了出色的性能,尤其擅长创意、个性化文本生成。其性能与Falcon-4b-Instruct、WizardLM-13B-v1、Llama-2-70b-chat和Claude-V1等大参数模型相当。

Stable LM Zephyr 3B:手机上的强大LLM助手_自动生成_04

结论

Stable LM Zephyr 3B的发布,标志着高效、低成本的大型语言模型在边缘设备上的实际应用成为可能。它不仅在文本生成领域展现了巨大潜力,同时也为移动设备上的AIGC应用开辟了新的道路。

模型下载

Huggingface模型下载

https://huggingface.co/stabilityai/stablelm-zephyr-3b

AI快站模型免费加速下载

https://aifasthub.com/models/stabilityai/stablelm-zephyr-3b

标签:Zephyr,模型,LM,zephyr,https,Stable,GPT,3B
From: https://blog.51cto.com/u_16323307/8862774

相关文章

  • 训练属于自己的大模型LM Studio使用记录
    LMStudio支持本地运营大模型下载地址: https://lmstudio.ai/一搜索下载管理安装之后打开,搜索对应大模型,下载,举例:baichuan点击左侧菜单栏文件夹图标进行管理二聊天点击左侧菜单栏聊天图标,新建聊天,输入框输入内容可能对回答的结果并不满意,我们可以点击结果后面的......
  • 记Linux跑ChatGLM2的坑及低显存解决办法
    记录一下踩过的坑…0.环境配置:全程国内网Ubuntu20.04withPython3.8andCUDA12.2RTX3060Laptop(6G)1.ChatGLM的下载:#clone仓库gitclonehttps://gitclone.com/github.com/THUDM/ChatGLM2-6BcdChatGLM2-6Bpip3install-rrequirements.txt#pip加速自行百......
  • 使用LM Studio在本地运行LLM完整教程
    GPT-4被普遍认为是最好的生成式AI聊天机器人,但开源模型一直在变得越来越好,并且通过微调在某些特定领域是可以超过GPT4的。在开源类别中出于以下的原因,你可能会考虑过在本地计算机上本地运行LLM:脱机:不需要互联网连接。模型访问:在本地运行模型,可以尝试开源模型(Llama2、Vicun......
  • helm部署Kafka集群
    1.准备文件1.1.创建命令空间kubectlcreatenskafka1.1.helm包拉取本地#添加bitnami仓库helmrepoaddbitnamihttps://charts.bitnami.com/bitnami#查询charthelmsearchrepobitnami#拉取zookeeperhelmpullbitnami/zookeeper#解压tarzxvfzookeeper-12.0.......
  • 聊聊GLM基座模型的理论知识
    概述大模型有两个流程:预训练和推理。预训练是在某种神经网络模型架构上,导入大规模语料数据,通过一系列的神经网络隐藏层的矩阵计算、微分计算等,输出权重,学习率,模型参数等超参数信息。推理是在预训练的成果上,应用超参数文件,基于预训练结果,根据用户的输入信息,推理预测其行为。G......
  • sqlmap的配置及基本用法
    SQLMap是一款非常强大的开源SQL注入测试工具,它能够帮助我们发现并利用潜在的SQL注入漏洞。SQLMap是基于Python开发的自动化SQL注入工具,其原理是通过构造恶意SQL查询语句,探测和利用目标网站的SQL注入漏洞。SQLMap通过发送不同类型的SQL查询请求,从而判断目标网站是否存在SQL注入漏洞,......
  • WVP+ZLMediaKit实现摄像头GB28181推流播放
    一、介绍概述WVP-PRO基于GB/T28181-2016标准实现的流媒体平台,依托优秀的开源流媒体服务ZLMediaKit,提供完善丰富的功能。GB/T28181-2016中文标准名称是《公共安全视频监控联网系统信息传输、交换、控制技术要求》是监控领域的国家标准。大量应用于政府视频平台。通过28181......
  • Helm Chart 部署 Redis 的完美指南
    目录一、Helm介绍二、安装Helm三、配置Helm的repository四、部署chart(以部署redis为例)1.搜索chart2.拉取chart3.修改values.yaml的一些配置(简单演示一下基本的配置)4.启动chart5.升级和回滚a.升级b.回滚一、Helm介绍Helm是一个Kubernetes的包管理工具,就像Linux下的包管......
  • SQL自动化注ru-SQLmap入门操作(一)
    了解SQLmap基础操作SQLmap是一款自动化的SQL注入工具,可以用于检测和利用SQL注入漏洞。以下是SQLmap的入门操作步骤:下载SQLmap:可以从官方网站(https://sqlmap.org/)下载最新版本的SQLmap。打开终端:在终端中进入SQLmap所在的目录。输入命令:使用以下命令运行SQLmap:pythonsqlmap.py-u<......
  • Seata 启动报错:[imeoutChecker_1] i.s.c.r.netty.NettyClientChannelManager : no av
    Seata启动报错:[imeoutChecker_1]i.s.c.r.netty.NettyClientChannelManager:noavailableservertoconnect.1.问题2.解决【application.xml和file.conf参数要相对应】......