首页 > 其他分享 >在MBP上运行推理LLaMA-7B模型

在MBP上运行推理LLaMA-7B模型

时间:2023-03-15 10:34:04浏览次数:37  
标签:7B models User LLaMA model MBP Bob

在MBP上运行推理LLaMA-7B模型

# build this repo
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
# obtain the original LLaMA model weights and place them in ./models
ls ./models
65B 30B 13B 7B tokenizer_checklist.chk tokenizer.model

# install Python dependencies
python3 -m pip install torch numpy sentencepiece
# convert the 7B model to ggml FP16 format
python3 convert-pth-to-ggml.py models/7B/ 1


# quantize the model to 4-bits
./quantize.sh 7B


# run the inference
./main -m ./models/7B/ggml-model-q4_0.bin -t 8 -n 128

互动模式

如果您想要更像ChatGPT的体验,您可以通过传递-i作为参数在交互模式下运行。在此模式下,您始终可以通过按Ctrl+C来中断生成,并输入一行或多行文本,这些文本将被转换为令牌并附加到当前上下文中。您还可以使用参数-r "reverse prompt string"指定反向提示。每当在生成中遇到反向提示字符串的确切令牌时,这将导致用户输入被提示。一个典型的用途是使用提示,使LLaMa模拟多个用户之间的聊天,比如Alice和Bob,并通过-r "Alice:"

这是一个用命令调用的交互示例:

./main -m ./models/7B/ggml-model-q4_0.bin -t 8 -n 256 --repeat_penalty 1.0 --color -i -r "User:" \
                                           -p \
"Transcript of a dialog, where the User interacts with an Assistant named Bob. Bob is helpful, kind, honest, good at writing, and never fails to answer the User's requests immediately and with precision.

User: Hello, Bob.
Bob: Hello. How may I help you today?
User: Please tell me the largest city in Europe.
Bob: Sure. The largest city in Europe is Moscow, the capital of Russia.
User:"


标签:7B,models,User,LLaMA,model,MBP,Bob
From: https://www.cnblogs.com/isLinXu/p/17217577.html

相关文章

  • 快速上手Meta大语言模型LLaMA,构建“本地化ChatGPT”
    近期,Meta发布了人工智能大语言模型LLaMA,包含70亿、130亿、330亿和650亿这4种参数规模的模型。其中,最小的LLaMA7B也经过了超1万亿个tokens的训练。本文我们将以7B模型为例,分......
  • 带宽知识MB/s、Mb/s、Mbps、Mbit/s、Kbps
    MB/s(兆字节每秒)Mb/s(兆比特每秒)Mbps(兆比特每秒)Mbit/s(兆比特每秒)Kbps(千比特每秒)1Byte(字节)=8bit(比特)【1B=8b】带宽用来表示网络中某通道传送数据的......
  • 无线和射频集成电路CC2651R3SIPAT0MOUR/CC2652PSIPMOTR/CC2651P31T0RKPR TxRx + MCU 2
    一、CC2651R3SIPAT0MOUR介绍:CC2651R3SIPA器件是一款多协议2.4GHz无线微控制器(MCU),支持Zigbee®、Bluetooth®5.2LowEnergy、IEEE802.15.4g、TI15.4stack(2.4GHz)......
  • CF607B
    Zuma-洛谷|计算机科学教育新生态(luogu.com.cn)跟 P4170[CQOI2007]涂色很像。令DP[i][j]为消灭区间(i~j)所需要的最少次数。考虑dp[i][j]的转移:如果a[i]==a[j......
  • ChatGPT战火越烧越猛!Meta公布最新开源大语言模型LLaMA,官方称效果优于GPT-3
    原创|文BFT机器人ChatGPT的横空出世打开了硅谷科技新局面:微软趁热打铁步步为营,先是将ChatGPT接入了Bing给热度再添一把火,接着又宣布将ChatGPT植入机器人进行了实验,现阶段......
  • TPS7B8733QKVURQ1 40V低压稳压器,REF4132B25DBVR功能框图 汽车类应用
    TPS7B8733QKVURQ140V低压差稳压器说明:TPS7B87-Q140V低压差稳压器设计用于连接汽车应用中的电池。TPS7B87-Q1的输入电压范围可扩展至40V,因此该器件可承受汽车系统中预计可......
  • CF607B zuma
    从序列中每次消去回文串,问最少几次消除完 #include<iostream>#include<cstring>usingnamespacestd;constintN=503,inf=0x3f3f3f3f;intf[N][N],a[N],n;......
  • Matlab 2017b 中文破解版软件包下载及图文安装教程​
    MATLAB是美国MathWorks公司出品的商业数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语......
  • 题解 CF637B
    题目大意:维护个栈,去重保留最上层题目分析:啥也不是,数组模拟\(\text{stack}+\text{unordered\_map}\)直接秒掉。复杂度\(O(n)\)代码实现:#include<bits/stdc++.h>......
  • 7.7BIOS和引导
       程序的运行环境中,存在着名为BIOS(BasicInput/OutputSystem)的系统。BIOS存储在ROM中,是预先内置在计算机主机内部的程序。BIOS除了键盘、磁盘、显卡等基本控制程序......