在MBP上运行推理LLaMA-7B模型

# build this repo
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp

# obtain the original LLaMA model weights and place them in ./models
ls ./models
65B 30B 13B 7B tokenizer_checklist.chk tokenizer.model

# install Python dependencies
python3 -m pip install torch numpy sentencepiece

# convert the 7B model to ggml FP16 format
python3 convert-pth-to-ggml.py models/7B/ 1

# quantize the model to 4-bits
./quantize.sh 7B

# run the inference
./main -m ./models/7B/ggml-model-q4_0.bin -t 8 -n 128

互动模式

如果您想要更像ChatGPT的体验，您可以通过传递-i作为参数在交互模式下运行。在此模式下，您始终可以通过按Ctrl+C来中断生成，并输入一行或多行文本，这些文本将被转换为令牌并附加到当前上下文中。您还可以使用参数-r "reverse prompt string"指定反向提示。每当在生成中遇到反向提示字符串的确切令牌时，这将导致用户输入被提示。一个典型的用途是使用提示，使LLaMa模拟多个用户之间的聊天，比如Alice和Bob，并通过-r "Alice:"

这是一个用命令调用的交互示例：

./main -m ./models/7B/ggml-model-q4_0.bin -t 8 -n 256 --repeat_penalty 1.0 --color -i -r "User:" \
                                           -p \
"Transcript of a dialog, where the User interacts with an Assistant named Bob. Bob is helpful, kind, honest, good at writing, and never fails to answer the User's requests immediately and with precision.

User: Hello, Bob.
Bob: Hello. How may I help you today?
User: Please tell me the largest city in Europe.
Bob: Sure. The largest city in Europe is Moscow, the capital of Russia.
User:"

标签：7B,models,User,LLaMA,model,MBP,Bob
From： https://www.cnblogs.com/isLinXu/p/17217577.html

快速上手Meta大语言模型LLaMA，构建“本地化ChatGPT”
近期，Meta发布了人工智能大语言模型LLaMA，包含70亿、130亿、330亿和650亿这4种参数规模的模型。其中，最小的LLaMA7B也经过了超1万亿个tokens的训练。本文我们将以7B模型为例，分......
带宽知识MB/s、Mb/s、Mbps、Mbit/s、Kbps
MB/s(兆字节每秒)Mb/s(兆比特每秒)Mbps(兆比特每秒)Mbit/s(兆比特每秒)Kbps(千比特每秒)1Byte(字节)=8bit(比特)【1B=8b】带宽用来表示网络中某通道传送数据的......
无线和射频集成电路CC2651R3SIPAT0MOUR/CC2652PSIPMOTR/CC2651P31T0RKPR TxRx + MCU 2
一、CC2651R3SIPAT0MOUR介绍：CC2651R3SIPA器件是一款多协议2.4GHz无线微控制器(MCU)，支持Zigbee®、Bluetooth®5.2LowEnergy、IEEE802.15.4g、TI15.4stack(2.4GHz)......
CF607B
Zuma-洛谷|计算机科学教育新生态(luogu.com.cn)跟 P4170[CQOI2007]涂色很像。令DP[i][j]为消灭区间(i~j)所需要的最少次数。考虑dp[i][j]的转移:如果a[i]==a[j......
ChatGPT战火越烧越猛！Meta公布最新开源大语言模型LLaMA，官方称效果优于GPT-3
原创|文BFT机器人ChatGPT的横空出世打开了硅谷科技新局面：微软趁热打铁步步为营，先是将ChatGPT接入了Bing给热度再添一把火，接着又宣布将ChatGPT植入机器人进行了实验，现阶段......
TPS7B8733QKVURQ1 40V低压稳压器,REF4132B25DBVR功能框图汽车类应用
TPS7B8733QKVURQ140V低压差稳压器说明：TPS7B87-Q140V低压差稳压器设计用于连接汽车应用中的电池。TPS7B87-Q1的输入电压范围可扩展至40V，因此该器件可承受汽车系统中预计可......
CF607B zuma
从序列中每次消去回文串,问最少几次消除完 #include<iostream>#include<cstring>usingnamespacestd;constintN=503,inf=0x3f3f3f3f;intf[N][N],a[N],n;......
Matlab 2017b 中文破解版软件包下载及图文安装教程
MATLAB是美国MathWorks公司出品的商业数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语......
题解 CF637B
题目大意：维护个栈，去重保留最上层题目分析：啥也不是，数组模拟\(\text{stack}+\text{unordered\_map}\)直接秒掉。复杂度\(O(n)\)代码实现：#include<bits/stdc++.h>......
7.7BIOS和引导
程序的运行环境中，存在着名为BIOS（BasicInput/OutputSystem）的系统。BIOS存储在ROM中，是预先内置在计算机主机内部的程序。BIOS除了键盘、磁盘、显卡等基本控制程序......

在MBP上运行推理LLaMA-7B模型

在MBP上运行推理LLaMA-7B模型

互动模式

相关文章

赞助商

阅读排行