在树莓派中跑迷你Llama2中文模型

时间：2023-08-20 16:35:47浏览次数：45

OpenAI的Karpathy利用周末搞了一个迷你Llama2项目llama2.c用500行C语言实现无任何依赖项的推理程序，此项目在github发布以来衍生出了基于各种语言的迷你Llama推理实现llama2.go、llama2.java、llama2.py等等；
但该项目原本的模型并不支持中文，最近正好看到一个基于llama2的中文训练模型；想着把它跑在树莓派上速度会怎样；
使用Go实现进行模型推理，该在树莓派中的Llama2 迷你中文模型，模型大小为15M使用的数据集为TinyStories 英文翻译后的数据但仅翻译了TinyStories 的部分数据目前为1M，中文词表使用UTF-8编码所以每个汉字为3个字节；

在树莓派中推理：

 ./llama2.go -checkpoint=stories15M-llama2-enzh.bin -tokenizer=tokenizer.bin -prompt="有个小姑娘" 
2023/08/20 15:43:55 config: llama2.Config{Dim:288, HiddenDim:768, NumLayers:6, NumHeads:6, NumKVHeads:6,VocabSize:55296, SeqLen:256}
 有个小姑娘。她正忙着在公园里玩耍。突然，她摔倒了，膝盖受伤了。她需要举起膝盖。
 她的父母提醒她保持冷静，然后乔把她救回她的安全位置。他们给了她一些创可贴，并告诉她会帮助她感觉好一点。
 小乔紧紧地抱住膝盖，微笑着。她相信她的父母会帮助她感觉更好。
 最终，收拾好竭，她的膝盖感觉好多了。她很高兴能能够再次感到安全。

可以看到在树莓派中跑这个150万参数的llama2模型Tokens/s速度只有每秒不到10；
由于TinyStories只是短篇故事数据集，加上中文翻译数据集也不完全，模型参数也只有百万规模所以讲故事的效果并不好；

Go推理fork于：https://github.com/nikolaydubina/llama2.go
模型、词表来源：https://github.com/chenyangMl/llama2.c-zh
文章首发地址：https://mp.weixin.qq.com/s/3jHg6kYFnd45JUZq9WK3sw

标签：中文,树莓,迷你,模型,llama2,Llama2
From： https://www.cnblogs.com/softlin/p/17644147.html

如何用手机为树莓派烧录系统
声明手机需要有第三方Recovery（如TWRP）!!!本文含有大量个人观点，为实践个人总结，不保证正确性，对应相关操作的理解可能也有失偏颇，如有错误，还望大家及时指出疫情在家，一直没啥事可以做，整理柜子的时候发现有一台吃灰的树莓派，于是想借他消磨一下时间。没带电脑回家，小区也封了，出不去了，有......
利用text-generation-webui快速搭建chatGLM2-6b/LLAMA2-7B-chat大模型运行环境
text-generation-webui 是一个基于Gradio的LLMWebUI开源项目，可以利用其快速搭建各种文本生成的大模型环境。一、安装text-generation-webui的readme其实已写得相当详细了，这里就不再重复，只说1个可能存在的坑：安装peft安装卡住requirements.txt中有一些依赖项，需要访问gith......
树莓派二驱动智能小车组装
复现up主：杨坤树莓派爱好者基地的https://www.bilibili.com/video/BV1pW411J7WG?vd_source=7f1982c56a437c7b00c3695687b7086d树莓派小车，稍微调整了一下连接的方式，做成后发现跟自己最终要实现的目标效果有很大的偏差，所以打算升级车型，但是这个形状的小车的已经做出来了，不记录一下有......
树莓派连接蓝牙遥控，控制播放音乐
采用的树莓派zerow，根据按键切换音乐#!/usr/bin/envpython#-*-coding:utf-8-*-#[NEW]DeviceEC:22:05:15:24:0DRMT-EC220515240Dimporttimefrombluepy.btleimport*frombinasciiimporthexlifyimportstructfromMusicimport*classNotifyDelegate(De......
Dify 加入更多国内外优秀模型，轻松调用 Llama2、ChatGLM 等热门开源模型
Dify的朋友们，不少细心的网友在周末的时候就已经发现了我们产品上的更新--模型供应商上新增了一大批新模型，这也是很多朋友翘首以盼的版本--V0.3.13。此前Dify已经陆续支持了全球前列的模型优秀代表：OpenAI的GPT系列、Anthropic的Claude系列、AzureOpenAI系列。本次更新......
树莓派配置清华源和WiringPi
在找树莓派小车的零件的时候大多都是卖整套的，自己觉得太贵，索性就自己买零件按照up主：杨坤树莓派爱好者基地的【【类型（教程、树莓派）】树莓派制作遥控小车教程（看了就会）】https://www.bilibili.com/video/BV1pW411J7WG?vd_source=7f1982c56a437c7b00c3695687b7086d造型和走线拼装了一......
树莓派Raspbian安装PYQT5
安装PYQT5.（树莓派Raspbian下pip3installPyQt5是无法正常安装的。）https://zhuanlan.zhihu.com/p/498682983 准备工作。pipinstallwheelsudoapt-getupdate Pip3installsip可直接用官方仓库安装。 sudoaptinstall-ypython3-pyqt5额外组件sudoaptin......
在树莓派上使用Dockers运行Openwrt并作为主路由器的旁路由
开启网卡混杂模式sudoiplinkseteth0promiscon首先需要新建一个/etc/rc.local并添加可执行权限sudotouch/etc/rc.localsudochmod+x/etc/rc.local内容如下：#!/bin/sh-e#/etc/rc.local##rc.local##Thisscriptisexecutedattheendofeachmultiuserrunlevel......
EdgeBERT：极限压缩，比ALBERT再轻13倍！树莓派上跑BERT的日子要来了？
文|Sheryc_王苏这个世界上有两种极具难度的工程：第一种是把很平常的东西做到最大，例如把语言模型扩大成能够写诗写文写代码的GPT-3；而另一种恰恰相反，是把很平常的东西做到最小。对于NLPer来说，这种“小工程”最迫在眉睫的施展对象非BERT莫属。从18年那个109M参数的BERT，到52M......
VSCode远程开发树莓派
一、安装Remote-SSH在插件中直接搜索ssh，可找到Remote-SSH，点击安装。二、配置Remote-SSH2.1配置远程树莓派的IP和登录用户名2.2配置使用账号密码方式登录文件--->首选项--->设置--->扩展--->找到ShowLoginTerminal并勾选。三、连接树莓派可以选择在本窗口或者新建......

在树莓派中跑迷你Llama2中文模型

在树莓派中推理：

相关文章

赞助商

阅读排行