首页 > 其他分享 >在树莓派中跑迷你Llama2中文模型

在树莓派中跑迷你Llama2中文模型

时间:2023-08-20 16:35:47浏览次数:42  
标签:中文 树莓 迷你 模型 llama2 Llama2

  OpenAI的Karpathy利用周末搞了一个迷你Llama2项目llama2.c用500行C语言实现无任何依赖项的推理程序,此项目在github发布以来衍生出了基于各种语言的迷你Llama推理实现llama2.go、llama2.java、llama2.py等等;
  但该项目原本的模型并不支持中文,最近正好看到一个基于llama2的中文训练模型;想着把它跑在树莓派上速度会怎样;
  使用Go实现进行模型推理,该在树莓派中的Llama2 迷你中文模型,模型大小为15M使用的数据集为TinyStories 英文翻译后的数据但仅翻译了TinyStories 的部分数据目前为1M,中文词表使用UTF-8编码所以每个汉字为3个字节;

在树莓派中推理:

 ./llama2.go -checkpoint=stories15M-llama2-enzh.bin -tokenizer=tokenizer.bin -prompt="有个小姑娘" 
2023/08/20 15:43:55 config: llama2.Config{Dim:288, HiddenDim:768, NumLayers:6, NumHeads:6, NumKVHeads:6,VocabSize:55296, SeqLen:256}
 有个小姑娘。她正忙着在公园里玩耍。突然,她摔倒了,膝盖受伤了。她需要举起膝盖。
 她的父母提醒她保持冷静,然后乔把她救回她的安全位置。他们给了她一些创可贴,并告诉她会帮助她感觉好一点。
 小乔紧紧地抱住膝盖,微笑着。她相信她的父母会帮助她感觉更好。
 最终,收拾好竭,她的膝盖感觉好多了。她很高兴能能够再次感到安全。

  可以看到在树莓派中跑这个150万参数的llama2模型Tokens/s速度只有每秒不到10;
  由于TinyStories只是短篇故事数据集,加上中文翻译数据集也不完全,模型参数也只有百万规模所以讲故事的效果并不好;

llama2.png

Go推理fork于:https://github.com/nikolaydubina/llama2.go
模型、词表来源:https://github.com/chenyangMl/llama2.c-zh
文章首发地址:https://mp.weixin.qq.com/s/3jHg6kYFnd45JUZq9WK3sw

标签:中文,树莓,迷你,模型,llama2,Llama2
From: https://www.cnblogs.com/softlin/p/17644147.html

相关文章

  • 如何用手机为树莓派烧录系统
    声明手机需要有第三方Recovery(如TWRP)!!!本文含有大量个人观点,为实践个人总结,不保证正确性,对应相关操作的理解可能也有失偏颇,如有错误,还望大家及时指出疫情在家,一直没啥事可以做,整理柜子的时候发现有一台吃灰的树莓派,于是想借他消磨一下时间。没带电脑回家,小区也封了,出不去了,有......
  • 利用text-generation-webui快速搭建chatGLM2-6b/LLAMA2-7B-chat大模型运行环境
    text-generation-webui 是一个基于Gradio的LLMWebUI开源项目,可以利用其快速搭建各种文本生成的大模型环境。一、安装text-generation-webui的readme其实已写得相当详细了,这里就不再重复,只说1个可能存在的坑:安装peft安装卡住requirements.txt中有一些依赖项,需要访问gith......
  • 树莓派二驱动智能小车组装
    复现up主:杨坤树莓派爱好者基地的https://www.bilibili.com/video/BV1pW411J7WG?vd_source=7f1982c56a437c7b00c3695687b7086d树莓派小车,稍微调整了一下连接的方式,做成后发现跟自己最终要实现的目标效果有很大的偏差,所以打算升级车型,但是这个形状的小车的已经做出来了,不记录一下有......
  • 树莓派连接蓝牙遥控,控制播放音乐
    采用的树莓派zerow,根据按键切换音乐#!/usr/bin/envpython#-*-coding:utf-8-*-#[NEW]DeviceEC:22:05:15:24:0DRMT-EC220515240Dimporttimefrombluepy.btleimport*frombinasciiimporthexlifyimportstructfromMusicimport*classNotifyDelegate(De......
  • Dify 加入更多国内外优秀模型,轻松调用 Llama2、ChatGLM 等热门开源模型
    Dify的朋友们,不少细心的网友在周末的时候就已经发现了我们产品上的更新--模型供应商上新增了一大批新模型,这也是很多朋友翘首以盼的版本--V0.3.13。此前Dify已经陆续支持了全球前列的模型优秀代表:OpenAI的GPT系列、Anthropic的Claude系列、AzureOpenAI系列。本次更新......
  • 树莓派配置清华源和WiringPi
    在找树莓派小车的零件的时候大多都是卖整套的,自己觉得太贵,索性就自己买零件按照up主:杨坤树莓派爱好者基地的【【类型(教程、树莓派)】树莓派制作遥控小车教程(看了就会)】https://www.bilibili.com/video/BV1pW411J7WG?vd_source=7f1982c56a437c7b00c3695687b7086d造型和走线拼装了一......
  • 树莓派Raspbian安装PYQT5
     安装PYQT5.(树莓派Raspbian下pip3installPyQt5是无法正常安装的。)https://zhuanlan.zhihu.com/p/498682983 准备工作。pipinstallwheelsudoapt-getupdate Pip3installsip可直接用官方仓库安装。 sudoaptinstall-ypython3-pyqt5额外组件sudoaptin......
  • 在树莓派上使用Dockers运行Openwrt并作为主路由器的旁路由
    开启网卡混杂模式sudoiplinkseteth0promiscon首先需要新建一个/etc/rc.local并添加可执行权限sudotouch/etc/rc.localsudochmod+x/etc/rc.local内容如下:#!/bin/sh-e#/etc/rc.local##rc.local##Thisscriptisexecutedattheendofeachmultiuserrunlevel......
  • EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?
    文|Sheryc_王苏这个世界上有两种极具难度的工程:第一种是把很平常的东西做到最大,例如把语言模型扩大成能够写诗写文写代码的GPT-3;而另一种恰恰相反,是把很平常的东西做到最小。对于NLPer来说,这种“小工程”最迫在眉睫的施展对象非BERT莫属。从18年那个109M参数的BERT,到52M......
  • VSCode远程开发树莓派
    一、安装Remote-SSH在插件中直接搜索ssh,可找到Remote-SSH,点击安装。二、配置Remote-SSH2.1配置远程树莓派的IP和登录用户名2.2配置使用账号密码方式登录文件--->首选项--->设置--->扩展--->找到ShowLoginTerminal并勾选。三、连接树莓派可以选择在本窗口或者新建......