首页 > 其他分享 >Phi-3 模型手机部署教程(微软发布的可与GPT-3.5媲美的小模型)

Phi-3 模型手机部署教程(微软发布的可与GPT-3.5媲美的小模型)

时间:2024-06-23 10:20:55浏览次数:3  
标签:Phi Qwen2 模型 部署 3.5 Linux Ollama

前面几篇博文,老牛同学和大家一起在个人电脑部署了Qwen2GLM4Llama3ChatTTSStable Diffusion等 LLM 大模型,也通过 API 和 WebUI 的方式完成了体验。

但是这些大模型因为部署在个人电脑本地,不能够随时携带。如果能在手机上部署大模型的话,老牛同学感觉很有意义,手机与我们的生活更为密切相关,并且手机上也有大量的个人数据,与大模型交互起来也更加方便。同时,在手机上跑个大模型,还是很酷!

老牛同学期望能通过本文,和大家一起完成这项很酷且有意义的事情。老牛同学用的是小米 10 Pro手机,其配置参数如下:

老牛同学手机配置

选择 Phi-3 微软开源模型

受限于手机 CPU 和内存等硬件配置,我们要选择小语言模型(SLM)。其中,阿里开源了Qwen2-0.5BQwen2-1.5B两款小尺寸模型,微软了开源Phi-3 Mini3.8B)和Phi-3 medium14B)两款尺寸模型。

由于之前我们在笔记本部署了Qwen2-7B大模型,本次我们就在手机部署Phi-3 Mini模型,顺便也体验一下不同科技公司的大模型产品,其效果可以媲美GPT-3.5大模型:

Phi-3性能评测报告

Qwen2-7B本地部署:Qwen2 阿里最强开源大模型(Qwen2-7B)本地部署、API 调用和 WebUI 对话机器人

手机配置 Linux 环境(Termux 应用)

小米等安卓手机的基于 Linux 内核的操作系统,但是我们无法像在 Linux 那样执行 Linux 命令,因此我首先得配置一下 Linux 环境。

Termux是一个 Android 的终端模拟器,可以在 Android 设备上运行 Linux 命令和工具。Termux的 Android APP 可通过官网下载并安装:https://github.com/termux/termux-app/releases

当前官网的最新稳定版本:v0.118.1 - 2024-06-18 00.05

Termux安装文件

请根据手机情况,下载对应的 apk 文件。老牛同学下载的 apk 文件:termux-app_v0.118.1+github-debug_universal.apk

apk 安装成功后,打开Termux应用后,默认展示如下,就可以开始输入 Linux 命令了:

Termux应用界面

手机上安装 Linux 操作系统

首先,我们安装proot-distro系统管理工具,proot-distro可以非常方便在 Termux 中安装卸载运行Linux 的发行版本(包括:Ubuntu、Debian、Arch Linux 等):

友情提示: 在手机中输入以下命令效率比较低,我们可以把命令发到微信,然后一条一条复制粘贴!

pkg install proot-distro

proot-distro 安装成功之后,我们安装Debian操作系统:

proot-distro install debian

Debian安装成功

最后,登录新安装的Debian操作系统:

proot-distro login debian

登录之后,自动启动了Shell命令行终端:root@localhost:~#

可以执行相关的 Linux 命令了:

Debian系统命令

通过 Termux 安装 Phi-3 模型

通过上面的操作,我们已经在手机上安装好了Debian操作系统,接下来在Debian操作系统中安装Phi-3 Mini模型。

第一步:Debian系统中安装Ollama软件,没错,就是之前在个人电脑部署Llama3Qwen2等大模型时,用于管理本地大模型的Ollama软件。由于我们在手机上安装了Debian系统,那么和电脑一样,Ollama也可以管理Debian系统本地部署的大模型:

# 安装Ollama软件
curl -fsSL https://ollama.com/install.sh | sh

Ollama安装成功输出信息如下:

Ollama安装成功

第二步: 通过后台启动Ollama服务:nohup ollama serve &

我们用Ollama命令,查看 Ollama 信息,如:

  • 查看版本:ollama -v
  • 查看本地模型列表:ollama list(目前还没有部署模型,因此结果列表为

第三步: 通过Ollama安装并启动Phi-3 Mini模型:ollama run phi3:mini

Phi-3 Mini模型文件总大小为2.4GB左右,因此下载需要一点时间:

Phi-3 Mini安装成功

到此,Phi-3 Mini模型部署成功,我们可以体验手机上的大模型,比如:请用 100 个汉字解释一下,天空为什么是蓝色的?

Phi-3 Mini模型推理

总结

相比电脑端,手机的算力弱太多,就算老牛同学用的是最小尺寸的模型(Phi-3 Mini),其推理的速度还是慢得多。其内容的输出速度,比我手机打字都要慢。盯着屏幕,看着模型一个字一个字的输出,感觉也挺有趣

标签:Phi,Qwen2,模型,部署,3.5,Linux,Ollama
From: https://www.cnblogs.com/obullxl/p/18263126/NTopic2024062301

相关文章

  • Ollama深度探索:AI大模型本地部署的全面教程
    目录引言一、Ollama概述1、定义与定位2、核心功能3、技术优势4、应用场景二、安装与配置1、系统要求2、安装方法3、配置指南4、启动Ollama服务四、快速开始1、启动Ollama2、部署运行模型3、REESTAPI五、自定义模型1、定制化的必要性2、使用Modelfile定制模型3、参数......
  • 大模型基本概念学习 - Checkpoint、PyTorch、 TensorFlow、Transformers、ModelScope
    文章目录前言一、checkpoint二、TensorFlow1.简介2.主要特点3.示例代码三、PyTorch1.简介2.主要特点3.示例代码四、TensorFlow和PyTorch区别五、Transformers六、Transformers通过配置或自动检测来决定使用PyTorch或TensorFlow1.自动检测2.通过环境变量配......
  • RSpromoter:基于视觉模型的遥感实例分割提示学习
    RSpromoter:基于视觉模型的遥感实例分割提示学习摘要-利用来自SA-1B的大量训练数据,分段任意模型(SAM)展示了显著的泛化和零样本能力。然而,作为一种与类别无关的实例分割方法,SAM在很大程度上依赖于先前的手动指导,包括点、框和粗粒度掩码。此外,它在遥感图像分割任务中的性能在很大程度......
  • Transformers是SSMs:通过结构化状态空间对偶性的广义模型和高效算法(一)
    文章目录摘要1、引言2、背景与概述2.1、结构化状态空间模型2.2、注意力机制2.3、结构化矩阵2.4、概述:结构化状态空间对偶性2.5、符号3、状态空间模型是结构化矩阵3.1、状态空间模型的矩阵变换形式3.2、半可分离矩阵3.2.1、顺序半可分离(SSS)表示3.2.2、1-半可分矩阵:标量SS......
  • 【BUAA-数据管理技术】2-数据模型-概念模型
    本文内容系2024年北航软件学院数据管理技术课程课堂笔记,内容大部分取自课程PPT,少量来源于互联网,若有侵权请联系删除。文章内容如有错漏,敬请批评指正!第二章数据模型02-数据模型-概念模型2.1什么是数据模型模型:是对现实世界的抽象,常用于帮助人们提取问题本质,从而更......
  • 无需科学上网:轻松实现国内使用Coze.com平台自己创建的Bot(如何实现国内免费使用GPT-4o/
    文章目录......
  • 探索图神经网络(GNN):使用Python实现你的GNN模型
    一、引言图神经网络(GraphNeuralNetwork,GNN)作为近年来机器学习和深度学习领域的热门话题,正逐渐吸引越来越多的研究者和开发者的关注。GNN能够处理图结构数据,在社交网络分析、推荐系统、化学分子结构预测等领域有着广泛的应用。本文将带你一步一步使用Python实现一个基本的......
  • 自我激励学习提升语言模型的推理能力
    随着人工智能技术的快速发展,语言模型(LMs)在各种下游任务中展现出了卓越的能力。特别是在少样本(few-shot)和零样本(zero-shot)学习环境中,通过吸收特定任务的指令和示例,这些模型已经引起了广泛关注。然而,要提升模型的推理能力,大规模高质量的训练数据是不可或缺的。由于注释成本高昂,包......
  • 国内外大模型生态发展报告!
    很多同学只知类似CheckGPT或者说对国内的一些比较了解,对国外的不太了解,所以在这总结。1大模型的发展左表名称参数特点发布时间GPT-215亿英文底模,开源2019年GoogleT5110亿多任务微调,开源2019年GPT-3.51750亿人工反馈微调2022年MetaOPT1750......
  • 深入理解ROC曲线和AUC分数:评估分类模型的黄金标准
    深入理解ROC曲线和AUC分数:评估分类模型的黄金标准引言在机器学习领域,分类模型的性能评估至关重要。ROC曲线和AUC分数作为两个核心指标,为我们提供了一种量化模型分类能力的方法。本文将深入探讨ROC曲线和AUC分数的概念、重要性以及如何使用Python代码实现它们。一、分类模......