自己搭建专属AI：Llama大模型私有化部署

时间：2024-12-20 17:21:55浏览次数：3

标签：专属 AI 模型文档 webui Llama 网安 open

前言

AI新时代，提高了生产力且能帮助用户快速解答问题，现在用的比较多的是Openai、Claude，为了保证个人隐私数据，所以尝试本地（Mac M3）搭建Llama模型进行沟通。

Gpt4all

安装比较简单，根据 https://github.com/nomic-ai/gpt4all 下载客户端软件即可，打开是这样的：

然后选择并下载模型文件，这里以Llama为例：

下载模型文件完，选择模型文件则可以进行对话了：

也可以利用基于 nomic-embed-text嵌入模型，把文档转成向量方便语义检索和匹配。选择文档所在的目录：

然后对话中选择对应的文档即可：

如果文件太大，需要在设置适当添加token大小，太大也不好，处理会慢且机器会卡死：

gpt4all使用起来还是比较方便的，但是有几个缺点：有些能在huggingface.co搜到的模型在gpt4all上面搜不到、退出应用后聊天记录会消失。

【----帮助网安学习，以下所有学习资料免费领！加vx：dctintin，备注 “博客园” 获取！】

　① 网安学习成长路径思维导图
　② 60+网安经典常用工具包
　③ 100+SRC漏洞分析报告
　④ 150+网安攻防实战技术电子书
　⑤ 最权威CISSP 认证考试指南+题库
　⑥ 超1800页CTF实战技巧手册
　⑦ 最新网安大厂面试题合集（含答案）
　⑧ APP客户端安全检测指南（安卓+IOS）

Ollama

安装也很方便，下载 https://ollama.com/download/Ollama-darwin.zip ，然后运行如下命令即可启动Llama：

ollama run llama3.2

为了方便图形化使用，可以借助 https://github.com/open-webui/open-webui 完整图形化的使用，启动也很简单，直接使用官方仓库中的命令即可：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

然后访问本地的3000端口即可：

open-webui的原理也比较简单，Ollama启动后会在本地监听11434端口，open-webui也是利用这个端口来和Ollama通信完成的图形化使用。open-webui还可以多选模型一起回答：

整体测试下来，发现Llama3.2对于文档分析差点意思，给他提供一个pdf文档，也看不出个啥来。但是上面的gpt4all，然后通过nomic-embed-text模型嵌入后好点。

总结

本文演示了通过不同手段来运行Llama模型，来达到本地使用LLM的目的。

更多网安技能的在线实操练习，请点击这里>>

标签：专属,AI,模型,文档,webui,Llama,网安,open
From： https://www.cnblogs.com/hetianlab/p/18619633

EmbodiedAI具身智能必读论文|MP5: A Multi-modal Open-ended Embodied System in Mine
论文标题MP5:AMulti-modalOpen-endedEmbodiedSysteminMinecraftviaActivePerception论文链接：MP5:AMulti-modalOpen-endedEmbodiedSysteminMinecraftviaActivePerception论文下载论文作者YiranQin,EnshenZhou,QichangLiu,ZhenfeiYin,LuSheng,......
基础（map,pair的使用详解）/题目两数之和讲解哈希表的使用
力扣题目链接(opensnewwindow)https://leetcode.cn/problems/two-sum/给定一个整数数组nums 和一个目标值target，请你在该数组中找出和为目标值的那两个整数，并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是，数组中同一个元素不能使用两遍。示例:给......
最强AI智能体竟如此简单！Anthropic首次公开内部秘籍！
0前言过去一年中，我们与不同行业中开发大语言模型(LLM)智能体的多个团队进行了合作。我们发现，最成功的实现并非依赖复杂的框架或专业化的库，而是通过简单、可组合的模式构建。本文分享从客户合作及自身开发智能体的过程中所学到的经验，并为开发者提供构建高效智能体的实用建议。......
旧硬盘上raid信息清除
硬盘软raid新的硬盘拿到，放到服务器上后，发现存在一个raid类型的分区。无法删除，无法挂载使用。[root@localhost~]#lsblkNAMEMAJ：MINRMSIZEROTYPEMOUNTPOINTSsda8：001.8T0disk|--md1269：12601.8T0raid1|--md1279：12700B0md对于这种情况，需要删除raid配置......
Solution - Atcoder ARC189E Straight Path
首先发现的是\(n=2,3\)必定无解。接下来考虑\(n\ge4\)的情况。首先手玩一下小数据\(n=4\)。因为此时对应的图为一个带对角线的正方形，于是可以从对称的角度入手，得到\(\max=3\)的解：\(\begin{matrix}1&{\color{red}{-}}&2\\{\color{blue}{|}}&{\color{gree......
AI智能分析视频分析网关关于监控摄像头数据量对云存储服务影响的探讨
在数字化安防监控领域，监控摄像头数据量的激增对云存储服务带来了前所未有的挑战与机遇。随着技术的不断进步和监控需求的日益增长，监控摄像头所产生的数据量正以前所未有的速度增长，这对云存储服务的性能、容量及可靠性提出了更高要求。本文将深入探讨监控摄像头数据量对云存储服务......
让AI碰撞！“天翼云息壤杯”高校AI大赛江苏赛区交流会热力开场！
由中国电信集团有限公司主办，天翼云科技有限公司承办的“天翼云息壤杯”高校AI大赛正在火热进行中。为了提高江苏赛区学生的参赛热情，增强学生的创作能力，江苏电信、天翼云华东中心于12月6日在南京联合举办了主题为“共筑教育新生态，息壤智汇新征程”的AI大赛交流分享会。此次交流分......
AI大模型在智慧教育学习平台上的实践与总结
随着ChatGpt的问世，科技互联网公司也相继推出自研AI大模型。从前期的生成式AI，用户通过AI技术实现内容问答，随着AI技术的不管发展，相继出现各种大模型。例如语言大模型、视觉大模型、多模态大模型、推荐系统大模型、强化学习大模型、生成对抗网络大模型（GAN）、深度学习模型、自然......
最新Midjourney/AI绘画系统+分销推介，GPT4.0模型支持，联网提问总结，AI文生图/图生图/垫图
目录一、人工智能系统介绍文档二、功能模块系统快速体验三、系统功能模块3.1AI全模型支持/插件系统AI大模型多模态模型文档分析多模态识图理解能力联网搜索回复总结3.2AI智能体应用3.2.1AI智能体/GPTs商店3.2.2AI智能体/GPTs工作台3.2.3自定义创建AI智能体......
YOLOv10改进，YOLOv10添加BiLevelRoutingAttention双层路由注意机制、CSPStage广义特征
摘要新型的BGF-YOLO模型，在YOLOv8的基础上进行优化，用于准确检测MRI中的脑肿瘤。作者证明，BGF-YOLO模型通过优化GFPN特征融合结构、引入BRA注意力机制以及增加检测头，显著提升了YOLOv8的物体检测能力。理论介绍BiLevelRoutingAttention（简称BRA）是一种动态、查询感知的稀......

自己搭建专属AI：Llama大模型私有化部署

前言

Gpt4all

Ollama

总结

相关文章

赞助商

阅读排行