首页 > 其他分享 >mac本地搭建ollama

mac本地搭建ollama

时间:2024-05-10 09:49:05浏览次数:39  
标签:RAG 模型 serve mac 点击 webUI ollama 搭建

mac本地搭建ollama webUI

*简介:ollama-webUI是一个开源项目,简化了安装部署过程,并能直接管理各种大型语言模型(LLM)。本文将介绍如何在你的macOS上安装Ollama服务并配合webUI调用api来完成聊天。

开源地址

环境要求

  • macos系统
  • nodejs >= 18
  • 没错,其他的都不需要了

目标

  • 运行ollama
  • 启用webUI
  • 启用API服务
  • 启用RAG

安装ollama

  • 官网直接安装,ollama官网
  • 选择macos,点击download for mac下载
  • 得到的是个压缩包,解压,然后一路next
  • 安装完成,直接使用
  • 系统可会默认启动ollama,在电脑的右上角能看到这个标记,如果没有,请看下一步

在命令行使用ollama

  • 打开终端,输入ollama -h,查看到所有的命令。

  • 点击这里搜索你需要的模型,然后直接启动,例如:ollama run llama3,可看到下载速度非常快,取决于你的宽带。

  • 下载完成,现在可以与他聊天了

  • control + D退出聊天

调用ollama的API

  • ollama提供api的形式调用,直接查看官网文档
  • ollama serve启动服务,发现端口被占用

需要点击电脑右上角的ollama图标来退出ollama,再来运行ollama serve

  • ollama服务默认是http://127.0.0.1:11434,目前在macOS上修改ip和端口无效,官方未解决(2024-5-9)。
  • 调用api会出现跨域,所以需要做一个服务端。我已经做好了,点击查看源码,感谢star

安装ollama-webUI和serve

  • git clone https://github.com/812781385/ollama-webUI.git

  • cd client

  • pnpm i

  • 修改.env 里的VITE_APP_AXIOS_BASE_URL 为自己的ip地址

  • npm run dev 运行webUI

  • cd serve

  • npm i

  • npm run dev 运行服务端

  • 浏览器访问http://localhost:8080/

  • 点击设置按钮,打开设置对话框,输入模型名称,例如:qwen:0.5b,点击按钮开始拉取模型

  • 选择刚刚拉取好的模型后,点击确定。就可以开始聊天了

使用RAG

什么是RAG,例如你问AI:你的名字叫什么?,他会告诉你他是个ai模型...,这不是我想要的答案,怎么办?有两种方式,1.训练自己的模型。2.在prompt里嵌入自己的文案。例如:你的名字叫小虎,请参考这个问题来回答: 你的名字叫什么,这时候他会回答,他的名字叫小虎。

  • 如果你要使用RAG,请先安装chroma数据库,点击查看官网文档
  • chroma run 启动数据库服务
  • 你还需拉取ollama的嵌入式模型mxbai-embed-large,点击查看官网文档
  • 然后调用serve/app/router里的接口,添加数据router.post('/addData', controller.chat.addDataForDB);
  • 在webUI的设置对话框里,开启RAG开关,就可以聊天了

模型推理内存损耗

  • 以llama2为例计算

视频演示

播放

标签:RAG,模型,serve,mac,点击,webUI,ollama,搭建
From: https://www.cnblogs.com/wangrui38/p/18183562

相关文章

  • macos安装miniconda
    macos自带python本机版本为3.9whichpython查看Python路径python--version查看Python版本到miniconda官网找合适的版本,下载并执行#文件名是自己下载的sh文件,-p后面填安装路径,默认装到user下#-b表示将环境变量自动写入到~/.bash文件中shMiniconda3-py39_24.3.0-0-MacO......
  • 【语音识别】搭建本地的语音转文字系统:FunASR(离线不联网即可使用)
    参考自:参考配置:FunASR/runtime/docs/SDK_advanced_guide_offline_zh.mdatmain·alibaba-damo-academy/FunASR(github.com)参考配置:FunASR/runtime/quick_start_zh.mdat861147c7308b91068ffa02724fdf74ee623a909e·alibaba-damo-academy/FunASR(github.com)参考运行......
  • redis三主三从集群快速搭建
    redis集群快速搭建 1本文以redis6.2.6版本为例,快速搭建一套三主三从的redis集群,已经提前将脚本写好,只需要在节点上面进行执行即可安装#!/bin/bashinstall_redis(){#解压Redis源码包tar-zxvfredis-6.2.6.tar.gz......
  • mac80211子系统学习-rx部分
    mac80211子系统学习-rx部分wifi网卡架构Linux将wifi芯片分成了fullmac和softmac两种类型,两种类型的区别在于mlme被driver+hardware实现还是被kernel实现,用wirelesswiki上的话来讲:SoftMACisatermusedtodescribeatypeofWNICwheretheMLMEisexpectedtobema......
  • rust搭建交叉编译环境
    最近尝试了一下rust交叉编译,简单记录一下。原理1、使用rust的编译器将rust源码编译到汇编或者.o的状态(具体是汇编还是.o没有考证过)。2、使用目标平台的toolchain将rust生成的汇编或者.o链接成ELF等可执行的格式。基于上述原理,需要解决两个问题:首先,怎么让rust将rust代......
  • 如何使用多协议视频汇聚/视频安防系统EasyCVR搭建智慧园区视频管理平台?
    智慧园区作为现代化城市发展的重要组成部分,不仅承载着产业升级的使命,更是智慧城市建设的重要体现。随着产业园区竞争的逐渐白热化,将项目打造成完善的智慧园区是越来越多用户关注的内容。然而我们往往在规划前期就开始面临众多难题,如:要在哪些地方做到智慧化?怎样选择合适项目的软硬......
  • docker搭建私人git仓库
    在安装完Docker后,可以在终端中运行以下命令来下载GogsDocker镜像:dockerpullgogs/gogsdockerrun--name=gogs-p10022:22-p10880:3000-v/var/gogs:/datagogs/gogs解释:dockerrun#通过Docker运行--name=gogs#取个名字叫gogs-p10022:22#......
  • 基于国产 Web 组态软件 TopStack 搭建隧道照明控制系统
    前言TopStack是一款轻量型Web组态软件,提供多种核心功能,包括设备数据采集、定时任务、控制策略、联动控制、设备告警等,支持移动端访问,可满足中小企业快速上云需求。TopStack被广泛应用于制造业、电力、石油、化工、能源、交通、冶金、水务等行业。本文介绍的是用TopStack搭......
  • mac修改idea中的git密码
    gitlab账号修改了密码,idea拉取远程仓库,无法拉取成功。在设置中勾选Donotsave,forgetpasswordsafterrestart重启如安装了gitlab插件,在插件中不勾选这个插件。(勾选这个插件会提示用Token登录)重新fetch代码,就会提示重新输入密码......
  • [附源码]秦时明月6.2魔改版_搭建架设教程_附GM工具_安卓&苹果
    本教程仅限学习使用,禁止商用,一切后果与本人无关,此声明具有法律效应!!!!教程是本人亲自搭建成功的,绝对是完整可运行的,踩过的坑都给你们填上了一.演示视频 https://githubs.xyz/boot?app=50二.环境联网环境:centos7.6,放开所有端口单机环境:VM虚拟机......