首页 > 其他分享 >本地大模型初体验

本地大模型初体验

时间:2025-01-01 21:18:46浏览次数:1  
标签:初体验 http 模型 地址 本地 maxkb docker ollama

前言

近几年这个话题很火,但是我一直没得去尝试一下,今天突然来兴趣想试试,然后就出来了这一篇文档。

环境准备

  • docker

安装管理工具

Ollama是一款开源的大模型管理工具,它允许用户在本地便捷地运行多种大型开源模型,包括清华大学的ChatGLM、阿里的千问以及Meta的llama等。目前,Ollama兼容macOS、Linux和Windows三大主流操作系统。

官网:https://ollama.com/

这里我们直接使用docker部署的Ollama,我直接放我的docker-compose文件配置

services:
  ollama: 
    container_name: ollama
    image: registry.cn-hangzhou.aliyuncs.com/zrng/ollama:0.4.6 # docker.io/ollama/ollama:latest
    ports:
      - 11434:11434 # 对外端口
    restart: always
    environment:
      - OLLAMA_PROXY_URL=http://host.docker.internal:11434/v1 # web ui使用的时候地址填写:http://host.docker.internal:11434
    volumes:
      - E:\Data\ollama:/root/.ollama # 挂载数据
  • 访问地址为:http://IP:11434
  • image地址配置的是阿里云镜像仓库地址,防止拉取失败
  • OLLAMA_PROXY_URL:这个是后面填写API 域名的时候要用的
  • volumes这个挂载了我的容器数据

执行docker-compose命令后,在容器启动正常后访问Ollama地址判断启动是否正常,比如我这里直接访问:http://localhost:11434/

image

通过命令进入Ollama容器中,查看是否存在默认的模型

# 查询模型列表
ollama list

image

现在来安装一个开源模型,我找了一个小一点的模型llama3.2进行测试,也可以去模型仓库中寻找合适的模型:https://ollama.com/library

# 安装大模型
ollama run llama3.2

image

安装完成可以通过命令行查看模型是否安装成功

image

现在模型已经安装成功,可以在容器内使用命令行使用模型,也可以使用其他UI服务进行使用

MaxKB

MaxKB = Max Knowledge Base,是一款基于大语言模型和 RAG 的开源知识库问答系统,广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。

官网:https://maxkb.cn/

部署

这个工具我还通过docker工具来创建,还直接放我的docker-compose文件配置

services:
  maxkb:
    container_name: maxkb # http://localhost:28080  admin/MaxKB@123..
    image: registry.cn-hangzhou.aliyuncs.com/zrng/maxkb:1.8.0 # 1panel/maxkb
    ports:
      - 28080:8080 # 对外端口
    restart: always
  • 访问地址为:IP+28080
  • image地址配置的是阿里云镜像仓库的地址,防止拉取失败

现在我访问地址:http://localhost:28080

image

默认用户名/密码:admin/MaxKB@123.. 官方文档地址为:https://maxkb.cn/docs/installation/online_installtion/ ,登录成功后可以按照弹框提示修改默认的密码,然后去系统管理添加模型

添加模型

image

这里我们可以看到支持很多的大模型

image

因为我的模型是Ollama,可以选择该私有模型,然后添加模型

image

添加应用

现在可以添加应用了,到应用界面添加新应用

image

image

下面的内容我使用默认的配置,然后点击右上角的保存并发布,然后点击左侧的概览,可以看到应用信息以及访问地址等

image

直接访问地址:http://localhost:28080/ui/chat/d0a18a63b48e8b94

image

这里可以就可以输入我们要咨询的内容了,根据电脑配置好坏响应内容的速度也有不同。

嵌入第三方

通过简单的配置可以将该应用嵌入到第三方系统中

image

知识库

在知识库选项卡,可以新建知识库并导入文本或Web站点等,然后将我们需要支持咨询的内容上传并向量化

image

然后在应用界面可以关联新建的知识库,以便返回我们更想要的内容。

image

总结

第一次尝试本地大模型到这暂时结束,后续再去发现更棒的功能。

标签:初体验,http,模型,地址,本地,maxkb,docker,ollama
From: https://www.cnblogs.com/azrng/p/18646318

相关文章

  • DeepSpeed训练得到checkpoint如何像Huggingface模型一样评测evaluation?zero_to_fp32.p
    DeepSpeed训练得到checkpoint如何像Huggingface模型一样评测evaluation?具体步骤首先看一个样例:这是我用open-instruct框架,使用DeepSpeed训练1728个steps得到的一个checkpoint。请注意,下文我演示用的例子是基于step_1152,主要方法和step_1728这个名字没有任何区别。在使......
  • MoA(Mixture-of-Agents)多模型协作框架设计
    一、系统整体架构与设计MoA的集成总体架构可采用分层+模块化的微服务理念进行设计,形成“前端UI层——中间件/任务调度层——模型服务层——数据与运维支撑层”的整体结构,涵盖以下核心组件:前端UI层负责用户的交互,例如输入需求描述,查看代码生成与空间分析结果等。......
  • 腾讯混元大模型翻译能力接入教程
    腾讯混元大模型翻译能力接入教程购买接入github地址:https://github.com/a18792721831/studyplugin/tree/master/translate购买文档:https://cloud.tencent.com/document/product/1729/106126控制台:https://console.cloud.tencent.com/hunyuan/packages打开控制台,选......
  • 如何通过设置失效时间清除本地存储的数据?
    使用localStorage和时间戳结合的方式(JavaScript)原理:localStorage是一种在浏览器中存储数据的方式,数据不会过期,除非手动清除。为了实现数据的自动过期,可以将数据存储的同时,也存储一个时间戳。在读取数据时,通过比较当前时间和存储的时间戳来判断数据是否过期。存储数据时添加时......
  • [Windows] 启动 Windows Update 服务失败,报:"Windows 无法启动 Windows Update 服务(
    1问题描述现象1:Windows10家庭版-服务(services.msc)-启动WindowsUpdate服务失败,报:"Windows无法启动WindowsUpdate服务(位于本地计算机上)错误126:找不到指定的模块"注:C:\Windows\System32\wuaueng.dll文件存在注:注册表regedit:计算机\HKEY_LOCAL......
  • 深度学习基础理论————分布式训练(模型并行/数据并行/流水线并行/张量并行)
    主要介绍Pytorch分布式训练代码以及原理以及一些简易的Demo代码模型并行是指将一个模型的不同部分(如层或子模块)分配到不同的设备上运行。它通常用于非常大的模型,这些模型无法完整地放入单个设备的内存中。在模型并行中,数据会顺序通过各个层,即一层处理完所有数据之后再传递给下一......
  • 超详细!uni-app Android本地打包傻瓜式教程
    前言本教程将指导您完成uni-app项目的Android本地打包过程。通过本地打包,您可以更好地控制应用的打包过程,实现更多自定义配置。一、申请应用标识1.1获取DCloudAppID登录DCloud开发者中心创建一个新应用点击创建后的项目创建证书,需要等一会儿时间,1分钟左右,可能......
  • 【2024超全汇总】这是我见过最全面的AI大模型面试题集合!
    节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。喜欢记得点赞、收藏、关注。更多技术......
  • 【2024最全总结】大模型面试题:每道都是硬核挑战,没有送分题!
    节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。今天分享大模型面试相关知识点,持续更新,希望对后......
  • 【LLM大模型】2025年最新字节内网流传的大模型面试真题揭秘!
    随着人工智能技术的迅猛发展,计算机视觉(CV)、自然语言处理(NLP)、搜索、推荐、广告推送和风险控制等领域的岗位越来越受欢迎,而_对于大型模型技术的掌握成为了这些岗位的标配_。但目前公开的大模型资源还是很少很少,面试真题就更不用多说了。为了让大家能够应对大模型面试,整理了......