首页 > 系统相关 >[软件工具使用记录] windows离线ollama部署本地模型并配置continue实现离线代码补全

[软件工具使用记录] windows离线ollama部署本地模型并配置continue实现离线代码补全

时间:2025-01-08 12:13:11浏览次数:1  
标签:文件 补全 windows qwen2.5 模型 离线 continue ollama

qwen2.5coder发布之后,觉得差不多可以实现离线模型辅助编程了,所以尝试在公司内网部署模型,配合vsocde插件continue实现代码提示、聊天功能。

目前使用qwen2.5coder的32b模型,体验上和gpt-4o差不多(都稀碎),适用于编写脚本,查一些简单问题,例如flask如何把变量传到前端,准确率还可以,但是补全功能稀碎。

硬件如下:

cpu gpu 内存
AMD Ryzen 9 5950X 16核 AMD Radeon TX 6900XT(需要安装最新驱动)/16G显存直接吃满 64G 2600Mhz/实际吃30G内存

跑起来不算快,和我阅读速度差不多,对这套硬件来说挺吃力的。GPU没怎么跑,似乎主要是cpu在发力吃到60%占用率

部署ollama

安装ollama客户端 && 选择模型

首先去Download Ollama on Windows下载ollama的windows版本,安装包非常大,基本上700-800M

在有网络的电脑上安装,然后在Ollama这里找到需要的模型,例如这里我选择qwen2.5code的0.5b模型

image

点击第二个箭头Tags可以选择不同的量化版本,然后复制第三个箭头的指令

按下Win+R快捷键,运行cmd,执行复制的命令,比如这里是ollama run qwen2.5-coder:0.5b

没有魔法的情况下可能会失败,一般情况下多试几次,最差可能需要几十次才能开始下载

找到模型文件及Modelfile内容

image

搜索pull的时候的哈希字符,可以找到模型位置,一般在C:\Users\Administrator\.ollama\models\blobs

按照时间排序,找到最大的那个文件,就是gguf格式的模型,复制出来,改名为qwen2.5-coder0.5b.gguf

在命令行执行形如ollama show qwen2.5-coder:0.5b --modelfile的指令,可以得到模型的Modelfile文件内容,保存为Modelfile文件

现在有以下两个文件

image

其中,文件内容是默认提示词模板,可参考模型文件参考 - Ollama 中文文档进行修改,例如可以实现让llama3.3优先使用中文,这个可以通过在其中加入请优先使用简体中文回复,这样的字符实现,最好使用翻译软件翻译成英文再放进去(比如插入到第13行)

  • 修改第五行的FROM,将模型路径修改为模型的真实路径,例如这里是./qwen2.5-coder0.5b.gguf

内网部署ollama

  • 在没有网络的内网电脑中安装第一步下载的ollama安装包
  • 复制上面准备的两个文件到内网

在两个文件所在目录的地址栏输入cmd,按下回车

image

命令行中输入ollama create qwen2.5-coder0.5b -f Modelfile,其中create后面是你自定义的模型名字(推荐和外网保持一样)

这样就导入进来了,接下来的使用和外网一模一样,输入ollama list命令可以看到导入的模型

默认情况下ollama会开机启动,如果没有启动,手动执行就行,右下角的托盘图表中应该有它

配置continue

本地使用

Releases · continuedev/continue这里下载到最新的continue插件,复制到内网,在vscode中安装,可参考VS Code 安装 VSIX 插件_.vsix-CSDN博客

image

现在,就可以使用模型了

局域网共享

如果项目组中只有一台电脑能运行模型,别的性能不够,需要局域网访问ollama,那么可以按照如下方式调整

ollama

默认它的服务监听127.0.0.1:11434端口,这会导致局域网其他机器访问不到,可以参考Allow listening on all local interfaces · Issue #703 · ollama/ollama实现监听所有端口

简单来说,就是设定环境变量OLLAMA_HOST=0.0.0.0,windows上也是一样的,如下

image

然后重启ollama即可,通过netstat -ano | findstr 11434查看是否监听了0.0.0.0

continue

可参考:https://github.com/continuedev/continue/issues/1175#issuecomment-2081651169

简单来说,在远程主机上,把设置中的以下内容改为指定内容即可

image

    {
      "model": "AUTODETECT",
      "title": "Ollama (Remote)",
      "completionOptions": {},
      "apiBase": "http://192.168.1.100:11434",
      "provider": "ollama"
    }

其中apiBase就是部署了ollama的机器

标签:文件,补全,windows,qwen2.5,模型,离线,continue,ollama
From: https://www.cnblogs.com/cjdty/p/18659438

相关文章

  • Windows bat批处理用for遍历、循环、查找的变量不能在for外用
    前言全局说明Windowsbat批处理用for遍历、循环、查找的变量不能在for外用Windowsbat不像Linuxshell有很完善的语法,bat中除了判断,很多查询或要遍历的东西都要用for完成。一、说明1.1环境:Windows二、for循环变量下面的写法,for循环外是获取不到file,因......
  • Ollama系列---【如何离线安装ollama?】
    1.环境本文以centos7.9安装ollama为例2.下载ollama安装包官网地址:https://ollama.com/download/linuxGitHub手动安装文档地址:https://github.com/ollama/ollama/blob/main/docs/linux.md安装包下载地址:https://ollama.com/download/ollama-linux-amd64.tgz3.上传到服务器并......
  • 深入探索 ScottPlot.WPF:在 Windows 桌面应用中绘制精美图表的利器
    一、ScottPlot.WPF简介ScottPlot.WPF是基于ScottPlot绘图库专门为WindowsPresentationFoundation(WPF)框架量身定制的强大绘图组件。它无缝集成到WPF应用程序中,为开发者提供了一种简洁、高效的方式来可视化数据,无论是科学研究中的实验数据展示、金融领域的行情走势......
  • ProxyPin开源免费抓包工具,支持Windows、Mac、Android、IOS、Linux 全平台系统
    您可以使用它来拦截、检查和重写HTTP(S)流量,支持Flutter应用抓包,ProxyPin基于Flutter开发,UI美观易用。核心特性手机扫码连接:不用手动配置Wifi代理,包括配置同步。所有终端都可以互相扫码连接转发流量。域名过滤:只拦截您所需要的流量,不拦截其他流量,避免干扰其他应用。搜索:根......
  • spring boot Linux dockerfile与Windows dockerfile区别
    在创建Dockerfile来构建SpringBoot应用程序的容器时,Dockerfile本身通常与操作系统的差异无关,因为Docker容器是跨平台的。然而,在某些情况下,可能会有一些细微的差别,这些差别主要来自于文件路径格式、换行符等操作系统之间的差异。以下是可能需要注意的几个方面:文件路径格式Windo......
  • Luogu P2414 NOI2011 阿狸的打字机 题解 [ 紫 ] [ AC 自动机 ] [ 离线思想 ] [ 树状数
    阿狸的打字机:非常牛的AC自动机题。暴力先考虑在暴力的情况下,我们如何计算\(x\)匹配\(y\)的次数。显然,我们会模拟往\(y\)里加字符的过程,在此过程中做KMP进行匹配,统计答案。那么如果涉及多个模式串呢?就可以把KMP加强成AC自动机了。考虑在AC自动机上如何刻画这个......
  • Windows10环境下安装RabbitMq折腾记
            最近有个老项目需要迁移到windows10环境,用的是比较老的rabbitmq安装包,如下所示。经过一番折腾,死活服务起不来,最终果断放弃老版本启用新版本。现在把折腾过程记录下:一、安装erlang 安装完成后的目录结构,我的路径是D:\Apps\EnvSoft\ErlangOPT21。:    ......
  • Flameshot - Install on Windows
     PSC:\Users\ZhangZhihui>wingetinstallflameshot“msstore”源要求在使用前查看以下协议。TermsofTransaction:https://aka.ms/microsoft-store-terms-of-transaction源要求将当前计算机的2个字母的地理区域发送到后端服务才能正常工作,(例如"US")。是否同意所有......
  • 在 Windows 系统安装过程中,以下是常见的组合键及其功能,表格化整理如下:Ctrl + Shift +
    在Windows系统安装过程中,以下是常见的组合键及其功能,表格化整理如下:快捷键组合功能描述应用场景Ctrl+Shift+F3进入Windows审核模式(AuditMode)用于进入审核模式,可以在安装过程中进行系统自定义设置。F8启动高级启动选项(AdvancedBootOptions)进入安全模......
  • PD19 Parallels Desktop 虚拟机 安装Windows10系统 操作步骤(保姆级教程,轻松上手)
    PD19ParallelsDesktop虚拟机安装Windows10系统操作步骤(保姆级教程,轻松上手)ParallelsDesktop19,是一款Mac虚拟机软件,能在搭载Intel或Apple芯片的任何Mac上运行Windows,体验不同操作系统之间的无缝集成。使用ParallelsDesktop19forMac不断创新。在您的Mac中......