首页 > 其他分享 >LocalLLaMA 客户端试验

LocalLLaMA 客户端试验

时间:2024-03-12 16:26:05浏览次数:13  
标签:RAG ollama 支持 server 试验 LocalLLaMA 显卡 local 客户端

  1. LM Studio. 可以直接下 hg 模型(实际使用需要自己修改成中国镜像). 有 local server, 符合 openai api 规范. 遗憾的是不支持选择显卡导致无法使用.
  2. Faraday. 第一个跑通的. 支持选显卡, 运行参数自动调校, 很好上手. 但只有 chat 功能, 没有 local server. hub 里有很多角色下载.
  3. GPT4ALL. 支持选显卡, 也有 local server. 但可能默认参数设置不当没用上我的 4090, 实际上还在用 CPU 和内存.
  4. Jan. 很好用, 支持 chat 也支持 local server, 也可以从 hg 下模型.
  • 可能 api 的规格有出入, 它的 completion 接口是 chat/completions, 而 openai 是 completions.
  1. local.ai. 只支持 ggml, 不支持 guff, 也不支持显卡, 貌似支持本地 RAG, 但因为上述原因没有试验.
  2. khoj. 不知道干嘛的, 需要连 server url, 主要特色应该是支持本地 RAG.
  3. ollama. 没有 GUI, 一个命令行程序.
  • 它会自动下载模型, 遗憾的是不知道怎么指定下载路径.
  • 可以指定单个模型, 要建一个文本文件写上路径, 再 -f 指定这个文本文件, 比较傻
  • 这个程序不知道什么情况, 输入一句你好, 就自己不停的输出, 速度倒是很快, 无法实用, 用的 yi34b
    7.1 ollama 的 gui, open-webui 以及 oobabooga/text-generation-webui.
    • open-webui 通过 docker 可以跑的很不错, 但是由于 ollama 的问题(不停的输出) 没有深入研究, 也不适合推荐给普通用户
    • oobabooga 更是支持 notebook, RAG 等功能, 甚至支持一些文生图, 但是产品化不够, 要自己配一堆东西, 同样不适合普通用户
  1. Chat with RTX. NVIDIA 自己出的客户端, 集成了 mistral 7b 和 llama2 13b, 主要特色是支持 RAG 本地检索, 还支持 youtube.

目前 Faraday 和 Jan 是比较好的选择, 期待 LM Studio 改善 GPU 支持.

就模型来看 Yi-34B-Chat-GGUF, Q3_M 比较适合我这个机器. 当然, 其它模型也值得尝试.

除了 chat 功能外, vscode 插件现在找到比较好用的是 Continue, 另外有一个 CodeGPT Chat 什么的一直转圈跑不起来.
Continue 的 tab completion 要连 ollama.

IDEA 的还没试.

写东西方面, 只有 oobabooga 有一个 notebook, 我找到一个 mikupad, 是一个单网页, 它连 Jan 有点问题, 改了一下它的代码可以工作了, 效果还不错.

标签:RAG,ollama,支持,server,试验,LocalLLaMA,显卡,local,客户端
From: https://www.cnblogs.com/inshua/p/18068588

相关文章

  • 绕过网页微信客户端限制
    目标网站https://open.weixin.qq.com/connect/oauth2/authorize?appid=wx3df73e654426c64c&redirect_uri=https%3A%2F%2Fwww.vyeah.com.cn%2FMember%2FIndex%3Fcompany%3Dvyeah&response_type=code&scope=snsapi_userinfo&state=STATE&connect_redirect=1#we......
  • 网络开发基础客户端001
    在unity中的代码   暂时看来就是 首先需要定义一个 Socket 来接收  然后我们 需要定义byte【】来接收数据 以及一个string显示  第一步就是连接  这是一个异步 如果不用异步就会有阻塞  所有在里面首先先定义我们的socket然后设置连接......
  • Python scapy模拟dhcp客户端
    安装scapyaptinstall-ypython3-scapy1.发送dhcpdiscover广播报文2.sniff抓包,收到dhcpoffer广播报文3.发送dhcprequest广播报文4.sniff抓包,收到dhcpack广播报文importthreadingfromscapy.allimport*fromscapy.layers.l2importEtherdefsend_dhcp_discover......
  • 转载:用示波器对单片机I2C时序进行图形波形分析的试验小结
    对于嵌入式开发的朋友来说,I2C协议实在是再熟悉不过了,有太多的器件,采用的都是通过I2C来进行相应的设置。今天,我们就随便聊聊这个I2C协议。I2C协议中最重要的一点是I2C地址。这个地址有7位和10位两种形式。7位能够表示127个地址,而在实际使用中基本上不会挂载如此多的设置,所以很多......
  • spring-webClient-响应式http客户端
    1.WebClient简介WebClient是SpringWebFlux模块提供的一个非阻塞的基于响应式编程的进行Http请求的客户端工具。WebFlux对标SpringMvc,WebClient相当于RestTemplate,同时也是Spring官方的Http请求工具。2.传统阻塞IO模型VS响应式IO模型传统阻塞IO模型RestTem......
  • 微服务架构,客户端如何捕捉服务端的异常?
    在微服务架构或者分布式系统中,客户端如何捕捉服务端的异常?这里说的客户端指调用方、服务端指被调用方,它们通常运行在不同的进程之中,这些进程可能运行在同一台服务器,也可能运行在不同的服务器,甚至不同的数据机房;其使用的技术栈可能相同,也可能存在很大的差异。为什么在Java、C#......
  • 在 Exchange Server 中配置特定于客户端的消息大小限制
    微软官方详细文档如下:https://learn.microsoft.com/zh-cn/exchange/architecture/client-access/client-message-size-limits?view=exchserver-2019解决方法:通过查看官方文档,打开cmd复制执行下面%windir%的部分命令,重新IIS服务,问题解决。注:下面的数值表示200MBActiveSync%E......
  • 使用 dat.GUI.js 简化试验流程
    导入jsimport{GUI}from"three/addons/libs/lil-gui.module.min.js";代码//定要要设置的属性varcontrols=new(function(){this.rotationSpeed=0.02;this.bouncingSpeed=0.03;//球体弹跳速度})();vargui=newGUI();gui.add(controls,"rotationS......
  • 推荐一个Mysql客户端命令行神器
    目录软件主页安装选项参考命令链接数据库参考网址​​ 今个推荐一个MySQL命令行客户端---MyCli,其支持命令的自动补全和语法高亮;软件主页MyCli--HomePags安装#Mycli支持在Python环境,MacOS,Windows系统下安装使用,pip3installmycli#Python下安装,解释器......
  • 使用SSH客户端登录Linux实例提示“ssh_exchange_identification: read: Connection re
    产品推荐:1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>;2、高防物理服务器20核/16G/50M/200G防御仅350元,点击抢购>>>3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>>使用SSH客户端登录Linux实例提示“ssh_exchange_identifi......