ollama 初体验

时间：2024-04-04 20:46:13浏览次数：48

标签：初体验 HTTP 1.1 0.0 content ollama 11434

参考

https://github.com/ollama/ollama
https://zhuanlan.zhihu.com/p/689555159
https://zhuanlan.zhihu.com/p/687099148
https://zhuanlan.zhihu.com/p/685166253
https://babyno.top/posts/2024/03/run-a-large-language-model-locally-2/ 提供RAG示例
https://sspai.com/post/85193#!
https://github.com/sugarforever/chat-ollama 一个支持RAG的webUI

Windows 设置环境变量

OLLAMA_HOST, 取值为 0.0.0.0
OLLAMA_MODELS, 取值为 D:\my_workspace\OLLAMA_MODELS\

下载并安装 ollama windows版本

ollama 安装后会提供一个命令行工具 ollama.exe, 可以用来下载模型, 也可以启动本地rest服务.

ollama pull qwen:0.5b #文件: 395MB, 千问小模型
ollama serve      # 启动 ollama 本地访问, 端口为 11434

下载模型

即使是同一个family的模型, 也有不同参数量和不同的量化策略, 需要按照电脑的硬件来选择合适的. 16 位浮点数精度(FP16)的模型, 推理所需显存约为模型参数量的2倍, 4比特量化模型: 显存(单位GB)为模型参数量的1/2(单位B).

ollama pull qwen:0.5b #文件: 395MB, 千问小模型
ollama pull tinyllama  #文件: 637MB, 一个比较有名的mini版llama模型
ollama pull qwen:1.8b   #文件: 637MB
ollama pull nomic-embed-text  #文件: 275MB
ollama pull qwen:7b   #文件: 1.1GB
ollama pull mistral  # mistral 模型
ollama pull llama2  #llama2模型
ollama pull llama2-chinese  #中文微调的llama2模型

ollama API 示例

下面是 VS code 的 RestClient写法, 不知为何 RestClient 无法使用 localhost 和 127.0.0.1 访问, 如果是postman可能需要通过localhost来访问.

可以访问:
GET http://0.0.0.0:11434/ HTTP/1.1

不可以访问:
GET http://localhost:11434/ HTTP/1.1
GET http://127.0.0.1:11434/ HTTP/1.1


POST http://0.0.0.0:11434/api/embeddings HTTP/1.1
content-type: application/json

{
 "model": "qwen:0.5b",
 "prompt": "Here is an article about llamas..."
}

POST http://0.0.0.0:11434/api/embeddings HTTP/1.1
content-type: application/json

{
 "model": "nomic-embed-text",
 "prompt": "Here is an article about llamas..."
}

POST http://0.0.0.0:11434/api/show HTTP/1.1
content-type: application/json

{
 "name": "qwen:0.5b"
}


POST http://0.0.0.0:11434/api/generate HTTP/1.1
content-type: application/json

{
  "model": "qwen:0.5b",
  "prompt": "Here is an article about llamas...",
  "context": [
  ],
  "stream": false,
  "format":"json",
  "options": {
    "seed": 123,
    "temperature": 0
  }  
}

POST http://0.0.0.0:11434/api/chat HTTP/1.1
content-type: application/json

{
  "model": "qwen:0.5b",  
  "stream": false,
  "format":"json",
  "messages": [
    {
      "role": "user",
      "content": "why is the sky blue?"
    }
  ]  
}


## Send a chat message with a conversation history, 同时增加system role设定系统提示词. 
POST http://0.0.0.0:11434/api/chat HTTP/1.1
content-type: application/json

{
  "model": "qwen:1.8b",  
  "stream": false,
  "format":"json",
  "messages": [
    {
      "role": "system",
      "content": "以海盗的口吻简单作答, 以中文回复"
    },    
    {
      "role": "user",
      "content": "why is the sky blue?"
    },
    {
      "role": "assistant",
      "content": "due to rayleigh scattering."
    },
    {
      "role": "user",
      "content": "请解释一下光的折射?"
    }
  ]  
}

标签：初体验,HTTP,1.1,0.0,content,ollama,11434
From： https://www.cnblogs.com/harrychinese/p/18114562

如何在本地使用Ollama运行开源LLMs
本文将指导您下载并使用Ollama，在您的本地设备上与开源大型语言模型（LLMs）进行交互的强大工具。与像ChatGPT这样的闭源模型不同，Ollama提供透明度和定制性，使其成为开发人员和爱好者的宝贵资源。我们将探索如何下载Ollama并与两个令人兴奋的开源LLM模型进行交互：Meta的基于文本的模型L......
InternLM2 Demo初体验-书生浦语大模型实战营学习笔记2
本文包括第二期实战营的第2课内容。本来是想给官方教程做做补充的，没想到官方教程的质量还是相当高的，跟着一步一步做基本上没啥坑。所以这篇笔记主要是拆解一下InternStudio封装的一些东西，防止在本地复现时出现各种问题。搭建环境首先是搭建环境这里，官方教程说：进入开发机后，在`t......
Elasticsearch：使用在本地计算机上运行的 LLM 以及 Ollama 和 Langchain 构建 RAG 应用
无需GPU的隐私保护LLM。在本博客中，我将演示使用不同的工具Ollama构建的RAG应用程序。与本文相关的所有源代码均已发布在github上。请克隆存储库以跟随文章操作。我们可以通过如下的方式来克隆：gitclonehttps://github.com/liu-xiao-guo/ollama_es什么是 Ollam......
langchain Chatchat 学习实践（二）——实现对Ollama的支持
1、采用Langchain的Ollama库，新建get_BaseChatModel方法，按照名称返回ChatOllama或ChatOpenAI实例;2、在model_config.py.example中添加了ollama相关配置,用于设置ollama模型名称和ollama部署发布地址;3、在chat.py,knowledge_base_chat.py,file_chat.py,search_engine_chat.py,ag......
【ai技术】（3）：树莓派4，成功安装ollama软件，内存4G，推荐使用命令行界面安装，使用raspi-config
1，关于raspberrypi4项目https://www.bilibili.com/video/BV1K2421P71h/【ai技术】（3）：树莓派4，成功安装ollama软件，内存4G，安装命令行版本，使用raspi-config配置wifi，速度9t/s2，下载raspberrypi镜像项目地址：https://www.raspberrypi.com/software/operating-systems/#r......
Ollama、Langchain相关学习资源（动态更新）
大型预训练模型如GPT系列、BERT系列等，在消费级产品和垂直行业应用中加快了部署步伐，包括但不限于智能客服、内容创作、代码生成、决策支持等领域。随着大模型开源，相关的部署工具和框架也得到发展和完善。例如，出现了一些专门针对大模型本地部署的解决方案，像Ollama（虽然该名......
Spring MVC初体验
使用maven框架构建SpringMVC项目，工具idea2023.2，jdk17，tomcat10。（之前使用tomcat9，与jdk17不兼容导致项目失败。在这个过程中失败很多次，有各种各样的原因，分别找到原因解决。）参考之前一篇文章SpringBootWeb项目整合jsp页面访问(非web项目改为web项目适用)。项目结构：......
java初体验———数组篇
在编程的世界里，数组无疑是最基础且重要的一种数据结构。经过这段时间对数组的学习，我对其有了更深刻的理解和认识，也从中体会到了编程的魅力和乐趣。数组的学习让我感受到了数据结构的魅力。数组作为一种线性数据结构，它的有序性和可索引性使得数据存储和......
OceanBase初体验之查看OceanBase的执行计划
前置条件包含obd和obclient的中控机OceanBase测试集群独立的测试租户BenchmarkSQL工具（可选）为了能够方面的查看复杂SQL的执行计划，我们先用TPCC模拟一些数据库负载。模拟数据库负载obd里面已经集成了tpcc测试工具，需要联网更新一下插件即可。如果机器不具备外网环境，需要提......
OceanBase初体验之从MySQL迁移数据到OceanBase集群
前置条件MySQL环境OceanBase环境测试用的表结构和一些数据先在源端MySQL用如下脚本创建测试表，以及写入10000条数据用于迁移测试。usetest;CREATETABLEstudents(`id`intNOTNULLPRIMARYKEY,`name`varchar(255),`code`varchar(20),`class`varch......

ollama 初体验

参考

Windows 设置环境变量

下载并安装 ollama windows版本

下载模型

ollama API 示例

相关文章

赞助商

阅读排行