Ollama + LangChain: 本地运行LLM大语言模型

时间：2024-10-17 18:00:23浏览次数：7

标签：LLM langchain LangChain llm import Ollama

简介

在大型语言模型（LLM）领域，Ollama和LangChain已经成为开发人员和研究人员的强大工具。Ollama提供了一种无缝本地运行开源LLM的方式，而LangChain提供了将模型灵活集成到应用程序中的框架。本文将介绍如何设置和使用Ollama和LangChain，以便能够在项目中利用LLM的强大功能。

搭建Ollama

安装和配置

要使用Ollama，首先需要在系统上安装它。对于macOS用户，Homebrew简化了这个过程：

brew install ollama
brew services start ollama

安装完成并启动服务之后，Ollama会在11434端口监听http请求。可以在浏览器访问http://localhost:11434/来验证服务是否已经正常开启。下一步拉取要运行的LLM模型。我们这里使用llama3.2进行实验:

ollama pull llama3.2

这个命令将会下载llama3.2模型。

运行模型

可以直接使用命令或HTTP API和本地托管的LLM进行交互。对于命令行交互，Ollama提供了Ollama run <模型名字> 命令。对于HTTP API，可以向Ollama的API端点发送JSON请求：

curl http://localhost:11434/api/generate -d '{
 "model": "llama3.2",
 "prompt":"give me a chinese poem?"
}'

由于这种灵活性，可以将LLM无缝地集成到各种应用程序中。

将Ollama与Langchain整合集成

LangChain是一个旨在促进llm与应用程序集成的框架。它广泛支持包括Ollama在内的各种聊天模型，并为链式(chaining)操作提供了一种表达语言( LangChain Expression Language )。将Ollama和Langchain整合集成需要安装Langchain及其依赖。

可以使用下面的命令直接完成

pip install -U langchain-ollama

(官方文档在：https://python.langchain.com/docs/integrations/llms/ollama 。)

在Langchain中使用Ollama

要在LangChain应用程序中使用Ollama，首先要从langchain_community.llms package导入相应的模块:

from langchain_community.llms import Ollama

然后，初始化一个Ollama模型实例:

llm = Ollama(model="llama3.2")

现在可以调用模型来生成响应。例如:

llm.invoke("Tell me a joke")

这个代码片段演示了如何使用Ollama生成对给定提示的响应。

高级用法

from langchain_community.llms import Ollama

llm = Ollama(model="llama3.2")
llm("The first man on the summit of Mount Everest, the highest peak on Earth, was ...")

LangChain还支持更复杂的操作，比如流式响应和使用提示模板。例如，可以像下面这样对模型的响应进行流处理:

from langchain.callbacks.manager import CallbackManager
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler

llm = Ollama(
    model="mistral", callback_manager=CallbackManager([StreamingStdOutCallbackHandler()])
)
llm("The first man on the summit of Mount Everest, the highest peak on Earth, was ...")

这种方法对于需要与LLMS实时互动的应用特别有用。

使用LangServe部署

对于生产环境，LangChain提供了LangServe。LangServer是简化应用程序运行的部署工具。可以使用LangServe部署LangChain应用程序。

LangServe是LangChain的一个开源库，它使您基于链创建API服务器的过程更容易。LangServe为核心的LangChain表达式语言方法（如invoke、batch和stream）提供远程api。

运行以下命令进行安装:

pip install "langserve[all]"

from typing import List
from fastapi import FastAPI
from langchain.llms import Ollama
from langchain.output_parsers import CommaSeparatedListOutputParser
from langchain.prompts import PromptTemplate
from langserve import add_routes
import uvicorn

llama2 = Ollama(model="llama3.2")
template = PromptTemplate.from_template("Tell me a poem about {topic}.")
chain = template | llama2 | CommaSeparatedListOutputParser()

app = FastAPI(title="LangChain", version="1.0", description="The first server ever!")
add_routes(app, chain, path="/chain")

if __name__ == "__main__":
    uvicorn.run(app, host="localhost", port=8000)

运行上面的代码

然后浏览器访问http://localhost:9001/chain/playground/：

（有可能出现langchain-community缺失，可以pip install langchain-community安装）

结语

通过集成Ollama和LangChain，开发人员可以在不需要外部api的情况下利用llm的功能。这种方案不仅节省了成本，而且允许更灵活的定制。无论是构建聊天机器人、内容生成工具还是交互式应用程序，Ollama和LangChain都提供了将llm引入其中所需的工具。

标签：LLM,langchain,LangChain,llm,import,Ollama
From： https://www.cnblogs.com/taceywong/p/18472825

大模型（LLM）最新研究论文介绍（合集）
目录\1.CTRLA:通过探针引导控制的自适应检索增强生成\2.压缩大型语言模型：使用低秩和低精度分解方法\3.通过LLM知识转移增强零样本面部表情识别\4.大型语言模型（LLMs）：部署、代币经济学与可持续性\5.审视大型语言模型提示策略以自动评估学习者创建的计算成果———......
langchain multi modal support
Howtopassmultimodaldatadirectlytomodelshttps://python.langchain.com/v0.2/docs/how_to/multimodal_inputs/ message=HumanMessage(content=[{"type":"text","text":"describetheweatherinthisimag......
UCB CS194/294-196 (LLM Agents) Lecture 4 (2024.10.1)
预备知识英文缩写&术语英语简中补充LargeLanguageModel(LLM)大语言模型ArtificialGeneralIntelligence(AGI)通用人工智能一个远大的目标Agent智能体/代理Embody具身Multi-AgentSystem(MAS)多智能体系统Token文本分割后得到的最小语义单位Prompt提示词我们向AI提出的......
代码随想录训练营第64天|bellman_ford
47.参加科学大会#include<iostream>#include<vector>#include<list>#include<queue>#include<climits>usingnamespacestd;//小顶堆classmycomparison{public:booloperator()(constpair<int,int>&lhs,constpai......
27K star！有没有显卡都能搞，Langchain-Chatchat 快速基于LLM构建本地智能知识库
觉得搞一个AI的智能问答知识库很难吗？那是你没有找对方向和工具，今天我们分享一个开源项目，帮助你快速构建基于Langchain和LLM的本地知识库问答，在GitHub已经获得27Kstar，它就是：Langchain-Chatchat......
外网爆火！仅需Python基础，即可从0构建LLM大语言模型（附PDF）
在当今人工智能技术飞速发展的时代，大型语言模型（LLM）作为聊天机器人、文本生成和理解等应用的核心，已经成为研究和商业领域关注的焦点。但对于大多数开发者来说，它们的工作原理仍然是一个黑箱，更不用说如何从头开始构建一个这样的模型了。而《从头开始构建大型语言模型》这本书，......
vLLM 推理引擎性能分析基准测试
文章目录分析步骤案例案例描述测试数据集原始数据〇轮测试（enable-64）一轮测试（enable-128）二轮测试（enable-256）三轮测试（enable-512）四轮测试（enable-2048）五轮测试（enable-4096）六轮测试（enable-8192）七轮测试（disable-256）八轮测试（disable-512）九轮测试（disable-2048）十轮测试（disable-4......
使用LLaMA-Factory训练LLM大模型并用ollama调用
环境搭建系统环境需要Nvidia显卡，至少8G显存，且专用显存与共享显存之和大于20G建议将非安装版的环境文件都放到非系统盘，方便重装或移植以Windows11为例，非安装环境文件都放在E盘下设置自定义Path文件夹创建E:\mypath文件夹，将其添加进用户环境变量Path中，之后会用CMake下载......
Bocha Web Search API：使用Langchain的Agent模式通过Tool Use调用博查 Search API实现L
上篇文章介绍了国内可用的博查WebSearchAPI，详见：使用博查WebSearchAPI获取搜索引擎的网页链接和文本摘要，给AI/RAG应用增加联网搜索功能本篇讲述一下如何通过LangChain的FunctionCall方式使用它。1.安装LangChainpipinstalllangchainopenai2.获取博查......
LangServe如何革新LLM应用部署？
0前言随LLM技术演进，AI应用开发部署越来越复杂。LangServe应运而生，旨在简化AI服务部署和运维的框架。专为LLM部署和管理而设计；本文旨在讲解LangServe的功能特点和实践运用。1概述LangServe提供一整套将LLM部署成产品服务的解决方案。可将LLM应用链接入常见PythonWeb框架（如Fa......