Springboot 使用langchain4j 访问qwen2:7b模型

时间：2024-10-25 11:43:12浏览次数：7

标签：langchain4j 7b qwen2 模型 dev version ollama String

一、模型部署

　　1、官网下载Ollama:https://ollama.com,选择自己系统对应的安装包进行下载安装

　　2、配置模型下载路径

　　　　1、一般默认情况安装位置: Linux:/var/lib/ollama/models Windows:C:\Usersx用户名>.o11ama\models

　　　　2、windows 改变下载位置环境变量--->系统环境变量--->添加变量名OLLMAM_MODELS 变量值:自定义的模型存储位置

　　　　3、设置访问端口添加变量 OLLAMA_HOST 变量值：11434(默认端口)

　　　　4、重启电脑后打开命令行输入 ollama -v 查看 ollama版本。有版本号说明安装成功

　　　　5、部署启动模型，在ollama官网中，点击models，然后搜索qwen2，选择7b

　　　　6、复制启动命令，然后打开命令面板点击粘贴，如果模型不存在将会进行下载，如果存在则直接可以提问

　　　　启动：

　　　　下载:：

　　　　查看：

　　3、Springboot中测试模型

　　　　1、添加依赖(版本根据自己项目来，我这里是 0.33.0

     <dependency>
            <groupId>dev.langchain4j</groupId>
            <artifactId>langchain4j-ollama</artifactId>
            <version>${langchain4j.version}</version>
        </dependency
    <dependency>
            <groupId>dev.langchain4j</groupId>
            <artifactId>langchain4j-core</artifactId>
            <version>${langchain4j.version}</version>
        </dependency>
        <dependency>
            <groupId>dev.langchain4j</groupId>
            <artifactId>langchain4j</artifactId>
            <version>${langchain4j.version}</version>
        </dependency>
        <dependency>
            <groupId>dev.langchain4j</groupId>
            <artifactId>langchain4j-embeddings</artifactId>
            <version>${langchain4j.version}</version>
        </dependency>
        <dependency>

　　　　2、测试

package com.langchain4j;

import dev.langchain4j.model.ollama.OllamaChatModel;
import dev.langchain4j.service.AiServices;
import dev.langchain4j.service.SystemMessage;

import java.time.Duration;

public class OpenAiDemo1 {
    interface Assistant {
        @SystemMessage("请用英语回答")
        String chat(String userMessage);
    }
    static OllamaChatModel qwen = OllamaChatModel.builder()
            .baseUrl("http://127.0.0.1:11434")
            .modelName("qwen2:7b")
            .temperature(0d)
            .timeout(Duration.ofSeconds(30))
            .maxRetries(3)
            .logRequests(true)
            .logResponses(true)
            .build();

    public static void main(String[] args) {
        Assistant assistant = AiServices.create(Assistant.class, qwen);
        String answer = assistant.chat("你好");
        System.out.println(answer);
    }
}

标签：langchain4j,7b,qwen2,模型,dev,version,ollama,String
From： https://www.cnblogs.com/liangyy09/p/18502205

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-CPU版本
一、前言离线推理能够在模型训练完成后，特别是在处理大规模数据时，利用预先准备好的输入数据进行批量推理，从而显著提高计算效率和响应速度。通过离线推理，可以在不依赖实时计算的情况下，快速生成预测结果，从而优化决策流程和提升用户体验。此外，离线推理还可以降低云计算成本......
Qwen2技术报告解读
论文：https://arxiv.org/pdf/2407.10671摘要本报告介绍了最新的大型语言模型和多模态模型Qwen2系列。该系列包括参数范围从0.5亿到720亿的基础型和指令微调型语言模型，涵盖密集模型和混合专家模型。Qwen2在多个基准测试中表现优异，超越了之前的开源模型，并在语言理解、生成、多语......
使用ollama本地部署qwen2并api调用
目录一、下载ollama二、安装qwen大模型三、Api调用四、尝试apifox调用一、下载ollamaOllama是一个开源的、本地运行的AI聊天模型，允许在自己的设备上运行LLM，无需依赖云服务。它支持多种LLM。目前Ollamalibrary已经支持Qwen2，可以直接使用。首先安装ollama，访问官......
qwen2.5 ollama推理；openai function call调用中文离线agents使用
ollama部署qwen2.5:3b0.3.11版本agents使用https://qwen.readthedocs.io/en/latest/framework/function_call.htmlfromopenaiimportOpenAIimportjsondefsend_messages(messages):response=client.chat.completions.create(model="qwen2.5:3b......
transformers 推理 Qwen2.5 等大模型技术细节详解(一)transformers 初始化和对象加载（
上周收到一位网友的私信，希望老牛同学写一篇有关使用transformers框架推理大模型的技术细节的文章。老牛同学刚开始以为这类的文章网上应该会有很多，于是想着百度几篇质量稍高一点的回复这位网友。结果，老牛同学搜索后发现，类似文章确实不少，但是总觉得不太满意，要么细节深度不够，要么......
题解：AT_agc027_b [AGC027B] Garbage Collector
ProblemLink[AGC027B]GarbageCollector题意原题翻译已经很不错了，这里不再赘述。思路推论：每次取的垃圾数量应尽可能均分。证明如图，假设有\(4\)个垃圾需要被捡起，有两种取法：取一号垃圾+取二三四号垃圾。取一二号垃圾+取二三号垃圾。前者所需能量为：\(\display......
openvino 大模型qwen2.5推理案例
参看：https://github.com/openvinotoolkit/openvino.genai/releases/tag/2024.4.0.0https://github.com/TommyZihao/openvino_tonypi/blob/main/OpenVINO-0911/AIPC%E4%BB%A3%E7%A0%81/%E3%80%90B1%E3%80%91%E4%B8%89%E8%A1%8C%E4%BB%A3%E7%A0%81%E5%BC%80%E5%90%AF%E5%A4%......
阿里云的Qwen2.5-Coder 和 Qwen2.5-Math专有模型怎么样？
阿里云发布Qwen2.5 系列模型，最新发布的Qwen2.5系列中包括普通的大语言模型(LLM)以及针对编程和数学的专用模型：Qwen2.5-Coder 和 Qwen2.5-Math。包括：Qwen2.5:0.5B、1.5B、3B、7B、14B、32B和72BQwen2.5-Coder:1.5B、7B和32B（即将发布）Qwen2.5-Math:1.5B、7B和72......
Qwen2.5-Coder——专门从事代码生成、完成和数学推理任务的 LLM
1.概述论文地址：https://arxiv.org/pdf/2409.12186源码地址：https://github.com/qwenlm/qwen2.5-coderQwen2.5-Coder是其前身CodeQwen1.5的重大演进，专门设计用于执行代码生成和代码修改等编程相关任务。该系列包括两个型号，参数分别为15亿（15亿）和70亿（70亿）。2.算法......
Springboot电子产品购物商城系统go37b（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表用户,产品分类,产品信息,通知公告开题报告内容一、课题研究背景与意义随着互联网技术的飞速发展，电子商务已成为当今商业活动的重要组成部分。电子产品，特别是智......

Springboot 使用langchain4j 访问qwen2:7b模型

一、模型部署

1、官网下载Ollama:https://ollama.com,选择自己系统对应的安装包进行下载安装

2、配置模型下载路径

3、Springboot中测试模型

相关文章

赞助商

阅读排行