首页 > 其他分享 >Springboot 使用langchain4j 访问qwen2:7b模型

Springboot 使用langchain4j 访问qwen2:7b模型

时间:2024-10-25 11:43:12浏览次数:1  
标签:langchain4j 7b qwen2 模型 dev version ollama String

一、模型部署

  1、官网下载Ollama:https://ollama.com,选择自己系统对应的安装包进行下载安装

 

  2、配置模型下载路径

    1、一般默认情况安装位置: Linux:/var/lib/ollama/models   Windows:C:\Usersx用户名>.o11ama\models

    2、windows 改变下载位置 环境变量--->系统环境变量--->添加变量名OLLMAM_MODELS 变量值:自定义的模型存储位置

        

    3、设置访问端口 添加变量 OLLAMA_HOST 变量值   :11434(默认端口)

        

    4、重启电脑后打开命令行输入 ollama -v 查看 ollama版本。有版本号说明安装成功

    5、部署启动模型,在ollama官网中,点击models,然后搜索qwen2,选择7b

    6、复制启动命令,然后打开命令面板点击粘贴,如果模型不存在将会进行下载,如果存在则直接可以提问

    启动: 

    下载::

    查看: 

  3、Springboot中测试模型

    1、添加依赖(版本根据自己项目来,我这里是 0.33.0

     <dependency>
            <groupId>dev.langchain4j</groupId>
            <artifactId>langchain4j-ollama</artifactId>
            <version>${langchain4j.version}</version>
        </dependency
    <dependency>
            <groupId>dev.langchain4j</groupId>
            <artifactId>langchain4j-core</artifactId>
            <version>${langchain4j.version}</version>
        </dependency>
        <dependency>
            <groupId>dev.langchain4j</groupId>
            <artifactId>langchain4j</artifactId>
            <version>${langchain4j.version}</version>
        </dependency>
        <dependency>
            <groupId>dev.langchain4j</groupId>
            <artifactId>langchain4j-embeddings</artifactId>
            <version>${langchain4j.version}</version>
        </dependency>
        <dependency>

    2、测试

package com.langchain4j;

import dev.langchain4j.model.ollama.OllamaChatModel;
import dev.langchain4j.service.AiServices;
import dev.langchain4j.service.SystemMessage;

import java.time.Duration;

public class OpenAiDemo1 {
    interface Assistant {
        @SystemMessage("请用英语回答")
        String chat(String userMessage);
    }
    static OllamaChatModel qwen = OllamaChatModel.builder()
            .baseUrl("http://127.0.0.1:11434")
            .modelName("qwen2:7b")
            .temperature(0d)
            .timeout(Duration.ofSeconds(30))
            .maxRetries(3)
            .logRequests(true)
            .logResponses(true)
            .build();

    public static void main(String[] args) {
        Assistant assistant = AiServices.create(Assistant.class, qwen);
        String answer = assistant.chat("你好");
        System.out.println(answer);
    }
}

 

标签:langchain4j,7b,qwen2,模型,dev,version,ollama,String
From: https://www.cnblogs.com/liangyy09/p/18502205

相关文章

  • 开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-CPU版本
    一、前言   离线推理能够在模型训练完成后,特别是在处理大规模数据时,利用预先准备好的输入数据进行批量推理,从而显著提高计算效率和响应速度。通过离线推理,可以在不依赖实时计算的情况下,快速生成预测结果,从而优化决策流程和提升用户体验。此外,离线推理还可以降低云计算成本......
  • Qwen2技术报告解读
    论文:https://arxiv.org/pdf/2407.10671摘要本报告介绍了最新的大型语言模型和多模态模型Qwen2系列。该系列包括参数范围从0.5亿到720亿的基础型和指令微调型语言模型,涵盖密集模型和混合专家模型。Qwen2在多个基准测试中表现优异,超越了之前的开源模型,并在语言理解、生成、多语......
  • 使用ollama本地部署qwen2并api调用
    目录一、下载ollama二、安装qwen大模型 三、Api调用四、尝试apifox调用一、下载ollamaOllama是一个开源的、本地运行的AI聊天模型,允许在自己的设备上运行LLM,无需依赖云服务。它支持多种LLM。目前Ollamalibrary已经支持Qwen2,可以直接使用。首先安装ollama,访问官......
  • qwen2.5 ollama推理;openai function call调用中文离线agents使用
    ollama部署qwen2.5:3b0.3.11版本agents使用https://qwen.readthedocs.io/en/latest/framework/function_call.htmlfromopenaiimportOpenAIimportjsondefsend_messages(messages):response=client.chat.completions.create(model="qwen2.5:3b......
  • transformers 推理 Qwen2.5 等大模型技术细节详解(一)transformers 初始化和对象加载(
    上周收到一位网友的私信,希望老牛同学写一篇有关使用transformers框架推理大模型的技术细节的文章。老牛同学刚开始以为这类的文章网上应该会有很多,于是想着百度几篇质量稍高一点的回复这位网友。结果,老牛同学搜索后发现,类似文章确实不少,但是总觉得不太满意,要么细节深度不够,要么......
  • 题解:AT_agc027_b [AGC027B] Garbage Collector
    ProblemLink[AGC027B]GarbageCollector题意原题翻译已经很不错了,这里不再赘述。思路推论:每次取的垃圾数量应尽可能均分。证明如图,假设有\(4\)个垃圾需要被捡起,有两种取法:取一号垃圾+取二三四号垃圾。取一二号垃圾+取二三号垃圾。前者所需能量为:\(\display......
  • openvino 大模型qwen2.5推理案例
    参看:https://github.com/openvinotoolkit/openvino.genai/releases/tag/2024.4.0.0https://github.com/TommyZihao/openvino_tonypi/blob/main/OpenVINO-0911/AIPC%E4%BB%A3%E7%A0%81/%E3%80%90B1%E3%80%91%E4%B8%89%E8%A1%8C%E4%BB%A3%E7%A0%81%E5%BC%80%E5%90%AF%E5%A4%......
  • 阿里云的Qwen2.5-Coder 和 Qwen2.5-Math专有模型怎么样?
    阿里云发布Qwen2.5 系列模型,最新发布的Qwen2.5系列中包括普通的大语言模型(LLM)以及针对编程和数学的专用模型:Qwen2.5-Coder 和 Qwen2.5-Math。包括:Qwen2.5:0.5B、1.5B、3B、7B、14B、32B和72BQwen2.5-Coder:1.5B、7B和32B(即将发布)Qwen2.5-Math:1.5B、7B和72......
  • Qwen2.5-Coder——专门从事代码生成、完成和数学推理任务的 LLM
    1.概述论文地址:https://arxiv.org/pdf/2409.12186源码地址:https://github.com/qwenlm/qwen2.5-coderQwen2.5-Coder是其前身CodeQwen1.5的重大演进,专门设计用于执行代码生成和代码修改等编程相关任务。该系列包括两个型号,参数分别为15亿(15亿)和70亿(70亿)。2.算法......
  • Springboot电子产品购物商城系统go37b(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表用户,产品分类,产品信息,通知公告开题报告内容一、课题研究背景与意义随着互联网技术的飞速发展,电子商务已成为当今商业活动的重要组成部分。电子产品,特别是智......