首页 > 其他分享 >智能工作流:Spring AI高效批量化提示访问方案

智能工作流:Spring AI高效批量化提示访问方案

时间:2024-05-11 21:19:04浏览次数:12  
标签:task 请求 批量 AI Spring 提示 线程 user

基于SpringAI搭建系统,依靠线程池\负载均衡等技术进行请求优化,用于解决科研&开发过程中对GPT接口进行批量化接口请求中出现的问题。

github地址:https://github.com/linkcao/springai-wave

大语言模型接口以OpenAI的GPT 3.5为例,JDK版本为17,其他依赖版本可见仓库pom.xml

拟解决的问题

在处理大量提示文本时,存在以下挑战:

  1. API密钥请求限制: 大部分AI服务提供商对API密钥的请求次数有限制,单个密钥每分钟只能发送有限数量的请求。
  2. 处理速度慢: 大量的提示文本需要逐条发送请求,处理速度较慢,影响效率。
  3. 结果保存和分析困难: 处理完成的结果需要保存到本地数据库中,并进行后续的数据分析,但这一过程相对复杂。

解决方案

为了解决上述问题,本文提出了一种基于Spring框架的批量化提示访问方案,如下图所示:

image-20240511160521257

其中具体包括以下步骤:

  1. 多线程处理提示文本: 将每个提示文本看作一个独立的任务,采用线程池的方式进行多线程处理,提高处理效率。
  2. 动态分配API密钥: 在线程池初始化时,通过读取本地数据库中存储的API密钥信息,动态分配每个线程单元所携带的密钥,实现负载均衡。
  3. 结果保存和管理: 在请求完成后,将每个请求的问题和回答保存到本地数据库中,以便后续的数据分析和管理。
  4. 状态实时更新: 将整个批量请求任务区分为进行中、失败和完成状态,并通过数据库保存状态码实时更新任务状态,方便监控和管理。

关键代码示例

  1. 多线程异步请求提示信息(所在包: ChatService)
    // 线程池初始化
	private static final ExecutorService executor = Executors.newFixedThreadPool(10);
    /**
     * 多线程请求提示
     * @param prompts
     * @param user
     * @param task
     * @return
     */
    @Async
    public CompletableFuture<Void> processPrompts(List<String> prompts, Users user, Task task) {
        for (int i = 0; i < prompts.size();i++) {
            int finalI = i;
            // 提交任务
            executor.submit(() -> processPrompt(prompts.get(finalI), user, finalI));
        }
        // 设置批量任务状态
        task.setStatus(TaskStatus.COMPLETED);
        taskService.setTask(task);
        return CompletableFuture.completedFuture(null);
    }
  • 如上所示,利用了Spring框架的@Async注解和线程池的功能,实现了多线程异步处理提示信息。

  • 首先,使用了ExecutorService创建了一个固定大小的线程池,以便同时处理多个提示文本。

  • 然后,通过CompletableFuture来实现异步任务的管理。

  • 在处理每个提示文本时,通过executor.submit()方法提交一个任务给线程池,让线程池来处理。

  • 处理完成后,将批量任务的状态设置为已完成,并更新任务状态。

  • 一个线程任务需要绑定请求的用户以及所在的批量任务,当前任务所分配的key由任务所在队列的下标决定。

  1. 处理单条提示信息(所在包: ChatService)
    /**
     * 处理单条提示文本
     * @param prompt 提示文本
     * @param user 用户
     * @param index 所在队列下标
     */
    public void processPrompt(String prompt, Users user, int index) {
        // 获取Api Key
        OpenAiApi openAiApi = getApiByIndex(user, index);
        assert openAiApi != null;
        ChatClient client = new OpenAiChatClient(openAiApi);
        // 提示文本请求
        String response = client.call(prompt);
        // 日志记录
        log.info("提示信息" + prompt );
        log.info("输出" + response );
        // 回答保存数据库
        saveQuestionAndAnswer(user, prompt, response);
    }
  • 首先根据任务队列的下标获取对应的API密钥
  • 然后利用该密钥创建一个与AI服务进行通信的客户端。
  • 接着,使用客户端发送提示文本请求,并获取AI模型的回答。
  • 最后,将问题和回答保存到本地数据库和日志中,以便后续的数据分析和管理。
  1. Api Key 负载均衡(所在包: ChatService)
    /**
     * 采用任务下标分配key的方式进行负载均衡
     * @param index 任务下标
     * @return OpenAiApi
     */
    private OpenAiApi getApiByIndex(int index){
        List<KeyInfo> keyInfoList = keyRepository.findAll();
        if (keyInfoList.isEmpty()) {
            return null;
        }
        // 根据任务队列下标分配 Key
        KeyInfo keyInfo = keyInfoList.get(index % keyInfoList.size());
        return new OpenAiApi(keyInfo.getApi(),keyInfo.getKeyValue());
    }
  • 首先从本地数据库中获取所有可用的API密钥信息
  • 然后根据任务队列的下标来动态分配API密钥。
  • 确保每个线程单元都携带了不同的API密钥,避免了因为某个密钥请求次数达到限制而导致的请求失败问题。
  1. 依靠线程池批量请求GPT整体方法(所在包: ChatController)
/**
     * 依靠线程池批量请求GPT
     * @param promptFile 传入的批量提示文件,每一行为一个提示语句
     * @param username 调用的用户
     * @return 处理状态
     */
    @PostMapping("/batch")
    public String batchPrompt(MultipartFile promptFile, String username){
        if (promptFile.isEmpty()) {
            return "上传的文件为空";
        }
        // 批量请求任务
        Task task = new Task();
        try {
            BufferedReader reader = new BufferedReader(new InputStreamReader(promptFile.getInputStream()));
            List<String> prompts = new ArrayList<>();
            String line;
            while ((line = reader.readLine()) != null) {
                prompts.add(line);
            }
            // 用户信息请求
            Users user = userService.findByUsername(username);
            // 任务状态设置
            task.setFileName(promptFile.getName());
            task.setStartTime(LocalDateTime.now());
            task.setUserId(user.getUserId());
            task.setStatus(TaskStatus.PROCESSING);
            // 线程池处理
            chatService.processPrompts(prompts, user, task);
            return "文件上传成功,已开始批量处理提示";
        } catch ( IOException e) {
            // 处理失败
            e.printStackTrace();
            task.setStatus(TaskStatus.FAILED);
            return "上传文件时出错:" + e.getMessage();
        } finally {
            // 任务状态保存
            taskService.setTask(task);
        }
    }
  • 首先,接收用户上传的批量提示文件和用户名信息。
  • 然后,读取文件中的每一行提示文本,并将它们存储在一个列表中。
  • 接着,根据用户名信息找到对应的用户,并创建一个任务对象来跟踪批量处理的状态。
  • 最后,调用ChatService中的processPrompts()方法来处理提示文本,并返回处理状态给用户。

数据库ER图

所有信息都与用户ID强绑定,便于管理和查询,ER图如下所示:

image-20240511165330676

演示示例

  1. 通过postman携带批量请求文件username信息进行Post请求访问localhost:8080/batch接口:

image-20240511165636797

  1. 在实际应用中,可以根据具体需求对提示文本进行定制和扩展,以满足不同场景下的需求,演示所携带的请求文件内容如下:
请回答1+2=?
请回答8*12=?
请回答12*9=?
请回答321-12=?
请回答12/4=?
请回答32%2=?
  1. 最终返回的数据库结果,左为问题库,右为回答库:

image-20240511165910247

  • 问题库和答案库通过question_iduser_id进行绑定,由于一个问题可以让GPT回答多次,因此两者的关系为多对一,将问题和答案分在两个独立的表中也便于后续的垂域定制和扩展。

标签:task,请求,批量,AI,Spring,提示,线程,user
From: https://www.cnblogs.com/linkcxt/p/18187163

相关文章

  • Spring MVC执行流程
    视图执行流程用户发送出请求到前端控制器DispatcherServlet。DispatcherServlet收到请求调用HandlerMapping(处理器映射器)。HandlerMapping找到具体的处理器,生成处理器对象及处理器拦截器(如果有),再一起返回给DispatcherServlet。DispatcherServlet调用HandlerAdapter(处理......
  • mysql使用group by查询报错SELECT list is not in GROUP BY clause and contains nona
    官方解释:ONLY_FULL_GROUP_BY是MySQL数据库提供的一个sql_mode,通过这个sql_mode来保证,SQL语句“分组求最值”合法性的检查.这种模式采用了与Oracle、DB2等数据库的处理方式。即不允许selecttargetlist中出现语义不明确的列.对于用到GROUPBY的select语句,查出......
  • Spring bean循环依赖
    Spring循环引用循环依赖其实就是循环引用,也就是两个或两个以上的bean互相持有对方,最终形成闭环。比如A依赖于B,B依赖于A。循环依赖在spring中是允许存在,spring框架依据三级缓存已经解决了大部分的循环依赖。一级缓存:单例池,缓存已经经历了完整的生命周期,已经初始化完成的bean对......
  • 困扰了一天的flask结合智谱ai langchain流式输出json问题终于解决了
    本次对接的大模型是智谱,首先想到去智谱开放平台找找有没有和langchain结合的文档: 结果还真有,就省去了谷歌的时间,但是智谱的文档只提供了非流式的示例代码,想着先拷过来跑一下再说,结果就是非流式是正常输出的,流式就遇到问题了,不管我咋配置,好像只能在控制台输出流失内容,遂去谷歌......
  • Spring bean的生命周期
    Spring的bean的生命周期通过BeanDefinition获取bean的定义信息。调用构造函数实例化bean。bean的依赖注入。@Autowired或者@Value的set方法。处理Aware接囗(BeanNameAware、BeanFactoryAware、ApplicationContextAware)Bean的后置处理器BeanPostProcessor-前置。初始化方......
  • springboot的链路日志
    1.背景在开发银行项目的时候有一个生成项目链路日志的需求。所谓的链路日志就是一个请求会经过多个项目的接口调用,它把这个请求内调用到的所有请求通过全局id串起来,通过全局id可以把所有涉及到的系统日志都快速的定位出来,方便线上出现问题时去排查问题。2.实现......
  • 网易Airtest集群方案大揭秘:小型便携式集群方案来啦
    此文章来源于项目官方公众号:“AirtestProject”版权声明:允许转载,但转载必须保留原链接;请勿用作商业或者非法用途一、前言中小型企业/工作室搭建便携设备集群的制胜法宝是什么?当然非网易Airtest便携式机柜莫属啦。得益于广大企业客户对我们便携式集群的支持,我们团队也一直在坚......
  • springboot使用log4j监控日志发送邮件
    实现log4j发送邮件功能大致流程:1、开启邮箱SMTP服务,获取SMTP登录密码2、引入javax.mail、javax.activation依赖3、配置log4j文件,指定邮件发送方和接收方以及发送方账号密码等4、重写SMTPAppender(不重写也能实现邮件发送功能)开启邮箱SMTP服务这里以qq邮......
  • Shell--批量删除指定目录下,带不同后缀名的文件
    文件根目录在 /home/service/app/sre/*/release 下,*表示一个目录,目录名不固定,文件后缀有多种,如:./data/dict/gc_app/gc_app.i2i*./data/dict/gc_app/gc_app.consociation_appid...脚本:#!/bin/bash#定义要删除的文件根路径base_dir="/home/service/app/sre/"#获取......
  • SciTech-BigDataAIML-TensorFlow-Model的编译:设置(LossFunction+Optimizer+Metrics)与
    机器学习|model.compile()用法model.compile()的作用:为经过设计的Model(神经网络模型)设置好:loss损失函数、optimizer优化器、metrics准确性评价函数。并且进行编译;Optimizers优化器:Optimizer的主要功能是作用在GD(梯度下降)的过程,使得Gradient(梯度)更快(快速......