首页 > 其他分享 >大模型落地难点之结构化输出

大模型落地难点之结构化输出

时间:2024-08-16 22:57:46浏览次数:7  
标签:难点 结构化 落地 输出 模型 JSON key Schema

应用至上

2023年的世界人工智能大会(WAIC)是“百模大战”,今年WAIC的关键词是“应用至上”。纵观今年论坛热点话题,无论是具身智能还是AI Agent(智能体),都指向以大模型为代表的AI技术在不同场景下的垂直应用。

请添加图片描述

从模型输出看大模型应用的两种范式:

输出非结构化数据:问答机器人,智能客服,或者另一个大模型的上游输入,都属于这种范式。技术架构是(领域)大模型+RAG,对输出格式没有要求。

输出结构化数据:当需要把大模型嵌入到工作流中(尤其是原有的工作流),就需要大模型和原工作组件进行交互,在这种情况下,我们期望大模型的输出是结构化数据(Json)。

如何输出json

我们需要在prompt里面提示大模型,具体的提示词类似于:

Wrap the output in json tags.
The output should be formatted as a JSON instance that conforms to the JSON schema below.
As an example, for the schema {“properties”: {“foo”: {“title”: “Foo”, “description”: “a list of strings”, “type”: “array”, “items”: {“type”: “string”}}}, “required”: [“foo”]}
the object {“foo”: [“bar”, “baz”]} is a well-formatted instance of the schema. The object {“properties”: {“foo”: [“bar”, “baz”]}} is not well-formatted.
Here is the output schema:

OpenAI的json输出

去年的 DevDay 上,OpenAI 引入了JSON Schema,这是一项为开发者量身定做的工具,旨在帮助他们构建更为可靠的应用程序。尽管 JSON Schema 提高了模型生成有效 JSON 输出的准确性,但它并不保证响应能够完全符合特定的 schema 规范。为了克服这一限制,OpenAI 进一步推出了API的结构化输出特性,确保模型的输出能够精确匹配开发者所提供的 JSON Schema。

将非结构化输入转化为结构化数据是大模型(LLMs)的关键应用之一。开发者们利用 OpenAI API 构建出功能强大的智能助手,这些助手能够通过函数调用来获取数据、回答问题、提取结构化数据进行数据录入,以及构建多步骤的代理工作流程,从而让LLMs能够执行实际任务。

过去,开发者们通过使用开源工具、精心设计的提示以及不断尝试不同的请求,来解决LLMs在结构化数据生成方面的局限,确保模型的输出能够与他们的系统无缝对接。

现在,结构化输出功能通过强制模型遵循开发者指定的模式,并通过对模型进行更深入的复杂模式理解训练,有效地解决了这些问题。

Corner/Edge Case

考虑边缘情况的重要性:

边缘情况的考虑是确保系统鲁棒性的关键。在LeetCode等编程挑战中,全面性是区分优秀解决方案与普通方案的分水岭。同样,在将大型模型集成到工作流程中时,我们必须预见并处理所有可能的异常情况。

大型模型的概率本质:

尽管大型模型可能拥有高达99.99%的准确率,但概率论告诉我们,随着运行次数的增加,即使是极小的失败几率也会导致失败的发生。在一万次的运行中,至少有一次失败是不可避免的。

对大型模型输出的期望:

在我们的应用场景中,我们依赖大型模型提供符合预定义JSON Schema的输出。任何与预期不符的返回结果都可能导致工作流程的中断,影响整体的稳定性和效率。

错误的类型:

错误的类型可能多样,我们要主要关注以下几种情况:

  • JSON的合法性问题:非法的JSON结构可能导致解析错误,影响数据的进一步处理;

  • JSON层级问题:大型模型有时可能会在没有明确指示的情况下增加或减少嵌套层级,这会破坏预期的数据结构;

  • JSON key的问题:key的结果不符合约定,或者在value缺失的情况下,相应的key也可能意外地消失;

  • JSON key-value对应错误:当key相似时,可能会出现key-value错配的情况,即value被错误地关联到了错误的key上。

解决方案:

这些情况都有可能让工作流失败,所以一个好的方式是在给出结果前reflection下,保险的方式是做些校验

  • reflection:在模型输出前,我们可以通过reflection的方式,检查模型输出的结构,确保其符合预期的JSON Schema;这种方式适合对时延要求不高的场景;

  • Hard code校验:在模型输出后,我们可以通过校验的方式,检查模型输出的结构,确保其符合预期的JSON Schema;这种方式适合对时延要求较高的场景。

参考

标签:难点,结构化,落地,输出,模型,JSON,key,Schema
From: https://blog.csdn.net/qq_25295605/article/details/141271005

相关文章

  • 实时数仓方案五花八门,实际落地如何选型和构建!(转载)
    原文链接:https://cloud.tencent.com/developer/article/2167527【作者介绍】王磊,阿里云MVP,华院计算技术总监。著有:《图解Spark大数据快速分析实战》;《offer来了:Java面试核心知识点精讲(原理篇)》;《offer来了:Java面试核心知识点精讲(架构篇)》。编辑|韩楠约4,989字|10......
  • Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI
    Xinference实战指南:全面解析LLM大模型部署流程,携手Dify打造高效AI应用实践案例,加速AI项目落地进程XorbitsInference(Xinference)是一个开源平台,用于简化各种AI模型的运行和集成。借助Xinference,您可以使用任何开源LLM、嵌入模型和多模态模型在云端或本地环境中运行推理,并......
  • 宏工科技发力包装领域,解决超细粉料包装难点
    在追求高效、精准与环保并重的现代工业制造中,传统包装方式在面对超细粉料等特殊物料时,往往显得力不从心。宏工科技作为物料处理领域的佼佼者,切入散料自动化包装领域,为行业带来了多款一站式包装解决方案。其中,针对超细粉料等特殊物料包装过程易漏粉、易架桥、包装成本高等问题,推......
  • 设计原则与思想:规范与重构 理论一 - 三 什么情况下要重构?到底重构什么?又该如何重构?有
    理论一:什么情况下要重构?到底重构什么?又该如何重构?重构的目的:为什么要重构(why)?对于项目来言,重构可以保持代码质量持续处于一个可控状态,不至于腐化到无可救药的地步。对于个人而言,重构非常锻炼一个人的代码能力,并且是一件非常有成就感的事情。它是我们学习的经典设计思想......
  • 京粉智能推广助手-LLM based Agent在联盟广告中的应用与落地
    一、前言拥有一个帮你躺着赚钱的助手,听起来是不是有点心动?依托于京东联盟广告平台,借助AIGC大语言模型出色的理解、推理、规划能力,我们推出了京粉智能推广助手机器人,帮助合作伙伴拥有自己的智能助理,为京东联盟的推客提供更加智能的一站式经营服务。1、京东联盟是什么?《京东联盟......
  • 超越流水线,企业研发规范落地新思路
    作者:子丑内容大纲:1、研发规范≠流程约束2、自动化工具→研发规范载体3、研发规范在工具上的落地示例4、研发规范的选型方法与常见实践研发规范≠流程约束这个故事特别适合研发规范的场景,我们要避免成为把猫绑在柱子上的信众。而要做到这一点,我们先要了解什么是研发规范。......
  • 超越流水线,企业研发规范落地新思路
    作者:子丑内容大纲:1、研发规范≠流程约束2、自动化工具→研发规范载体3、研发规范在工具上的落地示例4、研发规范的选型方法与常见实践研发规范≠流程约束这个故事特别适合研发规范的场景,我们要避免成为把猫绑在柱子上的信众。而要做到这一点,我们先要了解什么是研发规范。......
  • 为了给Javaer落地DDD,我们不得不写开源组件
    本文上回书接《这是DDD建模最难的部分(其实很简单)》,欢迎关注我的同名公众号。https://mp.weixin.qq.com/s/HZKMLF0_I10iczzp2mAR-w 故事背景2013年中,我们的Java后端团队为了落地DDD,全面引入了dotnet技术栈,具体过程和成果,可以看我的B站频道《Java8到.NET8,团队升级报告-第......
  • c++的类和对象(中):默认成员函数与运算符重载(重难点!!)
    前言 Hello,小伙伴们,我们今天继续c++的学习,我们上期有介绍到c++的部分特性,以及一些区别于c语言的地方,今天我们将继续深入了解c++的类和对象,探索c++的奥秘。好,废话不多说,开始我们今天的学习。 1.类默认成员函数默认成员函数就是用户没有显示实现,编译器会自动生成的函数称......
  • 为了落地DDD,我是这样“PUA”大家的
    本文书接上回《先有鸡还是先有蛋?这是领域驱动设计落地最大的困局》https://mp.weixin.qq.com/s/lzAZXgchCg_VyLmyo2N18Q 故事背景2023年,我加入了一个全新的团队,担任技术Leader的角色,可以算做是“空降”吧,至今已经一年有余的时间了。到目前为止,团队已经完成了领域驱动设计实......