大模型落地难点之结构化输出

时间：2024-08-16 22:57:46浏览次数：13

标签：难点结构化落地输出模型 JSON key Schema

应用至上

2023年的世界人工智能大会（WAIC）是“百模大战”，今年WAIC的关键词是“应用至上”。纵观今年论坛热点话题，无论是具身智能还是AI Agent（智能体），都指向以大模型为代表的AI技术在不同场景下的垂直应用。

请添加图片描述

从模型输出看大模型应用的两种范式：

输出非结构化数据：问答机器人，智能客服，或者另一个大模型的上游输入，都属于这种范式。技术架构是（领域）大模型+RAG，对输出格式没有要求。

输出结构化数据：当需要把大模型嵌入到工作流中（尤其是原有的工作流），就需要大模型和原工作组件进行交互，在这种情况下，我们期望大模型的输出是结构化数据(Json)。

如何输出json

我们需要在prompt里面提示大模型，具体的提示词类似于：

Wrap the output in json tags.
The output should be formatted as a JSON instance that conforms to the JSON schema below.
As an example, for the schema {“properties”: {“foo”: {“title”: “Foo”, “description”: “a list of strings”, “type”: “array”, “items”: {“type”: “string”}}}, “required”: [“foo”]}
the object {“foo”: [“bar”, “baz”]} is a well-formatted instance of the schema. The object {“properties”: {“foo”: [“bar”, “baz”]}} is not well-formatted.
Here is the output schema:

OpenAI的json输出

去年的 DevDay 上，OpenAI 引入了JSON Schema，这是一项为开发者量身定做的工具，旨在帮助他们构建更为可靠的应用程序。尽管 JSON Schema 提高了模型生成有效 JSON 输出的准确性，但它并不保证响应能够完全符合特定的 schema 规范。为了克服这一限制，OpenAI 进一步推出了API的结构化输出特性，确保模型的输出能够精确匹配开发者所提供的 JSON Schema。

将非结构化输入转化为结构化数据是大模型（LLMs）的关键应用之一。开发者们利用 OpenAI API 构建出功能强大的智能助手，这些助手能够通过函数调用来获取数据、回答问题、提取结构化数据进行数据录入，以及构建多步骤的代理工作流程，从而让LLMs能够执行实际任务。

过去，开发者们通过使用开源工具、精心设计的提示以及不断尝试不同的请求，来解决LLMs在结构化数据生成方面的局限，确保模型的输出能够与他们的系统无缝对接。

现在，结构化输出功能通过强制模型遵循开发者指定的模式，并通过对模型进行更深入的复杂模式理解训练，有效地解决了这些问题。

Corner/Edge Case

考虑边缘情况的重要性：

边缘情况的考虑是确保系统鲁棒性的关键。在LeetCode等编程挑战中，全面性是区分优秀解决方案与普通方案的分水岭。同样，在将大型模型集成到工作流程中时，我们必须预见并处理所有可能的异常情况。

大型模型的概率本质：

尽管大型模型可能拥有高达99.99%的准确率，但概率论告诉我们，随着运行次数的增加，即使是极小的失败几率也会导致失败的发生。在一万次的运行中，至少有一次失败是不可避免的。

对大型模型输出的期望：

在我们的应用场景中，我们依赖大型模型提供符合预定义JSON Schema的输出。任何与预期不符的返回结果都可能导致工作流程的中断，影响整体的稳定性和效率。

错误的类型：

错误的类型可能多样，我们要主要关注以下几种情况：

JSON的合法性问题：非法的JSON结构可能导致解析错误，影响数据的进一步处理；
JSON层级问题：大型模型有时可能会在没有明确指示的情况下增加或减少嵌套层级，这会破坏预期的数据结构；
JSON key的问题：key的结果不符合约定，或者在value缺失的情况下，相应的key也可能意外地消失；
JSON key-value对应错误：当key相似时，可能会出现key-value错配的情况，即value被错误地关联到了错误的key上。

解决方案：

这些情况都有可能让工作流失败，所以一个好的方式是在给出结果前reflection下，保险的方式是做些校验

reflection：在模型输出前，我们可以通过reflection的方式，检查模型输出的结构，确保其符合预期的JSON Schema；这种方式适合对时延要求不高的场景；
Hard code校验：在模型输出后，我们可以通过校验的方式，检查模型输出的结构，确保其符合预期的JSON Schema；这种方式适合对时延要求较高的场景。

参考

[1] GitHub: LLMForEverybody

标签：难点,结构化,落地,输出,模型,JSON,key,Schema
From： https://blog.csdn.net/qq_25295605/article/details/141271005

实时数仓方案五花八门，实际落地如何选型和构建！（转载）
原文链接：https://cloud.tencent.com/developer/article/2167527【作者介绍】王磊，阿里云MVP，华院计算技术总监。著有：《图解Spark大数据快速分析实战》；《offer来了：Java面试核心知识点精讲（原理篇）》；《offer来了：Java面试核心知识点精讲（架构篇）》。编辑|韩楠约4,989字|10......
Xinference实战指南：全面解析LLM大模型部署流程，携手Dify打造高效AI应用实践案例，加速AI
Xinference实战指南：全面解析LLM大模型部署流程，携手Dify打造高效AI应用实践案例，加速AI项目落地进程XorbitsInference(Xinference)是一个开源平台，用于简化各种AI模型的运行和集成。借助Xinference，您可以使用任何开源LLM、嵌入模型和多模态模型在云端或本地环境中运行推理，并......
宏工科技发力包装领域，解决超细粉料包装难点
在追求高效、精准与环保并重的现代工业制造中，传统包装方式在面对超细粉料等特殊物料时，往往显得力不从心。宏工科技作为物料处理领域的佼佼者，切入散料自动化包装领域，为行业带来了多款一站式包装解决方案。其中，针对超细粉料等特殊物料包装过程易漏粉、易架桥、包装成本高等问题，推......
设计原则与思想：规范与重构理论一 - 三什么情况下要重构？到底重构什么？又该如何重构？有
理论一：什么情况下要重构？到底重构什么？又该如何重构？重构的目的：为什么要重构（why）？对于项目来言，重构可以保持代码质量持续处于一个可控状态，不至于腐化到无可救药的地步。对于个人而言，重构非常锻炼一个人的代码能力，并且是一件非常有成就感的事情。它是我们学习的经典设计思想......
京粉智能推广助手-LLM based Agent在联盟广告中的应用与落地
一、前言拥有一个帮你躺着赚钱的助手，听起来是不是有点心动？依托于京东联盟广告平台，借助AIGC大语言模型出色的理解、推理、规划能力，我们推出了京粉智能推广助手机器人，帮助合作伙伴拥有自己的智能助理，为京东联盟的推客提供更加智能的一站式经营服务。1、京东联盟是什么？《京东联盟......
超越流水线，企业研发规范落地新思路
作者：子丑内容大纲：1、研发规范≠流程约束2、自动化工具→研发规范载体3、研发规范在工具上的落地示例4、研发规范的选型方法与常见实践研发规范≠流程约束这个故事特别适合研发规范的场景，我们要避免成为把猫绑在柱子上的信众。而要做到这一点，我们先要了解什么是研发规范。......
超越流水线，企业研发规范落地新思路
作者：子丑内容大纲：1、研发规范≠流程约束2、自动化工具→研发规范载体3、研发规范在工具上的落地示例4、研发规范的选型方法与常见实践研发规范≠流程约束这个故事特别适合研发规范的场景，我们要避免成为把猫绑在柱子上的信众。而要做到这一点，我们先要了解什么是研发规范。......
为了给Javaer落地DDD，我们不得不写开源组件
本文上回书接《这是DDD建模最难的部分（其实很简单）》，欢迎关注我的同名公众号。https://mp.weixin.qq.com/s/HZKMLF0_I10iczzp2mAR-w 故事背景2013年中，我们的Java后端团队为了落地DDD，全面引入了dotnet技术栈，具体过程和成果，可以看我的B站频道《Java8到.NET8，团队升级报告-第......
c++的类和对象（中）：默认成员函数与运算符重载（重难点！！）
前言 Hello,小伙伴们，我们今天继续c++的学习，我们上期有介绍到c++的部分特性，以及一些区别于c语言的地方，今天我们将继续深入了解c++的类和对象，探索c++的奥秘。好，废话不多说，开始我们今天的学习。 1.类默认成员函数默认成员函数就是用户没有显示实现，编译器会自动生成的函数称......
为了落地DDD，我是这样“PUA”大家的
本文书接上回《先有鸡还是先有蛋？这是领域驱动设计落地最大的困局》https://mp.weixin.qq.com/s/lzAZXgchCg_VyLmyo2N18Q 故事背景2023年，我加入了一个全新的团队，担任技术Leader的角色，可以算做是“空降”吧，至今已经一年有余的时间了。到目前为止，团队已经完成了领域驱动设计实......