校对：一键修复所有错误

时间：2024-09-25 22:15:13浏览次数：8

标签：修复语法错误模型一键调优 LLM 校对数据 hello

校对是 Gboard 的一项新功能，它使用服务器端大型语言模型(LLM)，只需点击一下就可以提供无缝的句子级和段落级更正，减轻了那些喜欢专注于打字而不是检查已提交单词的快速打字者的痛点。

校对背后的系统由四个部分组成:数据生成、指标设计、模型调优和模型服务。

数据生成过程涉及一个精心设计的错误合成框架，该框架模拟用户输入并确保数据分布接近 Gboard 域。
设计用于衡量模型质量的指标包括基于 llm 的语法错误存在性检查和相同含义检查。
模型调整过程包括监督微调，然后是受 InstructGPT 启发的强化学习(RL)

调整。结果表明，重写任务调优和 RL 调优配方显著提高了基础模型的校对性能。

为了降低服务成本，该功能构建在中型 LLM PaLM2-XS 之上，经过 8 位量化后可以装入单个 TPU v5。通过桶密钥、分段、推测解码等进一步优化时延。

数据合成和模型调优管道

数据集

数据集中的每个项目由一个源句子和几个可能的参考句子组成。数据集准备过程包括以下几个步骤:

从 web 抓取的数据集中采样数据，并使用语法错误纠正 (Grammar Error Correction, GEC)模型对其进行处理，以修复语法错误。

将语法错误合成到源句子中，模拟真实世界的用户输入，包括:

字符遗漏(例如，将“hello”写成“hllo”)
字符插入(例如，将“hello”替换为“hhello”)
换位(例如，将“hello”替换为“hhello”)
双击(例如，将“hello”替换为“heello”)
省略双字符(例如，将“hello”替换为“helo”)
基于高斯的位置错误(例如，将“hello”误认为“jello”)

将合成错误的数据传递给 Gboard 模拟器，使用 Gboard 内置的文字解码、主动密钥校正(KC)和主动自动校正(AC)功能来修复错误。此外，启发式规则被应用于修复以下情况:

Emoji /表情符号对齐
日期时间格式
URL 模式

使用大型语言模型(LLM)过滤噪声数据，并使用精心设计的指令，以避免污染模型。数据根据各种维度进行诊断，包括:

参考句子仍然存在错误
参考句子不够流利或清楚
参考句的意思与源句不同
参考句的语气、语气或时态与源句不同

使用人类评分员标记的部分示例作为评估的黄金集。

合成数据集的一个例子。

指标

给定三个元素，输入(损坏的文本)，答案(从模型中预测的候选人)和目标(基本事实)，我们提出以下指标。

EM /精确匹配率:答案与目标完全相等的比率。
NEM /标准化精确匹配率:忽略大写和标点符号的答案等于目标的比率。
错误率:包含语法错误的答案的比例，由 LLM 在特定的指导下进行。
Diff Meaning Ratio:答案与目标不具有相同含义的比例，这也是由 LLM 在特定指令下进行的。
Good Ratio:没有语法错误且与目标意义相同的答案比例。
差比:答案有语法错误或与目标意义不同的比例。

模型优化

模型调优过程从 PaLM2-XS 模型开始

第一步是在包含数百个文本重写任务的 Rewrite 数据集上对模型进行微调。接下来，在一个合成数据集上对模型进行微调。使用 RLAIF，以及启发式奖励。设计了两种基于大型语言模型(LLM)的可选启发式奖励:

1.全局奖励:LLM 用于确定候选是否是损坏输入的良好修复，使用少量示例。

2.直接奖励:目标是提高 Good Ratio，所以奖励直接从语法错误检查和 diff 意义检查转换而来，两者都依赖于 LLM。示例中包含了 ground truth，并且将奖励组合起来作为最终奖励。

为了优化模型，使用了近端策略优化(PPO)，其中涉及到 KL 散度，以帮助模型保留恢复原始文本的能力。

PaLM2-XS 的指标在 Golden 数据集的各个阶段进行了调优。

【对比 M2 和 M3】虽然在 Rewrite 数据集上进行微调会降低质量，但在

Rewrite 和 Proofread 数据集上进行顺序微调会产生最佳结果，Good ratio 为84.68%，Bad ratio 为 15.32%。

[比较 M3、M4 和 M5]分别采用全局奖励 RL 和直接奖励 RL，PaLm2-XS模型的 Bad ratio 可相对提高 0.56%和 0.88%。
[比较 M5 和 M6] RL 降低了 EM 和 NEM 比率，表明正确和错误情况下的输出分布发生了变化。虽然增加 KL 散度惩罚可以缓解这种情况，但它并没有显著提高好/坏比率。

模型服务

Proofread 模型使用谷歌的 TPUv5e 芯片提供服务，该芯片具有 16GB HBM 和 8

位量化，可以在不影响质量的情况下减少内存占用和延迟。该模型专为在聊天应用程序中部署而设计，这些应用程序的平均句子长度通常很短(少于 20 个单词)。为了处理较长的文档，该模型将文档分割成段落并并行处理。

该方法还结合了针对用户历史模式量身定制的推测解码和启发式起草人模型。使用推测草案处理初始输入，并根据需要使用外部起草人模型。这种方法降低了操作成本，提高了效率。

对该系统进行了实证评估，以 TPU 周期衡量，每个服务请求的中位延迟减少了39.4%。这突出了该系统在实时应用中的效率。

标签：修复,语法错误,模型,一键,调优,LLM,校对,数据,hello
From： https://www.cnblogs.com/little-horse/p/18432358

dllerrorsfix修复失败怎么办？全面解析dllerrorsfix从安装到使用的详细步骤
当您在使用dllerrorsfix工具修复计算机上的DLL错误时遇到“修复失败”的问题，这意味着该工具未能成功解决问题。这可能是因为多种原因造成的，例如系统文件损坏严重、病毒感染或者其他未识别的问题。不过，您不必为此感到沮丧，因为通过一些详细的步骤，您可以从安装到使用全面了解如何......
《刀剑江湖路》游戏启动时闪退弹窗“找不到Common.dll”文件该怎么办？刀剑江湖路游戏崩
在启动《刀剑江湖路》时，出现闪退并弹窗“找不到Common.dll”文件的状况，令人颇为头疼。要解决这个问题，您可以尝试重新安装游戏、检查系统环境，或者从可靠的途径获取该文件并放置到正确目录。本篇将为大家带来《刀剑江湖路》游戏启动时闪退弹窗“找不到Common.dll”文件该怎么办的......
MISC - 第五天( RouterPassView 路由器密码修复工具，steghide文件隐藏工具,多压缩包伪
前言各位师傅大家好，我是qmx_07,今天继续讲解MISC相关知识点荷兰宽带数据泄露下载附件，是一个bin后缀的宽带数据文件，使用RouterPassView工具查看现代路由器都会让用户备份一个配置文件，以便重置恢复数据一般配置文件会包含账户名和密码RouterPassView介绍：用于恢复路......
如何修复英雄联盟常见dll错误，操作系统提示缺少英雄联盟dll文件的有效解决办法
在众多热门游戏中，《英雄联盟》以其精彩的竞技性和丰富的玩法深受玩家喜爱。然而，当玩家准备在召唤师峡谷大显身手时，却可能遭遇因操作系统中缺少DLL文件而导致的游戏无法启动等问题，这无疑令人十分困扰。别担心，下面就为大家介绍一些有效解决操作系统中缺少英雄联盟DLL文件的办......
GZY.Quartz.MUI(基于Quartz的UI可视化操作组件) 2.7.0发布新增各项优化与BUG修复
GZY.Quartz.MUI(基于Quartz的UI可视化操作组件)2.7.0发布新增各项优化与BUG修复前言时隔大半年,终于抽出空来可以更新这个组件了(边缘化了,大概要被裁员了)2.7.0终于发布了~更新内容:1.添加API类任务的超时时间,可以通过全局配置也可以单个任务设置2.设置定时任务日......
代码报错不用愁，CodeGeeX一键完成代码修复、错误解释的功能上线了！
作为一名开发者，你一定遇到过在编写代码时出现的各种错误。这些错误可能是语法错误、运行时错误或者逻辑错误。处理这些错误通常需要花费大量的时间和精力，特别是当你对错误的原因一无所知时。CodeGeeX的v2.7.4版本最新上线的代码修复和错误解释功能，让你在解决代码错误的问题上，......
OPENLDAP部署完整版（Linux）附一键式脚本
（一）环境信息1，系统环境2，域信息(本章节使用)（二）应用部署1，ladp部署1、yum方式安装OpenLDAP服务2、拷贝数据库配置配置文件，并启动服务3、slappasswd生成OpenLDAP管理员密码4、导入基本的模式5、在OpenLDAPDB上配置域信息2，安装phpLDAPadmin实现通过Web管理LDAP服务1，部署httpd2，部署php应......
Flutter：如何修复/删除 .pub-cache 中的所有依赖项
Flutter：如何修复/删除.pub-cache中的所有依赖项作者：坚果华为云享专家，InfoQ签约作者，OpenHarmony布道师，电子发烧友鸿蒙MVP，阿里云专家博主，51CTO博客首席体验官，开源项目GVA成员之一，专注于大前端技术的分享，包括Flutter,小程序,安卓，VUE，JavaScript。如果您正在使用Flutter开发应用......
【ComfyUI工作流】神级AI文生图Flux.1本地一键部署整合包，6G显存NSFW版本
FLUX.1是由BlackForestLabs精心研发的AI图像生成模型，其强大的文本到图像的转换能力，让梦想变得触手可及。然而，FLUX.1模型对硬件的要求极为苛刻，尤其是显存需求高达42GB，这使得大多数普通用户难以直接运行该模型。为了解决这一难题，开发者们推出了FLUX.1GGUF版本。GGUF（GPT-Generated......
为什么会出现vcruntime140_1.dll丢失？无需重装系统，这里有vcruntime140_1.dll丢失最全修
为什么会出现vcruntime140_1.dll丢失？vcruntime140_1.dll是MicrosoftVisualC++RedistributablePackage的一部分，它是许多Windows应用程序正常运行所必需的。当计算机出现vcruntime140_1.dll丢失的问题时，通常是由以下几个原因造成的：安装问题：安装不完整或损坏：某些应用程......

校对：一键修复所有错误

相关文章

赞助商

阅读排行