大模型备案过程讲解

标签：模型安全讲解标注语料评估备案

以下是一般情况下大模型备案的大致过程讲解（不同地区和具体要求可能存在差异和细化等情况）：

一、备案前准备

了解法规和政策

熟悉《生成式人工智能服务管理暂行办法》《互联网信息服务深度合成管理规定》等相关法律法规对大模型备案的要求和规定。
明确备案的主管部门（通常是网信部门等）。

自我评估和准备材料

语料安全评估1：
- 评估文本训练语料规模（存储大小、词元计数等）。
- 明确各类型语料规模（不同语言文本、代码、多媒体等）。
- 梳理训练语料来源（开源、自采、商业等分类及来源地等）。
- 统计语料标注数量（文本和图片标注等）。
- 明确标注人员情况（数量、类型、培训等）。
- 制定和检查标注规则（是否符合相关办法要求）。
- 核验标注内容准确性。
- 分析语料合法性（有无侵权、违法违规信息等）。
模型安全评估1：
- 语料内容评估（人工、关键词、分类模型抽检及合格率等）。
- 生成内容评估（类似抽检及合格率等）。
- 涉知识产权、商业秘密等方面的评估（方法、标准、结果）。
- 涉民族、信仰、性别等方面的评估。
- 涉透明性、准确性、可靠性等的评估。
安全措施评估1：
- 明确模型适用人群（如是否适用未成年人等）、场合（关键信息基础设施等相关敏感场合）、用途（限定领域与否）。
- 梳理服务过程中收集保存个人信息情况（类型、数量、用途、保存期限）。
- 确定收集个人信息征得个人同意情况（方式）。
- 明确受理处理使用者查阅、复制、更正、补充、删除个人信息请求的情况（条件和途径方法）。
- 规划好图片、视频标识情况（样式、位置、频度等）。
- 建立接受公众或使用者投诉举报情况（途径及反馈方式）。
- 完善服务协议（将上述多方面内容写入）。
- 建立非法内容拦截措施（监看人员数量、预置关键词拦截列表、分类模型检测及准确性等）。
- 统计拒答率（拒绝回答等数量占比）。
- 规划模型更新、升级条件（如发现频繁非法等情况时）。

材料准备（以下是常见材料举例）3：

《算法备案承诺书》。
《落实算法安全主体责任基本情况》。
《算法安全自评估报告》（较复杂且重要，100页左右，包含附录各种证明材料等；需明确算法原理和逻辑、数据来源合规性、算法透明度和可解释性、安全漏洞检测与应对等）。
《拟公示内容》。
大模型上线备案表：
- 基本情况：模型名称、主要功能、适用人群、服务范围等。
- 模型研制：模型备案情况、训练算力资源（自研模型）、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等。
- 服务与安全防范：推理算力资源、服务方式及对象等、非法内容拦截措施、模型更新升级信息等。
- 安全评估：基本情况、评估情况。
- 自愿承诺：承诺所填信息真实性，并签字确认。
- 附件及备注：附件包括安全评估报告、模型服务协议、语料标注规则、拦截关键词列表、评估测试题。
安全评估报告（涵盖语料安全评估、模型安全评估以及安全措施评估，并形成整体评估结论）。
模型服务协议（包含产品及服务的各项规则及隐私条款等，需协同法务共同制定提交）。
语料标注规则（包括标注团队介绍、功能性及安全性标注细则，标注流程等）。
拦截关键词列表（总规模不宜少于10000个，应至少覆盖《生成式人工智能服务安全基本要求》a.1以及a.2中17种安全风险，a.1中每一种安全风险的关键词均不宜少于200个，a.2中每一种安全风险的关键词均不宜少于100个）。
10.评估测试题集：
- 包括生成内容测试题库、拒答内容测试题库、非拒答测试题库。
- 测试题分类满足《生成式人工智能服务安全基本要求》中相关的风险类型，并有最小的数量要求。
- 测试题建议是“问题”(包含主谓宾)，不可只是短词、长文章。
- 生成内容测试题库中建议明确标记出哪些问题是需要拒答的、哪些是需要回答的。

二、备案流程

向属地网信办提交备案申请：
通常在官方备案平台提交备案表、安全评估报告、服务协议、标注规则、关键词库等材料（如果有线上系统的话），目前大模型备案都是线下申请。
申请通过后会给到你相关资料。拿到资料后根据自己企业的具体情况撰写资料。
再去网信办预约审核

审核材料的完整性、准确性等。
可能进行技术测试（如对提交的模型进行安全测试，测试内容包括敏感词检测、涉政内容的生成等 2）。

反馈和整改
如果审核过程中发现问题，备案主体会收到反馈要求在规定时间内进行整改。整改内容可能包括补充材料、调整模型安全策略等。
审核通过

若材料审核和技术测试等都通过，属地上报中央网信办3。
中央网信办进行材料复审及技术评审，通过后企业获得备案号3。

三、备案后

持续管理和监控

建立内容监控体系，对关键词分级管理、制定内容撤回策略等2。
进行账号运营管理，如定期检查账号、制定账号违规处置策略等2。
在重要节假日、重大事件期间做好内容安全保障等。

配合检查和更新备案

主管部门可能会不定期检查备案后的落实情况。
如果大模型有重大升级、服务范围变更等情况，可能需要重新备案或更新备案信息。

需要注意的是，整个备案过程可能需要一定时间（如大模型备案周期按批次审核通过，一般一个半月至两个月左右一批2），并且备案要求和流程处于动态调整和完善中。

标签：模型,安全,讲解,标注,语料,评估,备案
From： https://blog.csdn.net/juzhi14plus/article/details/141129410

相关文章

赞助商

阅读排行