大模型上线备案所需资料
(1)大模型上线备案表,包含以下具体内容:
- 基本情况:模型名称、主要功能、适用人群、服务范围等。
- 模型研制:模型备案情况、训练算力资源(自研模型)、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等。
- 服务与安全防范:推理算力资源、服务方式及对象等、非法内容拦截措施、模型更新升级信息等。
- 安全评估:基本情况、评估情况。
- 自愿承诺:承诺所填信息真实性,并签字确认。
- 附件及备注:附件包括安全评估报告、模型服务协议、语料标注规则、拦截关键词列表、评估测试题。
(2)安全评估报告:提交的报告应包含语料安全评估、模型安全评估以及安全措施评估,并应在评估报告中形成整体评估结论。
(3)模型服务协议:一般包含产品及服务的各项规则及隐私条款等,需协同法务共同制定提交。
(4)语料标注规则:包括标注团队介绍、功能性及安全性标注细则,标注流程等。
(5)拦截关键词列表:总规模不宜少于10000个,应至少覆盖《生成式人工智能服务安全基本要求》A.1以及A.2中17种安全风险,A.1中每一种安全风险的关键词均不宜少于200个,A.2中每一种安全风险的关键词均不宜少于100个。
(6)评估测试题集:
- 该测试题集需要包括生成内容测试题库、拒答内容测试题库、非拒答测试题库。
- 测试题分类满足《生成式人工智能服务安全基本要求》中相关的风险类型,并有最小的数量要求。
- 测试题建议是“问题”(包含主谓宾),不可只是短词、长文章。
- 生成内容测试题库中建议明确标记出哪些问题是需要拒答的、哪些是需要回答的。