首页 > 其他分享 >大模型备案安全评估报告编写说明

大模型备案安全评估报告编写说明

时间:2024-11-01 17:20:31浏览次数:5  
标签:文本 模型 抽检 编写 备案 语料 评估 标注

 

一、语料安全评估

(一)评估内容

1.文本训练语料规模

训练语料存储规模,按文本格式存储时的语料大小。

训练语料数量,按词元(Token)计数。

2.各类型语料规模

训练语料中的中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。

3.训练语料来源

训练语料来源的组成情况,按照开源语料、自采语料、商业语料进行分类。

境外开源网站语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。

自采语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。

商业语料内中文文本、英文文本、代码、图片、音频、

视频及其他语料的规模。

4.语料标注数量

语料标注的数量,仅限文本和图片,按标注单元计数,通常按条数、张数。

5.标注人员情况

标注人员的数量,标注人员的类型,通常包括内部、外包。

标注人员培训时间、培训数量等情况。

6.标注规则

按照《生成式人工智能服务管理暂行办法》第四条要求制定的标注规则。

7.标注内容准确性核验

标注内容准确性人工核验比例。

8.语料合法性

语料来源合法性情况。

语料是否包含侵害他人知识产权内容。

语料是否包含违法违规的个人信息内容。

(二)评估结论

评估结论应包括以下内容:

1.语料是否符合《生成式人工智能服务管理暂行办法》相关规定,是否含有违反我国法律法规明确禁止的内容。

2.语料中包含个人信息语料的数量、种类,是否符合《生成式人工智能服务管理暂行办法》规定。

3.因语料产生知识产权纠纷的风险分析。

4.防范语料安全风险的措施和建议。

二、模型安全评估

1.语料内容评估

采用人工抽检,说明抽检数量与合格率。

采用关键词抽检,说明抽检数量与合格率。

采用分类模型抽检,说明抽检数量与合格率。

2.生成内容评估

采用人工抽检,说明抽检数量与合格率。

采用关键词抽检,说明抽检数量与合格率。

采用分类模型抽检,说明抽检数量与合格率。

3.涉知识产权、商业秘密的评估

评估方法、评判标准以及评估结果等。

4.涉民族、信仰、性别等的评估

评估方法、评判标准以及评估结果等。

5.涉透明性、准确性、可靠性等的评估

评估方法、评判标准以及评估结果等。

三、安全措施评估

1.模型适用人群、场合、用途

服务的适用人群,是否适用未成年人、学生等。

适用场合,是否适用关键信息基础设施、自动控制、医疗信息服务、心理咨询等。

服务范围,是否限定或未限定特定领域。

2.服务过程中收集保存个人信息情况

服务过程中收集保存个人信息情况,包括个人信息的类型、数量、用途以及保存期限。

3.收集个人信息征得个人同意情况

收集个人信息征得个人同意的方式。

4.受理处理使用者查阅、复制、更正、补充、删除个人信息请求的情况

受理处理的条件以及途径方法。

5.图片、视频标识情况

标识的样式,按1:1比例贴入。

标识在图片、视频中的具体位置。

标识频度,如每帧、跳帧等。

6.接受公众或使用者投诉举报情况

接受公众或使用者投诉举报的途径及反馈方式。

7.服务协议情况

上述1至6内容是否已经写入模型服务协议。

8.非法内容拦截措施

监看人员的数量。

预置关键词拦截情况,并提供预置关键词拦截列表。

分类模型的检测情况,说明分类模型研制情况和准确性。

9.拒答率

拒绝回答或者以简单模板回答数量占总测试数量的比率。

10.模型更新、升级

在何种情况下重新进行预训练,如较频繁发现生成非法内容。

重新预训练所需的时间。

计划优化训练(fine-tuning)的频度及所需时间。

四、总体结论

生成式人工智能(大语言模型)安全评估的评估结论重点应包括以下内容:

1.是否符合《生成式人工智能服务管理暂行办法》的相关规定。

2.语料、模型、安全措施等方面存在的主要风险。

3.模型上线提供服务后主要安全风险预判及防范措施建议。

4.如果模型上线提供服务后对用户和社会造成损害,服务提供者是否具备相应处置能力。

5.是否建议上线提供服务。

五、备案建议

如果企业能自己做,可以考虑安排产品、算法、法务等团队成员一起完成大模型备案、算法备案,毕竟找代办公司也是一笔几万块的不少的支出费用,如果自己办理有困难,也欢迎站内信、留言交流。

关于我们

+——:cybtec

标签:文本,模型,抽检,编写,备案,语料,评估,标注
From: https://blog.csdn.net/2403_87457919/article/details/143402387

相关文章

  • 想自己完成大模型备案的企业需关注的重点步骤「干货仅供参考」
    文章目录一、什么是大模型备案二、大模型备案主体三、大模型备案流程四、大模型备案所需材料汇总五、大模型备案时间成本对比六、备案建议七、附录大模型备案材料随着人工智能技术的发展,大模型在语音识别、图像处理、自然语言处理等领域应用日益广泛,为进一步保障和监......
  • 【硕士论文完美复现】【价格型需求响应】基于需求侧响应的配电网供电能力综合评估(Pyth
    ......
  • 项目经理如何进行项目绩效评估
    项目经理进行项目绩效评估是通过设定标准、跟踪进度、分析结果和整改措施等步骤完成的。在这个过程中,项目经理需要对各个关键绩效指标(KPIs)进行监控和评价,这样可以确保项目符合既定目标和标准。设定标准是项目绩效评估的基础,它为项目的成功定义了清晰的轨迹。设定标准应该包括具......
  • i2c与从设备通讯编程示例之i2c编写程序
    对于我们ELF 1板卡来说,我们前面看到的i2c-0、i2c-1总线对应着CPU的两个i2c适配器,作为主设备,而总线上挂载的设备作为从设备。如/dev/i2c-1对应的适配器作主设备,其上面挂载的光线传感器就作为从设备。前面我们了解了i2c的通讯协议,也初步用i2c-tools尝试着读写了一个从设备寄存......
  • 第十五章数据管理成熟度评估
    单选题(每题1分,共27道题)1、[单选]下列选项中属于数据管理成熟度2级特征的选项是?A:很少或没有治理;有限的工具集;单个竖井(系统)内定义角色;控件(如果有的话的应用完全不一致);未解决的数据质量问题B:治理开始出现;引入一致的工具集;定义了一些角色和过程;越来越意识到数据质量问题......
  • 基础markdown的编写格式
    所谓的.md文件,实际上就是markdown格式文本。因为在编写readme文档的时候需要使用这个格式进行编写,写devlog的时候也常使用.md转换成.rst格式然后进行编译,所以决定简单学习一下。这里简单整理了一些markdown格式文本常用的格式符号的用法,包括标题,引用,代码块,表格,强调字体,删除下划线......
  • ChatGPT、Python和OpenCV支持下的空天地遥感数据识别与计算(地质监测、城市规划、农业
    在科技飞速发展的时代,遥感数据的精准分析已经成为推动各行业智能决策的关键工具。从无人机监测农田到卫星数据支持气候研究,空天地遥感数据正以前所未有的方式为科研和商业带来深刻变革。原文链接:ChatGPT、Python和OpenCV支持下的空天地遥感数据识别与计算(地质监测、城市规划、......
  • 就业市场变革:AI时代,我们将如何评估人才?
    内容概要在这个充满变革的时代,就业市场正被人工智能(AI)技术深刻改变。随着技术的进步,传统的人才评估方式逐渐显示出其局限性。例如,过去依赖于纸质简历和面试评估的方式在快速变化的环境中难以准确识别真实的人才潜力。在AI的帮助下,企业能够更高效地进行人才评估。借助数据分析......
  • Adobe InCopy 2025 v20.0 (macOS, Windows) - 编写和副本编辑软件
    AdobeInCopy2025v20.0(macOS,Windows)-编写和副本编辑软件Acrobat、AfterEffects、Animate、Audition、Bridge、CharacterAnimator、Dimension、Dreamweaver、Illustrator、InCopy、InDesign、LightroomClassic、MediaEncoder、Photoshop、PremierePro、AdobeXD请......
  • 软件系统设计 - 如何评估代码质量
    先来看看非常知名且经验丰富的程序员是怎么看的在《代码整洁之道》一书中,作者Robert.C.Martin提出一种观念:代码质量与其整洁度成正比。干净的代码,既在质量上较为可靠,也为后期维护、升级奠定了良好基础。提倡通过编写干净的代码,有效地提升代码质量。引出了大师们的关于......