首页 > 其他分享 >一文学会编写大模型备案安全评估报告「小白也可学会」

一文学会编写大模型备案安全评估报告「小白也可学会」

时间:2024-09-29 13:51:06浏览次数:9  
标签:模型 小白 抽检 编写 备案 语料 数量 评估 标注

 

文章目录

一、语料安全评估

        (一) 评估内容

        (二) 评估结论

二、模型安全评估

三、安全措施评估

四、总体结论

适用于不会大模型备案过程中对大模型备案安全评估报告不会如何编写的业务人员。

*图:大模型备案全套素材文件

一、语料安全评估

(一) 评估内容

  1. 文本训练语料规模

    • 训练语料存储规模:详细说明训练语料按文本格式存储时的总容量。
    • 训练语料数量:统计训练语料中词元(Token)的总数,确保语料的丰富性和多样性。
  2. 各类型语料规模

    • 中文文本、英文文本、代码、图片、音频、视频及其他语料:分类统计各类语料的规模,以确保模型训练的全面性。
  3. 训练语料来源

    • 开源语料、自采语料、商业语料:分析语料来源的组成,确保来源的合法性和多样性。
    • 境外开源网站语料:详细统计境外开源网站提供的各类语料规模。
    • 自采语料:统计企业自行采集的各类语料规模。
    • 商业语料:统计购买的商业语料规模。
  4. 语料标注数量

    • 标注数量:统计文本和图片的标注数量,按标注单元计数。
  5. 标注人员情况

    • 人员数量和类型:统计标注人员的数量和类型,包括内部员工和外包人员。
    • 培训情况:记录标注人员的培训时间、培训数量等,确保标注质量。
  6. 标注规则

    • 规则制定:根据《生成式人工智能服务管理暂行办法》第四条要求,制定详细的标注规则。
  7. 标注内容准确性核验

    • 人工核验比例:统计标注内容准确性的人工核验比例,确保标注的准确性。
  8. 语料合法性

    • 来源合法性:评估语料来源的合法性,确保所有语料均来自合法渠道。
    • 知识产权内容:检查语料中是否含有侵害他人知识产权的内容。
    • 个人信息内容:确保语料中不包含违法违规的个人信息内容。

(二) 评估结论

  1. 合规性评估:判断语料是否符合《生成式人工智能服务管理暂行办法》的相关规定,是否含有违反我国法律法规的内容。
  2. 个人信息评估:统计包含个人信息的语料数量和种类,评估是否符合规定。
  3. 知识产权风险分析:分析因语料产生知识产权纠纷的风险。
  4. 安全风险防范建议:提出防范语料安全风险的措施和建议。

二、模型安全评估

  1. 语料内容评估

    • 人工抽检:说明抽检数量与合格率。
    • 关键词抽检:说明抽检数量与合格率。
    • 分类模型抽检:说明抽检数量与合格率。
  2. 生成内容评估

    • 人工抽检:说明抽检数量与合格率。
    • 关键词抽检:说明抽检数量与合格率。
    • 分类模型抽检:说明抽检数量与合格率。
  3. 涉知识产权、商业秘密的评估

    • 评估方法:详细说明评估方法。
    • 评判标准:列出评判标准。
    • 评估结果:展示评估结果。
  4. 涉民族、信仰、性别等的评估

    • 评估方法:详细说明评估方法。
    • 评判标准:列出评判标准。
    • 评估结果:展示评估结果。
  5. 涉透明性、准确性、可靠性等的评估

    • 评估方法:详细说明评估方法。
    • 评判标准:列出评判标准。
    • 评估结果:展示评估结果。

三、安全措施评估

  1. 模型适用人群、场合、用途

    • 适用人群:明确服务的适用人群,包括未成年人、学生等。
    • 适用场合:明确适用场合,如关键信息基础设施、自动控制、医疗信息服务、心理咨询等。
    • 服务范围:说明服务范围是否限定或未限定特定领域。
  2. 服务过程中收集保存个人信息情况

    • 个人信息类型、数量、用途及保存期限:详细说明服务过程中收集保存的个人信息情况。
  3. 收集个人信息征得个人同意情况

    • 同意方式:说明收集个人信息征得个人同意的方式。
  4. 受理处理使用者请求的情况

    • 条件及途径方法:详细说明受理处理使用者查阅、复制、更正、补充、删除个人信息请求的条件和途径方法。
  5. 图片、视频标识情况

    • 标识样式:描述标识的样式。
    • 位置:说明标识在图片、视频中的具体位置。
    • 频度:描述标识的频度,如每帧、跳帧等。
  6. 接受公众或使用者投诉举报情况

    • 途径及反馈方式:说明接受公众或使用者投诉举报的途径及反馈方式。
  7. 服务协议情况

    • 协议内容:确认上述1至6内容是否已经写入模型服务协议。
  8. 非法内容拦截措施

    • 监看人员数量:统计监看人员的数量。
    • 预置关键词拦截:提供预置关键词拦截列表。
    • 分类模型检测:说明分类模型研制情况和准确性。
  9. 拒答率

    • 拒答数量比率:统计拒绝回答或者以简单模板回答的数量占总测试数量的比率。
  10. 模型更新、升级

    • 重新预训练情况:说明在何种情况下重新进行预训练,如较频繁发现生成非法内容。
    • 所需时间:统计重新预训练所需的时间。
    • 优化训练频度及时间:计划优化训练(fine-tuning)的频度及所需时间。

四、总体结论

  1. 合规性评估:判断是否符合《生成式人工智能服务管理暂行办法》的相关规定。
  2. 主要风险:总结语料、模型、安全措施等方面存在的主要风险。
  3. 安全风险预判及防范措施建议:预判模型上线提供服务后的主要安全风险,并提出防范措施建议。
  4. 处置能力评估:评估如果模型上线提供服务后对用户和社会造成损害,服务提供者是否具备相应处置能力。
  5. 服务上线建议:根据评估结果,提出是否建议上线提供服务的建议。

———————————————————————————————————————————

——+:cybtec

标签:模型,小白,抽检,编写,备案,语料,数量,评估,标注
From: https://blog.csdn.net/cybtecor/article/details/142587236

相关文章

  • PTA 实验三 零基础JAVA语言学习 7-1 复数类的定义 要想编写一个复数类,可以进行复数加
      要想编写一个复数类,可以进行复数加法和减法运算。编写一个包含main方法的类测试该复数类。要求该复数类至少包含一个无参的构造方法和一个带参的构造方法;数据成员包括复数的实部和虚部,为double类型;包括两个方法,分别实现复数的加法和减法运算。测试代码如下:publicsta......
  • Redis小白学习笔记1
    目录这3篇文章是我在学习Redis的过程中,总结的笔记:第一篇Redis学习笔记1-理论篇1,Redis中的数据类型2,Redis的IO模型3,Redis的持久化4,Redis集群原理5,将Redis用作缓存第二篇Redis学习笔记2-性能篇6,Redis高性能的影响因素6.1,Redis内部的阻塞式操作......
  • CTF攻防世界小白刷题自学笔记9
    1.disabled_button,难度:1,方向:Web题目来源:Cyberpeace-n3k0题目描述:X老师今天上课讲了前端知识,然后给了大家一个不能按的按钮,小宁惊奇地发现这个按钮按不下去,到底怎么才能按下去呢?给一下题目链接:攻防世界Web方向新手模式第10题。打开题目场景一看果然有一个不能按的按钮,如图......
  • 一款革命性的AI写作工具——文字游侠AI大模型重大升级,创作效率提高高达20倍,小白也能轻
    在自媒体创作的浪潮中,如何高效地生产高质量内容成为许多创作者的难题。然而,随着AI技术的飞速发展,这一难题得到了完美的解决。今天,我要为大家介绍一款革命性的AI写作工具——文字游侠AI大模型,它不仅能够大幅提高创作效率,还能帮助你轻松实现月入过万的目标。那么,文字游侠AI大模......
  • 《Linux从小白到高手》理论篇(三):vi/vim编辑器和Linux文件处理“三剑客”(sed/grep/awk)
    Listitem本篇介绍vi/vim编辑器和Linux文件处理“三剑客”(sed/grep/awk),这5个工具命令可能是Linux最最常用的,而且功能超级强大。vi/vimvi和vim的基本介绍所有的Linux系统都会内建vi文本编辑器。Vim具有程序编辑的能力,可以看做是Vi的增强版本,可以主动的以字体颜色辨......
  • 细节解析:大模型备案安全评估要求
    ---专业解答:wacyltd唯安创远-----1.语料来源安全与《暂行办法》第七条,服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据这一要求相对应,该《要求》在此基础上,从语料来源管理、语料搭配、可追溯性方面提出了细化要求:(1)语料来源管理方面要求使......
  • 利用表格布局和表单编写简单代码
    利用表格布局编写程序设计“登录界面”代码如下:<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><title>登录界面</title></head><body><form><fieldsetstyle="width:300px;......
  • 【2024版】最简单的Python安装 | Pycharm专业版激活码教程(新手小白都能学会)
    Python环境的安装1.下载安装程序:•打开浏览器,在Python官方网站上可以下载打包好的安装包在这里......
  • 实验1 c语言输入输出和简单程序编写
    任务1:task1.11#include<stdio.h>2345intmain()6{7printf("o\n");8printf("<H>\n");9printf("II\n");10printf("o\n"......
  • 【Qt】编写第一个Qt程序 && 对象树 && 内存泄漏问题探讨
    编写第一个Qt程序1.使用图形化界面生成2.使用代码生成3.对象树3.1什么是对象树3.2验证对象树4.解决编码问题1.使用图形化界面生成创建好一个项目后,我们可以点击widget.ui进入图形化界面设计,可以直接通过拖拽的方式进行添加。通过拖拽的方式进行设计此......