AI产品商用前必须通过网信办等机构的审批备案,以规范AI发展。备案需区分大模型与算法,重点在于大模型的内容创新性。提交的备案材料应包括安全评估,确保语料来源和内容的安全性。备案流程通常需要4至7个月,选择服务商时需慎重考虑。
一、大模型备案定义:
大模型备案是大型AI模型在公开发布和商业化前,需通过国家互联网信息办公室(网信办)等监管机构的审批程序。该制度旨在规范生成式人工智能服务,确保技术发展与应用的安全、可靠,为公众提供优质智能服务,并为AI产业的可持续发展提供基础。
二、大模型备案与互联网算法备案的区别:
-
互联网算法备案(深度合成):
-
定义:利用深度学习、虚拟现实等技术生成合成文本、图像、音频等网络信息的技术。
-
特点:基于现有数据进行组合、拼接,不生成新内容。
-
适用对象:具有舆论属性或社会动员能力的深度合成服务提供者和技术支持者。、
-
大模型备案(生成式人工智能):
-
定义:具备文本、图片、音频、视频等内容生成能力的模型及相关技术。
-
特点:通过“理解-创作”逻辑,生成新颖内容,具有数据演绎创新的能力。
-
适用对象:提供具有舆论属性或社会动员能力的生成式人工智能服务的企业。
三、大模型备案与算法备案的适用条件:
根据《生成式人工智能服务管理暂行办法》,提供具有舆论属性或社会动员能力的生成式AI服务的企业需进行算法备案和大模型备案。以下情况建议优先进行大模型备案:
-
自主研发或基于开源模型深度定制,且涉及大量训练数据的模型。
-
企业规模较大或模型服务应用广泛。
-
主营业务依赖生成式AI,需进行商业宣传的企业。
-
所在地区提供备案补贴政策的企业。
-
被地方网信办、工业和信息化局等相关部门通知或推荐的企业。
四、不是必须做大模型备案的情况:
-
不从事生成式AI大模型业务的企业。
-
提供的生成式AI服务不具备舆论属性或社会动员能力(如仅限内部使用或服务少数B端客户)。
-
仅调用第三方大模型API接口的情况(需进行算法备案和登记备案)。
在这些情况下,企业通常只需进行算法备案。
五、大模型备案材料清单
《生成式人工智能 (大语言模型)上线备案申请表》
《附件1:安全自评估报告》
《附件2:模型服务协议》
《附件3:语料标注规则》
《附件4:关键词拦截列表》
《附件5:评估测试题集》
六、大模型备案安全评估核心要点剖析
(一)语料安全要求
1. 语料来源安全
与《生成式人工智能服务管理暂行办法》第七条中服务提供者依法开展训练数据处理活动且使用合法来源数据之要求相呼应,本《要求》于语料来源管理、搭配及可追溯性层面提出精细要求:
-
语料来源管理:应采用合法来源语料,并对语料内容质量设定量化标准,如违法不良信息超 5%的语料源不应采集或使用。
-
不同来源语料搭配:需提升语料来源多样性,针对不同语言与类型语料,应综合运用多元来源。例如使用境外语料时,应合理融合境内外语料以保障全面性,利于提升生成内容质量与客观性、多样性。
-
语料来源可追溯:服务提供者需具备合法处理依据,如开源许可协议、授权文件、交易或合作协议等。自采语料(无论是自产或网络采集)需留存详尽采集记录。对于明确禁止采集的语料,如受 robots 协议或其他技术手段限制的网络数据,以及个人拒绝授权采集的信息等,严禁采集。同时,依我国网络安全法规政策阻断的信息不得用作语料。
2. 语料内容安全要求
《暂行办法》第四条与第七条对训练数据“合法”性提出要求,《要求》进而倡导服务提供者运用关键词过滤、分类模型及人工抽检等手段甄别并过滤违法不良语料,并于知识产权与个人信息方面细化要求:
-
知识产权合规:《要求》围绕构建知识产权管理策略、识别侵权风险、完善投诉举报渠道及公开摘要信息等设定多项举措防范侵权。如(2024)粤 0192 民初 113 号案,被告 Tab 网站 AI 绘画模块因底层训练语料含他人版权作品,生成图像与原告授权 IP 形象相似,侵犯权利人知识产权。服务提供者管理语料时需高度审慎,防控潜在风险。
-
个人信息保护:服务提供者应确保个人信息处理行为合法,取得个人信息主体同意或符合法定情形,处理敏感个人信息需获单独同意。
3. 语料标注安全要求
基于《暂行办法》第八条对数据标注的规定,本《要求》于标注人员、规则及内容等维度予以更具体规范:
-
标注人员:
-
安全培训:定期开展标注人员培训,涵盖标注任务规则、工具使用、质量核验及数据安全管理要求等内容。
-
考核机制:考核合格者方具上岗资格,考核内容包括规则理解、工具使用、安全风险判定及数据安全管理能力等,并建立定期再培训考核及资格暂停或取消机制。
-
职能划分:至少划分为数据标注与审核两类,同一标注任务中同一人员不得兼任多职。
-
-
标注规则:标注规则应涵盖标注目标、数据格式、方法及质量指标等,贯穿数据标注与审核环节。功能性标注规则应助力标注人员产出真实、准确、客观、多样的标注语料;安全性标注规则应指导标注人员针对语料及生成内容主要安全风险开展标注。
-
标注内容准确性:功能性标注需对每批语料人工抽检,内容不准确应重新标注,含违法不良信息则作废;安全性标注要求每条语料至少经一名审核人员审核通过。
(二)模型安全要求
1. 模型生成内容安全性
服务提供者需对使用者每次输入信息进行安全监测,引导模型生成积极正向内容,并构建常态化检测测评手段,及时处置安全问题,借助指令微调、强化学习等优化模型。
2. 模型生成内容准确性
服务提供者应运用技术手段提升生成内容的实时性与精准度。如法律咨询场景中,人工智能回答应援引现行有效法规。同时,持续优化校正模型,降低生成内容不准确或虚构情形。
3. 模型生成内容可靠性
服务提供者应采取技术措施优化生成内容格式框架合理性与有效内容含量,增强对使用者的辅助效能。
(三)安全措施要求
1. 模型适用性
服务提供者于服务范畴内应用生成式人工智能服务时,应充分论证模型的必要性、适用性与安全性。应用于关键信息基础设施、医疗信息服务、心理咨询、金融信息服务等重要领域时,需配备适配风险程度的保护措施。面向未成年群体的服务提供者,应设立未成年人保护机制,并遵循相关法律法规,保障未成年人身心健康安全。
2. 服务透明度
以交互界面提供服务的,应于网站首页等显著位置向社会公开服务适用人群、场合、用途等信息及基础模型使用状况;以可编程接口形式提供服务的,应在说明文档中公开上述信息。
3. 用户数据处理
服务提供者应为用户构建便捷途径以关闭输入信息用于模型训练的功能,可通过直观选项或简洁语音指令实现。例如,用户通过选项关闭功能时,从服务主界面至关闭选项操作次数应控制在四次以内。同时,为契合《办法》“透明度”要求,应在界面设计或用户交互中显著告知用户输入信息收集状态,并清晰展示关闭训练信息的选项或指令。
4. 用户管理
依据《办法》第十条与第十四条,服务提供者有责任引导使用者科学理性认知并依法使用生成式人工智能技术,并监督其行为。《要求》提出以下具体措施:
-
实施监测机制:借助关键词筛查或分类模型等手段,实时监测用户输入信息,及时察觉并处理不当行为。
-
拒绝回答机制:对于检测到的含明显偏激或诱导生成违法不良信息的问题,系统自动拒绝回答,防范有害内容传播。
-
人工监看机制:配备专业监看人员,依据监看情况提升生成内容质量与安全性,并处理第三方投诉。
5. 服务稳定性
为保障服务稳定性,《要求》建议服务提供者施行多项安全措施,如隔离训练与推理环境预防数据泄露与不当访问、持续监测模型输入防范恶意攻击(如 DDoS、XSS 与注入攻击)、定期安全审计排查修复安全漏洞,以及构建数据、模型备份机制与恢复策略等。
(四)安全评估要求
为推动生成式人工智能服务提供者切实履行安全评估职责,《要求》细化《暂行办法》规定,即提供具舆论属性或社会动员能力的服务者应依国家规定开展安全评估,并履行算法备案及变更、注销备案手续。服务提供者需对第五章至第八章规定逐条审查,给出“符合”“不符合”或“不适用”评价,据此编制最终评估报告。此外,为确保评估可操作性,《要求》针对语料安全、生成内容安全、问题拒答等设定量化评估标准。
七、大模型备案流程及时间周期概览
当前大模型备案呈现井喷态势,众多符合申请条件的企业纷纷投身其中。整体备案流程预计耗费时长约 4 至 7 个月,据过去成功经验,在理想状况下最快可压缩至4个月。需注意的是,部分中介型服务商因对大模型备案缺乏深入认知,错误地认为其与算法备案可同步获取备案号,此为认知误区。在服务商遴选过程中,建议优先考量以技术服务为核心竞争力的服务商,以保障备案工作的专业性与高效性。
大模型线下备案流程图:
1.向属地网信办报备,获取备案表
备案流程的第一步是向相关网信办提交备案申请,以下是详细的步骤和注意事项:
-
确定备案级别:根据大模型的规模、服务范围和影响,确定是向省级还是市级网信办提交备案申请。
-
准备申请材料:准备完整的备案申请材料,包括但不限于企业资质证明、大模型的详细介绍、安全评估报告、语料标注规则、拦截关键词列表等。
-
提交备案申请:通过网信办指定的渠道或平台提交备案申请,并确保所有提交的信息真实、准确、完整。
-
获取备案表:在提交申请后,网信办会提供大模型上线备案表。这份表格是备案流程的核心,需要详细填写。
-
填写备案表:按照网信办的要求,认真填写备案表中的所有项目,包括大模型的基本情况、研发过程、服务内容、安全措施等。
-
提交备案表:在完成备案表的填写后,再次提交给网信办进行审核。确保提交的备案表内容准确无误,以免影响备案进度。
-
跟进审核进度:在提交备案表后,主动与网信办保持沟通,了解审核进度,及时响应网信办的任何询问或要求。
备案流程是确保大模型合法合规运营的重要环节,需要企业和开发者认真对待,确保每一步都符合网信办的要求。通过顺利完成备案流程,可以为大模型的上线和运营打下坚实的基础。
2.根据表格和评估要点准备材料
在获得备案表之后,企业和开发者需要根据备案表的要求和评估要点,系统地准备相应的材料。以下是准备材料的步骤和注意事项:
技术团队的准备
-
模型描述:提供大模型的技术架构、功能特性、算法原理等详细描述。
-
研发过程:记录模型的研发历程,包括关键的研发决策、技术挑战及解决方案。
-
服务内容:明确模型的服务范围、目标用户群体、预期应用场景等。
法务团队的准备
-
合规性声明:确保所有材料符合相关法律法规,提供合规性声明或证明。
-
服务协议:准备或审查模型服务协议,确保其合法性、公平性和透明度。
-
隐私政策:制定或更新隐私政策,明确用户数据的收集、使用和保护措施。
数据团队的准备
-
数据来源说明:提供数据来源的合法性证明,包括数据购买合同、用户授权书等。
-
数据保护措施:描述数据的加密、脱敏、访问控制等保护措施。
-
数据使用政策:制定数据使用政策,明确数据的用途、存储期限、用户访问权等。
安全团队的准备
-
安全评估报告:准备或更新安全评估报告,包括数据隐私保护、算法偏见识别、有害信息过滤等。
-
应急响应预案:制定详细的应急响应预案,以应对可能的安全事件。
-
安全培训记录:提供团队成员的安全培训记录,证明团队具备必要的安全意识和技能。
跨部门协作
-
协调会议:定期召开跨部门协调会议,确保各部门对备案要求有共同的理解。
-
材料审核:各部门准备的材料需经过内部审核,确保信息的一致性和准确性。
-
反馈整合:收集各部门的反馈,整合到备案材料中,以提高材料的完整性和有效性。
材料提交前的检查
-
完整性检查:确保所有要求的材料都已准备齐全,没有遗漏。
-
准确性验证:对材料中的信息进行核实,确保其真实性和准确性。
-
格式规范:按照网信办的要求,统一材料的格式和模板,确保材料的专业性和规范性。
通过跨部门的紧密合作和细致的准备工作,可以确保备案材料的高质量,从而顺利通过网信办的审核,为大模型的合规上线奠定坚实的基础。
3.企业内部评估,编写材料,准备测试账号
在备案流程中,企业内部的自评估和材料准备是至关重要的环节。以下是详细的步骤和注意事项:
企业内部评估
-
技术评估:技术团队需评估大模型的技术实现,确保其稳定性、性能和可靠性。
-
安全评估:安全团队需对模型进行全面的安全检查,包括数据安全、隐私保护、内容过滤等。
-
合规性评估:法务团队需确保模型符合所有相关的法律法规和行业标准。
-
风险评估:识别和评估潜在的风险点,制定相应的风险缓解措施。
编写材料说明
-
详细说明:为每项材料提供详细的说明,包括其目的、内容、依据和重要性。
-
结构化文档:将材料组织成结构化的文档,便于审核人员理解和评估。
-
附录和引用:在材料中包含必要的附录和引用,以支持材料中的声明和数据。
准备测试账号
-
访问权限:为审核人员准备测试账号,确保他们能够访问模型的关键功能和数据。
-
操作手册:提供操作手册或指南,指导审核人员如何使用测试账号进行验证。
-
技术支持:确保在测试期间有技术支持团队随时待命,以解决可能出现的技术问题。
材料和测试的准备
-
内部审核:在提交给网信办之前,进行内部审核,确保所有材料和测试账号都符合要求。
-
模拟测试:进行模拟测试,以确保测试账号在实际审核过程中能够正常工作。
-
反馈机制:建立反馈机制,收集审核人员的反馈,并及时进行调整和优化。
材料提交前的最终检查
-
一致性检查:确保所有材料之间的信息一致,没有矛盾之处。
-
格式和语言:检查材料的格式和语言,确保其专业性和可读性。
-
最终确认:在提交前进行最终确认,确保所有准备工作都已就绪。
通过这些步骤,企业可以确保大模型在技术、安全、合规等方面均达到备案要求,同时为审核人员提供必要的材料和测试账号,以便他们能够全面、准确地评估模型的性能和安全性。
4.提交材料和测试账号给属地网信办审核
在完成材料准备和测试账号设置之后,企业和开发者需要将这些材料正式提交给属地网信办进行审核。以下是提交材料和测试账号的步骤和注意事项:
提交前的准备
-
材料整理:确保所有材料都已齐全,包括但不限于备案表、安全评估报告、服务协议、语料标注规则、拦截关键词列表等。
-
电子化提交:根据网信办的要求,将所有材料转换为电子格式,如PDF或Word文档,并确保文件的可读性和完整性。
-
测试账号设置:确保测试账号的安全性和访问权限设置正确,以便审核人员可以顺利进行测试。
提交材料
-
正式提交:通过网信办指定的渠道或平台提交所有材料和测试账号信息。
-
提交确认:在提交后,获取网信办的确认回复,以确保材料已被正确接收。
审核期间的沟通
-
保持联系:在审核期间,保持与网信办的沟通渠道畅通,以便及时响应任何询问或要求。
-
问题回应:对于审核人员提出的问题,应迅速、准确地提供必要的信息和解释。
-
反馈处理:对于审核过程中的反馈,应及时进行评估,并根据需要调整材料或测试账号的设置。
审核结果的跟进
-
结果查询:在预计的审核周期结束后,主动查询审核结果。
-
后续行动:如果审核通过,按照网信办的指示进行后续的备案流程;如果审核未通过,根据反馈进行必要的修改和补充。
记录和文档管理
-
记录保存:保存所有提交材料的记录和网信办的沟通记录,以备后续参考。
-
文档更新:根据审核结果更新内部文档和材料,确保所有信息的准确性和最新性。
通过这些步骤,企业和开发者可以确保材料和测试账号的提交过程顺利,同时在审核期间保持有效的沟通,以提高审核的通过率。
5.属地网信办初审
在属地网信办的审核过程中,企业和开发者需要做好两种准备:一是审核通过后的上报流程,二是审核未通过时的调整和重新提交。以下是详细的步骤和注意事项:
审核通过后的上报流程
-
确认审核结果:在属地网信办完成审核后,确认审核结果,并获取正式的审核通过通知。
-
上报中央网信办:属地网信办审核没问题后,会将备案材料上报至中央网信办进行复审。
-
准备补充材料:如果中央网信办需要额外的材料或信息,及时准备并提交。
-
跟进复审进度:与地方网信办保持沟通,了解复审进度,并准备回答可能的询问。
审核未通过时的调整
-
获取反馈:向属地网信办获取详细的审核反馈,了解审核未通过的具体原因。
-
内部讨论:组织相关部门进行讨论,根据反馈意见制定调整计划。
-
调整材料:根据反馈意见,对备案材料进行必要的修改和补充。
-
重新测试:如果反馈涉及测试账号或模型性能问题,进行重新测试并更新测试结果。
-
重新提交:在完成调整后,按照属地网信办的要求重新提交材料。
持续的沟通和记录
-
沟通记录:保持与网信办的沟通记录,确保所有沟通都有文档支持。
-
材料更新:及时更新内部材料和记录,反映最新的审核状态和材料版本。
-
风险管理:评估审核过程中可能出现的风险,并制定相应的应对策略。
备案成功的后续行动
-
备案证书:在中央网信办审核通过后,获取备案证书,并按照规定进行公示。
-
内部培训:对企业内部员工进行备案流程和要求的培训,确保团队对备案要求有清晰的理解。
-
持续合规:即使备案成功,也要持续监控大模型的运行,确保其持续符合备案要求和法律法规。
通过这些步骤,企业和开发者可以确保在属地网信办的审核通过后,顺利进行上报流程;在审核未通过时,能够根据反馈进行有效的调整,并重新提交材料,以提高备案的成功率。
6.中央网信办复审
在中央网信办的复审阶段,企业和开发者需要密切关注审核结果,并做好相应的准备。以下是详细的步骤和注意事项:
中央网信办复审通过
-
接收备案号:在中央网信办复审通过后,接收下发的备案号,这是大模型合法运营的重要凭证。
-
公示备案信息:按照规定,将备案号和相关的备案信息进行公示,以增加透明度和公众信任。
-
内部通知:在企业内部进行通知,确保所有相关部门和团队都知晓备案成功的消息。
-
后续监管准备:备案成功后,准备接受后续的监管和检查,确保持续符合备案要求。
中央网信办复审未通过
-
获取反馈:向地方网信办获取详细的复审反馈,了解未通过的具体原因。
-
内部讨论:组织相关部门进行讨论,根据反馈意见制定调整计划。
-
调整材料:根据反馈意见,对备案材料进行必要的修改和补充。
-
重新测试:如果反馈涉及测试账号或模型性能问题,进行重新测试并更新测试结果。
-
重新提交备案申请:在完成调整后,按照中央网信办的要求重新提交备案申请。
持续的沟通和记录
-
沟通记录:保持与网信办的沟通记录,确保所有沟通都有文档支持。
-
材料更新:及时更新内部材料和记录,反映最新的审核状态和材料版本。
-
风险管理:评估复审过程中可能出现的风险,并制定相应的应对策略。
备案成功后的行动
-
备案证书:在中央网信办审核通过后,获取备案证书,并按照规定进行公示。
-
内部培训:对企业内部员工进行备案流程和要求的培训,确保团队对备案要求有清晰的理解。
-
持续合规:即使备案成功,也要持续监控大模型的运行,确保其持续符合备案要求和法律法规。
通过这些步骤,企业和开发者可以确保在中央网信办的复审通过后,顺利进行后续的公示和监管准备;在复审未通过时,能够根据反馈进行有效的调整,并重新提交备案申请,以提高备案的成功率。
四、填报注意事项
1.材料要真实、全面
在填报材料时,请确保所提供信息的真实性和全面性。不要遗漏任何重要的细节或信息。
2.评估报告要详尽,形成结论
在撰写评估报告时,请务必详尽地描述各项评估内容,并形成明确的结论。这将有助于审核人员更好地了解您的大模型的安全性和合规性。
3.测试题集要满足《生成式人工智能服务安全基本要求》
在准备测试题集时,请确保其能够满足《生成式人工智能服务安全基本要求》的相关标准,实际要远远超出要求的数量,这将有助于提高审核通过的可能性。
- 特别提醒
审核能否通过的主要决策权在省网信办,地方网信办做一个简单梳理后,提交至省网信办,由省网信办做主要的安全测试、评估等工作,省网信办检查无问题后,提交至中央网信办主要是事务性流程
标签:视角,材料,人工智能,模型,生成式,网信,审核,语料,备案 From: https://www.cnblogs.com/cybtec/p/18623969