绝对不能错过！整理的大模型备案坑点

时间：2024-08-07 22:24:22浏览次数：19

标签：坑点模型错过确保测试标注语料评估备案

截至2024年5月16日，国内共有约140个大模型完成生成式人工智能服务备案，占305个大模型的45.9%左右。

在已备案的大模型中，在地域分布上，北京以70个备案大模型领跑全国，凸显了其在AI领域的集聚效应。上海和广东紧随其后，分别有28个和19个模型备案。

大模型备案所需要的材料有那些？

1、语料安全评估：

1）应建立语料来源黑名单，不使用黑名单来源的数据进行训练；

2）使用开源语料或使用商业语料时，应具有该语料来源的开源授权协议或相关合作证明；

3）训练语料内容过滤方面：应采取关键词、分类模型、人工抽检等方式，充分过滤全部语料中违法不良信息。

4）语料用于训练前，知识产权相关负责人等应对语料中的知识产权侵权情况进行识别，提供者不应使用有侵权问题的语料进行训练：

5）应自行对标注人员进行考核，给予合格者标注资质，并有定期重新培训考核以及必要时暂停或取消标注资质的机制；

6）对功能性标注，应对每一批标注语料进行人工抽检，发现内容不准确的，应重新标注；发现内容中包含违法不良信息的，该批次标注语料应作废。

*做好语料合规化，训练语料的过程管理，包括员工培训材料，分工明确。

2、黑盒测试

1）功能需求验证：确保模型能够按照预期执行任务，对各种类型的输入产生正确和合理的输出。

2）用户界面测试：针对用户界面的测试，确保界面的易用性和一致性。

3）输出验证：检查模型的输出是否符合预期，是否满足业务需求

*确保模型在不同输入情况下能够按预期执行任务，输出准确、符合预期。包括功能需求的验证，测试模型的各个功能点是否符合设计要求。

3、模型安全措施评估

1）设定未成年人防沉迷措施：限制未成年人单日对话次数与时长，若超过使用次数或时长需输入管理密码等

2）个人信息处理方面：应按照我国个人信息保护要求，并充分参考现行国家标准，如GB/T 35273等，对个人信息进行保护

3）内容标识方面：显示区域标识、图片、视频的提示文字标识、图片音视频的隐藏水印标识文件元数据标识；

4）接受公众或使用者投诉举报方面：应提供接受公众或使用者投诉举报的途径及反馈方式，包括但不限于电话、邮件、交互窗口、短信等方式；

5）模型更新、升级方面：应制定在模型更新、升级时的安全管理策略；

4、性能评估

1）响应时间：测试模型在不同负载下的响应时间，确保在合理时间内完成任务。

2）资源消耗：评估模型对内存、计算资源等的消耗情况，确保资源利用合理。

*测试模型的性能，包括响应时间、内存消耗、计算资源占用等。确保模型能够在可接受的时间范围内完成任务，并且对资源的利用合理。

5、稳定性评估

1）长时间运行：测试模型在持续运行下的稳定性，避免内存泄漏、性能下降等问题。

2）大规模数据输入：模拟大规模数据输入，检验模型对此的稳定性和性能。

6、安全性评估

1）隐私保护：确保模型的输出不会侵犯用户隐私，对个人敏感信息进行隐私保护。

2）防止攻击：测试模型对恶意攻击或异常输入的鲁棒性，确保模型不易受到攻击。

7、可解释性评估

1）对模型的输出进行解释和验证，确保模型的决策是可解释和可信的，避免模型黑盒化带来的问题。

8、法律和合规性评估

1）隐私法规遵守：确保模型遵循隐私法规，不违反用户隐私和数据使用规定。

2）合规性检查：确保模型在使用中符合相关行业法规和标准，避免违规操作。

*参考《生成式人工智能服务暂行管理办法》

9、应急管理措施

1）采取防范计算机病毒、网络攻击、网络入侵等技术措施。

2）制定网络安全应急处置预案并且开展应急演练，保存演练记录材料。

3）警用接口建设。

10、材料准备

安全评估报告

模型服务协议

语料标准规则

拦截关键词列表

评估测试题库拒答测试题库

网络安全管理制度及操作规程

应急处置预案和记录材料

用户投诉举报处理制度

用户管理制度

个人信息安全保护制度

安全培训制度

网络安全负责人任命书

标签：坑点,模型,错过,确保,测试,标注,语料,评估,备案
From： https://blog.csdn.net/2401_86516744/article/details/141002804

千万别错过！AI 智能体树洞给你的心灵惊喜
本文由ChatMoney团队出品介绍说明在如今繁忙喧嚣的世界中，我们时常渴望能有一个安全且私密的空间，让我们毫无顾忌地袒露心声。AI智能体树洞便是这样一个独特的存在。它并非传统意义上的树洞，而是融入了前沿人工智能技术的心灵港湾。无论白天黑夜，无论您是处于喜悦的巅峰，还是深......
网络视听节目信息管理系统备案如何办理？
目前，网络视听节目备案系统已经全面启用，但仍有不少公司负责人在问，“怎么获取新备案系统的用户名和密码？应该找谁？”“新备案系统究竟怎么操作？”“要不要审核成片？”下面，众森企服小编来给你大家好好聊聊网络视听平台信息管理系统备案如何办理？一、网络视听平台信息管理系统备案需......
大模型备案流程最详细说明【附评估测试题+附件】
2024年3月1日，我国通过了《生成式人工智能服务安全基本要求》（以下简称《AIGC安全要求》），这是目前我国第一部有关AIGC服务安全性方面的技术性指导文件，对语料安全、模型安全、安全措施、词库/题库要求、安全评估等方面提出了具体规范和要求。（一）适用主体《AIGC安全要求》的适用主......
文件加密软件精品推荐（10款不容错过的文件加密软件）
文件加密软件是信息安全的必争之地，有多家公司推出了自己的产品，然而这些软件却良莠不齐，在加密强度、易用性、功能多样性、兼容性上有较大差异，今天盘点其中10款佼佼者，值得你去考虑。1.安企神主要功能实时监控与监控管理：安企神支持实时监控员工电脑使用行为，包括上网行为、......
大模型网信办备案全网最详细说明（附附件）
本文共分为以下几个章节一、大模型算法备案的强制性二、生成式人工智能(大语言模型)安全评估要点三、大模型备案必备材料+重点说明四、算法备案填报流程五、大模型备案时间成本对比六、备案建议附录、过程性材料一、大模型算法备案的强制性1、强制要求备案（1）《办法》......
域名申请与备案流程
1.域名申请流程(阿里云为例)1.1注册并登录阿里云账户如果你没有阿里云账号，首先需要注册一个。访问阿里云官网，点击“免费注册”。按照提示填写相关信息，完成账号注册。1.2登录阿里云账户：注册完成后，使用你的账户信息登录阿里云官网。1.3进入域名注......
不能错过的十大人工智能开源库
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：随着人工智能（AI）的不断进步，掌握最新的工具、框架和研究变得前所未有的重要。虽然TensorFlow和PyTorch等知名软件库占据了头条新闻，但许多鲜为人知但却非常有用的软件库也值得关注。这些隐藏的瑰宝......
干货！全网最权威最全面介绍网络短剧上线资质以及备案流程
今天，小编给大家详细梳理汇总一个全网最权威最全面的介绍网络微短剧上线所需要的资质，以及短剧备案流程到底是怎么样的？100%内行人实战总结的干货，希望对广大短剧从业者有所帮助。一、从事网络微短剧需要哪些资质？1、广播电视节目制作经营许可证（必备）根据《广播电视节目制作经营管......
三本IEEE会议“一区顶刊”大PK！年发文量＞1000+，千万别错过！
关于IEEE关于IEEEIEEE（TheInstituteofElectricalandElectronicsEngineers，电气电子工程师学会）是目前全球最大的非营利性专业技术学会，在全球160多个国家拥有超过45万名会员。IEEE在电气电子、计算机、半导体、通讯、电力能源、生物医学工程、航天系统工程、消费电子等......
Python 中的工作队列 - 我错过了什么吗？
这可能会被标记为重复或可能不相关。但我实际上相信这个问题对我和未来缺乏经验的Python开发人员都很重要。由于GIL，用于CPU密集型任务的本地工作队列的概念在Python中至关重要。这方面SE上有明显的答案。使用子进程的方法来绕过缺乏真正的CPU有限并行性的问题。在Pyth......

绝对不能错过！整理的大模型备案坑点

相关文章

赞助商

阅读排行