中国网络空间安全协会发布用于大模型的首批中文基础语料库

时间：2024-12-11 14:29:05浏览次数：4

中文基础语料库页面截图。

澎湃新闻从中国网络空间安全协会获悉，12月20日，中国网络空间安全协会人工智能安全治理专业委员会在北京发布了用于大模型的首批中文基础语料库。

中国网络空间安全协会相关负责人介绍，在中央网信办相关业务部门指导下，网安协会人工智能安全治理专委会会同国家权威机构，发挥企业、高校和科研单位协同优势，通过“共建－共享”机制，汇聚一批高质量可信数据，经过去重、过滤等技术手段，形成并对社会发布首批120G中文基础语料，包括1亿余条数据，500亿个token。

用户登录中国网络空间安全协会网站，点击“中文基础语料库”链接，通过注册、认证等程序，就能够下载相关语料。中文基础语料库的发布，是各界协同汇聚形成高质量语料库的初步成果。

网安协会人工智能安全治理专委会负责人表示，语料库建设是一项长期性、专业性的工作，需要遵循相应法规、标准和规范，需要合力共建、突破创新，推动形成科学有效的语料库汇聚、处理、使用机制，为国家人工智能技术创新和产业发展赋能。

标签：中文,人工智能,语料库,安全,网络空间,协会
From： https://blog.csdn.net/cybtec1717/article/details/144400217

基于PyTorch/MXNet的高效中文/英文场景文字检测Python3包设计源码-Z5yUlJls
基于PyTorch/MXNet的高效中文/英文场景文字检测Python3包设计源码地址CnSTD是一个高效的中文/英文场景文字检测Python3包，基于PyTorch/MXNet框架开发。该项目包含106个文件，主要为Python源码文件（63个.py），以及多种格式的资源文件，包括22个JPG图片、6个PNG图片、3个Makefile、3个YAML配......
DevExpress WinForms中文教程：Grid View - 如何实现自动调整宽度模式？
DevExpressWinForms拥有180+组件和UI库，能为WindowsForms平台创建具有影响力的业务解决方案。DevExpressWinForms能完美构建流畅、美观且易于使用的应用程序，无论是Office风格的界面，还是分析处理大批量的业务数据，它都能轻松胜任！本文主要介绍如何使用DevExpressWinFormsDataGr......
《赛博朋克2077》：官方中文版，V2.13版本+‘往日之影’DLC，全DLC内容，新版修改器
《赛博朋克2077》：官方中文版，V2.13版本+‘往日之影’DLC，全DLC内容，新版修改器《赛博朋克2077》是一款深受玩家喜爱的开放世界动作冒险角色扮演游戏，现在官方中文版已更新至V2.13版本，并包含备受期待的‘往日之影’DLC以及全部DLC内容。玩家可以体验到更加丰富的游戏世界和剧情。版......
中文分词学习
1.安装jieba库!pipinstalljieba jieba库是用于中文分词的工具，它通过精确的分词算法来处理文本。通过分词可以将中文句子拆分成单独的词语，这对于自然语言处理任务非常重要，比如文本分类、情感分析、关键词提取。2.中文文本分词处理importjiebatext="我喜......
冲刺金三银四！GitHub中文社区高热度的Java面试题被我整理好了！
面对已经过去的金九银十很多小伙伴都受到了很大的挫折！最近收到一个小伙伴金九银十在阿里的面试流程完全被吊打，和我一起看看阿里都问了什么吧！添加图片注释，不超过140字（可选）小编在这里也简单的看了一下牛客网阿里招聘的一些评价，难度指数普遍在四星以上！！！！添加图片注......
有没有学网络空间安全的学长，想知道学长们毕业以后都去干嘛了？
我作为一个零基础小白到白帽黑客，也认识到了很多零基础小白的，有一些网络空间安全的学员，但是大多数还是非计算机相关专业的学员。他们通过系统学习网络安全，掌握黑客技术之后，都找到了自己满意的工作。同学A：大学霸一枚，励志在化学行业里面发挥光芒。没想到化学行业就是天坑专业......
Figma中文网：UI设计必备的本土化设计平台！
Figma软件是一款功能强大的在线UI设计工具，彻底改变了设计工作的流程。作为一款基于Web操作的软件，Figma不需要下载，占用设备内存极小，适用于macOS和Windows平台，只要有浏览器和网络连接，用户便可以随时随地使用Figma。这种无需下载的优势，尤其适合跨设备、跨平台的团队协作。在UI设......
荒野大镖客2：官方中文版，全DLC+终极版奖励解锁，小姐姐MOD，内置修改器
荒野大镖客2：官方中文版，全DLC+终极版奖励解锁，小姐姐MOD，内置修改器游戏介绍：“荒野大镖客2”是一款深受玩家喜爱的动作冒险游戏。游戏中，玩家将体验到西部荒野的冒险生活，与各种角色互动，完成各种任务。系统要求：为了确保游戏的流畅运行，请确保您的计算机满足以下最低配置要求：操作......
Kali Linux 安装谷歌浏览器及中文输入法教程
KaliLinux安装谷歌浏览器及中文输入法教程在KaliLinux系统中，安装谷歌浏览器和中文输入法可以满足我们使用谷歌浏览器（谷歌翻译）以及中文输入的需求。以下是详细的安装步骤和注意事项，适合希望增强KaliLinux功能的用户。一、安装谷歌浏览器下载谷歌浏览器安装包在......
whisper v3 finetune 中文乱码问题的解决方案
最近学习了一下whisper的微调，主要是参考了github上的夜雨飘零大神项目。但是在操作中遇到了微调中文的时候出现了乱码的情况。以下是我这边对于微调过程中中文出现乱码情况的解决方案。出现情况如下图所示：系统环境NAME="CentOSLinux"VERSION="7(Core)"ID="centos"ID_LIKE......

中国网络空间安全协会发布用于大模型的首批中文基础语料库

相关文章

赞助商

阅读排行