首页 > 其他分享 >探索数据宝藏:填写《全国数据资源调查》的乐趣与技巧

探索数据宝藏:填写《全国数据资源调查》的乐趣与技巧

时间:2024-02-23 11:23:24浏览次数:27  
标签:存储 数字 填报 调查 填写 数据 宝藏 资源

2月19日,国家数据局等四部门发布关于开展全国数据资源调查的通知。通知提出,为贯彻落实《数字中国建设整体布局规划》工作部署,摸清数据资源底数,加快数据资源开发利用,更好发挥数据要素价值,国家数据局、中央网信办、工业和信息化部、公安部联合开展全国数据资源情况调查,调研各单位数据资源生产存储、流通交易、开发利用、安全等情况,为相关政策制定、试点示范等工作提供数据支持。中电金信基于20多年的数据领域经验,及时为大家解读了相关要点,以下一文带你读懂《关于开展全国数据资源调查的通知》。 图片   一、调查对象 通知中,本次的调查对象(填报单位)包括五类①:省级数据管理机构、工业和信息化主管部门、公安厅(局); ②:各省重点数据采集和存储设备商、消费互联网平台和工业互联网平台企业、大数据和人工智能技术企业、应用企业、数据交易所、国家实验室等单位; ③:中央企业(区分运营商及非运营商类); ④:行业协会商会; ⑤:国家信息中心。 这五类填报单位,又分别承担了数据生态中的不同角色: ◆ 数据管理者(数据局、大数据管理中心等) ◆ 数据交易平台 ◆ 政务数据供给者 ◆ 企业数据供给者 ◆ 科研数据供给者 ◆ 平台数据供给者 ◆ 数据使用者 ◆ 数字基础设施提供者   二、调查内容解读 本次通知共涉及11类数据资源调查表,内容覆盖了数据资源的生产、存储、应用、安全,以及数据算力等领域。这些内容与《数字中国建设整体布局规划》中“2522框架”的数字基础设施、数据资源体系,以及数据安全屏障高度相关。 数字基础设施 数字基础设施主要包括网络基础设施、算力基础设施和应用基础设施。其中,网络基础设施相关内容,主要由运营商以及涉及相关设备生产销售的重点行业及央企填报;算力基础设施相关内容,几乎涉及全部填报单位;应用基础设施相关内容,主要由数据应用环节中的相关企业填报。 图片编辑 数字资源体系系 数据资源体系围绕“管好数据、用好数据”展开,统筹管理数据生产存储、关联融合、高效共享和有序利用等环节,重点推进跨部门、跨层级、跨地域数据共享和交易,支撑整体协同数字政府建设及其数字治理能力提升。数据资源体系建设的首要基础是摸清数据家底,以实行未来一本账管理,确定“一数一源”的最优解,推进数据共享交易。 本次通知中数据资源的填写内容广泛,涉及政府、企业对数据的全生命周期管理,其中“平台和数据技术企业”要填写的指标最多。 图片编辑 另外,作为数据生态中的两类特殊企业:运营商和交易所,需要分别填报: ● 运营商:数据跨境流入、流出信息。 ● 交易所:各行业的数据产品、数据服务交易信息。 数字安全屏障 发展数字经济的首要前提,便是筑牢数据安全的底线。本通知中也特别设计了《附件8-数据安全情况调查表(仅公安厅(局)填写)》,其中主要填报内容如下: ● 处理重要数据的重要系统数量 ● 处理重要数据的关键信息基础设施数量 ● 处理重要数据的其他系统数量 ● 数据安全相关案件数量   三、填报方案建议 全国数据资源调查工作开展时间为2024年2月18日至3月5日,相关单位在规定时间内登录全国数据资源调查管理平台填报调查表。 填报工作准备 填报单位要在思想上统一认识。国家数据局联合相关部门进行的全国数据大摸底,旨在全面地了解我国数据资源的生产存储应用、数字基础设施的容量及水平。这个工作是数字中国建设的基础工程,是国家数字经济新动能的基础调研,意义重大而深远。 这次填报工作任务重、时间紧。同时,部分内容尚未提供标准规范的填报说明,维度、口径都会有二义性,这又会导致填报工作需要反复讨论确认,增加填报工作量。建议各填报单位调集精兵强将,组织专门的工作小组进行集中项目式攻关。 填报工作步骤 在工作方法上,建议以信息系统梳理为抓手,以数据盘点为核心,由点到面开展数据资源管理工作。 一、梳理本单位内部的信息系统,明确各个系统的用途定位、负责部门、硬件配置、存储容量、存储增速、功能模块、主要数据、用户场景等。 二、按主题进行数据盘点,包括每类数据的含义、分布、容量、增量。 三、按用户场景/功能模块进行数据服务、数据产品的梳理统计。 四、统计梳理外部数据采集,及对外数据交易。 如果填报单位已经建设了完善的数据平台,可以首先对数据平台进行梳理统计,建立基本的数据资源盘点概况;然后向数据平台的上游、下游系统进行扩展,对数据资源进行补充完善。 难度与挑战 本次填报任务重,时间紧,具体表现为三大挑战: 一、信息粒度不匹配:填报内容大都是企业全局性的汇总信息,需要相应细节信息加工汇总而成,而多数企业中的此类细节信息是分散在不同部门/层级/系统中的。 二、 信息化基础薄弱:很多企业的数据管理能力较低,缺乏数据资源台帐。这将导致在填报工作的职责分工难协调,填报内容的质量难保障。 三、智能化工具缺失:由于大部分企业缺乏数据管理工具或者现有工具难以支持数据资源的盘点工作,本次填报需要大量的手工线下统计,低效费时。   四、后续行动 调查数据的分析应用 ● 数据生产区域分析:按地区、行业分析我国不同省市、行业的数据生产、存储的排名、趋势。 ● 企业数据生产环节分析:企业在生产设备、物流设备、研发软件、运营管理软件、IoT服务、产品智能化等各环节生产数据的占比及趋势。 ● 数据存储分布:从数据存储主体来分析个人终端、企业、政府的数据存储对比;从数据存储设备来看手机、电脑、移动硬盘、云等设备中存储占比。 ● 企业数据存储方式分析:分布式存储、集中存储。 ● 企业数据应用分析:数据应用在研发创新、生产优化、运营管理、产品及客户服务、供应链优化、产业协同等领域的占比及趋势。 ● 政府部门数据开放:各省市地区的数据开放平台、开放数据集数量排名及趋势;反映各省市数据开放范围及质量:数据集更新频率、数据可机读率、关键数据集覆盖率、常见数据集覆盖率、开放数据集部门覆盖率等。 ● 国家间数据流通:国内访问国外、国外访问国内的业务类型排名、趋势。 数据资源调查逐步完善 正如人口普查、库存盘点,全国性的数据资源调查未来也很可能有下列趋势: ◆ 常态化:定期盘点调查。 ◆ 规范化:调查内容的标准越来越明确,逐步减少填报内容的模糊性。 ◆ 自动化:通过相关系统的建设以减少手工操作,提升填报过程的自动化水平。 数据资源调查,对各填报单位来说也是一个内部系统、数据大盘点的契机,完全可以作为后续企业数字化转型的前置工作。 中电金信基于金融级数字底座“源启”的工具包(元数据自动采集、数据资产管理平台),结合在数据领域的咨询、产品、交付经验,期待与填报单位一起完成数据资源大摸底,为数据要素化做好准备。  

标签:存储,数字,填报,调查,填写,数据,宝藏,资源
From: https://www.cnblogs.com/zhongdianjinxin/p/18029077

相关文章

  • R语言使用Bass模型进行手机市场产品周期预测|附代码数据
    原文链接:http://tecdat.cn/?p=17725最近我们被客户要求撰写关于Bass模型的研究报告,包括一些图形和统计输出。巴斯Bass扩散模型已成功地用于预测各种新推出的产品以及成熟产品的市场份额主要观点该模型的主要思想来自两个来源:消费者不受社会影响的产品意愿。因为其他人已经......
  • R语言逻辑回归(Logistic Regression)、回归决策树、随机森林信用卡违约分析信贷数据集
    原文链接:http://tecdat.cn/?p=23344最近我们被客户要求撰写关于信用卡违约分析的研究报告,包括一些图形和统计输出。本文中我们介绍了决策树和随机森林的概念,并在R语言中用逻辑回归、回归决策树、随机森林进行信用卡违约数据分析决策树是由节点和分支组成的简单树状结构。根据每......
  • 数据库升级
    数据库升级项目由于数据库MySQL5.7停止维护更新,故更新至MySQL8.0.35一、资源备份备份配置文件/etc/my.cnf   备份数据库数据  mysqldump-uroot-p库名>导出文件路径二、 环境检察操作系统版本Centos7.7uname-aldd版本 三、清理旧版......
  • clickhouse查看数据库和表的容量信息
         在mysql中information_schema这个数据库中保存了mysql服务器所有数据库的信息,那在clickhouse如何查询库表信息呢? 可以通过system.parts查看clickhouse数据库和表的容量大小、行数、压缩率以及分区信息。    详见正面实操,只是其中一例,大家可以举一返三。 1、......
  • 控制ERP物料主数据通过Middleware传往CRM
    先说一下优化过滤的必要性。CRM物料主数据一百多万。感谢MDM或者相关的系统,每天通过接口更新的不知道什么东西,每天数百万的物料更新队列进入CRM。CRM系统被搞死了好几次。然后各种优化报表,程序。。。最后有几个链接缓慢的自开发接口,背锅了。。。好吧,先不管那些了。现在在ERP......
  • Jenkins数据迁移
    Jenkins需要从一台主机换到另外一台主机怎么迁移数据两台主机的Jenkins版本需要保持一致安装Jenkins#sudowget-O/etc/yum.repos.d/jenkins.repohttps://pkg.jenkins.io/redhat-stable/jenkins.repo#sudorpm--importhttps://pkg.jenkins.io/redhat-stable/jenkins.i......
  • clickhouse 数据类型介绍
    clickhouse数据类型介绍clickhouse数据类型主要包括以下几种:   (1)、基础类型:       数值类型:包括整数、浮点数和定点数。           a、整数:有符号整型Int,分为Int8、Int16、Int32和Int64,分别对应8位、16位、32位和64位整数,占用字节大小分别为1、2、4......
  • 云数据库实现架构与设计的构想
    本文分享自天翼云开发者社区《云数据库实现架构与设计的构想》,作者:不知不觉随着云计算技术的飞速发展,云数据库作为云计算的重要组成部分,其实现架构与设计日益受到开发工程师的关注。本文将从开发工程师的角度出发,探讨云数据库的实现架构,并提出云数据库设计的构想,以期为云数据库的......
  • flowable清除表数据
    `DELETEFROMACT_RU_JOB;DELETEFROMACT_RU_VARIABLE;DELETEFROMACT_RU_DEADLETTER_JOB;DELETEFROMACT_GE_BYTEARRAY;DELETEFROMACT_RU_IDENTITYLINK;DELETEfromACT_RU_TASK;DELETEFROMACT_RU_EXECUTION;DELETEFROMACT_RE_DEPLOYMENT;DELETEFROMACT_......
  • 在k8S中,一个Pod如何实现数据持久化?数据共享?跨节点Pod如何实现数据共享?
    在Kubernetes(k8S)中,同一个Pod内实现数据持久化和数据共享的方式主要通过使用Volume(卷)来完成。Volume是Kubernetes提供的一种抽象,它代表了宿主机上的一个目录或存储设备,可以被Pod中的一个或多个容器挂载并访问。1.数据持久化:EmptyDir:在Pod创建时自动创建一个空......