最新动态

NEWS

人民数据探索实践数据标识编码体系,让数据显示出独特的“身份”

2024-01-23 来源:

分享到:

近日,国家发改委等五部门发布《关于深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》,《实施意见》要求探索构建多源异构数据统一标识编码体系,开展跨地区跨行业多源数据标识互认,促进数据流通体系与算力支撑体系协同运行。

构建数据统一标识编码体系意义重大

数据统一标识编码体系的重要意义是让数据互通、流通。它是数据要素化的重要基础设施之一,是多源异构数据能够“通”起来的前提。由于数据具有来源不一、结构差异等特性,推动数据流通必然需要统一的规则和标识。数据通过统一标识编码体系进行编码后,数据的价值能通过标识编码被外界看见,数据的价值外显;此外,数据还能实现两个层面的互联互通;一是通过数据的统一标识编码,让不同的数据在统一的规则规范下运行;二是打通数据地域行业产业上下游的壁垒,实现互联互通,真正地让数据流通起来,释放数据要素价值。

构建数据统一标识编码体系的三大要点

作为基础设施的数据统一标识编码体系,在探索过程中需要注意三点:一是根据数据流通需要,统一标识编码体系既能跨地域、跨行业实现国内流通,也能与国际接轨,毕竟促进数据有序跨境流动,对标国际高标准经贸规则是《“数据要素×”三年行动计划(2024—2026年)》重要内容之一。二是数据统一标识编码体系能够充分体现数据的关键特征,确保其流通过程中的各个环节的重要元素被看见。包括数据涉及的地域性、行业性、分类、分级、时效性、数据量、价值性等,如分级特征,通过分级的确定,直接确定该数据能否流通;时效性、数据量和价值性等特征是当前数据交易过程中的重要参考维度,甚至决定数据的价格。三是数据统一标识编码体系需要区块链、人工智能等技术作为支撑,做好数据标识编码,同时自动进行识别,提高数据的识别及流通效率。

国内工业数据编码体系及数据编码体系探索

当前,在工业互联网领域我国自主规划设计和应用的标识编码解析体系,能与VAA、Handle、OID、Ecode、GS1、MA等多种国际主流标识体系互联互通,赋予产品唯一的“数字身份证”,通过背后的数据链及其他技术进行编码识别,实现数据的流通。在数据领域,人民数据探索打造了中国首个数据元素识别编码体系,在与国际国内通用编码机构合作的基础上,人民数据取得数据领域第一个编码号段代码MA15602.data,并打造上线自主研发的数据元素识别体系。据了解,这一数据元素识别编码体系可以让数据价值真正被看见,是对数据要素系统化的分级分类,从最小元素实现数据识别标注的最大社会化梳理,解决了数据描述、数据画像、数据价值等关键问题,清晰界定数据地域、行业、大小、时间、质量等资源特征,形成唯一且能快速识别的数字身份,实现数据“持证流通”。

 

作者:人民数据研究院研究员 吴汉华