11月19日,由人民数据主办的“人民路演——高质量数据集专题交流”活动在人民日报社新媒体大厦举行。

作为“人民网百日AI直播活动”的重要组成部分和延伸实践,本次活动以高质量数据集建设为抓手,依托人民数据在数据资源整合与生态服务方面的核心能力,搭建政企协同、供需联动的专题平台,促进数据资源向产业价值、治理能力转化,助力政企双方降本增效,打造数据驱动的政企合作新生态。

人民数据总经理杨森滟在开场发言中表示,作为人民网旗下数据理论和实践的探索平台,人民数据秉承“智数惠民、用数利民、聚数兴民、以数便民”理念,积极探索数据业务,已接入数百个垂直领域细分数据,汇聚涵盖产业链、电商、工商、舆情等29个数据大类,并归集形成72个高质量语料库,构建起全国海量、及时更新、合规源头的高质量数据服务能力。

人民网研发部副主任宁东介绍,在高质量语料建设与探索方面,人民网已建成主流价值语料库,并全新推出语料社区,搭建起人工智能高质量数据语料共创共享生态服务平台。该语料社区既是语料“厨房”,也是语料“超市”,目前已归集基础语料超3000万篇、问答语料超30万对、图文语料超200万对,总数据规模超300T。通过构建全模态AI语料共创制作与共享生态服务平台,实现语料开源协作、安全流转与价值共创。

人民数据总编辑刘畅在《高质量数据集建设的探索与实践》主题演讲中表示,人民数据不断探索高质量数据集建设,形成了“解题思路”:一是夯基立本,推动高质量数据“供得出、流得动、用得好、保安全”;二是“价值化探索”与“实数融合”双向发力,激发高质量数据集多元价值;三是生态赋能,培育协同共生的数据发展环境。
路演中,山东省德州市陵城区政府、中国交通信息科技集团有限公司、中国移动通信集团北京有限公司、天融信科技集团股份公司、中科星图数字地球合肥有限公司、金蝶征信有限公司、安徽飞数信息科技有限公司、四川楠竹人工智能科技有限公司、中互金数据科技有限公司等政企单位集中展示了高质量数据集的建设实践、行业应用成效及数据全生命周期的安全治理方案。人民数据总编辑刘畅、北京科技大学大数据研究中心石志国、中国信通院云大所市场部窦佳丽等专家与路演单位现场互动,为政企数据领域的实践创新、价值释放与安全合规协同发展共商良策。

圆桌环节,人民数据研究院院长陈丽,北京科技大学大数据研究中心主任石志国,金蝶征信有限公司总裁王宏,中科星图副总裁、星图云研究院院长罗恒,沈阳市宸阳泓笙咨询有限公司总经理李巍围绕“高质量数据集如何赋能产业升级”展开探讨,立足“数据即服务”理念,结合场景需求与实践探索,为高质量数据集建设及产业数字化转型建言献策。
据悉,接下来人民数据将联合各合作单位,持续开展系列专题交流活动,通过“搭平台、强产业、建生态、树品牌”,积极探索务实高效的合作新路径,凝聚行业各方力量,构建开放协同的生态体系,激活数据要素价值,推动相关产业落地发展。