高新区——

“数典工程”建设初见成效 收录大数据术语两万余条

2020年06月03日10:50  来源:贵阳日报
 

本报讯 记者从贵阳高新区中电科大数据研究院有限公司了解到,公司数典工程研发团队的工作已取得了阶段性成果,收录大数据术语突破2万条数据模型200个。

“数典工程简单来说就是打造一本大数据领域的词典,就像我们经常使用的新华词典一样,是用于规范大数据技术发展与融合应用的一种基础工具。”该公司刘汪洋博士介绍,如今,数据要素正在成为推动整个数字经济发展的重要要素,但由于大数据的发展过程中存在一些规范性不强的问题,数典工程可以更好地去引导大数据的规范发展。

2019年,“数典”这一概念首次在数博会上被提出,同年5月,贵阳高新区中电科大数据研究院有限公司启动了“数典”策划论证工作,针对数据释义与内容格式不规范、数据标准难统一等问题,提出打造中国最大规模的数据基础资源集智平台——数典工程。秉承“工具化、平台化、开放化”的建设理念,构建以数典理论为基石、以大数据词典为核心、以数典平台为载体、以标准规范为保障并拓展多项数据服务的“3+3+N”体系架构。

经过数典工程研发团队近一年的工作,如今,围绕数据领域模型为“语法结构”的大数据“语言体系”已经初步成型,其中已收录“大数据+行业应用”相关术语词条2万余条,构建数据模型约200个以及公安、检务等行业领域描述模型50余个。

“数典工程可以有效解决数据规范定义、统一标识、系统分类以及数据融合应用等带来的困难,避免造成数据‘难用、滥用、混用’等现象。”刘汪洋博士说,打造数典是一项承前启后的基础性工程,对巩固大数据成果、引导大数据规范发展具有重要的意义。

(贵阳日报融媒体记者 杨婷)

(责编:陈晶晶、陈康清)

贵州新闻推荐

移动端新媒体

  • 贵州频道微信公众号贵州频道微信公众号
  • 贵州频道手机版贵州频道手机版
  • 贵州频道新浪微博贵州频道新浪微博
  • 贵州频道头条号黔沿贵州频道头条号黔沿