中电科大数据研究院:推进数典工程建设 助力数据新基建

2020年08月11日15:59  来源:中国大数据产业观察网
 

作为贵阳市建设数博大道的创新工程之一,数典工程秉承科技创新引领先行示范区发展的理念,践行着“新基建”的重要使命。

“数典工程不仅仅是出版一本标准化‘大数据词典’,而是基于词典这一标准化术语体系,着力于解决因‘数据标准规范不统一’导致的数据流通不畅和资源再开发利用度不高等问题,推动以数据资源为生产要素的相关领域规范集约发展的大数据基础设施工程。”中电科大数据研究院有限公司(提升政府治理能力大数据应用技术国家工程实验室)创新技术研究中心刘汪洋博士介绍到。

数典工程的建设,离不开多家机构、团队的努力与付出,而其中,包括了负责牵头推进数典工程建设的中电科大数据研究院有限公司(简称“中电科大数据研究院”)。

牵头建设数典在线平台 打造数典生态体系

据了解,作为数典工程建设的重要牵头单位,在贵阳市大数据发展管理局的指导下,中电科大数据研究院团队率先启动了整个工程的策划、设计和论证工作,深入开展对数典工程内涵和外延的研究,创新提出了“3+3+N”的数典工程总体架构,为做好数典工程建设提供了方向。

“我们提出的‘3+3+N’这一架构,预期要产出三大类成果,包括《数典》工具书、中国数典在线平台和数典生态体系。其中,我院主要承担大数据领域数据描述模型构建、数典在线平台建设、数典生态体系搭建这几项重要任务。”刘汪洋详细介绍了中电科大数据研究院在数典工程建设中所承担的工作内容。

对于数典工程建设,中电科大数据研究院有着明确的目标和计划。刘汪洋阐述了建设愿景:“我们希望将数典工程打造成为国内最大规模的大数据基础资源集智平台,巩固现有大数据发展成果,引导大数据规范发展,让‘数典’成为中国数谷一张靓丽的名片,助力贵州省成为大数据发展的战略策源地。”

当梦想与愿景交织在一起,实现起这样的目标也有了明确的计划。中电科大数据研究院提出了“三步走”战略,第一步,构建其跨域数据流通的标准化“语言体系”,规范数据共享交换场景下在数据层面的规则,建设中国数典在线平台,推动大数据共性资源再利用;第二步,拓展数典工程应用与服务,探索多元化数据赋能模式,搭建开放化数典生态,形成大数据共性资源传播与运营服务模式;第三步,推动跨域数据流通“语言体系”成为共识,实现全社会资源聚智,推进数典工程在大数据、人工智能等重点领域的赋能应用。

直面困难与挑战 着力推进数典工程建设

数典工程的建设有多难?贵阳市首提“数典”这一理念,这是一个全新的概念,更是一项创新性的工程,一次新的探索、新的挑战就这样摆在了中电科大数据研究院的面前。“在领域数据模型构建方面,国内在政务领域数据交换模型构建还处于初期,缺乏相关的参考和指导,在模型选取、要素构建、交换标准等方面都存在很大的困难;在开源社区建设方面,由于跨域数据流通‘语言体系’涉及到各行各业,需要多方的共同努力来推动数典工程成为大家认可的、愿意参与的一项工程。”刘汪洋谈到了其研发团队在推进数典工程建设中所存在的工作难点与技术方面的难题。

面对这些困难,中电科大数据研究院选择逐一攻破。首先通过内部专题讨论、拜访国内专家等多种方式进行交流、探索,逐渐形成了一套数据模型构建方法,解决了领域数据模型构建上的难题。

目前,中电科大数据研究院构建的模型涵盖了大数据、信息技术等通用领域和公安、互联网+政务服务、互联网+监管等多个专业领域。其中,“互联网+政务服务”领域数据描述模型不仅完善了数典工程中“大数据语言体系”的语法结构,还为其他领域数据描述模型的扩展和本体构建提供了强有力的方法论支撑,让数典工程的内容更加丰富。

此外,中电科大数据研究院正在围绕各行业各领域构建跨域数据流通“语言体系”。刘汪洋希望,社会各界也积极参与进来,共同推进开源社区的建设。

数据新基建,数谷新名片

目前,中国数典在线平台已经搭建完成,刘汪洋向记者现场展示了中国数典在线平台,并介绍道:“这一平台的建设,收录的‘大数据+行业应用’相关术语词条,可以很好地与《数典》工具书相结合,我们主要负责打造的领域数据模型——‘数网’,通过前期的努力,已经构建起几个领域的数据模型。在数据模型中,我们以列表方式陈列,可以有来源地查找到该领域下的数据模型标准字段的解释说明。”

不久的将来,中电科大数据研究院计划向全社会提供一个以跨域数据流通“语言体系”为核心的大数据基础资源共享平台。“希望中国数典在线平台未来能够触达更广的地域和人群,吸引相关领域的科研机构、高校、企业等提供标准化数据模型方面的资源,或者更加直接地使用平台,让平台可以成为载体,打造数典生态,加速大数据标准化‘语言体系’成为一种共识。”刘汪洋说到。

目前,各行业、各领域的数字化进程不断加速,数字产业化和产业数字化的发展持续升温,数据已然成为了驱动经济社会发展的新型生产要素,是新基建中的新基建,数据流通会推动新一轮生产力的爆发。

数典工程建设并非朝夕之功,贵阳率先建设数典工程首先就抓准了大数据行业发展的重要一环,积极构建适用性强、共识度高的大数据“语言体系”,让各行业、各领域的数字化进程更加规范。中电科大数据研究院积极参与建设数典工程的创新成果体系,让数据高效地流通,让数据价值充分释放,是研发团队的美好期许;为数典工程建设提供强有力支撑,助力贵州大数据发展,是他们奋斗的方向。(作者:陈骏佼)

(责编:陈晶晶、陈康清)

热闻推荐

动感H5欣赏

  • 知行合一看修文知行合一看修文
  • 美丽贵州行-务川美丽贵州行-务川
  • 我们的贵州会呼吸我们的贵州会呼吸
  • 你好,我叫贵州!你好,我叫贵州!

新媒体运营

  • 贵州频道微信公众号贵州频道微信公众号
  • 贵州频道手机版贵州频道手机版
  • 贵州频道新浪微博贵州频道新浪微博
  • 贵州频道人民微博贵州频道人民微博