中電科大數據研究院:推進數典工程建設 助力數據新基建

2020年08月11日15:59  來源:中國大數據產業觀察網
 

作為貴陽市建設數博大道的創新工程之一,數典工程秉承科技創新引領先行示范區發展的理念,踐行著“新基建”的重要使命。

“數典工程不僅僅是出版一本標准化‘大數據詞典’,而是基於詞典這一標准化術語體系,著力於解決因‘數據標准規范不統一’導致的數據流通不暢和資源再開發利用度不高等問題,推動以數據資源為生產要素的相關領域規范集約發展的大數據基礎設施工程。”中電科大數據研究院有限公司(提升政府治理能力大數據應用技術國家工程實驗室)創新技術研究中心劉汪洋博士介紹到。

數典工程的建設,離不開多家機構、團隊的努力與付出,而其中,包括了負責牽頭推進數典工程建設的中電科大數據研究院有限公司(簡稱“中電科大數據研究院”)。

牽頭建設數典在線平台 打造數典生態體系

據了解,作為數典工程建設的重要牽頭單位,在貴陽市大數據發展管理局的指導下,中電科大數據研究院團隊率先啟動了整個工程的策劃、設計和論証工作,深入開展對數典工程內涵和外延的研究,創新提出了“3+3+N”的數典工程總體架構,為做好數典工程建設提供了方向。

“我們提出的‘3+3+N’這一架構,預期要產出三大類成果,包括《數典》工具書、中國數典在線平台和數典生態體系。其中,我院主要承擔大數據領域數據描述模型構建、數典在線平台建設、數典生態體系搭建這幾項重要任務。”劉汪洋詳細介紹了中電科大數據研究院在數典工程建設中所承擔的工作內容。

對於數典工程建設,中電科大數據研究院有著明確的目標和計劃。劉汪洋闡述了建設願景:“我們希望將數典工程打造成為國內最大規模的大數據基礎資源集智平台,鞏固現有大數據發展成果,引導大數據規范發展,讓‘數典’成為中國數谷一張靚麗的名片,助力貴州省成為大數據發展的戰略策源地。”

當夢想與願景交織在一起,實現起這樣的目標也有了明確的計劃。中電科大數據研究院提出了“三步走”戰略,第一步,構建其跨域數據流通的標准化“語言體系”,規范數據共享交換場景下在數據層面的規則,建設中國數典在線平台,推動大數據共性資源再利用﹔第二步,拓展數典工程應用與服務,探索多元化數據賦能模式,搭建開放化數典生態,形成大數據共性資源傳播與運營服務模式﹔第三步,推動跨域數據流通“語言體系”成為共識,實現全社會資源聚智,推進數典工程在大數據、人工智能等重點領域的賦能應用。

直面困難與挑戰 著力推進數典工程建設

數典工程的建設有多難?貴陽市首提“數典”這一理念,這是一個全新的概念,更是一項創新性的工程,一次新的探索、新的挑戰就這樣擺在了中電科大數據研究院的面前。“在領域數據模型構建方面,國內在政務領域數據交換模型構建還處於初期,缺乏相關的參考和指導,在模型選取、要素構建、交換標准等方面都存在很大的困難﹔在開源社區建設方面,由於跨域數據流通‘語言體系’涉及到各行各業,需要多方的共同努力來推動數典工程成為大家認可的、願意參與的一項工程。”劉汪洋談到了其研發團隊在推進數典工程建設中所存在的工作難點與技術方面的難題。

面對這些困難,中電科大數據研究院選擇逐一攻破。首先通過內部專題討論、拜訪國內專家等多種方式進行交流、探索,逐漸形成了一套數據模型構建方法,解決了領域數據模型構建上的難題。

目前,中電科大數據研究院構建的模型涵蓋了大數據、信息技術等通用領域和公安、互聯網+政務服務、互聯網+監管等多個專業領域。其中,“互聯網+政務服務”領域數據描述模型不僅完善了數典工程中“大數據語言體系”的語法結構,還為其他領域數據描述模型的擴展和本體構建提供了強有力的方法論支撐,讓數典工程的內容更加豐富。

此外,中電科大數據研究院正在圍繞各行業各領域構建跨域數據流通“語言體系”。劉汪洋希望,社會各界也積極參與進來,共同推進開源社區的建設。

數據新基建,數谷新名片

目前,中國數典在線平台已經搭建完成,劉汪洋向記者現場展示了中國數典在線平台,並介紹道:“這一平台的建設,收錄的‘大數據+行業應用’相關術語詞條,可以很好地與《數典》工具書相結合,我們主要負責打造的領域數據模型——‘數網’,通過前期的努力,已經構建起幾個領域的數據模型。在數據模型中,我們以列表方式陳列,可以有來源地查找到該領域下的數據模型標准字段的解釋說明。”

不久的將來,中電科大數據研究院計劃向全社會提供一個以跨域數據流通“語言體系”為核心的大數據基礎資源共享平台。“希望中國數典在線平台未來能夠觸達更廣的地域和人群,吸引相關領域的科研機構、高校、企業等提供標准化數據模型方面的資源,或者更加直接地使用平台,讓平台可以成為載體,打造數典生態,加速大數據標准化‘語言體系’成為一種共識。”劉汪洋說到。

目前,各行業、各領域的數字化進程不斷加速,數字產業化和產業數字化的發展持續升溫,數據已然成為了驅動經濟社會發展的新型生產要素,是新基建中的新基建,數據流通會推動新一輪生產力的爆發。

數典工程建設並非朝夕之功,貴陽率先建設數典工程首先就抓准了大數據行業發展的重要一環,積極構建適用性強、共識度高的大數據“語言體系”,讓各行業、各領域的數字化進程更加規范。中電科大數據研究院積極參與建設數典工程的創新成果體系,讓數據高效地流通,讓數據價值充分釋放,是研發團隊的美好期許﹔為數典工程建設提供強有力支撐,助力貴州大數據發展,是他們奮斗的方向。(作者:陳駿佼)

(責編:陳晶晶、陳康清)

熱聞推薦

動感H5欣賞

  • 知行合一看修文知行合一看修文
  • 美麗貴州行-務川美麗貴州行-務川
  • 我們的貴州會呼吸我們的貴州會呼吸
  • 你好,我叫貴州!你好,我叫貴州!

新媒體運營

  • 貴州頻道微信公眾號貴州頻道微信公眾號
  • 貴州頻道手機版貴州頻道手機版
  • 貴州頻道新浪微博貴州頻道新浪微博
  • 貴州頻道人民微博貴州頻道人民微博