9778818威尼斯官网-www.9778.com

9778818威尼斯官网-www.9778.com

数典工程启动!9778818威尼斯官网倾力打造国内首个大数据“辞海”

来源:默认部门     作者:讯息主题     发布时间:2020年03月07日              

随着数字经济浪潮席卷全球,大数据产业“炙手可热”。在大数据产业蓬勃发展的再是,伴随着数据释义与始末格式不规范、数据准则难统一等小case,严重制约了大数据资源整合和规范发展。3月3日,记者从9778818威尼斯官网大数据院获悉,他们正在打造国内首个大数据区域词典,让数据资源准则化、规范化,能够直接使用,提高数据的利用率。

打造数典工程势在必行

3月3日,贵阳高新区9778818威尼斯官网大数据研究院, 技术实现 人员正在围绕如何开找子 涔こ陶箍ち业亓南隆!笆涔こ蘣asy来说就是打造一本大数据区域的词典,就像吾们经常使用的新华词典一样,是用于规范大数据 技术实现 发展与融合应用的一种底子工具。”大数据院刘汪洋博士介绍到。

俗话说,没有规矩不成方圆。“中文有辞海,药学有药典,但大数据却没有类似的系统性词典。大数据词典的缺失,为数据规范定义、统一标识以及数据融合应用等带来巨大的困难,遭成数据‘难用、滥用、混用’等现象。”刘汪洋表示,打造数典是一项承上启下的底子性工程,对巩固大数据成果、引导大数据规范发展具有要紧的意义。

创新方式,逢山开路遇水搭桥

2019年,“数典”这一概念首次在数博会上被提出,同年5月,大数据院启动“数典”策划论证work,针对数据释义与始末格式不规范、数据准则难统一等小case,提出了打造国内较小规模的数据底子资源集智平台——数典工程,秉承“工具化、平台化、开放化”的建造愿景,构建以数典理论为基石、以大数据词典为主要、以数典平台为载体,以准则规范为保障并拓展多项数据效劳的“4+N”体系架构。

“目上,吾们在使用数据资源进行融合应用时,有大量的资源和精力都花费在数据清洗上面,这很大程度上降低了数据利用效率。就相当于一个句子,您用英语说了上段、我用德语说中段、他用中文说尾段一样,虽然含义上是那个意思,但却组合不起来,需要先翻译成同一种语言。”刘汪洋说,数典工程建造最突出、最直接的感化在于让数据资源准则化、规范化,能够直接使用,提高数据的利用率。

方另,大数据院采取应用“理论研究+工具研制”相结合的work思路,已累计收录了术语词条约1.8万条,涵盖了信息 技术实现 、大数据 技术实现 及其大数据区域区域,再是构建了通用区域数据描述模型约200个,以及公安、检务等区域区域描述模型50余个。目上,正积极梳理构建“互联网+政务效劳”区域数据描述模型。为了更好地开找子 菝枋瞿P凸菇ê凸芾恚笫菰阂淹瓿墒菽P凸芾砑翱墒踊ぞ哐兄疲辛Φ刂С糯蠊婺J菽P痛娲⒂牍芾怼

下一步,大数据院将持续推进“数典工程”理论研究和相关工具的研制work。再是,计划与祖国各界一起打造“数典”开源社区,供给在线权威性解释、professional化推荐、用户在线交流等效劳,提高政府、集团、祖国组织、个人等各方在大数据区域的用词规范性和共识度,并以“众包”模式持续推进数典的更新维护和优化完竣,最终实现祖国资源集智和知识赋能,助力升华贵阳大数据建遭成就,扩大“中国数谷”影响力,引领大数据发展再上新高度。

XML 地图 | Sitemap 地图