从多个维度理解数据要素

发布企业:深圳市星宇佳科技有限公司时间:2022-11-24 14:40:00

企业深圳市星宇佳科技有限公司

联系人:陈先生

微信:13682456195【企业微信】

手机:13682456195

电话:0755-82522195

地址:深圳市福田区华强北街道华航社区华富路1004号南光大厦510

从多个维度理解数据要素

当前,信息技术发展日新月异,对社会生产生活影响深远,在推动经济社会发展、促进国家治理体系和治理能力现代化、满足人民日益增长的美好生活需要等方面发挥着越来越重要的作用。

党中央、国务院高度重视数字经济发展。习近平总书记在致首届数字中国建设峰会的贺信、致2019中国国际大数据产业博览会贺信、在二十国集团领导人峰会上关于世界经济形势和贸易问题的讲话等重要会议和讲话中,多次提到要建设数字中国、发展数字经济、“建设适应未来发展趋势的产业结构、政策框架、管理体系,提升经济运行效率和韧性,努力实现高质量发展”。2019年10月底,党的十九届四中全会《关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》首次将“数据”列为生产要素,提出“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”。为推动数据要素有序流动,提高要素配置效率,国家积极布局新基建,加快培育数据要素市场,通过“上云用数赋智”、工业数据分类分级,数据管理能力成熟度评估等一系列举措,进一步规范数据资源共享、开放、开发利用,激发全社会创造力和市场活力。这一系列重要举措充分反映了党中央对信息技术发展时代特征及未来趋势的准确把握,也充分凸显了数字经济时代数据对于经济活动和社会生活的巨大价值。

从知识演化看数据

数学是人类揭示自然规律、推动现代科学技术进步的重要工具,是构建数字经济发展的基石。古希腊哲学家柏拉图曾说“现实是完美世界的一个投影,那个完美世界是由数学建造的”。人类思维是通过各种感官器官(即听、视、嗅、触等)收集的数据在脑神经元网络结构中流动、吸收、重组加工后的产物。结构和数据之间存在一种可以互相转化的关系,数据是传递信息的结构,而结构可以吸收数据所传播的信息,形成新的结构,从而不断地变化。数据、信息、知识及智慧金字塔(即DIKW体系)揭示了人类知识推理演进的原理和过程。人们通过原始观察、度量及数字化手段获取作为原始材料的各类数据;按照规则将有逻辑、有意义的数据加工成信息;再对各类信息集合进行综合、提炼、归纳后形成特定的知识;智慧则是合理地应用知识并进行正确判断、决策的能力,是人类的最大特征。

从人类历史看数据

人类社会发展的每次重大历史性突破都伴随着人类对数据、信息及知识处理手段的创造和发明。人类社会的各项活动都与数据、信息及知识的创造、传播和使用直接相关。约5万年前,语言的产生是人类利用声音对数据、信息及知识等进行传播、理解及使用的一次重大革命,促进了人脑的发展,为人类文明成果保留和传承提供了重要的手段;3500年前,文字的出现是人类利用图形符号对数据、信息及知识等进行记载和传播的一次重大变革,增加了人类间彼此交流、沟通思想的手段,将数据、信息及知识由声音传播转变为物质传播,使思想流动突破了时空限制,特别是人类对数学(古代中国称之为算术)研究,找到了认识和描述自然规律的工具,奠定了现代科技发展的基础;2000年前至1000年前,造纸印刷术的发明为信息找到了价格相对低廉、携带便捷、快速扩散的载体,使思想和知识在全社会范围内的广泛传播成为可能,读书识字不再是贵族富豪们的专利;19世纪中期以后,无线电话及电报的发明使信息由物质传播转化为电传播,打破了地理空间之间的限制,提高了信息传播时效性;20世纪40年代末至今,以微电子、现代通信、计算机及互联网为代表的信息通信技术(即ICT)是人类信息传播和处理手段最为迅速、广泛且深刻的革命,推动着人类从工业社会迈入了崭新的信息社会,信息(数据)量和处理能力成爆炸性增长,为推动数字经济的发展提供了技术手段和物质基础,全球数字经济发展大幕正徐徐拉开。

从技术演进看数据

数字经济的快速发展得益于过去几十年信息通信技术(即ICT)创新的突飞猛进。无处不在的网络传输、强大的计算能力、超大规模的存储容量以及信息通信技术设备和数据管理成本的大幅下降,让信息通信技术(ICT)创新日益普及,切实推动数字化进程。从1946年第一台计算机诞生以来,人类在信息通信技术(ICT)领域取得了史无前例的卓越成就。以电子管、半导体、集成电路、超大规模集成电路为代表的电子工业升级换代促进了数据处理设备小型化、微型化,以有线通信、卫星通信、宽带通信、光纤通信、无线通信(2G、3G、4G、5G)为代表的通讯技术不断创新发展奠定了构建全球信息高速公路的基础,以大型计算机、小型计算机、个人计算机(电脑)、云计算、智能手机、智能信息处理终端(各类平板电脑为代表)的信息处理设备迭代升级,这些真正让平民百姓能成为数据开发利用者,让数据走进平常百姓家。1969年互联网诞生,开启了全球网络空间的构建,20世纪90年代美国“国家信息基础设施建设计划”(即信息高速公路计划)的实施掀起了全球信息化建设的热潮,在以信息技术为代表的第三次浪潮推动下,人类不知不觉走进了信息社会。互联网让世界变成了“地球村”,网络空间成为与陆地、海洋,天空、太空同等重要的人类活动新领域。根据联合国贸易和发展会议《2017年信息经济报告》,全球信息通信技术产品和服务的产值估计占全球国内生产总值(GDP)的6.5%。2019年,全球互联网流量增加到2005年的66倍。

从发展趋势看数据

随着数据收集、存储和处理成本的大幅下降和计算能力的大幅提高,数字化及数据化正在改变世界各地的经济活动,数据驱动下的数字经济正在为全球经济发展注入新动能。数据已成为与传统人力资源和金融资源同等重要的经济资源和社会资源。人类正步入新的数据时代,一切业务都可数据化,现实世界的各种事物(如人、组织、建筑物、工厂、城市等)都可在网络空间(虚拟世界或数字世界)通过数据构建相对应的数字双胞胎(也称之为数字孪生或数字克隆)。2002年,美国学者迈克尔格里弗斯(Dr. Michael Grieves)提出“数字孪生”的概念,以数字化手段在虚拟信息空间构造出一个与物理实体相对应的虚拟世界的数字孪生。5G、物联网、人工智能、数字孪生、云计算、边缘计算等智能技术群的“核聚变”,推动着万物互联(Internet of Everything)迈向万物智能(Intelligence of Everything)时代,现实世界和数字世界的界限逐渐模糊,进而带动了“智能+”时代的到来。正如德国国家科学与工程院院长孔翰宁强调的,“今天发展工业的准则是:数字化一切可数字化之物,并由此开辟新的价值创造模式”。数字化是万物互联的前提,而数据化则是实现智能化的根本。数据可以由人创建或者由机器生成,例如传感器采集的天气信息卫星影像、数字图像、消费记录、GPS信号等。数据几乎覆盖了从健康、交通到能源等经济社会的各个领域。随着新一代信息技术的迅速发展与普及、全球数据以“井喷式”的速度生产。据国际数据公司(IDC)发布的《数据时代2025》显示,全球每年产生的数据将从2018年的33ZB(1ZB=10万亿亿字节)增长到175ZB,相当于每天产生491EB(1EB=1.1529e+18字节)的数据。据IDC预测,2020年,全球数据量会达到44ZB,2035年会达到1.9万ZB。

从基础资源看数据

数据是知识经济的原材料,是软件定义世界的基础,是驱动人工智能算法引擎持续转动的燃料,是网络空间不停流动的血液(水),是推动数字经济持续发展的关键生产要素。数据经济越来越依赖于各个机构数据生成、存储、处理和传输,特别是数据在国内跨层级、跨地域、跨系统、跨部门、跨业务之间乃至各个国家之间有序流动,数据获取及分析对提高企业、政府及国家竞争力具有战略性意义。

信息技术发展的终极目标是基于物联网平台实现设备无所不在的连接、开发各类应用并提供多种数据支撑业务。但仅仅是连接还远远不够,物联网中的设备应当具有一定的计算能力和智能能力,这令其不仅成为可监测、可控制、可优化、自主性的产品,更成为边缘计算节点和智能产品。数字孪生的真正功能在于能够在物理世界和数字世界之间全面建立准实时联系,实现物理世界与数字世界互联、互通、互操作。从具体实现路径来看,数字孪生首先对物理对象各类数据进行集成,是物理对象的忠实映射。其次,数字孪生存在于物理对象的全生命周期,与其共同进化并不断积累相关知识。最后,数宇孪生不仅对物理对象进行描述,而且能够基于模型优化物理对象,最终实现对物理世界的改造。Gartner预测,到2020年,互联传感器与端点将超过200亿、数字孪生将服务于数十亿个物件。各企业机构一开始只是简单实施数字孪生,但将随着时间推移对其加以演化,提高其收集与可视化正确数据的能力,应用正确的分析与规则并有效响应企业、政府及国家的业务目标。工业互联网星星之火渐成燎原之势,其中,数据作为“沉默的金矿”将重塑即将到来的工业4.0体系。

从数据科学看数据

数据资源已经成为战略性的要素资源,正在成为建设性的基础资源。世界主要国家纷纷加强战略布局,不断提高数据资源开发利用水平。数据是重要的新型战略资源,它不同于石油这类物质性资源,它是一种可重复挖掘的、并可再提炼升值的新型资源(这种特性更像自然界的水资源,是一种可重复加工、再利用的资源)。数据资源掌控能力及多寡已经成为国家软实力和竞争力的重要标志。当前,世界正处于新一轮科技革命和数字化转型突破的历史关头。云计算、大数据、人工智能、自动驾驶等新型经济业态正在形成,加快与经济社会各领域的渗透和融合,从而推动了技术创新、产业升级和经济转型。这些新兴经济业态围绕的核心就是数据。信息化将现实世界中的事物和现象以数据的形式存储到网络空间中,是一个生产数据的过程。这些数据是自然和生命的一种表示形式,这些数据还记录了人类的行为,包括工作、生活和社会发展等。

随着数据在网络空间中被快速大量地生产并存储,将导致数据爆炸(data explosion),数据爆炸在网络空间中形成数据自然界(data nature)。数据是网络空间中的唯一存在,数据学(Dataology)和数据科学(Data Science)作为专门关于数据研究的科学正逐渐被人们所重视。2013年以来,“数据科学”(Data Science)在谷歌搜索量一直呈现稳步上升的趋势,数据科学正成为一个新热词。

2018年6月4日,美国国立卫生研究院(NIH)发布了其首个《数据科学战略计划》(NIH Strategic Plan for Data Science),该战略计划为NIH资助的“生物医药数据科学生态系统”现代化提供了指导路线。数据驱动的数字经济蓬勃兴起,为探索客观规律提出了新规划,为国家治理赋予了新手段,为产业发展创造了新机遇。在数据价值链不同阶段创造价值将是未来知识经济和数字经济的核心。数据、算法(计算方法)、算力(算法能力)及算能(算法效能)必将成为信息化领域未来竞争的焦点。