行业动态/

王家耀院士:人工智能是地理信息产业转型升级的核心驱动力

时间:2018.08.10

作者:王家耀、武芳(信息工程大学地理空间信息学院、河南省时空大数据产业技术研究院)

地理信息产业与时空大数据产业

地理信息产业与时空大数据产业两者的内涵及其区别和联系是一个很难说清楚但是又应该说清楚的问题。

1.1 地理信息与地理信息产业

地理信息,指人对地理现象的感知。其内容包括地理系统诸要素的数量、质量 、分布特征、相互联系和变化规律等,分为空间位置信息和属性特征信息两大类 , 在计算机中以数据的形式存储和处理。

地理信息产业,指以全球导航卫星系统、遥感、地理信息系统及计算机通信网络技术为支撑,以地理信息 “ 获取( 传感网 )→处理( 生产 )→应用 ( 服务 )” 作为产业链的信息产业,属于信息服务产业, 即地理信息服务产业,是信息产业的基础和重要组成部分。

地理信息产业的发展取得了可喜的成绩,表现出了明显的发展趋势:

一是实现了模拟测绘产品生产到数字测绘产品的转变;
二是实现了延续多年的以基础测绘生产任务为主到基础测绘产品与深加工产品的转变;
三是实现了基础测绘向地 理国情普查和监测的延伸和拓展;
四是正在经历 从沿袭多年的计划经济体制机制到适应市场经济 体制机制转变 ;
五是正在建立 “ 基础地理信息+”( 跨界融合)的地理信息产业新理念和新思维 ;
六是正在思考和迎接当前迅速发展的云计算 、 大数据 、人工智能等新兴信息技术给地理信息产业 的转型发展带来的挑战和机遇 。


1.2 时空大数据与时空大数据产业


时空大数据:指基于统一时空基准活动或存 在于时间和空间与位置直接或间接相关联的大数据 。据此,时空大数据由时空框架数据和时空变 化数据两大类数据组成。

时空框架数据指基于统一时空基准的卫星导航定位数据 (含连续运行参考站 数据)、遥感影像数据、地图数据、地名数据等;时空变化数据包括社会经济人文数据、位置轨迹数据 、与位置相关联的空间媒体数据、社交网络数据、搜索引擎数据 、 视频观测数据 、生态环境 监测数据等。

时空变化数据聚合 (关联)在时空框架数据上,就构成了时空大数据。时空大数据具有位置、属性、时间、尺度、分辨率、多样性、异构性、多维性、价值隐含性、快速性等特性。

这样定义时空大数据的科学依据如下 :

其一,从哲学上讲,空间与时间一起构成运动着的物质存在的两种基本形式,两者相互联系且不可分割。
其二,从全球治理的角度讲,当今社会的一个重要特点是,随着全球化进程的加快,世界(区域 、国家、城市)管理和治理对空间和时间的依赖程度 越来越高,时空大数据正日益成为全球治理体系和治理能力现代化的核心驱动力。
其三,从作战 指挥的角度看,时间和空间的使用任何时候都是至关重要的 。作战指挥特别是一体化联合作战指挥,武器平台特别是远程精确打击武器等,需要精确的时间和空间协同。对于未来的非接触、非线性作战,需要天空地海一体实时动态的全球一致、陆海一体、无缝连续的时空大数据引领和支撑。
其四,从复杂世界的表达看,世界上变化着的万事万物只能通过时间维、 空间维、属性维来表达多维特征信息、即在空间维上关联随时变化的各种属 性信息。
其五,从大数据的本质看,大数据是包括人类活动在内的事物( 现象 )运动变化的产物,而且这种运动变化都是在确定的时间和空间中进行的,都具有时间参照和空间参照两个基本特征,所以,大数据本质上就是时空大数据。
时空大数据产业( 简称大数据产业 ):指以天空地海传感器网络为基础,以时空信息 “ 获取 (传感网)→处理(生产)→应用(服务)” 为产业链,以 人工智能等新兴信息技术为支撑 , 以数据密集型计算为特征的知识密集型信息产业 , 属于第四产业的范畴(从第三产业中分离出来)。

同地理信息产业相比较,时空大数据产业内涵要宽泛得多,规模要大得多,类型更具多维性和多样性,知识更密集,速度更快,产品更加多样化和个性化。与大数据相比较,时空大数据的概念提出较晚,但内涵外延都有了很大的丰富和扩展,时空大数据的应用领域更加广阔和有效,产业发展态势很好。

时空大数据发展的现状与趋势

2.1 国外时空大数据发展态势

目前,时空大数据已进入从概念到推广应用的关键转折期。

1)时空大数据全球战略布局全面提升。

以美国为代表的发达国家期望通过大数据竞争优势巩固其在该领域的领先地位。美国最早实施国家 大数据战略、2012年3月发布《大数据研究和发展倡议 》,2016年5月出台《 联邦大数据研究与开 发战略计划 》; 欧盟继2011年发布 《开放数据:创新、增长和透明治理的引擎》之后,又出台了《 数据 驱动经济战略》;

澳大利亚先后于2011年5月和2013年8月发布了《国家数字经济战略报告》 和《公共服务大数据战略》;英国于2013年10月发布了《英国数据能力发展战略规划》;日本于2012年、2013年先后发布了《面向2020年和ICTS综合战略 》 和《 新IT战略——创建最顶尖IT国家宣言》;韩国于2011年提出《大数据中心战略》,2013年又宣布建设首个面向社会公共开放的“全行业数据中心” 计划;等等。

2)时空大数据已成为战略性资源,判断大数据的核心价值成为核心 。

据有关统计分析资料,2020年前,全球数据量将保持40%以上的指数增长速度 ,大约每年翻一番,到2020年人类将拥有40ZB(1ZB=1048 576GB)的数据量 ,相当于地 球上的每个人产生5200GB数据,数据将成为核心生产资料 。数据总量的爆炸式增长也给数据存储、分析和使用带来巨大挑战,对大数据的分析和挖掘能力提出了更高的要求,判断大数据的价值成为核心问题,这就要求加大对大数据处理和分析挖掘技术研究的投入力量,以实现 “ 数据隐含价值 → 计算发现价值 → 应用实现价值 ”的目标。

3)跨境数据流驱动全球商品流 、服务贸易流、资本流,标志着全球化进入了新的发展阶段 。

根据麦卡锡全球研究院发布的《数字全球化:新时代的全球性流动》,2000-2014年 ,全球数据流从4.7TB增长到211.3TB,增长了43倍 , 与之相 对应的,全球商品流从10.6万亿美元增长到19万亿美元 , 全球服务贸易流从2.5万亿美元增长到4.9万亿美元,全球资本流( 外商直接投资 )从 1.39万亿美元增长到1.63 万亿美元。这就是大数据的力量。

时空大数据产业保持快速增长。时空大数据产业较之一般大数据产业更加宽泛和丰富。仅就一般大数据产业而言,据有关文献对2012-2018年全球大数据市场规模分析,2015年全球大数据 产业规模同比增长24.2%,预计2015-2018年全球大数据产业规模的复合增长率为21.8%。

2.2 中国时空大数据发展态势

中国政府高度重视大数据作为一种前瞻领域的战略意义,正在加快推进相关政策的制定和实施 ,启动促进大数据发展的数据强国计划。

1)国家大数据战略体系基本形成。

2014年,中国首次将大数据战略写入《政府工作报告》; 2015年8月,国务院发布了《促进大数据发展行 动纲要 》;同年10月,中共十八届五中全会将大数 据写入会议公报并升级为国家战略;

2016年3月公布的《 国家 “ 十三五 ” 规划纲要 》中 ,明确提出 “ 大 数据战略及行动计划”;2017年1月,正式发布《大数据产业发展规划 (2016-2020)》,为大数据产业的持续健康发展确立了目标与路径。国家大数据战略体系基本形成。

2)地区大数据发展格局初步形成。

在国务院2015年发布《促进大数据发展行动纲要》之前,广东(2012年12月 )、 上海 (2013 年7月 )、 贵州 (2014年2月 )等省( 市 )率先开展大数据地方政 策的先行先试 ;

在《促进大数据发展行动纲要》发布之后,各地政府加快跟进,截至2017年2月,全国已有28个省份出台与大数据相关的政策文件;特别是两批国家大数据综合试验区的获批启动,对中国大数据发展起到了重要辐射带动作用。

3)数据开放取得初步成效 。

面对开放数据所能带来的经济发展的巨大潜能,中国政府正在推动全国范围的数据开放工作。2015年发布的 《 促进大数据发展行动纲要 》明确提出,要在2017年底前形成跨部门数据资源共享共用格局 ,2018年底以前建成国家政府数据统一开放平台,到2020年逐步实现交通、医疗、卫生、环境、气象、企业登记监管等领域的数据向社会开放。

从实际执行情况来看,中央各部门间的数据共享与开放已取得一定进展,同时辐射带动了各省、市、县下设的十余万个单位;以上海、北京为代表的十多个地方政府自2011年便陆续启动了自己的数据开放计划 。

4)大数据产业规模快速增长 。

据有关文献,中国大数据产业规模到2018年将超过500亿元人民币,2015-2018年的复合增长率将达到47%,是全球大数据产业复合增长率的2.2倍,2018年以后的两年,大数据核心产业将有40%左右的高增长空间。2017年发布的《大数据产业发展规划(2016-2020)》提出 ,2020年大数据产 业将突破1万亿元人民币的规模,年复合增长率将达到30%。

2.3 国内外时空大数据发展水平和存在的问题

从世界范围看,美国是大数据的策源地和创新引领者。可以说,美国200多年的发展史也是一部围绕美国人口普查的数据科学和数据文化形成的发展史。

200多年前的美国第一次人口普 查拉开了这个新生国家初数时代的序幕 , 数据在 内战时期的成功应用成为1863年终结奴隶制的灯塔,从1865年内战结束到1900年 “ 镀金时代的三重崛起 ”(思维变革、组织变革和技术创新)影响 了其后整整一个世纪 ,20世纪30年代对选举结果的预测研究催生了统计科学的一次重大变革——科学抽样,1951年电子计算机走出 “ 象牙塔” 到20世纪80年代互联网的普及促成了开放 时代的到来,与数据总量急骤增加相适应的摩尔定律、社交网络、数据挖掘成为“ 改变世界的三股力量”,标志着大数据时代的到来,万物皆联网、无处不计算的普适计算即计算型社会时代正在到来。

美国200多年来数据科学和数据文化的形成与发展,使得美国在大数据理论和技术方面走在了世界各国的前面。

尽管如此 ,目前大数据领域仍然存在许多问题。例如,关注商业大数据的多 ,而研究科学大数据的少;讨论一般大数据的多,而研究时空大数据的少,忽视大数据的时空观,这涉及对大数据本质的认识问题;“ 一切凭数据说话,一切靠数据决策” 的尊重事实( 数据 )、 强调精准、推崇理性和逻辑的大数据理念尚未普遍建立等等。

人们应深刻认识到,大数据不仅涉及自然科学,也涉及社会人文科学;不仅涉及社会经济,也涉及内政外交和国防军事。文化本质上是人类及 其社会的品格 ,或一个国家及其社会的品格,数据文化是人类及其社会对待数据( 事实 ) 的品格。

中国大数据发展总体态势很好,但也存在一些急待解决的问题。

例如部分领域过热,盲目建设大数据中心和重建设轻应用、重硬件轻软件 重 复建设问题突出;数据开放进展相对滞后,地方数据开放的积极性不高,总体水平较低,质量参差不齐,试图拥有或占有大数据的多,而真正开发应用大数据的少;

投入大数据领域研究的人力、物力、财力不足和产学研相结合的政策、体制机制不落实,数据隐含价值→计算发现价值→应用实现价值的大数据理论、技术 、 产品和服务模式体系远未形成;数据文化的培育和普及未受到应有的重视,没有认识到数据文化是我国大数据及其产业化发展的灵魂,是推动数据科学不断发展的更基本、更深沉、更持久的力量。

尽管中国的大数据和数据文化相对滞后,但占有后发优势,特别是2017年5月贵阳大数据博览会期间,大数据战略重点实验室和全国科学技术名词审定委员会发布的 “大数据十大新名词”,即块数据、主权区块链、秩序互联网、激活数据学 、5G社会、开放数据、数据交易、数据铁笼、数据安全、数权法等,既揭示了大数据的时代特征 ,又反映了大数据的发展趋势。

“ 大数据十大新名词 ” 的发布代表了中国在实施大数据战略方面取得的成绩与经验,说明中国在推动大数据发展中正在 抢占理论创新、实践创新和规则创新的制高点。

时空大数据及其产业化

——地理信息产业的转型升级版

3.1 时空大数据平台

时空大数据平台是时空大数据产业化的核心。它是指把各种分散的和分割的大数据即时空框架数据和时空变化数据汇聚到一个特定的平台上,并使之发生持续的聚合效应 。

这种聚合效应就是通过数据多维融合和关联分析与数据挖掘,揭示事物的本质规律,对事物做出更加快捷、更加全面、更加精准和更加有效的研判和预测。从这个意义上讲,时空大数据平台是大数据的核心价值,是大数据发展的高级形态,是大数据时代的解决方案。

3.2 “通用时空大数据平台+”模式

从产业化的角度讲,通用时空大数据平台是指将时空框架数据汇聚在一个特定平台上,利用这个平台生产军民两用的基础测绘地理信息产品。

所谓“通用时空大数据平台+”模式,即以通用时空大数据平台作为框架,聚合民用、军用的时空变化数据,分别构成民用、军用时空大数据平台。

对于 “ 通用时空大数据平台+民用”模式,即将地方政府各部门各行业的政务 、自然资源、规划、交通、水利、管网、人口、经济、人文、社会、医疗、教育、电力、公安等数据汇聚在通用时空大数据平台上,使之成为新型智慧城市的 “ 智脑 ”,通过持续的聚合效应,生成各类(种)民用深加工知识产品,为政府综合决策、各部门各行业和社会公众提供智能化服务;

对于“通用时空大数据平台+军民”模式,即将战场(作战)环境、兵要、目标、情报、态势等数据汇聚在通用时空大数据平台上,使之成为联合作战一体化指挥的“ 智脑 ”,通过数据分 析与数据挖掘,生成各类军用深加工知识产品,为国防建设、作战指挥和作战行动提供智能化决策支持 。

3.3 时空大数据平台的构建

从目前信息技术发展情况看,时空大数据平台的构建有4种模式可供借鉴:

一是基于网络服务的空间信息共享与空间数据互操作技术模式 ;
二是基于网格服务的信息资源共享与协同工作(协同解决问题)技术模 式 ;
三是基于云计算的时空信息服务技术模式 ;
四是基于网格集成与弹性云的 混合式时空信息服务技术模式。
上述4种模式中,第一 、三种技术模式是分别基于网络计算和云计算的,应用较普遍,特别是第三种技术模式;第二种技术模式是基于网格计算的,这里的网格是指新一代网络或第三代互联网,主要用于重大工程和复杂科学计算的广义信息资源共享和协同工作,技术 门框相对要高;而第四种则是吸取了网格服务和云服务各自特点的优势互补的技术模式 。

针对上述 4 种模式,从内涵、功能、技术架构、关键技术、标准、服务共享特点和发展趋势等7个方面分析,可以看出4种技术模式都是采用面向服务的体 系架构,都是解决 “共 享”与 “服务” 问题,只不过“共享”的程度与“服务”的范围 、 方式不完全相同;

网络服务与网格服务的技术标准有相同的,也有不同的, 二者的大趋势是兼容或融合,但标准是国际或国家统一的,服务提供方和服务请求方都必须清楚;而云服务标准可以是内部统一的,用户不必清楚;网格服务是网络服务的发展 , 云服务是网格服务的简化版或商业化实现。

据此,提出如下构建时空大数据平台的技术重点。

1)构建一个开放共享的体系架构, 强化共用,整合通用,开放应用。SOA 由 3个角色(服务提供者、服务请求者、服务注册中心)和4个基本操作(服务提供者将自己的 “ 服务 ” 描述和发布到服务注册中心,服务请求者在服务注册中心访问 和发现自己所需的 “ 服务 ”, 根据服务注册中心的 “ 服务 ” 定位直接 “ 绑定 ” 服务提供者的 “ 服务 ”, 调 用 “ 服务 ”) 构成。

2)构建一张天地一体的信息服务网络 为实现范围更加广泛的信息资源共享与多层次 、 多节点的协同工作提供崭新的运行环境。包括时空信息获取(实时化)、 处理(智能化)、服务(网络/网格化)的一体化运行环境,多源异构时空信息融合环境,实现数据即服务软件即服务、基础设施即服务、平台即服务 和知识即服务的信息资 源共享环境 , 多层次 、 多节点协同工作(协同解决 问题)的环境,以及分布异构时空信息系统网格集成的环境。

3)构建一个开放共享的时空信息服务“ 资源池 ”为时空大数据平台应用服务提供强大支撑(数据体系)。通过多源异构时空大数据融合(聚合),形成一致性的数据集(全球一致、陆海一体、无缝连续),通过数据挖掘与知识发现 , 进一步提升治理体系和指挥决策的现代化水平。

4)构建一个通用功能平台 通过服务化封装,实现各类信息资源的高效调度 , 支撑信息服务 的智能化 。

5)构建一个高效运行的组织管理指挥体系实现信息资源的汇聚共享和跨部门的多层次、多节点的协调联动,保证时空大数据平台安全 、可靠运行。

6)构建一套标准体系 保证时空大数据平台规范、有序、健康、安全、可持续运行。

3.4 时空大数据的产业化

时空大数据产业化是通过时空大数据平台产业化实现的。因为时空大数据产业化是一个新问题,应该走一条从基础研究起步产业化创新之路。

1)要研究和建立以数据科学为核心的时空大数据理论体系 目前,“ 数据科学 ” 的边界还不清晰,时空大数据理论研究薄弱,更未形成时空大数据的理论体 系,而这是时空大数据产业化的基础 。

2)要研究和建立以 “数据隐含价值 → 计算发 现价值 → 应用实现价值” 为核心 , 以 “ 数据获取(传感器网)→处理(生产)→应用(服务)” 为产业链的 时空大数据产业化的技术体系 。

3)研究和设计包括软件产品、硬件产品、软硬件集成产品、各类(种)应用平台产品和数字产 品在内的时空大数据产品体系。

地理信息产业转型升级的驱动力

信息化的发展遵循数字化→网络化→智能化的规律,地理信息产业的发展亦如此 ,智能化是地理信息产业发展的高级阶段。

1) “ 互联网+”改变地理信息产业发展的思维方式:跨界融合。

“ 互联网+”本质上是互联网、物联网、云计算等新兴信息技术在包括地理信息 产业在内的各行各业“ 全工作 流 ”、“全产业链”、“全价值链”中的深度融合和集成创新应用,已经成为包括地理信息产业在内的信息服务业发展的新动力。

因此,“互联网+”的本质是跨界融合, “基础地理信息+”和“ 通用时空大数据平台 +”的本质也是跨界融合,“+” 是核心,提出跨界融合的解决方案是关键。只有这样,才能更充分地发挥基础地理信息和通用时空大数据平台的“基础”和“通用 ” 作用,实现地理信息产业到时空大数据产业的转型升级。

2)云计算具有的信息资源管理、处理和应用的“全面弹性”支撑“地理信息产业 ”到“时空大数据产业”的转型。

时空大数据产业化需要超强计算能力的支持。云计算是一种新的计算模式 ,它 通过 “ 池化”和 “云化”把数千台甚至上万台机器都 放在一个“池子”里面 , 具有时间弹性和空间弹性 ,用户需要多少CPU、内存、硬盘的 “虚拟电脑 ”,只要通过一种叫做“调度” 的算法,就可 以在 “池子”里面找到并使用自己所需要的信息资源。这就是 “资源弹性”IaaS。

云计算在“资源弹性”即基础设施即服务(IaaS)之上增加了一层 “应用弹性”,即平台即服务(PaaS)和软件即服务(SaaS),以满足时空大数据的“应用弹性“需求。云计算支撑时空大数据处理的分布、协作(同)化和智能化。通过任务分解,解决分布式问题;通过工作流重构,解决并行问题;通过算法调度, 解决协作(同)化问题。

3)人工智能是地理信息产业转型升级的核心驱动力。

人工智能技术的发展经历了推理期(20世纪50年代至70年代初)、知识期(20世纪中期开始)、学习期(20世纪80年代以来)。机器学习是人工智能技术发展进入学习期的标志性事件,即计算机通过学习获取知识。算法、大数据和计算能力构成了人工智能的三要素或 “三驾马车”。

其中,算法是用好大数据和计算能力的关键 需要靠机器学习来不断优化,而算法的不断优化又是靠不断输入大数据进行深度学习来实现的,没有大数据,算法就成了 “无本之木、无米之炊 ”,数据质量不好,就会算不准。算法、大数据还要靠超算能力,没有计算能力,算法就失去了引擎,大数据处理的快速性也不可能实现。

在人工智能的算法、大数据、计算能力三要素中,随着智能感知技术的快速发展,时空大数据已出现爆炸式增长态势,为时空大数据产业化提供充足的数据支撑;随着计算机技术的快速发展,适应时空大数据产业化需求的计算能力已经完全具备;需要人们更加关注的是算法研究,特别需要加强多源异构时空大数据融合、分析、挖掘与知识发现、可视化等方面的算法研究。

在人工智能算法、大数据、计算能力 “三驾马车” 的驱动下,地理信息产业 到时空大数据产业的转型升级必将加速实现。

来源:武汉大学学报(2019年1月,44卷1期)GIS圈对原文进行了编辑(版权归原作者及刊载媒体所有)