行业动态/

刘先林院士:AR技术与三维GIS的融合

时间:2018.07.26

       6月15日上午,空间地理信息数据高效获取、应用与服务峰会在北京国家会议中心开幕,中国工程院院士、摄影测量与遥感专家刘先林先生做了题为“AR技术与三维GIS的融合”的演讲,以下为演讲实录,未经院士本人确认:

  刘先林:

  各位同志,欢迎大家来这里听我的报告。前不久中国电子协会邀请我做一个关于这方面的报告,因为我过去做了一些显示的技术,所以答应了。后来发现VR技术已经向AR过渡了,就是要把实景和虚景相结合,实景就是我们测绘人的长处了。昨天(6月14日)上海搞AR最著名的公司来找我要搞合作,要快速把实景生产出来。AR行业在2015年的时候很疯狂,到后来就越来越不行了。现在看起来,能不能把地理信息技术注入进去,获得新生,希望AR和VR技术进入新一轮的潮流。

  地学业者对AR有个定义,说现在空间地理信息数据主要是形的基础上来叠加各种实时大数据,就是流,使人们对客观世界有更深刻的认识,这是我们对AR的见解。这个大会包括了三维显示的报告,我们讲的是测绘工作者,立体观察已经几十年了,经过了很多次的更新换代。比如说左边这个立体机,右边这个就是我们解析测图仪,解析测图仪很少,1998年之后就不怎么用了,大家可能没见过。这个大家非常熟悉,就全数字,这个很流行,全国大概有几千套。然后多通道的立体显示,基于GPU的融合技术,我们可以实现这样的大屏幕的上下融合、左右融合,过去只能是普通三维显示,做成了可以在立体上显示,主要的技术就是把显卡底层的功能专门做一个空间实现融合。融合也不是那么简单,几何上要融合起来、光度融合起来、高度上融合起来,要看不出任何的缝。比如说左图是有三通道的,这三个通道早期都是用双液晶,最早大家都知道我们是CRT的,CRT的照度非常低,我们花几百万、上千万买过这个比利时的东西,简直比较用,后来全部退掉了。后来我们发明了双投影、高亮度液晶投影,亮度非常高,其中一个重要的技术就是两个投影来实现一个立体的投影,同时还要融合,因为一个投影仪的宽度有限的,我们要更大的,整个会场要很震撼的,这个也做了不少,全国所有的地理信息产业部门目前用到的液晶的高亮度的东西。右边这个用了一个国外的投影,直接人可以沉浸式的,也是国家测绘局用的。

  最近新出来的就是LED大屏幕,这个比较新。所有的那些投影仪亮度还是不够,不能在室外,只能在室内。要在室外看立体就是要高亮度的LED,LED的每一个发光管都是可以表现红蓝绿彩色的板,方便率很高,可以在野外使用。我们目前有两种方式,一种就是主动立体,就是戴上液晶眼镜,把这个液晶放在眼镜上来是可以看到的,戴上眼镜就能看到立体。另外一种方式就是被动的LED,被动LED戴的不是液晶眼镜了,目前销售了第一台,估计未来在一些大场合,像今天这个LED屏幕还是相当高了,但是不能看立体,给什么眼镜都不行。我们的测绘人的立体是不需要旋转的,现在的发展趋势就是LED。目前LED的立体大屏幕的需求非常大,已经开始出现了,这是最新一代的立体。手机立体也有。

  下一步我们提倡一个叫做手机的裸眼立体,手机很有意思,我们年轻的时候看立体有的要拿立体镜,有的不用立体镜,直接拿两个照片折起来就可以,裸眼没有任何的装备就可以看立体。智能手机横过来以后跟我们眼基线正好相等,所以拿来看立体非常合适。所以下一步手机的裸眼立体将会出现,我们也致力于这方面的研究。因此在三维显示方面,应该说我们测绘人比搞AR、VR的人很高,而且现在还有新花样要出来,就是手机的裸眼立体,这是我们下一步要提出的。

  我们陆部长提出来要把所有的二维系统变成三维系统,因此这就给我们带来了机会。我们认为所谓的地理信息大数据分为两种,一种叫做形为主的,一种就是流为主的,一种是时空大数据,一种是实时大数据。我们做的事就是时空大数据,实时大数据很有意思,它是没有目的的,不知道采集是为了谁采集的,实时大数据可以进入流通领域的,它的时间周期也比较短,甚至于毫秒级在那里采集数据。我们最近采集周期也很快,一般一个城市最快三个月要扫一次,北京就每三个月要拍一次,我们拍了四万公里,马上又要开展这方面的工作了,又要拍四万公里。我们下一步怎么样?是不是新的冒出来了?又要拍。实时大数据频率是非常高的。

  我们所做的时空大数据分两种,一种是无结构大数据,一种是有结构的大数据。无结构的大数据实际上不是大数据,它是数据大,我们常常说的这不是大数据。什么叫无结构大数据呢?比如说航片、卫片都是这个东西,最近非常流行的叫做mesh模型,我们芯片机动辄售价七八百万,今年订货很多,国外的产品都没把我们压跨。国外的产品比不过我们,今年全部都找我们订货了。因此可见mesh模型非常流行,因为它的感官上感觉还是比较好的,但是mesh模型是无结构的,你看到路上的行人、车,你都关不掉,它不分类,更不要说分对象了,所以这种无结构模型的话是可以看、可以感受,它要做出决策的话只能用人脑,而结构化的时空大数据是电脑来产生知识的。要想用电脑产生知识,你所用到的数据绝不是无结构的大数据,而是有结构的大数据。这种数据才叫真正的大数据,才叫做会说话的数据,或者叫做智慧数据。而我们所说的mesh模型都不是智慧数据,仅仅是数据大而已。因此这套技术,我们地理信息界下一步为社会提供的数据一定是这样的数据,这样的数据绝对不是工厂化处理能够实现的,一定是智能化处理才能够提供的。过去说一流的企业是做标准的,现在不是说了,现在是一流的企业做平台。

  这是一个无结构的三维模型,这个模型很老了。

  传统的测绘遥感数据量非常大,但是要把它由数据大转化为大数据,必须要用人工智能的技术来对大数据进行结构化,特别是当前流行的深度学习能够自动的监测、分割、跟踪矢量、挂接属性。传统意义上的深度学习就是监测,能够找到,找到这里是程序,但是这还远远不够,一定要进行分割,然后在这个基础上进行跟踪得到矢量,然后挂接属性,如果没有属性的话是不可能产生知识的。所以说结构化数据第一个就是分层分类,一层层打上来的建筑物。这是我们所要求的结构化的大数据。这是电线的探头,在你的系统里一定是分开的管理的,对于他们搞虚拟现实的人来说很不可理解,他们做的AR、做的实体模型不分层分类,他们对这个也感兴趣,觉得为什么要这样?昨天专门跑来问我,我给他们讲了很多的原理。第一步这个数据一定是分层分类的,哪怕没有类,大家都混在一起不行。这个就是对象化管理,每一棵树都有自己的属性,一定是对象化管理的,这是结构化数据。还有一定要有三维矢量,像是房屋。这些图形的背后一定是一些文件来支持的,将来计算机能懂读这个东西,它不用再自己去用深度学习来对这些不会说话的数据进行改造,事先采集的时候就把它搞定了,这中间就Y轴就是对象实体。你要和这些工业部门相结合的话属性要求非常严格。我们可以把几何属性都事先做好。这种形式的数据是高级形式的,生产最困难,必须高度自动化,人工是不可能生产出来的。这种数据做出来之后可以生产任何一种低级形式的数据,无结构的也可以做出来。

  目前从AR的观点来看是以感性为主,不是理性的。感性为主的意思就是放在卡上进行一次碰撞检测,或者前后遮挡检测,这个就很低级,只能在卡上运算,不能在云上运算,我们要的数据是要在云上进行知识产出,这点对AR是很重要的。昨天跟他们搞虚拟的人讲到,我们是搞现实的,虚拟和现实一定要相结合。

  当然对于AR数据结构化的数据标准还有待研究,流动的数据,所谓的流分两种,一种是有形的流,比如说车辆探头。一种是无形的数据流,比如说数据流、资金流,网购的数据。这两种流都可以叠加到相对静止的空间地理信息数据上,使得观测效果更生动,这就是我们说的热力图,所以我们能够做的事很多。

  最后,我给他们讲了一下AR技术怎么样才能再次成为一个潮流,它的核心问题要使受众达到千万级,甚至于亿级的,我们做一个产品动不动就几百万。用户一年最多销七台,但是人家滴滴打车融资动不动上百亿美元,因为他的受众非常广、非常巨大,你这个AR要想再次成为潮流的话,受众一定要从少数人变成多数人。

  AR的下一步热点,跟我们地理信息相结合可以做些什么事情?

  第一个是4DAR,就是交通部门的探头。这个探头的数据量是爆炸性的,警察要想从里面找到一点知识是很困难的,就要用4DAR技术帮助他。因为这个探头数据里面有大部分的数据都是静止的,比如说树、标线、房子,都是静止的,只要把移动的部分提取出来。每个探头是有模型的,有它的位置和方位,在这个基础上就可以把探头的数据进行叠加,这个就是录像用深度学习很方便的可以把车找到,过去用这个技术是在街景发布的时候把车牌给隐蔽掉,现在不是了。现在是要把这个车牌用上,没有车牌的数据无法使用,这是我们三维模型。车上去之后这个模型还可以旋转,这就是AR现场的实景。也就是通过深度学习的办法把警察的数据拿出来,把车找出来,把固定场景的东西更真实的表现在上面,仅仅把警察所关心的车提取出来,然后投上去,这就是4D。

  如果警察关心人的话也是可以的,这有什么好处呢?就是数据量大的现状,而且不仅可以看到现状,还可以追溯历史、预测未来,看这个车下面要跑到哪儿去。这里面最核心的是移动对象应该是有属性的,就是说这些移动对象他的车牌号、车型、车的颜色,这都是移动对象的属性。所以我们的三维对象的话过去有点状对象、线状对象、面状对象、体状对象,这是我们的对象化管理中的四种。点状对象比如说电杆,线状对象是隔离带,面状对象是墙,体状对象是建筑物或者过街天桥。现在出来了第五种就是移动的对象,这个移动对象在我们的结构里面能改,仅仅是把属性里面对这个对象要有描述,在我们的属性里面有它的大写坐标、小写坐标、几何形状,还要增加它的时间。就是我们过去三维时代的时候,这个属性里面的几何对象三维矢量,比如说一个路灯三个点就够了,一个坐标也是三个点,一个电杆两个点就够了,一个房子当然多一些。现在移动对象的话属性里面的几何矢量就增加了,T1XYZ,T2X2Y2Z2,属性项里面的矢量部分变成了四维的矢量,这就是4DAR结构的数据基础。如果不是这样的,警察可以在系统里面调任何时刻、任何地点的场景,任意时间、任何地点、你所需要的任何对象的场景,可是周围的一切东西都是真实的。把干扰的车也可以去掉了。

  这是第一个“热”,我们预计在国家公安部门大量的探头数据量爆炸的情况下,将会有这个“热”支持AR技术进一步的发展。当然AR技术可以在手机上发布,也可以在LED上发布,也可以在网上发布。

  第二点就是手机上的立体观察,因为手机的数据量有限,目前要都从网上下载的话,你在网上下载一个带纹理的模型数量会很大。那么怎么办呢?最近我们就搞了一个数据量几乎为零的,几乎可以忽略不计的,叫做“白膜”。这就是一个“白膜”,当然这里面把建筑物关掉了,当时做得还不是很成功,完全用激光,不用影像就可以把“白膜”输入进来,做好之后它的数据量几乎可以忽略不计,用本地数据就可以漫游,但是标线、路杆、天桥都是真实的,虽然没有用影像,但是也足够让人看到这一切。所以这种“白膜”做出来以后就有可能在手机上进行漫游,这个我们认为是AR的下一个热点。

  这个“白膜”做出来之后有什么用呢?首先一个就是可以作为自动导航,给他们注入一些新的血液。现在的导航软件当然也有三维,但三维基本上都是虚假的,跟真实的情况不一致。我们现在虽然不是真实的纹理,但是基本上形状是真实的,因此从过去所谓的百度、高德这些自动驾驶的软件中注入这样的东西,就是所谓的实体导航。实体导航有什么好处呢?第一个好处就是到了目的地之后可以找到真正要去的地方,而不是走错了。现在因为北京搞拆伪建,把大厂商和宾馆的标志都拆了,所以到了目的地之后导航结束了你也找不到要去的地方。因此这样的实体导航就可以把你的目标所处在的路口,或者是建筑物进行渲染,渲染成另外一种颜色,你这样就很容易的在最后100米的时候找到你要去的地方,这是一个模式。另外一个就是实体定位,假设我们把这个街区所有的“白膜”都建起来,这个“白膜”建起来并不是很复杂,只要车开过去数据拿回家,第二天早上就出来了,这个就靠云计算,靠GPU,第二天早上就可以拿到“白膜”,基本上八九不离十,应该说基本上不用编辑了。这样的数据对于未来的实体定位提供了一个基础,现在的定位潮流很多,现在的地基增强、蓝牙定位、基站定位,这些都是无线电定位,跟我们搞测绘的没有关系。但是我们搞测绘的下一步会推一个实体定位,我实体都做出来了,你拿我就可以了,当然也不是图像定位,图像定位的话信息量太大。所以我们测绘工作者在定位的技术上可能会有新的思路。

  第三个热点,就是AR车窗的自动驾驶。也就是说在国外是有这个想法的,还没有完全实现。会上有一个公司说他可以做AR车窗,AR车窗就是在车上可以既把你计算机里面的实体街景的模型投影到屏幕上去,同时你又可以从,AR车窗是一个透明的,可以看到地面、看到实景。这两者结合起来对于自动驾驶,对于驾驶的乐趣会提高。一方面你的数据是不是对,就可以知道了。另外一方面你自动驾驶的路线是不是对,如果不对的话一定是模糊的。因此AR在移动物体,包括人当中都会很有用,过去的头盔都是VR头盔,目前所看到的都是VR头盔,这个VR头盔看不到自己的身体,也看不到地面,用户用一会儿就头晕。因此提出来一个AR头会的概念。而AR头盔要想推广的话,那就离不开我们搞测绘的人了,因为它要实际模型,实际模型由谁提供呢?就是靠我们测绘人提供的,所以我们在这个当中的应用是有很多场合的,虽然我们是跨界融合碰撞了一下,最后反响还是很好的。十多个人来加我的微信,我为什么在这里做报告呢?就是希望我们测绘人不要局限在过去的二维、三维,现在是四维时代了。也许这个会来的很快,把AR技术和我们现有的采集技术结合起来,我们现在做的数据就要求非常科学的,将会在马路上每隔200米就修一个5G的基站。刚才我们四五十类的路线都可以全要素的采集出来,这点是有基础的。但是客户提出来的一个需求,你采集了之后我怎么知道它的变化?是不是再采一次?我现在初步的思路还不是这样的,而是用电子标签,用RFDI的技术实现动态的监测,因此我们测绘工作者的服务面,虽然我们测绘局现在定到自然资源部去了,但是服务面是非常宽的,几乎没有一个行业能够不用我们的技术。所以我们测绘地理信息工作者是在新一轮的创新大潮中大有可为。我的报告就到这里,谢谢。