感受“大数据”里的地质情——2014年国际数学地球科学前沿问题学术研讨会侧记

23.10.2014  18:08

        对很多在北京生活的人来说,一场不期而至的重度雾霾或许搅乱了他们在黄金周拾起的好心情。但在中国地质调查局的大会议室里,一场属于数学地球科学家们的聚会正悄然上演,台上的激情演讲、台下的踊跃提问,似乎是在用智慧的“火花”和窗外令人压抑的天气“唱反调”。

   用数字破地质之“霾”

  用巧妙的公式拨开地下世界的迷雾、用缜密的逻辑驱散找矿大军的阴霾。10月9日,2014年国际数学地球科学前沿问题学术研讨会在京召开。

  “基于大数据理念,充分利用现代数学地质理论与方法,云计算、物联网、移动通信等新一代信息技术,加强两者交叉融合,为加快实现地质找矿突破等方面提供了前所未有的机遇。”正如中国地质调查局副局长王研在致辞中指出的,数字技术的大发展给地调工作带来了新的启迪。

  “大数据技术的意义不在于掌握规模庞大的数据信息,而在于对这些数据进行智能处理,从中分析和挖掘出有价值的结构化信息。”数据、信息、知识、财富、服务、再数据,从数据到财富是一个过程复杂的完整数据链。

  如何实现由“数字地质”向“智慧地质”的转变?

  “过去我们只用统计分析研究数据”,中国地质调查局发展研究中心李超岭研究员说,2010年以来,随着大量智能技术和设备的出现,中国地质调查局使数字地调系统向智能化延伸的脚步就没有停歇过。

  逐步实现从数字化转向智能、从2D走向3D的地质调查,形成天地一体野外地质调查工作、管理和安全保障和泛在服务模式,这便是智能地质调查体系架构。

  “目前,数字地质调查系统已在国内全面推广应用,并开始被国外引进和应用,推广应用超过15000套,其中涉及国内八大工业部门及特大型矿业公司,累计单位超过1000家。”

  “这是集文字、素描、照片、视频、音频、电子罗盘、信手剖面为一体的野外智能电子手簿。”结合中国地质调查信息网格平台、云计算、网格GIS和北斗系统,中国地调局还开发出野外地质调查安全保障服务主动服务技术。该平台能够根据用户的位置,自动或通过请求方式,挖掘获取用户所处位置的预警信息、附近人员信息、地质信息等,再用北斗短信或网络的方式发送给查询用户。

  数字地质学是以数字技术为基础的一门交叉学科,获取信息的渠道、信息集中速度及规模成了决定一个系统成败的关键。

   网连千线,有容乃大

  在馆长严光生的带领下,与会嘉宾参观了全国地质资料馆,体验了检索功能。在微机室,工作人员正将影印的地质资料信息输入电脑,编辑成数字资料后入库。

  “咦,温家宝?!”当一份由温家宝曾于1979年在甘肃省地质局工作时所做的地质调查报告出现在投影仪上时,现场顿时热闹了起来。

  “我们要打造地质学界的Google!”严光生的这句话并非口号,现如今全国地质资料馆的老资料数字化率已超过90%;电子数据量达56TB,近几年来,更是以5TB/年至8TB/年的数据量增长。“数字地质资料汇聚已具规模,为地质资料的社会化服务奠定了基础。”

  他说,下一步将利用国际标准接口建立数字资源的国际互联,将地质目录与元数据、调查报告、科学报告、成果图件、成果数据及出版物以目录服务、地图服务、文档浏览、数据下载等在线数字资源服务聚合。

  “地质学从它最早期建立的时候开始,实质上就是一门信息学科。”数据资源为地质学发展的终极目标——全面掌握和了解地球运动规律,建立满足实际需求的地质模型提供了一个看起来非常合适的解决方案。

  早在8年前,《直面明日挑战——美国地调局十年科学战略(2007-2017)》报告中就有这样一段话:“注重为科学家、资源管理者和公众发送和解释高分辨率的综合性图件和其他形式的数据和信息,发挥为整个美国地质调查局服务于世界的广博知识库作基础性贡献的功能。”

  大数据技术为智能与云服务支撑应用研究现状。基于大数据平台技术hadoop平台原型系统的智能地质调查,无需人工参与,可自动聚类,智能推荐相关文档,2天~3天就能完成一个省几十年资料文档的存储。

  中国首台千万亿次超级计算机“天河1号”,拥有186368个核,总计算性能达168万亿次/每秒,计算峰值达4700万亿次/每秒。对华北地区的3D成像大约需要1天,若用清华的计算机大约需17天。

  问题导向概念的植入让美国地调局的转型一举成功。那么,对研究数字地质的个人来说,是做迷失于数字海洋的小舟,还是做数字世界的建筑师?这是个问题。

   “老”小伙与老“小伙”

  在普通人的印象里,科研人员乃是不苟言笑埋头实验室,偶尔透过厚重镜片,用望穿了几个世纪的深邃眼神俯视众生,一副“我们的世界你们不懂”的形象。这其中,以数学家最甚。但参加过该会后,记者对科学家这个群体的原有认识却完全被打破了。

  这里有一群世界上最聪明可爱的人。

  老“小伙”赵鹏大。

  上场前,主持人就他名字的英文直译“big bird”来了个即兴小段子,引来满场笑声。就在记者还震惊于如此调侃一位颇有威望的80多岁老教授是否不太礼貌时,着红黑条纹衬衫、一头银发的赵鹏大院士登上了讲台,这时记者才“有点明白了”。会后记者了解到,这位中科院院士就是在2011年用微博寄语新生的“国内最潮老校长”。

  赵鹏大说,大数据时代正呼唤每个学科建立自己的数据库,但“地质数据不是越多越好”。他认为,与商业领域的“自然获取”、“无成本获取”数据不同,地质数据的“成本”很高,因此获取数据必须本着“充分、必要、合理”的原则,贵在“代表性”和“准确性”,而不是盲目追求数量。

  “老”小伙Jef Caers。

  自信的表情、饱满的状态、抑扬顿挫的语调,记者感到正在台上发言的不是斯坦福大学能源工程系的数学家,而是当年参加总统竞选的奥巴马。

  置身于一群白发长者中的Jef高挑英俊,很容易被误认为是某个教授的助手。

  “你负责组织一个长城周边无图地区的冒险徒步旅行,需要决定如何带水和食物以及提货位置,怎样预测旅行所需时间和搜集数据所需精力?”当这个年轻的比利时人用一个中国人熟悉的建筑和休闲娱乐活动来解释对外行来说复杂难懂的方程式时,冰冷的数字仿佛变得亲切起来。

  Jef说,他在工作中发现,在现实预测中传统地质统计学存在不足和局限:一是对样本要求苛刻,导致取样耗时长;二是样本差异性无法真实体现于图像,导致生成图像与实际情况相差甚远。于是他想到将多点地质统计学应用于图像的随机建模,使用训练图像直接采样,快速生成复杂空间变异性,最后使用图像缝合算法实现预测,“它的好处是可以从任何地方捕获信息”。

  对数学的热爱、绝不墨守成规、以问题为导向、发散性思维、从生活中找规律,让两人找到了统计学原理与地质找矿的结合点,也让两人分别于1990年和2014年获得国际数学地球科学协会最高奖——克伦宾奖。