【战略前沿】从地图到模型:增强国家地理空间情报能力
被阅读 189 次
2017-04-27

摘要

美国面临着数量众多、样式多样、以及不断演变的国家安全威胁,包括恐怖主义、食品与水供应的安全和中断、极端天气事件、以及全球各地的地区冲突。有效地管理这些威胁,需要情报,不仅评估现在正在发生什么,还要预料到未来潜在的威胁。国家地理空间情报局(NGA)就负责提供其他国家的地理空间情报――评估那里到底有什么,是什么,以及为什么这些信息在支持国家安全、灾害响应以及人道主义援助时很重要。今天,NGA的方法在很大程度上依赖于图像分析和制图,提供当前和过去情况的评价。但是,扩展这种途径,增强建模能力,将使NGA也能够预测和探索未来的结果。

模型是一种对真实世界系统的简化表示,被用于提取该系统中可解释的见解,预测未来的结果,或探索在合理的情景下将可能会发生什么。在本报告中,模型意味着一个可以在计算机上运行的数学或数值模型。这种模型使用指定输入(如初始条件、边界条件和模型参数)的数据和/或理论,来产生输出结果。

应NGA的请求,美国国家科学工程医学研究院成立一个委员会,对用于了解真实世界系统的模型和分析方法进行描述;确定还需要什么才能使这些模型和方法有益于地理空间情报工作;并为NGA识别支持研究与开发的内容与方向(见栏S.1)。本报告提供的示例模型,已被用来帮助回答NGA可能提出的此类问题;描述了如何进行基于模型开展调查,用问题例子说明NGA可能会如何考虑选择和权衡的问题;并讨论了与NGA使命相关的模型和方法。

基于模型的调查

模型并不孤立存在,而是存在于一个环境之中,包括现有数据、分析与模型评估方法、计算和数据基础设施、以及熟练掌握开发、定制服务以及运行模型并解释其输出的人才。基于模型的调查首先需要制定有待解决的关键问题。这些问题驱动模型选择、分析方法、数据和计算资源,以及如何将这些模块结合起来,以必要的速度和精度生成结果。使用现有模型或模型输出的结果,能加快调查进度并降低成本。如果没有适当的现有模型或模型输出的结果,调查人员有两种选择:从零开始开发一个新模型,或者利用现有的子系统模型组合成一个新模型。只要在子系统模型内的流程以及它们的连接过程被恰当地表达出来,一个组合模型有潜力捕获更大系统的行为。

一旦选择,模型或模型产品就被纳入到分析之中,通常涉及数据与计算,来连接模型与真实世界系统。有许多种分析方法可用于开展调查,例如,在把数据纳入到模型之前的预处理方法,随着新的观测数据积累更新模型状态的方法,校正模型参数的方法,结合子系统模型的方法,确定获取哪些新数据,或更关键的是,评估结果的可信度和不确定性的方法。模型不同于试图代表的真实世界系统有几个原因,包括,系统过程表达的省略或不足、用于输入模型数据的出错和不确定性,以及模型的编码错误。任何基于模型的研究都必须评估这些不确定性对我们推断真实世界系统的影响,并将这种不确定性转告给决策者。

需求分析决定了所需的计算机基础设施。一些模型和方法可以在笔记本电脑上运行。计算密集型模型通常都会需要高性能计算,需要大量的处理器(如,数千个)、专用处理器间的通信,以及大量数据(如,千兆字节至兆兆字节)的内存和存储(如,气候模型)。数据密集型计算用于分析海量数据(如,tb和pb字节),主要是数据处理任务。在这些情况下,计算和数据操作必须分成多个并行任务,可以最小的通讯量,在这些独立任务之间(如,文本挖掘)分别运行独立的数据模块。

 

栏S.1 委员会任务

1、确定数学、数值计算以及统计模型与时空分析方法(例如,耦合模型、反演模型、基于代理模型、机器学习以及统计推断)的类型,用于了解诸如那些在自然或建造环境中发现的,以及在医疗、政治、社会或经济系统中发现的复杂适应系统。

2、描述这些模型和方法与地理空间情报的潜在相关性。

3、描述当前与地理空间情报相关模型与方法的技术发展水平,包括一些因素,诸如模型获取的功能和尺度,精度、可靠性、可预测性、不确定性描述以及计算要求。

4、确定还需要什么才能使这些模型和方法于地理空间情报有用,考虑到诸如为其他目的模型适应性、数据的可用性、互操作性和计算事宜等问题。

5、确定NGA用于地理空间情报所必要的适应、植入、链接、分析以及维护模型与方法的研究与开发。

 

NGA的模型与方法

鉴于国家安全和人道主义挑战的广度在NGA的范围之内,可能这样认为,许多模型与分析方法,其中每种方法具有重要的变体,与NGA有潜在关系。总体上看,这项研究不是保密的,所以委员会利用NGA任务,地理空间数据的特点,以及NGA提供的两个情报情景的例子,来指导相关模型与方法的选择。下面是似乎与NGA特别相关的模型与方法的讨论,如以下NGA情报情景所示:

中国需要找到更多的水来满足农业和能源的需求,但主要的大坝项目(例如,三峡大坝)已强迫大量人口迁移。广泛的情报问题:包括农业和能源生产与消费如何随时间变化?人口包括农村社区如何以及向哪里转移?

NGA有关的模型与方法类型

委员会的前两个任务是确定用于了解复杂系统并描述其与NGA有关的模型与方法的类型(见栏S.1)。NGA的使命是提供地理空间情报,这被定义为对图像和地理空间信息的开发与分析,以描述、评估以及对自然特性和地球上以地理为参考的活动信息进行可视化表达。把这个任务扩展到建模领域,NGA需要人类行为(活动)模型,设置在一个环境中(自然特性)和用于整合与分析地理空间(具有地理空间属性的)数据的技术之中。这种分析将受到空间、时空,或存在于地理空间数据中的网络结构的影响。这些数据的关键特征包括自相关性(比如,附近位置的属性趋于相似)以及空间异质性(也就是,所建模型随位置移动而变化的现象)。

需要重视以下模型与方法的类型:

  • Ÿ影响人类活动的物理过程模型。这类模型使用理论驱动方程来描述环境(大气、海洋、水文和地质)系统并预测其未来行为。比如,对于NGA的情报情景,在中国一个大尺度水文系统物理过程模型可以用来预测在不同引水情景中的地表径流、地下径流以及丰水情况。
  • Ÿ在地理空间背景下的人类行为社会系统模型。特别相关的模型包括股票间影响和流动的系统级模型,以及基于代理模型,它使用个体间行为的界定规则,研究突现的群体行为。这些模型支持假设推理,诸如不同情景的展开会如何不同。例如,可以构建社会系统模型情景来评估在中国,受大坝建设影响的群众和非自愿移民可能会产生什么反应。
  • Ÿ物理与社会系统相结合的模型。彼此互相依赖的物理和社会子系统过程可被耦合用于了解其在不同地点的相互作用。例如,天气、波浪和海盗行为模型已与航运模型结合,来帮助预测何时何地有可能会被海盗攻击。更复杂的经济、资源和能源之间的相互作用与反馈,可以被综合评估模型反映出来。例如,综合评估模型,可用来研究中国的水、农业、能源生产和消费之间的复杂相互作用。
  • Ÿ用真实世界系统测量值来推断不确定模型参数的反演方法。这些方法将计算模型与真实世界的观测结合起来,以约束模型参数(如,物理常数、初始条件、边界条件以及系统状态),以便使模型更好地代表真实世界系统,并由此产生更可靠的结果。例如,反演方法可用来估测或约束一个大尺度水文模型(比如,空间变化的渗透率、流速,以及蒸发)的关键模型参数,来产生作为全中国各地函数的水资源可利用量的合理预测。必须提供特定问题的信息给反演方法,根据所使用的模型进行调整。
  • Ÿ用来发现趋势、形态和关联的空间统计、数据挖掘和机器学习。这些方法使用数据驱动的实证模型和方法来了解不同的观测对于系统的揭示。例如,实证模型可用来监测中国由于制定大坝建设、农业以及煤炭生产等相关政策,所引起的水资源可用量的变化。实证方法往往根据被分析的数据类型(如,时空数据、影像及文本)和可用的计算环境,进行自定义设置。
  • Ÿ用于检测关系形态是如何影响个体到国家层面行为的空间网络分析。网络分析模型是图形或统计模型,解释人与人之间通过友谊、金融、文化、或其他关系的相关行为。空间网络模型,结合空间和网络推理,解释关系模式如何影响行为。网络模型被用来描述秘密团体成员特征及他们之间的关系,用来评估潜在的各种各样的攻击,也用于在动态地缘政治环境下,评估变化和趋势。它们通常用于情景描述和假设推理分析,而且网络数据动态变化趋势也被用于预测。例如,社交媒体分析可以用来确定中国哪些社区和团体可能会强烈抵制大坝建设引起的移民。

当前发展状况

委员会的第三个任务是描述模型与方法的当前发展状况,包括特征和尺度、精度、可靠性、可预测性、不确定性特征,以及计算需求(见栏S.1)。这些因素适用于在特定环境中的特定模型或方法,但不适合上面描述的广泛类别。因此,本报告为任务3所提及的各种因素提供了范围或案例。

当前发展状态影响着NGA在短期内能适应哪些模型与方法,哪些需要进一步的研究和开发。一般来说,物理过程模型和数据驱动方法(反演、实证或网络分析)相对成熟,但是必须能适应于地理空间情报的用途。有益发展的例子包括降尺度技术,将促进NGA遥感数据在规模较小、与政策更相关尺度中的应用;还包括实证方法,可以处理专业模型结构(如,时空依赖性)和地理空间数据的特点。社会系统和物理-社会系统耦合模型,可以支持假设推理和情景发展,这对许多NGA的应用非常有用。然而,需要基础研究来提升对人类行为的了解,使模型更易于开发。

增加模型与方法对NGA的作用

委员会的第四个任务是确定需要做什么才能使相关模型与方法为地理空间情报工作(见栏S.1)发挥作用。以地理空间情报为目的,开发或调整何种特定模型与方法,主要取决于现有研究的效用,但也取决于模型与方法开发或调整的难度、软件与代码的可用性、需要进行培训支持的水平,以及NGA分析人员的知识和经验。例如,NGA通常必须快速应对一个突发的国家安全威胁或自然灾害,所以,一种相对能快速开发、适应或运行的简单模型,可能比需要用数月或更长时间开发的更全面模型更有用。当需要用到更复杂的模型时,NGA可以利用来自大学、国家实验室、联邦机构和私人公司的建模工作组的大量专业知识。NGA可以采取开发或适应上述模型与分析方法的行动总结如下:

内部开发或适应。数据驱动的模型与分析方法适合短期发展,因为NGA分析师已有一定的相关知识和经验,方法论已建立,而且软件、工具和培训支持都是现成的。特别是,NGA的时空分析经验为开发或调整空间统计、数据挖掘和机器学习方法奠定了基础。尤其对NGA有使用前途的方法包括:(1)贝叶斯分层模型,它联系空间连接数据,不同级别分辨率或不同数据源的数据聚合;(2)聚类和其他非监督分类以及深度学习方法,在数量大到人类现有手段无法分析的海量数据中,发现其结构;(3)监测变化足迹和空间热点与异常的方法。此外,NGA不断增加对人文地理方面的重视,为开发网络分析模型,以调查关系模式如何影响行为奠定基础。

对这两种类型的分析,基本方法也已颇具规模,而且软件和用户支持(如,教材、会议以及特别的短期课程)都是现成的。然而,为利用地理空间数据以及NGA使用案例,还需要一些额外的开发和培训以适应这些方法。此外,为空间统计和空间数据挖掘方法,可能必需开发数据密集型计算的软件和算法。NGA学院或基于大学的项目,可以提供网络培训或空间网络分析。

协作。NGA需要合作伙伴来帮助开发、适应和使用更复杂的模型与方法(如,流程模型、耦合模型、基于代理模型、反演方法,以及空间网络模型),以及尚未被先进的计算基础设施很好支持的地理空间模型。任何组织在功能复杂的建模能力方面,有相当一部分是通过合作伙伴、学徒以及协作学得的。这种协作可以采取多种形式,包括作为一个在开发模型或拓展其在其他领域的应用团队中的合作伙伴,作为一个模型或方法团队的用户,或作为最终数据产品的用户。无论如何,NGA需要确定相关的领域专家,他们可以设计与NGA相关的模型或情景、可以运行模型、解释结果或者帮助NGA找到有用的现有模型输出。为了有效地使用这些模型或模型结果,NGA需要了解这些模型或模型结果对支持自己当前在地理空间情报任务方面的优势和局限。

为NGA建模任务寻找合作伙伴的工作非常不简单,因为工作的涉密性,广泛和不断变化的专家需求,以及培养长期关系的需要。复杂系统的模型,通常是由多学科团队开发的,他们对于和当前任务相关的科学领域和计算能力方面,拥有雄厚的知识和丰富的经验。然而,把不同学科的专家请到一起,使他们在NGA优先项目的背景下相互学习,可能会有益于NGA相关问题取得重大突破。主要的研究型大学,以及NGA已建立关系的组织(如,国防与情报机构、国家实验室、私营承包商,以及NGA地理空间科学卓越学术中心),可能是为NGA建模工作寻找专家和建模团队的一个起点。

NGA资助的研究与开发

委员会的第五项任务是确定可以受益于NGA已资助的研发项目的领域(见栏S.1)。对研究和开发的大量投资,可以在未来几年加强NGA的建模能力。这些投资集中在何处,取决于已有事实证明的对地理空间情报工作最有用的模型和方法。潜在研究领域涉及扩展与NGA情况相关的现有模型,提升对人类行为的了解,减少开发、测试和运行模型所需要的时间,以及开发为NGA相关模型和数据定制的方法等,如下所述:

扩展用于NGA相关情况的模型。NGA调查可能会对模型提出新的要求,把它们用于最初设计时没有或至少未被完全测试的设置中。例子包括精确、近实时风、海浪、或天气预测,用于支持军队部署、抢险救灾、或在城市环境中有害物质泄露的消散和损失估计。此外,这些模型可能需要与社会系统模型相结合,帮助决策制定者为社会动荡、分裂或移民做好准备。需要大量研究以采用物理过程模型、社会系统模型,以及结合的物理-社会系统模型,更可靠地处理这些比较罕见的情况。

提升对人类行为的了解。社会系统模型只是刚刚超越专家判断。要推进其发展,开发物理-社会系统相结合的模型,需要基础研究来提升对人类行为的了解。有前途的研究领域,包括以了解人类行为如何受地理因素,包括自然和建造环境的制约或激励为目标的研究,包括地理因素如何影响明星之间社交网络与通信的发展,以及认知偏见如何影响对空间的感知。

加速模型开发、测试和运行的时间。情报问题往往对时间敏感,所以,研究进展能加快模型开发、测试或运行时间,这将对NGA有益。通过以促进NGA调查现有子系统模型结合为目标的研究,可以加快模型开发的进度。通过研究和开发精度降低的模型,使用更粗糙、更简化,或比计算密集型模型具有更少表征过程的模型,可以减少模型开发和运行的时间。开发模拟试验平台,有助于所有这些工作,也便于评估模型的准确性和速度。

NGA相关模型定制的方法论研究与开发。为NGA用途开发或采纳的模型,必须伴随有定制的方法,能把这些模型与数据结合起来。反演、探索合理的结果或场景、量化预测的不确定性,以及模型评估等方法论,都需要更多地使基于模型的结果与可用的测量结果相符合。社会系统和物理-社会系统模型特别需要这种方法论。该领域的可能方向,包括开发反演方法,制约社会系统模型与数据一致的合理状态,还包括方法开发,用于针对NGA相关基准和测试案例的模型结果的正式验证和确认。此外,研究如何采用现有的反演方法以整合NGA获取并使用的(如,卫星、传感器、地理空间以及开源的)不同形式的数据,将有利于所有类型的模型。

NGA数据源与需求定制的方法论研究与开发。通过以NGA数据和应用案例所定制化的研究可以推进实证方法论的发展。具体例子包括结合异构数据或来自不同途径的结果,以及在支持推理与决策时更准确地表达其不确定性,还包括处理具有空间、时间和网络结构数据(如,评估一段时间某恐怖分子小组活动)的方法。一种相关的需求是情绪探测技术,在基于地理和社区网络功能方面的文档中描述这种情绪的特性,诸如地理位置、当地活动、语言、当地组织的结构,以及在网络中的自我认同感的趋势。还需要的研究包括为有前景的空间和时空方法开发算法,有效地利用先进数据密集型计算架构中出现的处理和数据存储功能。

总体结论

总体而言,委员会得出结论,基于模型的调查将为NGA搜索时空格局提供强有力的手段;从这些格局做出推断;预测未来对美国的政治、经济和军事威胁;并评估世界各地的应对措施及后果。然而,对每一个地理空间情报问题,比如,当时间太短不足以执行基于模型的调查,或当缺乏数据或关键过程不确定,很难对真实世界系统获得有用内在见解时,模型并不是最佳工具。因此,制图和图像分析仍将是地理空间情报的重要手段。

考虑到分析师在时空分析方面的长期经验,以及可用的支持软件和工具,NGA可以开始开发或调整一些数据驱动模型。发展更复杂的建模和分析能力,可能需要许多年,因为NGA需要新的知识、技能、技术和工作流;与外部的建模团队交流;额外的数据来源;增强的计算能力;以及建模思维模式的转变。NGA不需要建立由一个大型研究部门来开发、维护、及支持前沿或复杂模型(如,气候模型)的能力。事实上,与外部建模团队合作,利用他们的模型、模型输出以及分析方法,用于地理空间情报,将延伸资源并帮助分析师在建模和分析方法方面获得知识与技能。随着他们的经验逐渐增长,NGA分析师将能够承担越来越复杂的基于模型的世界分类调查。

 

原文题目:

From Maps to Models: Augmenting the Nation's Geospatial Intelligence Capabilities

资料来源:

http://www.nap.edu/23650

 

(黄铭瑞、王化编译,殷永元审核)