AI研习丨专题:人流大数据和 AI 驱动的城市智能化管理


摘 要


城市智能化管理往往需要以人为核心,感知和理解城市尺度上的人流移动,从而实现高效的交通调度、城市应急管理、灾难人道救援和传染病传播防治等目的。本文介绍使用人流大数据实现在城市尺度上感知、模拟和预测人流移动的关键技术,并结合城市应急管理、交通管理和重大传染病防疫等应用场景列举了具体应用案例。。


关 键 字


时空数据挖掘;城市应急管理;智慧城市;传染病防疫;城市计算


0 引言


近年来,随着第五代移动通信技术(5G)和移动互联网的快速发展,各类基于手机定位的移动数据、GPS 轨迹数据、地铁公交刷卡数据和社交网络数据等呈“爆炸式”增长,人类进入了大数据时代。在此背景下,这些海量的、多模态的、基于位置的移动轨迹数据和社交网络数据为解决各类城市新兴挑战,以及进行更为高效的城市管理,如智能交通调度、城市应急管理、能源高效利用、公共健康提升及传染病防治等,提供了全新的方式方法。

在人工智能和大数据时代,城市智能化管理、智慧城市和城市计算作为一个新兴的学术领域,得到各国学术界、工业界和各国政府的高度重视。日本野村综合研究所预测,仅美国、欧洲、日本的智慧城市建设和相关技术研发在 2030 年前就需累计投资约 100 万亿日元 ( 约 6 万亿元人民币 )。而美国博斯公司 (Booz & Company) 预测,全世界的智慧城市基础设施建设,以及相关技术研发投资额在 2030 年前最少将增至 41 万亿美元 ( 约254 万亿元人民币 )。党的十九届四中全会中提出“推进国家治理体系和治理能力现代化”;国务院印发的《新一代人工智能发展规划》中,将“建设安全便捷的智能社会”“推进社会治理智能化”等定义为重点发展战略。

城市智能化管理往往需要以人为核心,感知和理解城市尺度上的人流移动,从而实现高效的交通调度、城市应急管理、灾难人道救援,传染病传播防治和公共健康提升等目的。因此,智能化城市管理和各类城市大脑项目中的一个最为核心研究课题和关键技术,则是对城市尺度上的人类移动行为的感知、分析、理解、模拟和预测。本文,首先介绍城市尺度人流移动行为感知和建模的关键技术;随后总结相关的难题和挑战;最后列举和介绍相关的应用案例。


1 城市尺度人流移动行为感知和建模技术


近年来,随着智能手机和移动互联网的普及,对城市尺度人流移动的感知成为了可能。瑞典斯德哥尔摩大学的研究人员收集了 190 万海地手机用户的移动数据,通过这些数据来分析 2010 年 1月 12 日海地大地震发生后,灾民的移动行为模式。日本东京大学的研究人员建立了一个 160 万人在日本一年中的 GPS 移动轨迹数据库,利用这个数据库对东日本大地震和福岛核事故发生后的灾民移动、避难行为进行了建模、预测和模拟。

相比手机 GPS 轨迹这种较为全面的城市尺度人流数据,针对特定的应用场景,例如研究城市人们地铁出行模式,往往采取与之相对应的城市尺度人流感知方式。微软亚洲研究院的研究人员收集了名为 T-drive 的北京出租车 GPS 轨迹数据库,并在此基础上挖掘了城市汽车出行与空气质量、房价等与人们生活息息相关的城市要素之间的相关性。摩拜单车与微软亚洲研究院合作通过对上海共享单车的 GPS 轨迹数据,对人们单车出行需求进行分析,对上海新建自行车道的规划提出建议。伦敦大学学院的研究人员分析伦敦智能交通卡的数据,挖掘人们在伦敦的出行模式,并提出更节约地使用公共交通出行方式的推荐系统。

对于人类移动行为的分析理解按照研究对象,可分为对个体行为的建模与群体行为的建模。美国华盛顿大学的研究人员将条件随机场运用于个体移动行为的建模,并提出了金字塔结构的多级抽象个体移动行为模型。美国加州伯克利分校的研究人员融合隐马尔可夫模型与长短期记忆模型,对手机用户的移动行为建立了深度生成模型。对于群体行为的建模比较早期的工作是美国麻省理工学院的研究人员通过人们在罗马的手机使用记录,提出了基于主成分分析方法的城市时间 - 空间模式的发掘,帮助人们更好地理解城市的动态功能划分。日本东京大学的研究人员对日本的东京,以及福岛地区 4 个月的人流密度在时间和空间维度进行非负张量分解,以更好地挖掘城市尺度周期性的人流变化模式,以及东日本大地震对城市中人们日常生活的影响。

模拟和预测是对城市尺度上的人类移动行为建模的核心任务。对于一般性的人流模拟预测任务,美国东北大学的研究人员从统计学和复杂系统的角度探讨了城市尺度人流预测精度的局限;微软亚洲研究院的研究人员提出了一个基于深度学习的模型,实现对城市格网内进出人流的精确预测。从城市管理的角度出发,城市尺度人流的异常情况对于城市的安全保障更为重要。但由于异常情况的复杂性与不可预估性,异常情况人流的建模往往更为困难。日本东京大学的研究人员针对日本地震等大型自然灾害,提出了基于马尔可夫决策过程和深度学习的预测模拟模型。浙江大学的研究人员对于大型的集会事件,提出了对于共享单车超过预期的预测模型。然而,现有研究还没有完全解决或实现高效融合多模态异构城市大数据,并对其进行有效的特征学习,城市尺度上的人流分析和建模还面临着诸多难题和挑战。


2 难题和挑战


2.1 稀少人流数据下的精准建模

城市尺度的人流移动是一种高度非线性复杂的多模态分布现象,用经典方法很难得到满意的大城市预测模型。特别区别于计算机视觉和自然语言处理等经典问题,由于数据源及隐私性等诸多因素的限制,不可能收集到城市内每位居民的移动轨迹数据,因此用于模型训练的人流移动数据常常只被限制在整体人口的很小一部分。在我们的研究案例中,竭尽所能也仅收集到了相当于整体人口 1% 的数据。如何用稀少人流数据建立一个精准的城市尺度人流预测模型,是城市尺度人流建模的主要的技术难点之一。


2.2 针对稀少异常事件的特定建模

在稀少异常事件发生时,城市尺度的人流移动往往与平日正常情况下呈现出很大的差异。我们的案例中,研究了东日本大地震发生前后东京市人流移动的变化。如图 1 上部所示,突如其来的大地震使整个城市交通系统瘫痪,人流移动也因此受到了很大影响,呈现出与以往不同的样态。除了人流移动,我们也调研了稀少异常事件发生时人流密度的变化。如图 1 下部所示,东京站和新宿站的人流密度在正常情况下和异常情况下呈现出截然不同的时间序列走势。这也间接地告诉我们,使用历史人流移动数据对于在稀少事件发生时的人流移动建模不会十分有效。以上表明,城市尺度的人流预测已经是一个极具挑战问题,在稀少异常事件发生时会让问题变得更加复杂难以处理。如何针对稀少异常事件建立特定的城市尺度人流预测模型,是另一个主要的技术难点。

AI研习丨专题:人流大数据和 AI 驱动的城市智能化管理

图 1 稀少异常事件发生时的城市人流情况


2.3 人口密度和人流密度的联合建模

在很多城市计算的实际应用场景下,例如人流监控和交通管制等,需要对城市人流进行一个全方位支持快速部署的建模预测。既应该掌握城市各个区域的人口密度,同时也应该掌握城市各个区域的人流移动情况,这里称之为人流密度。

这是具有高度关联性的两个问题,在实际城市计算应用场景中也密不可分。高人口密度的地方往往会吸引越来越多的人流涌入,高人口密度和高人流密度都潜在地加大了诸如踩踏拥堵等事故发生的风险。如何针对人口密度和人流密度进行一个联合建模预测,是另一个主要的技术难点和挑战。


3 应用案例


近年来,我们使用人工智能技术分析城市尺度的人流移动,帮助政府进行更为高效的城市智能化管理和决策。


3.1 城市应急和灾难管理

灾难救援、灾后重建和城市应急管理往往以人为中心,在最大程度挽救生命的同时,如何快速有效组织救援,安置疏散灾民,科学指导灾民避难,快速恢复城市交通和秩序成为了灾后应急管理的重中之重。因此,如何分析灾后灾民的行为模式,如何对受灾城市可能发生的大规模灾民避难、迁移行为进行建模、预测和模拟,如何对灾后灾民的撤离路线进行有效的推荐,成为了新一代灾后应急管理的核心和关键。

针对 2011 年的东日本大地震和福岛核事故这次人类历史上最大复合型灾难之一,我们研发了了基于海量 GPS 轨迹数据(160 万人 3 年的移动轨迹数据)的灾难行为分析和推断系统。该系统可以对东日本大地震和福岛核事故中的灾民迁移行为进行挖掘、分析、建模和推断。通过使用深度学习和增强学习技术,实现了对海量人流移动行为的建模。当再次发生灾难或应急事件时,建模模型可以对城市尺度上可能发生的大规模人流移动进行模拟和预测(见图 2,图中蓝色为预测值、红色为真实值),并推荐高效的避难路线,从而帮助政府进行更为高效的决策和城市应急管理。

AI研习丨专题:人流大数据和 AI 驱动的城市智能化管理

图 2 2011 年东日本大地震人流移动预测


3.2 城市交通需求和出行预测

在城市尺度上预测市民交通出行需求是各类智能交通调度平台和城市大脑平台的关键技术,也是城市“治堵”的关键。我们研发了针对基于深度学习技术的交通出行需求预测系统。该系统使用深度长短记忆网络(LSTM)和在线集成学习(见图 3)对海量人流出行数据进行建模,对特定城市区域内的市民出行行为和出行需求进行预测和模拟。

AI研习丨专题:人流大数据和 AI 驱动的城市智能化管理

图 3 在线集成学习模型


3.3 重大传染病传播建模和防疫

重大新发传染病的传播感染与城市人流移动存在密不可分的关联。针对新型冠状病毒

疫情,我们紧急研发了“人流大数据和 AI 驱动的新型冠状病毒传播建模预测和模拟推演平台”。该平台是一个针对新型冠状病毒传播的大数据分析和 AI 建模平台(见图 4),其中预测和模拟推演模型完全由数据驱动,需要使用人流大数据进行训练和优化。

AI研习丨专题:人流大数据和 AI 驱动的城市智能化管理

图 4 人流大数据和 AI 驱动的新型冠状病毒(COVID-19)传播建模预测和模拟推演平台


数据拥有方只要将人流大数据输入平台,平台可以自动完成模型迭代训练,并输出相关的预测和模拟推演的可视化结果。平台可实现的基本功能包括:

① 新型冠状病毒和人流移动的映射模型的建立,包括传染概率确定 / 潜伏期分析 / 传染代数分析等;

② 隐藏病患分析:由于疾病传播为链式,可以根据缺失轨迹链反推出尚未确诊的实际病患;

③ 风险人群分析,可根据病患轨迹寻找可能有接触的风险人群,提前预警;

④ 潜在病原地挖掘,可分析病人间的轨迹交叉点确认潜在的未知病原地。在以上功能基础上,平台可以实现在城市尺度上,基于人流移动的新型冠状病毒传播感染情况的细粒度预测和模拟;并根据其制定不同的隔离和公共防疫政策(如封闭特定城市区域或道路),动态推演和模拟传播感染情况(见图 5)。

AI研习丨专题:人流大数据和 AI 驱动的城市智能化管理

图 5 重大传染病防疫政策动态模拟和推演


4 结束语


大数据和 AI 驱动的城市智能化管理是一个热门研究领域。随着 5G 时代的到来,也将催生更多的应用,具有广阔的市场前景。与此同时,如何打破“数据孤岛”,整合各类城市人流大数据,提升数据质量,也是政府和研究人员需要思考和解决的难题。另一方面,在落地各类应用的同时,如何保护用户隐私,以及保障数据安全也是另一个政府和研究人员需要共同面对和解决的问题。

(参考文献略)

AI研习丨专题:人流大数据和 AI 驱动的城市智能化管理


选自《中国人工智能学会通讯》

2020年第10卷第7期 AI研究前沿与群体智能计算专题