一、轨迹生成与模拟模型研究
(1)Act2Loc:耦合机器学习与机理模型的轨迹模拟方法

提出一种个体时空轨迹模拟方法—Act2Loc (Activity to Location)。该方法根据人类轨迹特点,适应性结合并发挥了机器学习和机理模型的各自优势,使得模型兼具较高的真实度和可解释性。Act2Loc可基于易获取的小样本个体活动序列和人口分布,生成给定数量的合成轨迹,方法训练成本低且易于迁移应用。所生成的合成轨迹数据可直接规避真实数据存在的隐私安全问题及数据质量缺陷,为智能交通、公共安全、疫情模拟控制等领域的研究及现实应用提供重要支持。[详细介绍]

Liu K*, Jin X, Cheng S, Gao S, Yin L, Lu F. Act2Loc: a synthetic trajectory generation method by combining machine learning and mechanistic models[J]. International Journal of Geographical Information Science, 2024, 38(3), 407-431.(中科院一区SCI)[paper]

刘康. 人类移动数据生成方法:研究进展与趋势探讨[J]. 地球信息科学学报, 2024, 26(4): 831-847.(国内高水平EI期刊)[paper]

陆锋, 刘康, 陈洁. 大数据时代的人类移动性研究[J]. 地球信息科学学报, 2014, 16(5): 665-672.(国内高水平EI期刊)[paper]

(1)Act2Loc:耦合机器学习与机理模型的轨迹模拟方法
(2)STAGE:基于多时空任务生成对抗网络的轨迹模拟方法

人的移动行为具有一些显著模式和特征。例如,城市中个体通常具有一定的日常活动规律(例如,晚上居家、白天工作),形成特定的时序模式;轨迹可使用不同粒度的空间单元表达,而不同尺度下生成的轨迹应当具有空间一致性(例如,1公里网格应当是相应2公里网格的一部分)。上述模式和特征可以从轨迹中直接获取,并将其视为轨迹固有的显式时空知识,通过多任务学习来指导轨迹生成过程。基于上述分析,本团队创新性提出一种时空知识增强的多任务生成对抗网络——STAGE (Spatiotemporal-knowledge enhanced multi-TAsk GEnerative adversarial network)用于生成大规模个体时空轨迹。STAGE主要采用GAN架构,由生成器和判别器两部分组成。生成器包含三个分阶段的时空生成任务,依次是①个体活动序列生成、②街道层面(粗粒度)的个体轨迹生成和③社区层面(细粒度)的个体轨迹生成。其中,社区层面(细粒度)的轨迹生成为主任务,其余两个为辅任务。判别器主要用于鉴别所生成轨迹的真实度。此外,本文在对抗训练阶段设计了空间一致性损失函数,以约束不同尺度下生成的轨迹在空间上保持一致。STAGE所生成的轨迹数据与真实数据更加接近,不但在下游任务中具有较好可用性,且通过了隐私泄露测试。[详细介绍]

Cao Z, Liu K*, Jin X, Ning L, Yin L, Lu F. STAGE: A Spatiotemporal-Knowledge Enhanced Multi-Task Generative Adversarial Network (GAN) for Trajectory Generation[J]. International Journal of Geographical Information Science, 2024.(中科院一区SCI)[paper]

(2)STAGE:基于多时空任务生成对抗网络的轨迹模拟方法
(3)GeoKG-TPM:融合地理知识图谱与轨迹预训练模型的轨迹模拟方法

提出一种融合地理知识图谱与轨迹预训练模型的人类时空轨迹模拟方法—GeoKG-TPM。首先,基于大量真实轨迹数据,以掩码方式训练双层Transformer编码器,得到轨迹预训练模型;其次,将有益于轨迹建模的地理信息组织为地理知识图谱并进行表示学习;最后,融合轨迹预训练模型与地理知识图谱嵌入表示,构建基于Transformer解码器的轨迹生成模型。本研究所提出的轨迹模拟模型取得了比基线模型更好的效果,所生成的轨迹数据不但与真实数据具有更相似的时空统计特征,且通过了隐私泄露测试,能够为现实应用提供高质量的合成轨迹数据集。

Liu K*, Zheng S, Chen Z, Yang X, Yin L, Deng M, Lu F. GeoKG-TPM: A Trajectory Generation Method by Integrating Geographic Knowledge Graph and Trajectory Pre-training Model [J]. International Journal of Geographical Information Science, 2025.(中科院一区SCI,已投稿)

(3)GeoKG-TPM:融合地理知识图谱与轨迹预训练模型的轨迹模拟方法
(4)Urban-EPR:模拟城市内部个体移动行为的统一机理模型

本研究系统分析了全球6个城市的2类轨迹数据集(手机信令连续轨迹数据+社交网站签到轨迹数据),发现:1)城市内部个体移动过程中的等待时间(waiting time or duration)可以用参数统一的对数正态分布拟合,相比已有研究中常用的幂律分布、指数分布等效果更好。2)城市内部个体移动过程中的空间选择行为可以用参数统一的统一机会(UO)模型刻画,相比已有研究中常用的重力模型、辐射模型等效果更好。Urban-EPR融入这些发现,将探索与偏好返回(EPR)框架中的等待时间采样部分替换为基于对数正态分布的采样,并在探索阶段使用UO模型来选择下一个位置。通过全面对比当前主流的7类机理模型,发现Urban-EPR在不同时空粒度下均具有优势且鲁棒的模拟效果。本研究可为城市内部个体移动机理模型研究提供了较为全面的benchmark,旨在破除以往相关模型及参数使用随意的现状。

Jin X, Liu K*, Cao Z, Yin L, Luo Y, Zhao X. Urban-EPR: A universal model for simulating intra-urban human mobility[J]. International Journal of Geographical Information Science, 2025.(中科院一区SCI)[paper]

(4)Urban-EPR:模拟城市内部个体移动行为的统一机理模型
(5)基于路网拓扑层次性表达的机动车轨迹模拟方法

提出了一种基于路网拓扑层次性表达的机动车出行路径模拟方法。首先,利用路网自身结构可表达出行者对路网层级认知的特性,提出了基于路网结构指标的路段重要性度量方法。然后,将路段重要性、长度和平均通行速度三个因子组合成路段耗费因子,并以动态时间依赖的 Dijkstra 算法模拟真实机动车的出行路径。该研究不但提供了一种真实出行路径还原方法,还揭示了路网结构对出行路径选择行为影响的微观机理。

刘康, 段滢滢, 张恒才. 基于路网拓扑层次性表达的驾车路径规划方法[J]. 地球信息科学学报, 2015, 17(9): 1039-1046.(国内高水平EI期刊)[paper]

(5)基于路网拓扑层次性表达的机动车轨迹模拟方法
(6)基于智能卡数据的地铁乘客轨迹模拟方法

提出一种推导式方法,基于智能卡数据将乘客与具体列车匹配,还原乘客出行路径。给定一条乘客OD出行记录,本研究结合地铁线路图,使用Dijkstra算法搜索时间最短路径来确定个体的出行路径(即经过的站点序列),并据此将个体出行分为非换乘出行、单次换乘出行和多次换乘出行三类。进一步,通过为每个站点定义①进出站步行时间和②换乘步行时间,辅助乘客-列车匹配过程,还原乘客出行路径。

Liu K, Yin L, Ma Z, et al. Investigating physical encounters of individuals in urban metro systems with large-scale smart card data[J]. Physica A: Statistical Mechanics and its Applications, 2020: 123398.(中科院二区SCI)[paper]

(6)基于智能卡数据的地铁乘客轨迹模拟方法
(7)ActInfer-LLM:基于大语言模型提示设计的轨迹语义化方法

提出了提出一种基于大语言模型的个体时空轨迹语义解析方法—ActInfer-LLM。一方面,通过提出基于POI的区域关键地理特征识别方法,有效辅助了LLM理解时空轨迹并推理其活动语义;另一方面,通过提出针对性的LLM提示设计方案,实现了以零样本学习方式为时空轨迹赋予语义信息。

Cao Z, Liu K*, Luo Y, Yin L, Chen Z. ActInfer-LLM: Inferring Activity Semantics from Raw Trajectories Through Geographic-Information Enhanced LLM Agents [J]. International Journal of Digital Earth, 2024.(中科院一区SCI,审稿中)

Luo Y, Cao Z, Jin X, Liu K*, Yin L*. Deciphering Human Mobility: Inferring Semantics of Trajectories with Large Language Models[C]. 2024 25th IEEE International Conference on Mobile Data Management (MDM), Brussels, Belgium, 2024: 289-294. (CCF-C类会议;EI收录)[paper]

(7)ActInfer-LLM:基于大语言模型提示设计的轨迹语义化方法
二、基于轨迹大数据的城市交通治理研究
(1)Road2Vec:基于机动车轨迹数据的城市道路交通交互强度度量

提出了一种基于轨迹数据挖掘的城市道路交通空间交互强度度量方法——Road2Vec。该方法将出行路径类比为文本文档、路段类比为词,利用词向量模型Word2Vec从大规模浮动车轨迹数据中挖掘交通流在邻近路段之间的传播扩散特征,度量了路段之间的交通空间交互强度。该方法能很好地顾及道路交通影响关系的空间异质性和非线性特征,有助于从交互的视角揭示城市道路交通影响和拥堵传播的成因,服务于交通预测、控制及动态导航。

Liu K, Gao S, Qiu P, et al. Road2vec: Measuring traffic interactions in urban road system from massive travel routes[J]. ISPRS International Journal of Geo-Information, 2017, 6(11): 321.(JCR二区SCI)[paper]

刘康, 仇培元, 刘希亮, 等. 利用词向量模型分析城市道路交通空间相关性[J]. 测绘学报, 2017, 46(12):2032-2040.(国内高水平EI期刊)[paper]

(1)Road2Vec:基于机动车轨迹数据的城市道路交通交互强度度量
(2)Street2Topic:基于机动车轨迹数据的城市道路交通交互模式提取

提出了一种基于轨迹数据挖掘的城市道路交通空间交互模式提取方法。该方法抓住“路链”可表达出行者寻路过程中的空间认知特性,将出行路径类比为文本文档、路链类比为词,利用自然语言处理领域的主题模型LDA从大规模浮动车轨迹数据中提取道路交通空间交互模式,可帮助交通管理者把握和理解城市群体出行模式及交通时空影响格局。[详细介绍]

Liu K, Gao S, Lu F. Identifying spatial interaction patterns of vehicle movements on urban road networks by topic modelling[J]. Computers, Environment and Urban Systems, 2019, 74: 50-61.(中科院一区SCI)[paper]

(2)Street2Topic:基于机动车轨迹数据的城市道路交通交互模式提取
(3)DeFlow-Net:基于可变形卷积深度神经网络的城市区域间交通出行量预测模型

引入可变形卷积,通过额外的偏移量来增加空间采样位置,以增强空间非平稳性建模能力。在此基础上,设计了一个深度可变形卷积残差网络,即DeFlow-Net,以对交通出行量的全局空间依赖性、局部空间非平稳性和时间周期性进行建模。基于BikeNYC和TaxiBJ等数据集的实验表明,本项目提出的DeFlow-Net性能优于图神经网络(GNN)和使用标准卷积的卷积神经网络(CNN)。

Zeng W, Lin C, Liu K, et al. Modeling Spatial Non-stationarity via Deformable Convolutions for Deep Traffic Flow Prediction[J]. IEEE Transactions on Knowledge and Data Engineering, 2023, 35 (3): 2796-2808.(中科院二区SCI)[paper]

(3)DeFlow-Net:基于可变形卷积深度神经网络的城市区域间交通出行量预测模型
(4)ST-GCN-SC:基于时空语义图神经网络的城市区域间交通出行量预测模型

提出了一种基于时空图卷积网络的城市区域间交通出行量预测模型,通过空间上下文增强的时间依赖性建模(ST-GCN-SC),更加科学地刻画了区域间交通出行量的时间和空间依赖性。首先,利用空间上下文增强的长短期记忆网络(SC-LSTM)进行时间依赖性建模。其次,提出了一种图构建方法,以对城市区域的邻近关系和语义关系建模。实验表明,相比当前若干种前沿方法,所提模型的预测误差(RMSE)在BikeNYC和TaxiBJ数据集上分别下降了4.8%和5.7%,实现了预测效果的提升。

Xi G, Yin L*, Liu K. Intra-urban Region-based Traffic Flow Prediction Based on Spatial-Temporal Graph Convolutional Network Enhanced by Spatial Context[C]. The 10th International Workshop on Urban Computing (UrbComp 2021), held in conjunction with the 29th ACM SIGSPATIAL, 2021.(Best Paper Award)[paper]

(4)ST-GCN-SC:基于时空语义图神经网络的城市区域间交通出行量预测模型
三、基于轨迹大数据的城市传染病治理研究
(1)耦合人口流动数据的城市内部登革热时空预测

提出一种人口流动信息融合方法,将区域之间的人口移动交互“二阶量”通过网络表示学习方法转为“一阶量”,用以增强传染病时空预测精度。基于此技术实现了广州市街镇级别的精细空间尺度登革热时空预警预测,支撑了2019年广东省重点城市登革热防控工作部署。进一步融合街景图像大数据等城市环境信息,与温度、降雨量、人口等变量融合以增强登革热时空预测精度,助力登革热防控的空间精准化实施。

Liu K, Zhang M, Xi G, Deng A, Song T, Li Q, Kang M, Yin L*, Enhancing fine-grained intra-urban dengue forecasting by integrating spatial interactions of human movements between urban regions[J]. PLOS Neglected Tropical Diseases, 2020, 14(12): e0008924.(中科院一区SCI)[paper]

Liu K, Yin L*, Zhang M, Kang M, Deng A, Li Q, Song T. Facilitating fine-grained intra-urban dengue forecasting by integrating urban environments measured from street-view images[J]. Infectious Diseases of Poverty, 2021, 10: 40.(中科院一区SCI)[paper]

尹凌, 刘康, 张浩, 等. 耦合人群移动的COVID-19传染病模型研究进展[J]. 地球信息科学学报, 2021, 23(11): 1894-1909.[paper]

(1)耦合人口流动数据的城市内部登革热时空预测
(2)基于人口流动数据的城市内部COVID-19模拟与防控措施推荐

基于深圳市人口普查数据、建筑物数据、手机轨迹数据、出行调查数据等多源异构城市大数据,构建了基于空间显式智能体的COVID-19时空扩散模型,较好地模拟了深圳市疫情时空发展状态,并模拟了戴口罩、居家隔离、密切接触者追踪等非药物干预措施的效果,评估了不同防控措施组合及实施力度下深圳市暴发二次疫情的概率,为高密度人口的超大型城市防控提供了重要参考。

Yin L, Zhang H, Li Y, Liu K, et al. A data driven agent-based model that recommends non-pharmaceutical interventions to suppress Coronavirus disease 2019 resurgence in megacities[J]. Journal of the Royal Society Interface, 2021, 18(181): 20210112.(中科院二区SCI)[paper]

(2)基于人口流动数据的城市内部COVID-19模拟与防控措施推荐
(3)深圳市呼吸道传染性疾病精细化风险评估系统

研发了“深圳市呼吸道传染性疾病精细化风险评估系统”,为深圳市疾病与预防中心提供日常决策辅助支持。该系统以深圳市COVID-19和流感为例,在500米精细格网尺度上研发了融合人口流动的城市内部呼吸道传染病时空传播建模技术,评估城市内部传染病初始暴发位置所致风险,定量识别城市内部关键空间传播节点,支撑社区人口流动管制效果的高效模拟。此外,该技术已被推广至新疆自治区乌鲁木齐市,协助该市搭建平战结合的防控决策系统。

尹凌, 刘康, 梅树江, 等. 呼吸道传染病时空传播风险精细化评估系统构建与应用[J]. 中国卫生信息管理杂志, 2024, 21(05): 653-660.

(3)深圳市呼吸道传染性疾病精细化风险评估系统
四、基于多源时空大数据的城市规划研究
(1)POI2Vec:城市区域POI配置可视化与探索分析方法

创新性地提出一种顾及POI类型之间语义关系的城市区域POI配置可视探索方法。该方法的核心思想是使用词嵌入模型从海量POI空间分布中量化POI类型之间的语义相关度或相似度,构建POI类型二维语义空间,并在该空间中可视化和探索区域POI配置情况。该方法可方便探索和对比城市区域的功能、活力和发展现状,为城市规划提供了有效的分析工具。[系统页面]

Liu K, Yin L, Lu F, et al. Visualizing and exploring POI configurations of urban regions on POI-type semantic space[J]. Cities, 2020, 99: 102610.(中科院一区SCI)[paper]

(1)POI2Vec:城市区域POI配置可视化与探索分析方法
(2)PlaceSemantic:城市地铁站域的场所认知范围提取及语义特征识别

从场所的角度研究城市地铁站域,创新性地提出一种面向城市地铁站域的场所认知边界提取与语义特征识别方法。该方法首先利用网页抽取技术从互联网页面搜索量中获取大众对地铁站与周围POI的认知关系强度;然后利用拐点探测技术识别地铁站周围与其认知关系强度显著的POI;最后利用多边形生成技术提取站域认知边界,并引入TF-IDF算法从站域内POI类型分布中提取人们对站域的独特认知语义。该研究将地铁站的交通功能与活动场所特征整合,为城市规划提供了新视角,并有助于增强位置服务及网络地图功能。

Liu K, Qiu P, Gao S, et al. Investigating urban metro stations as cognitive places in cities using points of interest[J]. Cities, 2020, 97: 102561.(中科院一区SCI)[paper]

(2)PlaceSemantic:城市地铁站域的场所认知范围提取及语义特征识别