跳转到主要内容

绿色出行(GreenMove):构建上海市公共绿地游览数据集

上海市城市设计与城市科学重点实验室(以下简称LOUD重点实验室与上海交通大学人工智能研究院合作,探索城市绿地研究向数据驱动方法论的转型。研究团队利用来自上海一千万匿名手机用户的数据,识别并分析了为期四个月的城市公园出行行为,构建了一个反映真实人口每日出行的动态网络“绿色出行”(GreenMove),揭示了城市各居住区与公园之间的连接关系。研究成果《上海市公共绿地游览数据集Dataset for visitations of public green spaces in Shanghai, China 发表于Nature Portfolio旗下期刊Scientific Data

本研究构建动态出行网络“绿色出行”GreenMove)涵盖了流量、通勤比例、节点之间距离等具有信息量的指标。该网络通过建模居住区与公园之间的连接关系,弥合了需求-供给之间的鸿沟,并量化了公园的需求强度与吸引力。

除了考虑公园的地理特征与竞争关系,“绿色出行”还整合了全面的社会经济指标以及精细的天气数据。作为一个动态的拓扑结构,“绿色出行”展示了居民享受绿地的行为模式,为城市公园研究的发展以及注重公平的规划提供了多维度的见解。它尤其为理解城市长期演变过程中的时序基准提供了重要参考,并揭示了居民公园可达性的纵向动态,同时也为未来可持续城市设计的多个领域提供了支持。

1

图:研究的示意图概览。

 

城市绿地已被证实可带来社会、经济、环境、身体和心理健康等多方面的益处。特别是在新冠疫情等流行病期间,公园和绿地因其不可替代的作用而受到前所未有的重视。尽管公园到访仅占居民每日出行的一小部分,但对具有时间与空间分辨率的公园到访数据的需求日益增长。这种需求不仅源于绿色城市规划的呼声,也来自对绿地使用过程与模式及其影响因素的深入理解。相关洞察对于进一步探讨公园可达性、多样性、有效性、公平性与可持续性的社会影响至关重要。当前,全球南方城市(如中国、印度、中东)的平均绿地暴露率仅为14.39%,因此亟需通过绿地规划改善居民健康与福祉,这也进一步强调了获取真实数据以支持城市绿地有效管理与规划策略的重要性。

以往以地理参数为基础的研究已显滞后,这些研究通常假设访客来源于周边社区或一定范围内的区域。无论是缓冲区、邻近距离,还是基于引力模型,这些方法都未能充分考虑现实中更为复杂的居民出行行为。纳入真实行为数据才能更有说服力地解析人们如何实际使用公园并从中受益。然而,由于公园长期奉行开放与可达的原则,公园数据的获取往往是间接的,大多数公园仍然是免费开放的。在新冠疫情期间,中国政府引入了一种独特的主动上报机制:要求在重点场所(包括公园)扫码登记,记录到访的起止时间。这一机制在理论上实现了精确的访问记录,但随着疫情结束和隐私政策的加强,该类数据已不再公开可用。代理建模的偏置扩散过程可用于模拟居民流动,但仍假设居民总是前往最近的绿地,这显然不符合现实。

近年来,数据驱动方法受到广泛关注,特别是得益于移动设备所采集的大规模居民出行与行为数据,使得探索现实世界中复杂的公园到访模式成为可能。越来越多的研究开始利用手机数据研究影响公园可达性、服务范围、吸引力、隔离性与公平性等因素。一些研究也通过在线评论与社交媒体数据分析公园的公平性问题。基于真实、细粒度个体出行数据构建城市公园到访网络,已成为理解居民使用绿地行为模式的重要手段。

然而,尽管使用手机数据进行公园研究在理论上面临障碍较少,目前基于此类出行数据、专门针对公园的公开数据集却极为稀缺。已有研究或多或少存在以下限制:(1)用户样本规模有限,如2230万移动设备、150万手机号、或仅33万居民;(2)时间跨度不足,如仅24小时或一个月,难以捕捉季节性或长期趋势;(3)空间偏倚,往往只聚焦部分样本公园;(4)属性缺失,虽然部分研究构建了加权双向网络来衡量绿地暴露与需求,但仍缺乏内建的环境信息,且未考虑网络构建的时间维度。此外,大多数基于手机数据生成的访问数据尚未公开。尽管加拿大多伦多的一项公开数据研究从公园角度出发,提供了公园可达性公平的分析,并包含普查区级别的社会经济信息,但其并未体现居住区与公园之间的连接,从而难以闭合需求-供给回路。截至目前,尚无公开数据集可全面反映整个城市尺度上,不同时间与属性维度下的公园需求与吸引力。

考虑到隐私保护,公开个体级的公园访问记录是不现实的。因此,我们构建了“绿色出行”数据集,这是一个居住区多边形与公园之间的动态双向出行网络。该网络基于来自多个电信运营商的上海手机数据,涵盖20141月至4月的1000万匿名用户。所有数据在接收前均已完成匿名处理,严格遵守相关隐私保护法规。我们通过空间聚类方法识别出个体停留点,并将其归类为居住、工作或其他活动地点,再识别出这些其他地点中与公园地理重叠的区域,从而界定公园到访行为。

上海共有226个镇级行政单位,是中国人口普查中最细的行政区划。但这一层级在城市尺度上仍偏粗,不足以系统地刻画城市范围内的公园使用行为。我们基于基站位置重新划分城市空间,使用Voronoi图将城市划分为居住多边形。进而将每天来自每个多边形的公园到访数据进行聚合,形成全市尺度上关于公园需求吸引力的动态网络。数据集覆盖2014年上海市共计38,055个居住多边形与394座城市公园。

“绿色出行”不仅提供了一个从网络科学角度分析居住区、公园及其连接关系的视角,还集成了大量社会经济(如房价、POI密度)、天气(如每日气温、降水量)以及一定半径内的公园存在情况等多维属性。研究人员可据此深入探讨影响公园访问模式的因素与驱动机制,为关注公平性的研究提供可操作性的见解。此外,“绿色出行”基于真实人口构建的网络也可为政策制定者在现实情境下进行未来城市公园布局提供决策支持,有助于打造更健康的城市绿地,提升居民福祉,改善以人为本的城市生活质量,最终实现生态与社会福利的共同提升。

另一方面,城市公园随时间推移的变化也反映出城市增长的趋势,揭示出城市结构与规模的演变。因此,“绿色出行”也可作为研究城市形态演变中绿地使用模式变化的桥梁,帮助我们构想未来城市绿地的样貌。

本研究由LOUD重点实验室联合上海交通大学人工智能研究院共同完成。本研究得到了上海市数据局、上海市自然与健康基金会、上海市教委“人工智能促进科研范式改革赋能学科跃升“计划、远景能源等多方支持。

 

文章引用:

Feng, Y., Huang, S., Chen, S., Guan, C., Li, Y., Tan, Q., Jin, Y., Yang, X., & Xu, Y. (2025). Dataset for visitations of public green spaces in Shanghai, China. Scientific Data, 12(1260). https://doi.org/10.1038/s41597-025-05581-w