Выявление участков повышенной опасности на дорогах Массачусетса в 2013-2018 годах
Аннотация
Для выявления участков повышенной опасности на дорогах штата Массачусетс применяется метод кластеризации DBSCAN. Исследуются серьезные (т.е. приведшие к летальному исходу или травмам) дорожно-транспортные происшествия (ДТП) с 2013 по 2018 годы. Алгоритм DBSCAN был также применен к набору равномерно распределенных по дорожной сети точек для определения порога в численности ДТП, после которого кластер можно считать статистически достоверным. Было произведено сравнение двух метрик расстояния: эвклидовой и сетевой. Показано, что обе метрики эквивалентны, если минимальное расстояние между отдельными ДТП в кластере не превышает 10 метров. Последний результат позволяет обосновать гибридный метод кластеризации, применимый для нахождения участков повышенной опасности на дорогах: для нахождения компактных кластеров можно использовать обычные эвклидовы расстояния между ДТП, а дорожную сеть использовать только для генерации равномерно распределенных по сети точек, нужных для выявления достоверных кластеров методом Монте-Карло. Гибридный метод позволяет обработать десятки тысяч ДТП, располагая сравнительно скромными вычислительными ресурсами. Анализ кластеров, выявленных на протяжении нескольких последовательных лет позволяет сделать вывод о их стабильности и прогностической ценности.
Литература
S. Chainey, L. Tompson, and S. Uhlig, “The utility of hotspot mapping for predicting spatial patterns of crime,” Secur J, vol. 21, no. 1, pp. 4–28, 2008; doi: 10.1057/palgrave.sj.8350066
S. Chainey and J. Ratcliffe, GIS and Crime Mapping, Chichester, UK: John Wiley and Sons, 2005; doi: 10.1002/9781118685181
M. Ester, H-P. Kriegel, J. Sander, and X. Xu, “A density-based algorithm for discovering clusters in large spatial databases with noise,” in Proc. KDD’96: 2nd Int. Conf. on Knowledge Discovery and Data Mining, 1996, pp. 226–231.
A. Gramacki, Nonparametric Kernel Density Estimation and Its Computational Aspects, Cham, Swi- tzerland: Springer International Publishing, 2018; doi: 10.1007/978-3-319-71688-6
P. A. P. Moran, “Notes on Continuous Stochastic Phenomena,” Biometrika, vol. 37, no. 1/2, pp. 17–23, 1950; doi: 10.2307/2332142
A. Okabe and K. Sugihara, Spatial Analysis along Networks: Statistical and Computational Methods, Hoboken, NJ, USA: John Wiley & Sons, 2012; doi:10.1002/9781119967101
P. Songchitruksa and X. Zeng, “Getis–Ord Spatial Statistics to Identify Hot Spots by Using Incident Management Data,” Transportation Research Record, no. 2165, pp. 42–51, 2010; doi: 10.3141/2165-05
L. Yingjie, et al., “Mapping the hotspots and coldspots of ecosystem services in conservation priority setting,” Journal of Geographical Sciences, vol. 27, no. 6, pp. 681–696, 2017; doi: 10.1007/s11442-017- 1400-x
Y. Xie and S. Shekhar, “Significant DBSCAN towards Statistically Robust Clustering,” in Proc. SSTD’19: 16th International Symposium on Spatial and Temporal Databases, 2019, pp. 31–40; doi: 10.1145/3340964.3340968
“Massgis data-massachusetts department transportation massdot roads,” in docs.digital.mass.gov, [Online]. Available: https://docs.digital.mass.gov/dataset/massgis-data-massachusetts-department-transportation-massdot-roads
“QGIS,” in www.qgis.org, [Online]. Available: https://www.qgis.org/en/site/
“Open jump,” in www.openjump.org, [Online]. Available: http://www.openjump.org/
“MassDOT Crash Open Data Portal,” in Mass.gov, [Online]. Available: https:// massdot-impact-crashes-vhb.opendata.arcgis.com/search
“SANET,” in sanet.csis.u-tokyo.ac.jp, [Online]. Available: http://sanet.csis.u-tokyo.ac.jp/
Материал публикуется под лицензией: