测绘通报 ›› 2018, Vol. 0 ›› Issue (2): 94-98.doi: 10.13474/j.cnki.11-2246.2018.0051
肖屹1, 何宗宜1, 苗静2, 潘峰1,3, 杨好1
收稿日期:
2017-07-18
修回日期:
2017-08-30
出版日期:
2018-02-25
发布日期:
2018-03-06
作者简介:
肖屹(1994-),男,硕士生,主要研究方向为空间统计与空间数据挖掘。E-mail:arsrvp@foxmail.com
基金资助:
国家自然科学基金(41071290);教育部人文社会科学研究项目(14YJCZH028)
XIAO Yi1, HE Zongyi1, MIAO Jing2, PAN Feng1,3, YANG Hao1
Received:
2017-07-18
Revised:
2017-08-30
Online:
2018-02-25
Published:
2018-03-06
摘要:
互联网记录了人们的日常生活,对带有位置信息的搜索引擎数据进行分析和挖掘可以获得隐藏于其中的地理信息。本文通过分析中国各省流感月度发病数与相关关键词百度搜索指数之间的相关性,选取相关性较高关键词的百度指数作为解释变量,发病数作为因变量,在采用主成分分析法消除变量共线性后,分别使用普通最小二乘回归(OLS)、地理加权回归(GWR)及时空地理加权回归(GTWR)构建流感发病数的空间分布模型。模型的拟合度能够从OLS的0.737、GWR的0.915提高到GTWR的0.959,赤池信息准则(AIC)也表明,GTWR模型明显优于OLS与GWR模型。验证结果显示,GTWR模型能准确识别流感高发地区,将该方法与搜索引擎数据结合能较好地模拟流感空间分布,为空间流行病学的研究提供预测模型和统计解释。
中图分类号:
肖屹, 何宗宜, 苗静, 潘峰, 杨好. 利用搜索引擎数据模拟疾病空间分布[J]. 测绘通报, 2018, 0(2): 94-98.
XIAO Yi, HE Zongyi, MIAO Jing, PAN Feng, YANG Hao. Modelling the Spatial Distribution of Epidemic by Search Engine Data[J]. 测绘通报, 2018, 0(2): 94-98.
[1] 胡雪芸,何宗宜,苗静.疾病数据的时空聚集分析及可视化[J].测绘通报,2015(11):106-111. [2] 单杰,秦昆,黄长青,等.众源地理数据处理与分析方法探讨[J].武汉大学学报(信息科学版),2014,39(4):390-396. [3] 艾廷华.大数据驱动下的地图学发展[J].测绘地理信息,2016,41(2):1-7. [4] 鲁力,邹远强,彭友松,等.百度指数和微指数在中国流感监测中的比较分析[J].计算机应用研究,2016(2):392-395. [5] 李秀婷,刘凡,董纪昌,等.基于互联网搜索数据的中国流感监测[J].系统工程理论与实践,2013,33(12):3028-3034. [6] GINSBERG J,MOHEBBI M H,PATEL R S,et al.Detecting Influenza Epidemics Using Search Engine Query Data[J].Nature,2008,457(7232):1012-1014. [7] 王若佳,李培.基于互联网搜索数据的流感监测模型比较与优化[J].图书情报工作,2016(18):122-132. [8] 焦利民,许刚,赵素丽,等.基于LUR的武汉市PM2.5浓度空间分布模拟[J].武汉大学学报(信息科学版),2015,40(8):1088-1094. [9] 赵阳阳,刘纪平,徐胜华,等.一种基于半监督学习的地理加权回归方法[J].测绘学报,2017,46(1):123-129. [10] 张金牡,刘彪,吴波,等.应用改进的时空地理加权模型分析城市住宅价格变化[J].东华理工大学学报(自然科学版),2010,33(1):53-59. [11] HUANG B,WU B,BARRY M.Geographically and Temporally Weighted Regression for Modeling Spatio-temporal Variation in House Prices[J].International Journal of Geographical Information Science,2010,24(3):383-401. [12] 董晓春,李琳,徐文体,等.特定关键词及百度指数与流感病毒活动相关性分析[J].中国公共卫生,2016(11):1543-1546. [13] YUAN Q,NSOESUE E O,LV B,et al.Monitoring Influenza Epidemics in China with Search Query from Baidu[J].Plos One,2013,8(5):e64323. [14] 王旭,林征,张志,等.基于GWR模型的北极滨海平原融冻湖表面温度空间分布模拟[J].武汉大学学报(信息科学版),2016,41(7):918-924. [15] 黄达沧.基于搜索引擎数据的手足口病监测[D].长春:东北师范大学,2015:27-32. [16] 覃文忠,王建梅,刘妙龙.混合地理加权回归模型算法研究[J].武汉大学学报(信息科学版),2007,32(2):115-119. [17] ZHANG H,GUO L,CHEN J,et al.Modeling of Spatial Distributions of Farmland Density and Its Temporal Change Using Geographically Weighted Regression Model[J].Chinese Geographical Science,24(2):191-204. [18] LAMPOS V,CRISTIANINI N.Tracking the Flu Pandemic by Monitoring the Social Web[C]//2010 Second International Workshop on Cognitive Information Processing(CIP).Elba:IEEE,2010:411-416. |
[1] | 葛鹏飞, 刘辉, 陈蜜, 李昱, 丁瑞力, 刘菲. 时序InSAR监测京雄城际铁路河北段地面沉降[J]. 测绘通报, 2022, 0(7): 64-70. |
[2] | 吕峥, 孙群, 温伯威, 马京振. 一种自身全局最优的道路网Stroke生成方法[J]. 测绘通报, 2022, 0(7): 93-99. |
[3] | 钟祺康, 王志一, 王娜, 郗富瑞. 陕北干旱区景观生态风险空间分异特征及驱动因素分析[J]. 测绘通报, 2022, 0(7): 100-106. |
[4] | 强德霞, 马海政, 朱自平, 苟彦梅. 甘肃省积石山县泥石流空间分布及分析[J]. 测绘通报, 2022, 0(7): 107-111,117. |
[5] | 韩文立, 张继贤, 陈海鹏, 黄海英, 章力博, 葛娟, 沈晶, 卢遥. 新型基础测绘质检技术探讨[J]. 测绘通报, 2022, 0(7): 148-153. |
[6] | 陶肖静. 基于TEA算法的地理信息数据安全保护技术及验证分析[J]. 测绘通报, 2022, 0(7): 154-157,167. |
[7] | 蔡柔丹. 一种基于用户异步轨迹的身份识别智能方法[J]. 测绘通报, 2022, 0(7): 158-162,167. |
[8] | 周烨, 刘云波, 郑丽波, 龙泱君. 多平台点云数据的单木参数提取精度分析[J]. 测绘通报, 2022, 0(7): 168-172. |
[9] | 贺瑜琦, 曾一笑, 陈光, 陈良超. 新型测绘视角下的山地城市规划实施场景预警模拟技术探索[J]. 测绘通报, 2022, 0(4): 11-15. |
[10] | 罗国玮, 叶嘉媛, 王金凤. 基于多特征相似性的多源POI匹配方法[J]. 测绘通报, 2022, 0(4): 96-100. |
[11] | 闫明涛, 乔家君, 瞿萌, 朱乾坤, 韩冬. 黄河流域乡村社会经济与生态环境耦合协调测度及影响因素分析[J]. 测绘通报, 2022, 0(4): 101-105,116. |
[12] | 张普伟, 付梁, 王国华, 卢嫣楠, 赵海云. 乡村休闲养老项目的选址评价体系分析[J]. 测绘通报, 2022, 0(4): 106-110. |
[13] | 黄鹤, 孟维明. 基于视觉的大半径圆曲线车道线识别[J]. 测绘通报, 2022, 0(4): 134-137. |
[14] | 张定祥, 汪秀莲, 刘顺喜, 张嘉, 陈强, 李士江. 第三次全国国土调查土地利用矢量数据栅格化方法[J]. 测绘通报, 2022, 0(4): 138-144. |
[15] | 曾元武, 史京文, 罗宏明, 程迎轩. 省市县三级联动国土空间规划实施监督信息系统建设研究——以广东省为例[J]. 测绘通报, 2022, 0(4): 145-148. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||