地理加权回归 | 模型如何应用于新数据的预测?
创始人
2024-06-02 18:22:44
0

专注系列化高质量的R语言教程

推文索引 | 联系小编 | 付费合集


有读者不知道如何用地理加权回归去预测新的数据。本篇以常用的两个工具包为例进行介绍。

本篇目录如下:

  • 0 数据准备

  • 1 spgwr工具包

  • 2 GWmodel工具包

  • 3 结语

相关推文:

  • spgwr | R语言与地理加权回归(Ⅰ-1):线性地理加权回归

  • spgwr | R语言与地理加权回归(Ⅰ-2):广义线性地理加权回归

  • GWmodel | 地理加权模型(Ⅱ-1):地理加权主成分分析(GWPCA)

  • GWmodel | 地理加权模型(Ⅱ-2):如何查看地理加权回归的显著性

0 数据准备

示例数据是来自spData工具包的NY8_utm18.shp。该数据在推文线性地理加权回归中使用过。

library(rgdal)
NY8 <- readOGR(system.file("shapes/NY8_utm18.shp",package = "spData"))

该数据共包含281个空间单元。随机选择其中的276个作为模型数据,剩余5个作为预测数据。代码如下:

set.seed(0312)
modelid <- sample(1:281, 276)
predid <- setdiff(1:281, modelid)modeldata <- NY8[modelid,]
preddata <- NY8[predid,]plot(modeldata)
plot(preddata, add = T, col = "red")
04acc7229f174ac8a2bc3f0728744c1d.png

1 spgwr工具包

使用spgwr工具包的函数运行一个地理加权模型:

library(spgwr)
form <- Z ~ PEXPOSURE + PCTAGE65P + PCTOWNHOME
bw <- gwr.sel(formula = form, data = modeldata,gweight = gwr.Gauss, method = "cv")model <- gwr(formula = form, data = modeldata,bandwidth = bw, gweight = gwr.Gauss)

该模型不能使用predict()函数进行预测:

predict(model, preddata) 
## Error in UseMethod("predict") : 
##  no applicable method for 'predict' applied to an object of class "gwr"

在R语言中,使用什么函数预测模型需要看对应工具包的设计。比如spgwr工具包,在帮助文档中可以发现gwr()函数有两个参数与模型预测有关:

  • fit.points: an object containing the coordinates of fit points; often an object from package sp; if missing, the coordinates given through the data argument object, or the coords argument are used;

  • predictions: default FALSE; if TRUE and no fit points given, return GW fitted values at data points, if fit points given and are a Spatial*DataFrame object containing the RHS variables in the formula, return GW predictions at the fit points.

因此,在spgwr工具包中模型运行和预测使用的是同一个函数;如需使用新数据进行预测,需使用fit.points参数指定包含新数据的矢量数据,并设置predictions = TRUE

model12 <- gwr(formula = form, data = modeldata,bandwidth = bw, gweight = gwr.Gauss,fit.points = preddata,predictions = T) 
## 查看预测结果
model12$SDF$pred
## [1]  0.04586992 -0.36963028 -0.09173360 -0.39631776  0.13528131
  • 对比modelmodel12SDF可以发现:不需要模型预测的model,其SDF@data对应的是模型数据;需要模型预测的model12,其SDF@data对应的是预测数据;

  • 其他函数如ggwr()函数的预测方法类似。

2 GWmodel工具包

使用GWmodel工具包的函数运行一个地理加权模型(带宽参数bw仍使用上例的值):

library(GWmodel)
model2 <- gwr.basic(formula = form, data = modeldata,bw = bw, kernel = "gaussian")

该工具包同样不支持使用predict()函数进行模型预测:

predict(model2, preddata) 
## Error in UseMethod("predict") : 
##  no applicable method for 'predict' applied to an object of class "gwrm"

查看帮助文档可发现一个gwr.predict()函数,其参数predictdata的说明如下:

  • predictdata: a Spatial*DataFrame object to provide prediction locations, i.e. SpatialPointsDataFrame or SpatialPolygonsDataFrame as defined in package sp.

示例如下:

model22 <- gwr.predict(formula = form, data = modeldata,bw = bw, kernel = "gaussian",predictdata = preddata) 
## 查看预测结果
model22$SDF$prediction
## [1]  0.04586992 -0.36963028 -0.09173360 -0.39631776  0.13528131

3 结语

关于R语言中的函数使用方法,学堂君在下面的推文中已经介绍了:

  • 如何正确使用R语言的函数——为什么有的模型结果不能使用summary函数查询?

相关内容

热门资讯

中证A500ETF摩根(560... 8月22日,截止午间收盘,中证A500ETF摩根(560530)涨1.19%,报1.106元,成交额...
A500ETF易方达(1593... 8月22日,截止午间收盘,A500ETF易方达(159361)涨1.28%,报1.104元,成交额1...
何小鹏斥资约2.5亿港元增持小... 每经记者|孙磊    每经编辑|裴健如 8月21日晚间,小鹏汽车发布公告称,公司联...
中证500ETF基金(1593... 8月22日,截止午间收盘,中证500ETF基金(159337)涨0.94%,报1.509元,成交额2...
中证A500ETF华安(159... 8月22日,截止午间收盘,中证A500ETF华安(159359)涨1.15%,报1.139元,成交额...
科创AIETF(588790)... 8月22日,截止午间收盘,科创AIETF(588790)涨4.83%,报0.760元,成交额6.98...
创业板50ETF嘉实(1593... 8月22日,截止午间收盘,创业板50ETF嘉实(159373)涨2.61%,报1.296元,成交额1...
港股异动丨航空股大幅走低 中国... 港股航空股大幅下跌,其中,中国国航跌近7%表现最弱,中国东方航空跌近5%,中国南方航空跌超3%,美兰...
电网设备ETF(159326)... 8月22日,截止午间收盘,电网设备ETF(159326)跌0.25%,报1.198元,成交额409....
红利ETF国企(530880)... 8月22日,截止午间收盘,红利ETF国企(530880)跌0.67%,报1.034元,成交额29.0...