R语言数据预处理及模型评估方法
1.数据预处理
1.1数据标准化
对iris数据的值进行标准化,使用as.data.frame()函数将得到的矩阵再次转换为数据框,进行标准化时,需要将Species剔除,完成标准化后,使用cbind()函数合并最后的结果。scale()
cbind(as.data.frame(scale(iris[1:4])),iris$Species)
1.2PCA
x<-1:10 y<-x+runif(10,min=-.5,max=.5) z<-x+y+runif(10,min=-.10,max=.10) data=data.frame(x,y,z) data pr<-princomp(data) summary(pr)
1.3独热编码
使用model.matrix(object,data)#创建设计矩阵 x<-data.frame(lv1=factor(c("A","B","A","A","C")),value=c(1,3,2,4,5))
1.3缺失值处理
近期评论