R语言数据预处理及模型评估方法

1.数据预处理

1.1数据标准化

对iris数据的值进行标准化,使用as.data.frame()函数将得到的矩阵再次转换为数据框,进行标准化时,需要将Species剔除,完成标准化后,使用cbind()函数合并最后的结果。scale()

cbind(as.data.frame(scale(iris[1:4])),iris$Species)

1.2PCA

x<-1:10
y<-x+runif(10,min=-.5,max=.5)
z<-x+y+runif(10,min=-.10,max=.10)
data=data.frame(x,y,z)
data
pr<-princomp(data)
summary(pr)

1.3独热编码

使用model.matrix(object,data)#创建设计矩阵
x<-data.frame(lv1=factor(c("A","B","A","A","C")),value=c(1,3,2,4,5))
A转换为(0,0)B转换为(1,0)C转换为(0,1)

1.3缺失值处理

You may also like...

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注