首先需要理解在回归(regression)中为什么分类型变量(categorical data)不能和其他自变量一样直接处理?
因为分类型变量的值没有数学意义,它只是一个编号或者序号,不能直接用于回归运算。
找一个方法让分类型变量的值具有数学意义。
将每个分类展开,并分别作为一个特征,其特征值非0即1。
研究股票的股价,有以下四个特征,其中最后一个特征“所属板块”就是分类型变量
我们就可以按照上面的解决方法,将其展开,用0、1作为值,即:
Category: 机器学习 Tags: regression, 回归, 机器学习
小伙子,很久没更新文章了 😛
太懒了,还在治疗中 😛
电子邮件地址不会被公开。
评论
姓名
电子邮件
站点
小伙子,很久没更新文章了 😛
太懒了,还在治疗中 😛