背景
所有的线性回归分析中,因变量的类型都是连续变量,如果需要预测的变量类型为分类变量,则需要采用回归分析中的Logistic回归。
##Logistic回归
Logistic回归是针对因变量为分类变量而进行回归分析的一种统计方法,属于概率型非线性回归。
一旦因变量是分类变量,那么因变量与自变量之间就不存在这种线性关系了。这个时候就需要通过某种变换来解决这个问题,这个变换称为对数变换。
##分类变量
包括二分类和多分类。
(1)二分类:就是两个分类状态,例如用户是否购买商品、用户是否流失等都属于二分类;
(2)多分类:就是具有多个类别的状态,例如客户价值分类,可分为高价值客户、中价值客户、低价值客户。