定义
回归分析是研究自变量和因变量之间数量变化关系的一种分析方法,它主要是通过建立因变量Y与影响它的自变量X之间的回归模型,衡量自变量X对因变量Y的影响能力,进而可以预测因变量Y的发展趋势。例如,销售额对广告费用存在依存关系,通过对这一依存关系的分析,在制定下一期广告费用的情况下,可以预测将实现的销售额。
##相关性分析和回归分析
联系:两者均为研究及测度两个或两个以上变量之间关系的方法。在实际工作中,一般先进行相关分析,计算相关系数,然后建立回归模型,最后用回归模型进行推算或预测。
区别:
(1)相关分析研究的都是随机变量,并且不分因变量和自变量;回归分析研究的变量要定义出自变量和因变量,并且自变量是确定的普通变量,因变量是随机变量。
(2)相关分析主要是描述两个变量之间相关关系的密切程度;回归分析不仅可以揭示变量X对变量Y的影响程度,还可以根据回归模型进行预测。
##线性回归步骤
(1)根据预测目标,确定自变量和因变量围绕业务问题,明晰预测目标,从经验、常识、以往历史数据研究等角度,初步确定自变量和因变量。
(2)绘制散点图,确定回归模型类型通过绘制散点图的方式,从图形化的角度初步判断自变量和因变量之间是否具有线性相关关系,同时进行相关分析,根据相关系数判断自变量与因变量之间的相关程度和方向,从而确定回归模型的类型。
(3)估计模型参数,建立回归模型采用最小二乘法进行模型参数的估计,建立回归模型。
(4)对回归模型进行检验回归模型可能不是一次即可达到预期的,通过对整个模型及各个参数的统计显著性检验,逐步优化和最终确立回归模型。
(5)利用回归模型进行预测模型通过检验后,应用到新的数据中,进行因变量目标值的预测。