背景
描述性分析只能分析数据呈现出来的基本特征,不能挖掘变量之间深层次的关系,无法为后期模型的建立及预测做准备。这个时候就需要掌握推断性分析方法,第一个方法就是相关分析。
##相关分析
(1)相关关系
相关关系是指现象之间存在着非严格的、不确定的依存关系。这种依存关系的特点是:某一现象在数量上发生变化会影响到另一现象数量上的变化,而且这种变化在数量上具有一定的随机性。即当给定某一现象一个数值时,另一个现象会有若干个数值与之对应,并且总是遵循一定的规律,围绕这些数值的平均数上下波动,其原因是影响现象发生变化的因素不止一个。例如,影响销售的因素除了推广费用外,还有产品质量、价格、渠道等因素。
(2)回归函数关系
回归函数关系是指现象之间存在着依存关系。在这种依存关系中,对于某一变量的每一个数值,都有另一变量值与之相对应,并且这种依存关系可用一个数学表达式反映出来。例如,在一定条件下,身高和体重存在着依存关系。
相关分析可分为线性相关和非线性相关,线性相关也称为直线相关,非线性相关从某种意义来讲也就是曲线相关。