一 定性变量的统计分析
多项分布与X检验
列联表分析
一致性检验
拟合优度检验
二、回归分析
概述:考察变量之间的数量变化规律,确定自变量和因变量之间的数学关系式,建立回归方程,对回归方程进行各种统计检验,并能进行预测。
三、均值分析
概述:均值分析过程计算指定变量的综合描述统计量,包括反映总体特征的分析和离散态势两部分。其中分析包括统计量均值、总和两项;离散态势包括统计量最小值、最大值、标准差、方差、极差和均值标准差六项。
四、频率分析
概述:对数据按组进行归纳整理,形成变量取不同值的频数分析表,形成对数据的数量特征和观测量分布状况的总体认识。
五、描述分析
对数据进行分组统计分析,得出应变量的聚集态势、离散态势、异常值的各指标、比例表、茎叶图、盒状图。
六、相关分析
相关分析是对客观事物数量依存关系分析的一种方法,它主要刻画两类变量间线性相关的密切程度,其两个变量x、y全是随机变量,且处于平等的地位。两变量之间的相关关系可以通过绘制散点图或计算相关系数来反映。本部分包括二元变量相关分析和偏相关分析。
七、方差分析
进行单变量方差分析,即检验两个及两个以上彼此独立的样本是否来自均值相同的总体。本过程要求分析变量为正态分布,否则应该选择卡方检验或多样本检验所包括的某些功能。
八、多样本检验
推断样本来自的多个独立总体的分布是否存在显著性差异。其方法是:推断多个独立总体的均值或中位数是否存在显著性差异。多样本检验提供了常用的两种检验方法:Kruskalwall H和中位数检验法。
九、一元线性回归
十、 多元线性回归
十一、 逐步回归
根据预先设定的选入和剔除的标准进行变量筛选。首先分别计算各自变量对y的贡献大小,按由大到小挑选贡献最大的一个先进入方程;随后重新计算各自变量对y的贡献,并考察已在方程中的变量是否由于新变量的引入而不再有统计意义。如果是,则将它剔除,并重新计算各自变量对y的贡献。如仍有变量低于入选标准,则继续考虑剔除,直到方程内没有变量可以剔除,方程外没有变量可引入为止。
十二、 聚类分析
距离和相似系数
系统聚类法
十三、模糊聚类分析
概述:聚类分析是一种研究事物分类的方法,其目的是把分类对象按一定的规则分为若干类,这些类不是事先给定的,而是根据数据的特征确定的。通俗的讲,聚类分析法是用来对资料做简化的工作及分类,也就是把相似的个体(观察量)归于一群。
十四、因子分析
因子分析是主成分分析的推广,它也是一种把多个变量化为少数几个综合变量的多元分析方法。