因子分析
因子分析(Factor Analysis,FA)是一种数据简化技术,通过研究众多变量之间的内部依赖关系,探求观测数据的基本结构,并用少数几个假想变量(因子)来表示原始数据。
与主成分分析的区别
因子分析区别于主成分分析的地方在于:
因子具有明确解释性,而主成分解释含义较原始数据比较模糊
主成分的解唯一,而因子有多解(由于增加了特殊因子向量),可以进行旋转而增大可解释的可能性
主成分分析不需要构造模型,而因子分析需要构造一个因子模型,并伴随几个关键性的假定
因子分析的一般模型
根据模型意义,我们给出几个重要假设:
性质
1. 原始变量X的协方差矩阵分解
说明:特殊因子的协方差越小,公共因子共享的成分越多。
2. 载荷矩阵不唯一
说明:可以通过对载荷矩阵进行正交旋转,在不改变特殊因子的情况下寻求更鲜明的实际意义或可解释性的因子。
载荷矩阵中的统计意义
1. 变量共同度
即:横向代表所有载荷因子对某变量影响的程度。
2. 因子重要性
即:纵向代表某载荷因子对整体x变量的贡献度。
3. 因子载荷的统计意义
因子载荷$a_{ij}$是第$i$个变量与第$j$个公共因子的相关系数,反映了第$i$个变量与第$ j$
个公共因子的相关重要性。绝对值越大,相关的密切程度越高。
载荷矩阵A的估计方法
- 主成分分析法(这里可以发现是用主成分方法解的)
- 极大似然估计法
- 主轴因子法
spss上直接选即可。
载荷矩阵A的旋转方法
我们可以通过正交变换使矩阵$A$中有尽可能多的元素等于或接近于0,从而使因子载荷矩阵结构简单化,便于做出更有实际意义的解释。
常用方法有:最大方差法、Oblimin方法、最优斜交旋转等。
spss上直接选即可。
计算公共因子取值——因子得分
前面我们主要解决了用公共因子的线性组合来表示一组观测变量的有关问题。如果我们要使用这些因子做其他的研究,比如把得到的因子作为自变量来做回归分析,对样本进行分类或评价,这就需要我们对公共因子进行测度,即给出公共因子的值。
常用Anderson-Rubin方法。
spss上直接选即可。
总结
综上所述,因子分析的基本步骤可概括;
求样本相关系数矩阵R的特征值(依大小次序)及其相应的特征向量。 取前面k个特征值使其累积方差贡献率超过85%,并给出前k个特征值对应的特征向量。
求因子载荷矩阵 A 。
对载荷矩阵A作正交旋转 ,使得到的矩阵方差和最大
ref: