correlation-analysis
相关性分析
相关性分析的概念
相关分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个因素的的相关密切程度,相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。
变量关系强度通常从以下的角度分析:
-
两变量是否相互独立。
-
两变量是否有共变趋势。
-
一变量的变化多大程度上能由另一变量的变化来解释。
相关性分析的方法
四种基本变量
- 定类变量:根据定性的原则区分总体各个案类别的变量,如性别,民族、婚姻状况
- 定序变量:区别同一类别个案中等级次序的变量,如文化程度、工厂规模· 、年龄大小
- 定距变量:区别同一类别个案中等级次序及其距离的变量,如摄氏温度、比率、智力水平
- 定比变量:也是区别同一类别个案中等级次序及其距离的变量,如收入、价格、市场占有率
分辨定距变量和定比变量的方法是看其取0时是否有含义。
两变量的相关分析
Pearson相关系数
适用条件
- 两变量均应由测量得到的连续变量。
- 两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。
- 变量必须是成对的数据。
- 两变量间为线性关系。
适用范围
适用于定距、定比类型的变量。是运用最广的一种相关程度统计量。检验用t统计量:其中统计量t服从自由度(n-2)的分布
|r|越接近于1,表明两变量相关程度越高,它们之间的关系越密切。
Spearman 等级相关系数
适用于度量定序变量与定序变量之间的相关。
双变量关系强度测量的主要指标
定类 | 定序 | 定距 | |
---|---|---|---|
定类 | 卡方类检测 | 卡方类检测 | Eta系数 |
定序 | Spearman相关系数 | Spearman相关系数 | |
定距 | Pearson相关系数 |
偏相关分析
偏相关分析的基本概念
在多变量的情况下,变量之间的相关关系是很复杂的。偏相关分析是指在对其他变量的影响进行控制的条件下,分析多个变量中某两个变量之间的线性相关程度,计算偏相关系数。
偏相关系数与简单相关系数区别
在计算简单相关系数时:只需要掌握两个变量的观测数据,并不考虑其他变量对这两个变量可能产生的影响。
在计算偏相关系数时:需要掌握多个变量的数据,一方面考虑多个变量相互之间可能产生的影响,一方面又采用一定的方法控制其他变量,专门考察两个特定变量的净相关关系。
偏相关系数及其检验
MATLAB代码示例
Spearman相关系数
1 | function coeff = mySpearman(X , Y) |
皮尔逊相关系数
1 | function coeff = myPearson(X , Y) |
- Title: correlation-analysis
- Author: Charles
- Created at : 2023-09-02 13:16:47
- Updated at : 2023-09-02 13:58:57
- Link: https://charles2530.github.io/2023/09/02/correlation-analysis/
- License: This work is licensed under CC BY-NC-SA 4.0.
recommend_articles
recommend_articles
Comments