时间序列

【数据分析】两种相关

两种相关

最近遇到需要用统计学知识衡量两个变量的相关程度,于是用了scipy中的工具中Pearson相关与Spearman相关系数。

  • Pearson相关主要来衡量线性分布之间的相似性。当两个成正比例且增长速度一直时,Pearson接近于1。
  • Spearman相关主要来度量单调关系。同是单调增长时,Spearman接近1,哪怕增长速率差别很大。

    它俩的关系,下面这篇文章说的非常好:Pearson 相关方法和Spearman相关方法的比较

    Pearson和Spearman在衡量两个量没有关系上都很给力。如果绝对值接近于0,那么差不多就是没关系了。其中,Pearson在0.8-1.0,为极强相关,0.6-0.8为强相关,0.4-0.6为中等程度相关,0.2-0.4为弱相关,0-0.2为极弱相关或无关。

附上一个小Demo:

输出结果为:

Be the First to comment.

Leave a Comment

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.