R语言相关性分析简单小例子开发者社区

R语言相关性分析简单小例子

csvpath<-file.choose()
csvpath
df<-read.csv(csvpath,header=T,row.names = 1)

> cor(df)
              fruit_weight soluble_sugar organic_acid anthocyanin
fruit_weight    1.00000000    0.06342157   -0.2647533   0.1038605
soluble_sugar   0.06342157    1.00000000    0.2580373  -0.2590438
organic_acid   -0.26475334    0.25803726    1.0000000  -0.2241183
anthocyanin     0.10386047   -0.25904381   -0.2241183   1.0000000

> cor(df,method = 'sperman')
Error in match.arg(method) :
  'arg' should be one of “pearson”, “kendall”, “spearman”
> cor(df,method = 'spearman')
              fruit_weight soluble_sugar organic_acid anthocyanin
fruit_weight     1.0000000     0.1357143   -0.1714286   0.1892857
soluble_sugar    0.1357143     1.0000000    0.2821429  -0.2000000
organic_acid    -0.1714286     0.2821429    1.0000000  -0.2142857
anthocyanin      0.1892857    -0.2000000   -0.2142857   1.0000000

library(Hmisc)
res2<-rcorr(as.matrix(df))

> res2$r
              fruit_weight soluble_sugar organic_acid anthocyanin
fruit_weight    1.00000000    0.06342157   -0.2647533   0.1038605
soluble_sugar   0.06342157    1.00000000    0.2580373  -0.2590438
organic_acid   -0.26475334    0.25803726    1.0000000  -0.2241183
anthocyanin     0.10386047   -0.25904381   -0.2241183   1.0000000
> res2$n
              fruit_weight soluble_sugar organic_acid anthocyanin
fruit_weight            15            15           15          15
soluble_sugar           15            15           15          15
organic_acid            15            15           15          15
anthocyanin             15            15           15          15
> res2$P
              fruit_weight soluble_sugar organic_acid anthocyanin
fruit_weight            NA     0.8223325    0.3402882   0.7126110
soluble_sugar    0.8223325            NA    0.3531301   0.3511885
organic_acid     0.3402882     0.3531301           NA   0.4219767
anthocyanin      0.7126110     0.3511885    0.4219767          NA

flattenCorrMatrix <- function(cormat, pmat) {
  ut <- upper.tri(cormat)
  data.frame(
    row = rownames(cormat)[row(cormat)[ut]],
    column = rownames(cormat)[col(cormat)[ut]],
    cor  =(cormat)[ut],
    p = pmat[ut]

> flattenCorrMatrix(res2$r,res2$P)
            row        column         cor         p
1  fruit_weight soluble_sugar  0.06342157 0.8223325
2  fruit_weight  organic_acid -0.26475334 0.3402882
3 soluble_sugar  organic_acid  0.25803726 0.3531301
4  fruit_weight   anthocyanin  0.10386047 0.7126110
5 soluble_sugar   anthocyanin -0.25904381 0.3511885
6  organic_acid   anthocyanin -0.22411828 0.4219767

> df1<-flattenCorrMatrix(res2$r,res2$P)
> abs(df1$cor)>0.25
[1] FALSE  TRUE  TRUE FALSE  TRUE FALSE
> df1[abs(df1$cor)>0.25,]
            row       column        cor         p
2  fruit_weight organic_acid -0.2647533 0.3402882
3 soluble_sugar organic_acid  0.2580373 0.3531301
5 soluble_sugar  anthocyanin -0.2590438 0.3511885

library(corrplot)
corrplot(res2$r,type="upper",tl.col ="black",tl.srt = 45)

install.packages("PerformanceAnalytics")

R语言相关性分析简单小例子

R语言相关性分析简单小例子

原文链接

相关性分析的应用场景

读入数据