ဒေတာသိပ္ပံ - Statistics Correlation Matrix


ဆက်စပ်မက်ထရစ်

မက်ထရစ်ဆိုသည်မှာ အတန်းများနှင့် ကော်လံများတွင် စီထားသော ကိန်းဂဏန်းများ၏ အခင်းအကျင်းတစ်ခုဖြစ်သည်။

Correlation matrix သည် variable များကြားရှိ ဆက်စပ်ကိန်းများကို ပြသသော ဇယားတစ်ခုဖြစ်သည်။

ဤတွင်၊ ကိန်းရှင်များကို ပထမအတန်းနှင့် ပထမကော်လံတွင် ကိုယ်စားပြုသည်-

ဆက်စပ်မက်ထရစ်

အထက်ဖော်ပြပါဇယားတွင် ကျန်းမာရေးဒေတာအစုံအလင်မှ ဒေတာကို အသုံးပြုထားသည်။

လေ့လာတွေ့ရှိချက်များ-

  • ကြာချိန်နှင့် Calorie_Burnage သည် ဆက်စပ်ကိန်း 0.89 ဖြင့် အနီးကပ်ဆက်စပ်နေကြောင်း ကျွန်ုပ်တို့သတိပြုမိပါသည်။ ကျွန်ုပ်တို့ လေ့ကျင့်ချိန်ကြာလာသည်နှင့်အမျှ ကယ်လိုရီများ ပိုမိုလောင်ကျွမ်းလေဖြစ်သည်။
  • Average_Pulse နှင့် Calorie_Burnage (correlation coefficient of 0.02) အကြား မျဉ်းသားသော ဆက်ဆံရေး မရှိသလောက်ကို ကျွန်ုပ်တို့ တွေ့ရှိရပါသည်။
  • Average_Pulse သည် Calorie_Burnage ကို မထိခိုက်စေကြောင်း ကျွန်ုပ်တို့ ကောက်ချက်ချနိုင်မလား။ နံပါတ်၊ ဤမေးခွန်းကို နောက်မှဖြေကြားရန် ကျွန်ုပ်တို့ ပြန်လာပါမည်။

Python ရှိ Correlation Matrix

corr()ဆက်စပ်မက်ထရစ်တစ်ခုကို ဖန်တီးရန် Python တွင် လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည် ။ round()အထွက်ကို ဒဿမနှစ်ခုသို့ ပတ်ရန် လုပ်ဆောင်ချက် ကိုလည်း ကျွန်ုပ်တို့အသုံးပြုသည် -

ဥပမာ

Corr_Matrix = round(full_health_data.corr(),2)
print(Corr_Matrix)

အထွက်-

ဆက်စပ်မက်ထရစ်

အပူမြေပုံကိုအသုံးပြုခြင်း။

ကိန်းရှင်များကြား ဆက်စပ်မှုကို မြင်ယောင်ရန် Heatmap ကို သုံးနိုင်သည်။

ဆက်စပ်မှု အပူမြေပုံ

ဆက်စပ်ကိန်းက 1 နှင့် ပိုနီးစပ်လေ၊ လေးထောင့်များ ပိုမိုစိမ်းလန်းလေဖြစ်သည်။

ဆက်စပ်ကိန်းက -1 နှင့် ပိုနီးစပ်လေ၊ လေးထောင့်များ ပိုညိုလာလေဖြစ်သည်။


အပူမြေပုံဖန်တီးရန် Seaborn ကိုသုံးပါ။

ဆက်နွယ်မှုအပူမြေပုံတစ်ခုဖန်တီးရန် Seaborn စာကြည့်တိုက်ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည် (Seaborn သည် matplotlib ကိုအခြေခံ၍ ပုံရိပ်ယောင်စာကြည့်တိုက်တစ်ခုဖြစ်သည်)

ဥပမာ

import matplotlib.pyplot as plt
import seaborn as sns

correlation_full_health = full_health_data.corr()

axis_corr = sns.heatmap(
correlation_full_health,
vmin=-1, vmax=1, center=0,
cmap=sns.diverging_palette(50, 500, n=500),
square=True
)

plt.show()

ဥပမာ ရှင်းပြထားသည်-

  • sns အဖြစ် ပင်လယ်မွေးစာကြည့်တိုက်ကို တင်သွင်းပါ။
  • full_health_data set ကို သုံးပါ။
  • ဆက်စပ်မက်ထရစ်ကို မြင်သာစေရန် အပူမြေပုံတစ်ခုလိုချင်ကြောင်း Python အားပြောပြရန် sns.heatmap() ကိုသုံးပါ။
  • ဆက်စပ်မက်ထရစ်ကိုသုံးပါ။ အပူမြေပုံ၏ အမြင့်ဆုံးနှင့် အနည်းဆုံးတန်ဖိုးများကို သတ်မှတ်ပါ။ 0 သည် အလယ်ဗဟိုဟု သတ်မှတ်သည်။
  • အရောင်များကို sns.diverging_palette ဖြင့် သတ်မှတ်ပါ။ n=500 ဆိုသည်မှာ တူညီသောအရောင် palette တွင် အရောင်အမျိုးအစား 500 လိုချင်ပါသည်။
  • square = မှန်သော အဓိပ္ပါယ်မှာ လေးထောင့်ကို မြင်လိုသည်။