ဒေတာသိပ္ပံ - Statistics Correlation Matrix
ဆက်စပ်မက်ထရစ်
မက်ထရစ်ဆိုသည်မှာ အတန်းများနှင့် ကော်လံများတွင် စီထားသော ကိန်းဂဏန်းများ၏ အခင်းအကျင်းတစ်ခုဖြစ်သည်။
Correlation matrix သည် variable များကြားရှိ ဆက်စပ်ကိန်းများကို ပြသသော ဇယားတစ်ခုဖြစ်သည်။
ဤတွင်၊ ကိန်းရှင်များကို ပထမအတန်းနှင့် ပထမကော်လံတွင် ကိုယ်စားပြုသည်-
အထက်ဖော်ပြပါဇယားတွင် ကျန်းမာရေးဒေတာအစုံအလင်မှ ဒေတာကို အသုံးပြုထားသည်။
လေ့လာတွေ့ရှိချက်များ-
- ကြာချိန်နှင့် Calorie_Burnage သည် ဆက်စပ်ကိန်း 0.89 ဖြင့် အနီးကပ်ဆက်စပ်နေကြောင်း ကျွန်ုပ်တို့သတိပြုမိပါသည်။ ကျွန်ုပ်တို့ လေ့ကျင့်ချိန်ကြာလာသည်နှင့်အမျှ ကယ်လိုရီများ ပိုမိုလောင်ကျွမ်းလေဖြစ်သည်။
- Average_Pulse နှင့် Calorie_Burnage (correlation coefficient of 0.02) အကြား မျဉ်းသားသော ဆက်ဆံရေး မရှိသလောက်ကို ကျွန်ုပ်တို့ တွေ့ရှိရပါသည်။
- Average_Pulse သည် Calorie_Burnage ကို မထိခိုက်စေကြောင်း ကျွန်ုပ်တို့ ကောက်ချက်ချနိုင်မလား။ နံပါတ်၊ ဤမေးခွန်းကို နောက်မှဖြေကြားရန် ကျွန်ုပ်တို့ ပြန်လာပါမည်။
Python ရှိ Correlation Matrix
corr()
ဆက်စပ်မက်ထရစ်တစ်ခုကို ဖန်တီးရန် Python တွင် လုပ်ဆောင်ချက်ကို ကျွန်ုပ်တို့ အသုံးပြုနိုင်သည် ။ round()
အထွက်ကို ဒဿမနှစ်ခုသို့ ပတ်ရန် လုပ်ဆောင်ချက် ကိုလည်း ကျွန်ုပ်တို့အသုံးပြုသည် -
ဥပမာ
Corr_Matrix = round(full_health_data.corr(),2)
print(Corr_Matrix)
အထွက်-
အပူမြေပုံကိုအသုံးပြုခြင်း။
ကိန်းရှင်များကြား ဆက်စပ်မှုကို မြင်ယောင်ရန် Heatmap ကို သုံးနိုင်သည်။
ဆက်စပ်ကိန်းက 1 နှင့် ပိုနီးစပ်လေ၊ လေးထောင့်များ ပိုမိုစိမ်းလန်းလေဖြစ်သည်။
ဆက်စပ်ကိန်းက -1 နှင့် ပိုနီးစပ်လေ၊ လေးထောင့်များ ပိုညိုလာလေဖြစ်သည်။
အပူမြေပုံဖန်တီးရန် Seaborn ကိုသုံးပါ။
ဆက်နွယ်မှုအပူမြေပုံတစ်ခုဖန်တီးရန် Seaborn စာကြည့်တိုက်ကို ကျွန်ုပ်တို့အသုံးပြုနိုင်သည် (Seaborn သည် matplotlib ကိုအခြေခံ၍ ပုံရိပ်ယောင်စာကြည့်တိုက်တစ်ခုဖြစ်သည်)
ဥပမာ
import matplotlib.pyplot as plt
import seaborn as sns
correlation_full_health =
full_health_data.corr()
axis_corr = sns.heatmap(
correlation_full_health,
vmin=-1, vmax=1, center=0,
cmap=sns.diverging_palette(50,
500, n=500),
square=True
)
plt.show()
ဥပမာ ရှင်းပြထားသည်-
- sns အဖြစ် ပင်လယ်မွေးစာကြည့်တိုက်ကို တင်သွင်းပါ။
- full_health_data set ကို သုံးပါ။
- ဆက်စပ်မက်ထရစ်ကို မြင်သာစေရန် အပူမြေပုံတစ်ခုလိုချင်ကြောင်း Python အားပြောပြရန် sns.heatmap() ကိုသုံးပါ။
- ဆက်စပ်မက်ထရစ်ကိုသုံးပါ။ အပူမြေပုံ၏ အမြင့်ဆုံးနှင့် အနည်းဆုံးတန်ဖိုးများကို သတ်မှတ်ပါ။ 0 သည် အလယ်ဗဟိုဟု သတ်မှတ်သည်။
- အရောင်များကို sns.diverging_palette ဖြင့် သတ်မှတ်ပါ။ n=500 ဆိုသည်မှာ တူညီသောအရောင် palette တွင် အရောင်အမျိုးအစား 500 လိုချင်ပါသည်။
- square = မှန်သော အဓိပ္ပါယ်မှာ လေးထောင့်ကို မြင်လိုသည်။