ဒေတာသိပ္ပံ - Statistics Correlation vs. Causality


ဆက်စပ်မှုသည် အကြောင်းရင်းခံကို မရည်ညွှန်းပါ။

Correlation သည် ကိန်းရှင်နှစ်ခုကြားရှိ ကိန်းဂဏာန်းဆက်နွယ်မှုကို တိုင်းတာသည်။

မြင့်မားသော ဆက်နွယ်မှုကိန်းဂဏန်း (1 နှင့် နီးစပ်သည်) သည် ကိန်းရှင်နှစ်ခုကြားရှိ အမှန်တကယ်ဆက်စပ်မှုကို ကျွန်ုပ်တို့ အသေအချာ ကောက်ချက်ချနိုင်သည်ဟု မဆိုလိုပါ။

ဂန္တဝင်ဥပမာတစ်ခု-

  • နွေရာသီတွင် ကမ်းခြေတွင် ရေခဲမုန့်ရောင်းချမှု တိုးလာသည်။
  • တစ်ချိန်တည်းမှာပင် ရေနစ်သေဆုံးမှုများလည်း တိုးလာပါသည်။

ရေခဲမုန့်ရောင်းချမှု တိုးလာခြင်းသည် ရေနစ်သေဆုံးမှု တိုးလာရခြင်း၏ တိုက်ရိုက်အကြောင်းအရင်းဖြစ်သည်ဟု ဆိုလိုပါသလား။


Python ရှိ ကမ်းခြေနမူနာ

ဤတွင်၊ သင်ကြိုးစားရန် စိတ်ကူးယဉ်ဒေတာအစုံကို ကျွန်ုပ်တို့ တည်ဆောက်ထားပါသည်။

ဥပမာ

import pandas as pd
import matplotlib.pyplot as plt

Drowning_Accident = [20,40,60,80,100,120,140,160,180,200]
Ice_Cream_Sale = [20,40,60,80,100,120,140,160,180,200]
Drowning = {"Drowning_Accident": [20,40,60,80,100,120,140,160,180,200],
"Ice_Cream_Sale": [20,40,60,80,100,120,140,160,180,200]}
Drowning = pd.DataFrame(data=Drowning)

Drowning.plot(x="Ice_Cream_Sale", y="Drowning_Accident", kind="scatter")
plt.show()

correlation_beach = Drowning.corr()
print(correlation_beach)

အထွက်-

ဆက်စပ်မှုနှင့် အကြောင်းရင်းခံ

Correlation vs Causality - The Beach Example

တစ်နည်းဆိုရသော် ရေနစ်သေဆုံးမှုများအား ကြိုတင်ခန့်မှန်းရန် ရေခဲမုန့်ရောင်းချခြင်းကို ကျွန်ုပ်တို့အသုံးပြုနိုင်ပါသလား။

အဖြေက - ဖြစ်နိုင်တယ်။

ဤကိန်းရှင်နှစ်ခုသည် တစ်ခုနှင့်တစ်ခု မတော်တဆဆက်စပ်နေခြင်းကြောင့် ဖြစ်နိုင်သည်။

ဒါဆို ရေနစ်ရခြင်းကဘာတွေလဲ။

  • မကျွမ်းကျင်သော ရေကူးသမားများ
  • လှိုင်း
  • ကြွက်တက်ခြင်း။
  • အဖမ်းအဆီးမမှန်ခြင်း။
  • ကြီးကြပ်မှုကင်းမဲ့ခြင်း။
  • အရက်(အလွဲသုံး)
  • စသည်တို့

အငြင်းအခုံကို ပြောင်းပြန်လှန်ကြပါစို့။

ဆက်စပ်ဆက်နွယ်မှုကိန်းဂဏန်း (သုညနှင့်နီးစပ်) သည် x ပြောင်းလဲမှုသည် y ကိုမထိခိုက်စေဟု ဆိုလိုပါသလား။

မေးခွန်းသို့ ပြန်သွားရန်။

  • Average_Pulse သည် Calorie_Burnage ကို သက်ရောက်မှုမရှိဟု ကျွန်ုပ်တို့ ကောက်ချက်ချနိုင်ပါမည်လား။

အဖြေက မဟုတ်ဘူး ။

ဆက်စပ်မှုနှင့် အကြောင်းရင်းခံတို့အကြား အရေးကြီးသော ခြားနားချက်တစ်ခုရှိသည်။

  • Correlation သည် အချက်အလက် မည်မျှ နီးကပ်စွာ ဆက်စပ်နေသည်ကို တိုင်းတာသည့် ကိန်းဂဏန်းတစ်ခု ဖြစ်သည်။
  • အကြောင်းရင်းသည် x သည် y ကိုဖြစ်စေသော နိဂုံးဖြစ်သည်။

ထို့ကြောင့် ကျွန်ုပ်တို့သည် ကြိုတင်ခန့်မှန်းမှုများပြုလုပ်သောအခါ အကြောင်းရင်း၏သဘောတရားကို ပြင်းပြင်းထန်ထန်ထင်ဟပ်ရန် အရေးကြီးပါသည်။