Pandas - ဒေတာဆက်စပ်မှုများ


ဆက်ဆံရေးကိုရှာဖွေခြင်း။

Pandas module ၏ ကြီးမားသော ရှုထောင့်မှာ corr()နည်းလမ်းဖြစ်သည်။

နည်းလမ်း သည် corr()သင့်ဒေတာအတွဲရှိ ကော်လံတစ်ခုစီကြား ဆက်စပ်မှုကို တွက်ချက်ပေးသည်။

ဤစာမျက်နှာရှိ နမူနာများသည် 'data.csv' ဟုခေါ်သော CSV ဖိုင်ကို အသုံးပြုသည်။

data.csv ကို ဒေါင်းလုဒ်လုပ် ပါ။ သို့မဟုတ် data.csv ကိုဖွင့်ပါ။

ဥပမာ

ကော်လံများအကြား ဆက်စပ်မှုကို ပြပါ-

df.corr()

ရလဒ်

            Duration     Pulse  Maxpulse  Calories
  Duration  1.000000 -0.155408  0.009403  0.922721
  Pulse    -0.155408  1.000000  0.786535  0.025120
  Maxpulse  0.009403  0.786535  1.000000  0.203814
  Calories  0.922721  0.025120  0.203814  1.000000

မှတ်ချက်- နည်းလမ်း corr()သည် "ဂဏန်းမဟုတ်" ကော်လံများကို လျစ်လျူရှုသည်။

ရလဒ်ရှင်းပြသည်။

နည်းလမ်း ၏ရလဒ်သည် corr()ကော်လံနှစ်ခုကြားရှိ မည်မျှကောင်းမွန်ကြောင်းကို ကိုယ်စားပြုသည့် နံပါတ်များစွာပါသော ဇယားတစ်ခုဖြစ်သည်။

နံပါတ် -1 မှ 1 ကွဲပြားသည်။

1 သည် 1 မှ 1 ဆက်ဆံရေး (ပြီးပြည့်စုံသောဆက်စပ်ဆက်နွယ်မှု) ရှိကြောင်းကို ဆိုလိုပြီး ဤဒေတာအတွဲအတွက်၊ ပထမကော်လံတွင် တန်ဖိုးတစ်ခုတက်လာတိုင်း အခြားတစ်ခုလည်းတက်သွားသည်။

0.9 သည် ကောင်းမွန်သော ဆက်ဆံရေးတစ်ခုဖြစ်ပြီး တန်ဖိုးတစ်ခုတိုးပါက အခြားတစ်ခုလည်း တိုးလာမည်ဖြစ်သည်။

-0.9 သည် 0.9 ကဲ့သို့ ကောင်းမွန်သော ဆက်ဆံရေးဖြစ်နိုင်သော်လည်း တန်ဖိုးတစ်ခုတိုးပါက အခြားတစ်ခုသည် ကျသွားမည်ဖြစ်သည်။

0.2 ဆိုသည်မှာ ကောင်းမွန်သောဆက်ဆံရေးမဟုတ်ဟု ဆိုလိုသည်မှာ တန်ဖိုးတစ်ခုတက်သွားပါက အခြားတစ်ခုက ပေးမည်ဟု မဆိုလိုပါ။

ကောင်းသောဆက်စပ်မှုဆိုသည်မှာ အဘယ်နည်း။ အသုံးပြုမှုအပေါ်တွင်မူတည်သော်လည်း ၎င်းကို ကောင်းမွန်သောဆက်စပ်ဆက်စပ်မှုဟု ခေါ်ရန် သင့် တွင် အနည်းဆုံး 0.6(သို့မဟုတ် ) ရှိရန် လိုအပ်သည်ဟု ဆိုရန် စိတ်ချရသည်ဟု ကျွန်တော်ထင်ပါတယ်။-0.6

ပြီးပြည့်စုံသော ဆက်နွယ်မှု-

"ကြာချိန်" နှင့် "ကြာချိန်" သည် နံပါတ်များရရှိထားသည်ကို ကျွန်ုပ်တို့တွေ့မြင်နိုင်သည် 1.000000၊ ဆိုလိုသည်မှာ ကော်လံတစ်ခုစီသည် သူ့အလိုလိုနှင့် ပြီးပြည့်စုံသောဆက်ဆံရေးတစ်ခု အမြဲရှိနေပါသည်။

ဆက်စပ်မှုကောင်း

"ကြာချိန်" နှင့် "ကယ်လိုရီများ" သည် 0.922721အလွန်ကောင်းသောဆက်စပ်မှုဖြစ်သည့် ဆက်နွယ်မှုတစ်ခုရရှိထားပြီး၊ သင်အချိန်ကြာကြာအလုပ်လုပ်လေ၊ ကယ်လိုရီလောင်ကျွမ်းလေလေ၊ နှင့် အခြားနည်းအားဖြင့်- သင် ကယ်လိုရီများစွာလောင်ကျွမ်းသွားပါက၊ အချိန်အတော်ကြာ အလုပ်ထွက်ဖြစ်နိုင်သည် ။

မကောင်းတဲ့ဆက်စပ်မှု

"ကြာချိန်" နှင့် "Maxpulse" တို့သည် 0.009403အလွန်ဆိုးရွားသောဆက်စပ်ဆက်နွယ်မှုတစ်ခုဖြစ်သည်၊ ဆိုလိုသည်မှာ အလုပ်ထွက်သည့်ကြာချိန်ကိုကြည့်ရုံဖြင့် max pulse ကိုခန့်မှန်း၍မရပါ။


လေ့ကျင့်ခန်းများဖြင့် သင့်ကိုယ်သင် စမ်းသပ်ပါ။

လေ့ကျင့်ခန်း

DataFrame ရှိ ကော်လံများကြား ဆက်စပ်မှုများကို ရှာဖွေရန်အတွက် မှန်ကန်သော syntax တစ်ခုကို ထည့်သွင်းပါ။

df.()


w3schools CERTIFIED . 2021

လက်မှတ်ရယူပါ။

Pandas modules များကိုဖြည့်ပါ၊ လေ့ကျင့်ခန်းများလုပ်ပါ၊ စာမေးပွဲဖြေဆိုပါ၊ ထို့နောက်သင်သည် w3schools certified ဖြစ်လာလိမ့်မည်။

$10 စာရင်းသွင်းပါ။