ကျပန်းဒေတာဖြန့်ဝေခြင်း။
Data Distribution ဆိုတာဘာလဲ။
Data Distribution သည် ဖြစ်နိုင်ချေတန်ဖိုးများအားလုံး၏ စာရင်းတစ်ခုဖြစ်ပြီး တန်ဖိုးတစ်ခုစီတွင် မည်မျှဖြစ်ပွားလေ့ရှိသည် ။
စာရင်းအင်းများ နှင့် ဒေတာသိပ္ပံတို့ ဖြင့် လုပ်ဆောင်သောအခါတွင် အဆိုပါစာရင်းများသည် အရေးကြီးပါသည်။
ကျပန်း module သည် ကျပန်းထုတ်လုပ်ထားသော ဒေတာဖြန့်ဝေမှုများကို ပြန်ပေးသည့်နည်းလမ်းများကို ပေးဆောင်သည်။
ကျပန်းဖြန့်ဝေခြင်း။
ကျပန်းဖြန့်ဖြူးမှုဆိုသည်မှာ အချို့သော ဖြစ်နိုင်ခြေသိပ်သည်းဆလုပ်ဆောင်မှု နောက်ဆက်တွဲဖြစ်သော ကျပန်းနံပါတ်များအစုအဝေးတစ်ခုဖြစ်သည် ။
Probability Density Function- ဆက်တိုက်ဖြစ်နိုင်ခြေကို ဖော်ပြသည့် လုပ်ဆောင်ချက်တစ်ခု။ ဆိုလိုသည်မှာ array တစ်ခုရှိ တန်ဖိုးများအားလုံး၏ ဖြစ်နိုင်ခြေ။
module ၏ choice()
နည်းလမ်းကို
အသုံးပြု၍ သတ်မှတ်ထားသောဖြစ်နိုင်ခြေများပေါ်အခြေခံ၍ ကျပန်းနံပါတ်များကိုထုတ်ပေးနိုင်သည်
။random
နည်းလမ်း သည် choice()
တန်ဖိုးတစ်ခုစီအတွက် ဖြစ်နိုင်ခြေကို သတ်မှတ်နိုင်စေပါသည်။
ဖြစ်နိုင်ခြေကို 0 နှင့် 1 အကြား ကိန်းတစ်ခုဖြင့် သတ်မှတ်သည်၊ 0 ဆိုသည်မှာ တန်ဖိုးသည် မည်သည့်အခါမျှ ဖြစ်ပေါ်မည်မဟုတ်ကြောင်းနှင့် 1 သည် တန်ဖိုးအမြဲဖြစ်ပေါ်မည်ဟု ဆိုလိုသည်။
ဥပမာ
တန်ဖိုးတစ်ခုစီသည် 3၊ 5၊ 7 သို့မဟုတ် 9 ဖြစ်ရမည့် တန်ဖိုး 100 ပါရှိသော 1-D အခင်းအကျင်းကို ဖန်တီးပါ။
တန်ဖိုး 3 ဖြစ်ရန် ဖြစ်နိုင်ခြေကို 0.1 ဟု သတ်မှတ်ထားသည်။
တန်ဖိုး 5 ဖြစ်ရန် ဖြစ်နိုင်ခြေကို 0.3 ဟု သတ်မှတ်ထားသည်။
တန်ဖိုး 7 ဖြစ်ရန် ဖြစ်နိုင်ခြေကို 0.6 ဟု သတ်မှတ်ထားသည်။
တန်ဖိုး 9 ဖြစ်ရန် ဖြစ်နိုင်ခြေကို 0 ဟု သတ်မှတ်ထားသည်။
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(100))
print(x)
ဖြစ်နိုင်ခြေနံပါတ်အားလုံး၏ပေါင်းလဒ်သည် 1 ဖြစ်သင့်သည်။
ဥပမာကို အကြိမ် 100 အထက် run ရင်တောင် value 9 က ဘယ်တော့မှ ဖြစ်မလာပါဘူး။
ကန့်သတ်ဘောင်အတွင်း ပုံသဏ္ဍာန်ကို သတ်မှတ်ခြင်းဖြင့် မည်သည့် ပုံသဏ္ဍာန်နှင့် အရွယ်အစား၏ array များကိုမဆို ပြန်ပေး
size
နိုင်ပါသည်။
ဥပမာ
အထက်ဖော်ပြပါနမူနာအတိုင်း တူသော်လည်း တစ်ခုစီတွင် တန်ဖိုး 5 ခုပါရှိသော အတန်း 3 ခုပါသော 2-D အခင်းအကျင်းကို ပြန်ပေးပါ။
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(3, 5))
print(x)