စက်သင်ယူခြင်း - ဒေတာဖြန့်ဝေခြင်း။
ဒေတာဖြန့်ဝေခြင်း။
ဤကျူတိုရီရယ်တွင် အစောပိုင်းတွင် ကျွန်ုပ်တို့သည် မတူညီသော သဘောတရားများကို နားလည်စေရန်အတွက် ကျွန်ုပ်တို့၏နမူနာများရှိ ဒေတာပမာဏအနည်းငယ်ဖြင့် လုပ်ဆောင်ခဲ့ပါသည်။
လက်တွေ့ကမ္ဘာတွင်၊ ဒေတာအစုံများသည် ပိုမိုကြီးမားသော်လည်း ပရောဂျက်တစ်ခု၏အစောပိုင်းအဆင့်တွင် အစစ်အမှန်ကမ္ဘာဒေတာကို စုဆောင်းရန် ခက်ခဲနိုင်သည်။
Big Data Sets တွေကို ဘယ်လိုရနိုင်မလဲ။
စမ်းသပ်ရန်အတွက် ကြီးမားသောဒေတာအစုံများကို ဖန်တီးရန်အတွက် အရွယ်အစားမရွေး ကျပန်းဒေတာအတွဲများကို ဖန်တီးရန် နည်းလမ်းများစွာပါရှိသည့် Python module NumPy ကို အသုံးပြုပါသည်။
ဥပမာ
0 နှင့် 5 ကြားတွင် ကျပန်း float 250 ပါရှိသော array တစ်ခုကို ဖန်တီးပါ-
import numpy
x = numpy.random.uniform(0.0, 5.0, 250)
print(x)
Histogram
ဒေတာအတွဲကို မြင်ယောင်ရန် ကျွန်ုပ်တို့စုဆောင်းထားသောဒေတာဖြင့် ဟီစတိုဂရမ်တစ်ခုဆွဲနိုင်သည်။
Histogram တစ်ခုဆွဲရန် Python module Matplotlib ကိုအသုံးပြုပါမည်။
ကျွန်ုပ်တို့၏ Matplotlib ကျူတိုရီရယ် တွင် Matplotlib module အကြောင်း လေ့လာပါ ။
ဥပမာ
ဟစ်စတိုဂရမ်ဆွဲပါ
import numpy
import matplotlib.pyplot as plt
x =
numpy.random.uniform(0.0, 5.0, 250)
plt.hist(x, 5)
plt.show()
ရလဒ်:
Histogram ဖြင့် ရှင်းပြထားသည်။
ဘား 5 ခုပါသော histogram တစ်ခုဆွဲရန် အထက်နမူနာမှ array ကိုအသုံးပြုသည်။
ပထမဘားသည် 0 နှင့် 1 အကြားရှိ array တွင်တန်ဖိုးမည်မျှရှိသည်ကိုကိုယ်စားပြုသည်။
ဒုတိယဘားသည် 1 နှင့် 2 အကြား တန်ဖိုးမည်မျှရှိသည်ကို ကိုယ်စားပြုသည်။
စသည်တို့
ကျွန်ုပ်တို့အား ဤရလဒ်ကိုပေးသည်-
- 52 တန်ဖိုးများသည် 0 နှင့် 1 ကြားဖြစ်သည်။
- 48 တန်ဖိုးများသည် 1 နှင့် 2 ကြားဖြစ်သည်။
- 49 တန်ဖိုးများသည် 2 နှင့် 3 ကြားဖြစ်သည်။
- 51 တန်ဖိုးများသည် 3 နှင့် 4 ကြားဖြစ်သည်။
- 50 တန်ဖိုးများသည် 4 နှင့် 5 ကြားဖြစ်သည်။
မှတ်ချက်- Array တန်ဖိုးများသည် ကျပန်းနံပါတ်များဖြစ်ပြီး သင့်ကွန်ပျူတာပေါ်တွင် တူညီသောရလဒ်ကို ပြသမည်မဟုတ်ပါ။
ဒေတာဖြန့်ဝေမှုများ
တန်ဖိုး 250 ပါရှိသော array တစ်ခုသည် အလွန်ကြီးသည်ဟု မယူဆသော်လည်း ယခုတွင် သင်သည် ကျပန်းတန်ဖိုးများကို မည်သို့ဖန်တီးရမည်ကို သိပြီး ကန့်သတ်ဘောင်များကို ပြောင်းလဲခြင်းဖြင့် သင်သည် ဒေတာအစုံကို လိုချင်သလောက် ကြီးအောင် ဖန်တီးနိုင်သည်။
ဥပမာ
ကျပန်းနံပါတ်များ 100000 ဖြင့် array တစ်ခုဖန်တီးပြီး 100 bars ရှိသော histogram ကိုအသုံးပြု၍ ၎င်းတို့ကိုပြသပါ-
import numpy
import matplotlib.pyplot as plt
x =
numpy.random.uniform(0.0, 5.0, 100000)
plt.hist(x, 100)
plt.show()