စက်သင်ယူခြင်း။
Machine Learning သည် ဒေတာနှင့် စာရင်းဇယားများကို လေ့လာခြင်းမှ ကွန်ပျူတာကို သင်ယူစေသည်။
Machine Learning သည် Artificial Intelligence (AI) ၏ ဦးတည်ရာသို့ ခြေလှမ်းတစ်ခုဖြစ်သည်။
Machine Learning သည် အချက်အလက်များကို ပိုင်းခြားစိတ်ဖြာပြီး ရလဒ်ကို ခန့်မှန်းရန် သင်ယူသည့် ပရိုဂရမ်တစ်ခုဖြစ်သည်။
ဘယ်မှာ စတင်ရမလဲ။
ဤသင်ခန်းစာတွင် ကျွန်ုပ်တို့သည် သင်္ချာနှင့် ကိန်းဂဏန်းများကို လေ့လာကာ ဒေတာအတွဲများကို အခြေခံ၍ အရေးကြီးသောနံပါတ်များကို တွက်ချက်နည်းကို ပြန်သွားပါမည်။
ကျွန်ုပ်တို့လိုအပ်သောအဖြေများရရှိရန် အမျိုးမျိုးသော Python module များကိုအသုံးပြုနည်းကိုလည်း လေ့လာပါမည်။
ပြီးတော့ ကျွန်တော်တို့လေ့လာခဲ့ပြီးတဲ့အပေါ် မူတည်ပြီး ရလဒ်ကို ကြိုတင်မှန်းဆနိုင်တဲ့ function တွေလုပ်နည်းကို လေ့လာသွားမှာပါ။
ဒေတာသတ်မှတ်
ကွန်ပြူတာတစ်လုံး၏စိတ်တွင် ဒေတာအစုသည် မည်သည့်ဒေတာစုဆောင်းမှုမဆိုဖြစ်သည်။ array တစ်ခုမှ ပြီးပြည့်စုံသော ဒေတာဘေ့စ်တစ်ခုအထိ မည်သည့်အရာမဆို ဖြစ်နိုင်သည်။
array တစ်ခု၏ ဥပမာ-
[99,86,87,88,111,86,103,87,94,78,77,85,86]
ဒေတာဘေ့စ်တစ်ခု၏ ဥပမာ-
အမည်ပြောင် | အရောင် | အသက် | အရှိန် | AutoPass |
ဘီအမ်ဒဗလျူ | အနီေရာင် | ၅ | ၉၉ | Y |
Volvo | အနက်ရောင် | ၇ | ၈၆ | Y |
VW | မီးခိုးရောင် | ၈ | ၈၇ | ဎ |
VW | အဖြူ | ၇ | ၈၈ | Y |
ဖို့ဒ် | အဖြူ | ၂ | ၁၁၁ | Y |
VW | အဖြူ | ၁၇ | ၈၆ | Y |
တက်စလာ | အနီေရာင် | ၂ | ၁၀၃ | Y |
ဘီအမ်ဒဗလျူ | အနက်ရောင် | ၉ | ၈၇ | Y |
Volvo | မီးခိုးရောင် | ၄ | ၉၄ | ဎ |
ဖို့ဒ် | အဖြူ | ၁၁ | ၇၈ | ဎ |
တိုယိုတာ | မီးခိုးရောင် | ၁၂ | ၇၇ | ဎ |
VW | အဖြူ | ၉ | ၈၅ | ဎ |
တိုယိုတာ | အပြာ | ၆ | ၈၆ | Y |
array ကိုကြည့်ခြင်းဖြင့်၊ ပျမ်းမျှတန်ဖိုးသည် 80 သို့မဟုတ် 90 ဝန်းကျင်ဖြစ်နိုင်သည်ဟု ခန့်မှန်းနိုင်ပြီး အမြင့်ဆုံးတန်ဖိုးနှင့် အနိမ့်ဆုံးတန်ဖိုးကိုလည်း ဆုံးဖြတ်နိုင်သည်၊ သို့သော် ကျွန်ုပ်တို့ ဘာလုပ်နိုင်မည်နည်း။
ဒေတာဘေ့စ်ကိုကြည့်ခြင်းအားဖြင့် လူကြိုက်အများဆုံးအရောင်မှာ အဖြူရောင်ဖြစ်ပြီး အသက်အကြီးဆုံးကားသည် 17 နှစ်ဖြစ်သည်ကို သိနိုင်သော်လည်း ကားတစ်စီးတွင် AutoPass ရှိ၊ မရှိကို အခြားတန်ဖိုးများကိုကြည့်ရုံဖြင့် ခန့်မှန်းနိုင်လျှင်ကော။
အဲဒါက Machine Learning အတွက်ပါ။ ဒေတာကို ခွဲခြမ်းစိတ်ဖြာပြီး ရလဒ်ကို ခန့်မှန်းခြင်း။
Machine Learning တွင် အလွန်ကြီးမားသော ဒေတာအတွဲများဖြင့် အလုပ်လုပ်လေ့ရှိသည်။ ဤသင်ခန်းစာတွင် စက်သင်ယူခြင်း၏ ကွဲပြားခြားနားသော သဘောတရားများကို နားလည်ရန် တတ်နိုင်သမျှ လွယ်ကူအောင် ကြိုးစားမည်ဖြစ်ပြီး နားလည်ရလွယ်ကူသော ဒေတာအတွဲများဖြင့် လုပ်ဆောင်ပါမည်။
ဒေတာအမျိုးအစားများ
ဒေတာခွဲခြမ်းစိတ်ဖြာရန်၊ ကျွန်ုပ်တို့နှင့် ဆက်ဆံနေသည့် ဒေတာအမျိုးအစားကို သိရန် အရေးကြီးသည်။
ကျွန်ုပ်တို့သည် ဒေတာအမျိုးအစားများကို အဓိကအမျိုးအစားသုံးမျိုးခွဲ၍ လုပ်ဆောင်နိုင်သည်-
- ဂဏန်း
- အမျိုးအစားအလိုက်
- သာမာန်
ကိန်းဂဏာန်းဒေတာများသည် နံပါတ်များဖြစ်ပြီး ဂဏန်း အမျိုးအစား နှစ်မျိုးအဖြစ် ခွဲနိုင်သည်။
- Discrete Data
- ကိန်းပြည့်များအတွက် ကန့်သတ်ထားသော နံပါတ်များ။ ဥပမာ- ဖြတ်သန်းသွားတဲ့ ကားအရေအတွက်။ - Continuous Data
- အဆုံးမရှိတန်ဖိုးရှိသော ဂဏန်းများ။ ဥပမာ- ပစ္စည်းတစ်ခု၏စျေးနှုန်း၊ သို့မဟုတ် ပစ္စည်းတစ်ခု၏အရွယ်အစား
အမျိုးအစားအလိုက် အချက်အလက်များသည် တစ်ခုနှင့်တစ်ခု တိုင်းတာ၍မရနိုင်သော တန်ဖိုးများဖြစ်သည်။ ဥပမာ- အရောင်တန်ဖိုး၊ သို့မဟုတ် ဟုတ်/မဟုတ် တန်ဖိုးများ။
ပုံမှန် ဒေတာများသည် အမျိုးအစားအလိုက် ဒေတာနှင့်တူသော်လည်း တစ်ခုနှင့်တစ်ခု တိုင်းတာနိုင်သည်။ ဥပမာ- A က B ထက် ပိုကောင်းတဲ့ ကျောင်းအဆင့်တွေ စသဖြင့်ပေါ့။
သင့်ဒေတာရင်းမြစ်၏ ဒေတာအမျိုးအစားကို သိခြင်းဖြင့် ၎င်းတို့ကို ခွဲခြမ်းစိတ်ဖြာသောအခါတွင် မည်သည့်နည်းပညာကို အသုံးပြုရမည်ကို သိနိုင်မည်ဖြစ်သည်။
နောက်အခန်းများတွင် စာရင်းဇယားများနှင့် ဒေတာခွဲခြမ်းစိတ်ဖြာခြင်းအကြောင်း ပိုမိုလေ့လာနိုင်ပါမည်။