စက်သင်ယူခြင်း - စကေး
စကေးအင်္ဂါရပ်များ
သင့်ဒေတာတွင် မတူညီသော တန်ဖိုးများနှင့် မတူညီသော တိုင်းတာမှုယူနစ်များ ရှိနေပါက ၎င်းတို့ကို နှိုင်းယှဉ်ရန် ခက်ခဲနိုင်သည်။ ကီလိုဂရမ်ဆိုတာ မီတာနဲ့ယှဉ်ရင် ဘာလဲ။ ဒါမှမဟုတ် အမြင့်ပေက အချိန်နဲ့နှိုင်းလား။
ဤပြဿနာအတွက် အဖြေမှာ အတိုင်းအတာဖြစ်သည်။ ကျွန်ုပ်တို့သည် ဒေတာကို နှိုင်းယှဉ်ရန် ပိုမိုလွယ်ကူသော တန်ဖိုးအသစ်များအဖြစ် အတိုင်းအတာကို တိုင်းတာနိုင်ပါသည်။
အောက်ဖော်ပြပါဇယားကိုကြည့်ပါ၊ ၎င်းသည် များစွာသောဆုတ်ယုတ်မှုအခန်းတွင် ကျွန်ုပ်တို့ အသုံးပြုခဲ့သည့် ဒေတာအစုံနှင့် အတူတူပင်ဖြစ်သည် ၊ သို့သော် ယခုအကြိမ်တွင် ထုထည် ကော်လံတွင် စင်တီမီတာ 3 (1000 အစား 1.0 အစား 1.0) အစား လီ တာ တွင် တန်ဖိုးများပါရှိသည်။
ဖိုင်ကို စမ်းသပ်ရန်အတွက်သာ ရည်ရွယ်သည်၊ သင်သည် ၎င်းကို ဤနေရာတွင် ဒေါင်းလုဒ်ဆွဲနိုင်သည်- cars2.csv
ကား | မော်ဒယ် | အတွဲ | အလေးချိန် | CO2 |
တိုယိုတာ | Aygo | ၁.၀ | ၇၉၀ | ၉၉ |
မစ်ဆူဘီရှီ | အာကာသကြယ် | ၁.၂ | ၁၁၆၀ | ၉၅ |
စကိုဒါ | Citigo | ၁.၀ | ၉၂၉ | ၉၅ |
Fiat | ၅၀၀ | ၀.၉ | ၈၆၅ | ၉၀ |
မီနီ | ကူပါ | ၁.၅ | ၁၁၄၀ | ၁၀၅ |
VW | တက်! | ၁.၀ | ၉၂၉ | ၁၀၅ |
စကိုဒါ | Fabia | ၁.၄ | ၁၁၀၉ | ၉၀ |
မာစီးဒီး | A-Class ပါ။ | ၁.၅ | ၁၃၆၅ | ၉၂ |
ဖို့ဒ် | Fiesta | ၁.၅ | ၁၁၁၂ | ၉၈ |
အော်ဒီ | A1 | ၁.၆ | ၁၁၅၀ | ၉၉ |
ဟွန်ဒိုင်း | I20 | ၁.၁ | ၉၈၀ | ၉၉ |
ဆူဇူကီး | လျင်မြန်သည်။ | ၁.၃ | ၉၉၀ | ၁၀၁ |
ဖို့ဒ် | Fiesta | ၁.၀ | ၁၁၁၂ | ၉၉ |
ဟွန်ဒါ | အရပ်ဘက် | ၁.၆ | ၁၂၅၂ | ၉၄ |
ဟွန်ဒိုင်း | I30 | ၁.၆ | ၁၃၂၆ | ၉၇ |
Opel | Astra | ၁.၆ | ၁၃၃၀ | ၉၇ |
ဘီအမ်ဒဗလျူ | ၁ | ၁.၆ | ၁၃၆၅ | ၉၉ |
မာဇဒါ | ၃ | ၂.၂ | ၁၂၈၀ | ၁၀၄ |
စကိုဒါ | မြန်သည်။ | ၁.၆ | ၁၁၁၉ | ၁၀၄ |
ဖို့ဒ် | အာရုံစူးစိုက်မှု | 2.0 | ၁၃၂၈ | ၁၀၅ |
ဖို့ဒ် | Mondeo | ၁.၆ | ၁၅၈၄ | ၉၄ |
Opel | အဆောင်အယောင် | 2.0 | ၁၄၂၈ | ၉၉ |
မာစီးဒီး | C-Class | ၂.၁ | ၁၃၆၅ | ၉၉ |
စကိုဒါ | Octavia | ၁.၆ | ၁၄၁၅ | ၉၉ |
Volvo | S60 | 2.0 | ၁၄၁၅ | ၉၉ |
မာစီးဒီး | CLA | ၁.၅ | ၁၄၆၅ | ၁၀၂ |
အော်ဒီ | A4 | 2.0 | ၁၄၉၀ | ၁၀၄ |
အော်ဒီ | A6 | 2.0 | ၁၇၂၅ | ၁၁၄ |
Volvo | V70 | ၁.၆ | ၁၅၂၃ | ၁၀၉ |
ဘီအမ်ဒဗလျူ | ၅ | 2.0 | ၁၇၀၅ | ၁၁၄ |
မာစီးဒီး | E-Class ပါ။ | ၂.၁ | ၁၆၀၅ | ၁၁၅ |
Volvo | XC70 | 2.0 | ၁၇၄၆ | ၁၁၇ |
ဖို့ဒ် | B-Max | ၁.၆ | ၁၂၃၅ | ၁၀၄ |
ဘီအမ်ဒဗလျူ | ၂ | ၁.၆ | ၁၃၉၀ | ၁၀၈ |
Opel | Zafira | ၁.၆ | ၁၄၀၅ | ၁၀၉ |
မာစီးဒီး | SLK | ၂.၅ | ၁၃၉၅ | ၁၂၀ |
Volume 1.0 ကို အလေးချိန် 790 နှင့် နှိုင်းယှဉ်ရန် ခက်ခဲနိုင်သော်လည်း ၎င်းတို့ နှစ်ခုလုံးကို နှိုင်းယှဉ်နိုင်သော တန်ဖိုးများအဖြစ် တိုင်းတာပါက အခြားတန်ဖိုးတစ်ခုနှင့် နှိုင်းယှဉ်ပါက မည်မျှရှိသည်ကို အလွယ်တကူ သိနိုင်သည်။
ဒေတာကို စကေးချရန် နည်းလမ်းအမျိုးမျိုးရှိပါသည်၊ ဤသင်ခန်းစာတွင် standardization ဟုခေါ်သော နည်းလမ်းကို အသုံးပြုပါမည်။
စံသတ်မှတ်ရေးနည်းလမ်းသည် ဤဖော်မြူလာကို အသုံးပြုသည်-
z = (x - u) / s
z
တန်ဖိုးအသစ်က
ဘယ်မှာလဲ x
၊ မူရင်းတန်ဖိုးက
u
ပျမ်းမျှနဲ့ s
စံသွေဖည်မှုပါ။
အထက်ဖော်ပြပါ ဒေတာအတွဲမှ အလေးချိန် ကော်လံ ကို ယူပါက ၊ ပထမတန်ဖိုးသည် 790 ဖြစ်ပြီး အတိုင်းအတာတန်ဖိုးမှာ-
(790 - ) / = -2.1
အထက်ဖော်ပြပါ ဒေတာအတွဲမှ ထုထည် ကော်လံ ကို ယူပါက ၊ ပထမတန်ဖိုးသည် 1.0 ဖြစ်ပြီး အတိုင်းအတာတန်ဖိုးမှာ-
(1.0 - ) / = -1.59
ယခု သင်သည် -2.1 နှင့် 790 ကို 1.0 နှိုင်းယှဉ်မည့်အစား -1.59 နှင့် နှိုင်းယှဉ်နိုင်ပါပြီ။
၎င်းကို သင်ကိုယ်တိုင်လုပ်ဆောင်ရန် မလိုအပ်ပါ၊ Python sklearn module တွင် StandardScaler()
ဒေတာအတွဲများကို အသွင်ပြောင်းသည့်နည်းလမ်းများဖြင့် Scaler အရာဝတ္ထုကို ပြန်ပေးသည့် နည်းလမ်းတစ်ခုရှိသည်။
ဥပမာ
အလေးချိန်နှင့် ထုထည်ကော်လံများရှိ တန်ဖိုးအားလုံးကို အတိုင်းအတာ-
import pandas
from sklearn import linear_model
from
sklearn.preprocessing import StandardScaler
scale = StandardScaler()
df = pandas.read_csv("cars2.csv")
X = df[['Weight', 'Volume']]
scaledX = scale.fit_transform(X)
print(scaledX)
ရလဒ်:
ကျွန်ုပ်တို့၏တွက်ချက်မှုများနှင့်ကိုက်ညီသော ပထမတန်ဖိုးနှစ်ခုမှာ -2.1 နှင့် -1.59 ဖြစ်ကြောင်း သတိပြုပါ။
[[-2.10389253 -1.59336644] [-0.55407235 -1.07190106] [-1.52166278 -1.59336644] [-1.78973979 -1.85409913] [-0.63784641 -0.28970299] [-1.52166278 -1.59336644] [-0.76769621 -0.55043568] [ 0.3046118 -0.28970299] [-0.7551301 -0.28970299] [-0.59595938 -0.0289703 ] [-1.30803892 -1.33263375] [-1.26615189 -0.81116837] [-0.7551301 -1.59336644] [-0.16871166 -0.0289703 ] [ 0.14125238 -0.0289703 ] [ 0.15800719 -0.0289703 ] [ 0.3046118 -0.0289703 ] [-0.05142797 1.53542584] [-0.72580918 -0.0289703 ] [ 0.14962979 1.01396046] [ 1.2219378 -0.0289703 ] [ 0.5685001 1.01396046] [ 0.3046118 1.27469315] [ 0.51404696 -0.0289703 ] [ 0.51404696 1.01396046] [ 0.72348212 -0.28970299] [ 0.8281997 1.01396046] [ 1.81254495 1.01396046] [ 0.96642691 -0.0289703 ] [ 1.72877089 1.01396046] [ 1.30990057 1.27469315] [ 1.90050772 1.01396046] [-0.23991961 -0.0289703 ] [ 0.40932938 -0.0289703 ] [ 0.47215993 -0.0289703 ] [ 0.4302729 2.31762392]]
CO2 တန်ဖိုးများကို ခန့်မှန်းပါ။
Multiple Regression အခန်း ရှိ တာဝန်မှာ ကားတစ်စီးမှ CO2 ထုတ်လွှတ်မှုကို ခန့်မှန်းရန်ဖြစ်ပြီး ၎င်း၏ အလေးချိန်နှင့် ထုထည်ကို သင်သိမှသာ သိနိုင်သည်။
ဒေတာအစုံကို စကေးချသောအခါ၊ တန်ဖိုးများကို ခန့်မှန်းသောအခါတွင် သင်သည် စကေးကို အသုံးပြုရပါမည်-
ဥပမာ
အလေးချိန် 2300 ကီလိုဂရမ်ရှိသော 1.3 လီတာ ကားမှ CO2 ထုတ်လွှတ်မှုကို ခန့်မှန်းပါ-
import pandas
from sklearn import linear_model
from
sklearn.preprocessing import StandardScaler
scale = StandardScaler()
df = pandas.read_csv("cars2.csv")
X = df[['Weight', 'Volume']]
y = df['CO2']
scaledX = scale.fit_transform(X)
regr = linear_model.LinearRegression()
regr.fit(scaledX, y)
scaled =
scale.transform([[2300, 1.3]])
predictedCO2 = regr.predict([scaled[0]])
print(predictedCO2)
ရလဒ်:
[107.2087328]