Pandas - ကြံစည်ခြင်း ။
ကြံစည်ခြင်း။
ပန်ဒါ plot()
များသည် ပုံများဖန်တီးရန် နည်းလမ်းကို အသုံးပြုသည်။
ဖန်သားပြင်ပေါ်ရှိ ပုံကြမ်းကိုမြင်ယောင်ရန် Matplotlib စာကြည့်တိုက်၏ခွဲခန်းတစ်ခုဖြစ်သည့် Pyplot ကို အသုံးပြုနိုင်သည်။
ကျွန်ုပ်တို့၏ Matplotlib ကျူတိုရီရယ် တွင် Matplotlib အကြောင်း ပိုမိုဖတ်ရှုပါ ။
ဥပမာ
Matplotlib မှ pyplot ကို တင်သွင်းပြီး ကျွန်ုပ်တို့၏ DataFrame ကို မြင်ယောင်ကြည့်ပါ-
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
ဤစာမျက်နှာရှိ နမူနာများသည် 'data.csv' ဟုခေါ်သော CSV ဖိုင်ကို အသုံးပြုသည်။
data.csv ကို ဒေါင်းလုဒ်လုပ်ပါ သို့မဟုတ် Open data.csv
ကွက်ကျားကွက်၊
kind
အငြင်းအခုံ ဖြင့် ခွဲခြမ်းစိပ်ဖြာမှုတစ်ခုကို လိုချင်ကြောင်း သတ်မှတ်ပါ -
kind = 'scatter'
ဖြန့်ကြဲကွက်တစ်ခုသည် x- နှင့် y-ဝင်ရိုးတစ်ခု လိုအပ်သည်။
အောက်ပါဥပမာတွင် x-axis အတွက် "Duration" နှင့် y-axis အတွက် "Calories" ကိုသုံးပါမည်။
ဤကဲ့သို့သော အကြောင်းပြချက် x နှင့် y တို့ကို ထည့်သွင်းပါ-
x = 'Duration', y = 'Calories'
ဥပမာ
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
ရလဒ်
သတိရပါ-
ယခင်ဥပမာတွင်၊ "ကြာချိန်" နှင့် "ကယ်လိုရီများ" အကြားဆက်စပ်မှုကို သိရှိခဲ့ရပြီး 0.922721
ကြာချိန်ပိုမိုမြင့်မားခြင်းသည် ကယ်လိုရီပိုမိုလောင်ကျွမ်းစေသည်ဟူသောအချက်ကို ကျွန်ုပ်တို့နိဂုံးချုပ်ခဲ့သည်။
ခွဲခြမ်းစိပ်ဖြာကိုကြည့်ခြင်းအားဖြင့် ငါသဘောတူမည်။
ဆက်စပ်မှုဖြင့် "Duration" နှင့် "Maxpulse" ကဲ့သို့သော ကော်လံများကြားတွင် မကောင်းတဲ့ ဆက်နွယ်မှုရှိသည့် အခြား scatterplot တစ်ခုကို ဖန်တီးကြပါစို့ 0.009403
။
ဥပမာ
ကော်လံများကြားတွင် ဆက်နွှယ်မှုမရှိသော အပိုင်းအစတစ်ခု-
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
ရလဒ်
လက်မှတ်ရယူပါ။
$10 စာရင်းသွင်းပါ။
Histogram
kind
သင်ဟစ်စတိုဂရမ်ကို လိုချင်ကြောင်း သတ်မှတ်ရန် အကြောင်းပြချက် ကို အသုံးပြုပါ -
kind = 'hist'
ဟီစတိုဂရမ်တစ်ခုသည် ကော်လံတစ်ခုသာ လိုအပ်သည်။
ဟစ်စတိုဂရမ်တစ်ခုသည် ကြားကာလတစ်ခုစီ၏ အကြိမ်ရေကို ပြသည်၊ ဥပမာ- မိနစ် 50 နှင့် 60 ကြားတွင် လေ့ကျင့်ခန်းမည်မျှကြာသနည်း။
အောက်ပါဥပမာတွင် ဟီစတိုဂရမ်ကိုဖန်တီးရန် "ကြာချိန်" ကော်လံကို အသုံးပြုပါမည်။
ဥပမာ
df["Duration"].plot(kind = 'hist')
ရလဒ်
မှတ်ချက်- မိနစ် 50 နှင့် 60 အကြားကြာမြင့်သောလေ့ကျင့်ခန်း 100 ကျော်ရှိကြောင်း Histogram ကပြောပြသည်။