HTML အက္ခရာအစုံများ
HTML စာမျက်နှာကို မှန်ကန်စွာပြသရန်၊ ဘရောက်ဆာသည် အသုံးပြုရန် အက္ခရာသတ်မှတ်ထားသည် (ကုဒ်နံပါတ်) ကို သိရပါမည်။
ဥပမာ
<meta charset="UTF-8">
HTML အက္ခရာအစုံများ
HTML5 သတ်မှတ်ချက်သည် ဝဘ်ဆော့ဖ်ဝဲရေးသားသူများကို UTF-8 ဇာတ်ကောင်အစုံကို အသုံးပြုရန် အားပေးသည်။
ဒါက အမြဲတမ်းဖြစ်မလာဘူး။ အစောပိုင်း ဝဘ်အတွက် ဇာတ်ကောင်ကုဒ်ကုဒ်သည် ASCII ဖြစ်သည်။
နောက်ပိုင်းတွင်၊ HTML 2.0 မှ HTML 4.01 သို့ ISO-8859-1 ကို စံဇာတ်ကောင်သတ်မှတ်မှုအဖြစ် သတ်မှတ်ခဲ့သည်။
XML နှင့် HTML5 ဖြင့် UTF-8 သည် နောက်ဆုံးတွင်ရောက်ရှိလာပြီး စာလုံးအသွင်ဝှက်ခြင်းဆိုင်ရာ ပြဿနာများစွာကို ဖြေရှင်းပေးခဲ့သည်။
အစတွင်- ASCII
ကွန်ပျူတာဒေတာကို အီလက်ထရွန်းနစ်ပစ္စည်းများတွင် ဒွိကုဒ်များ (01000101) အဖြစ် သိမ်းဆည်းထားသည်။
စာသားသိမ်းဆည်းမှုကို စံသတ်မှတ်ရန်၊ သတင်းအချက်အလက်ဖလှယ်ခြင်းအတွက် အမေရိကန် စံကုဒ်နံပါတ် (ASCII) ကို ဖန်တီးခဲ့သည်။ ၎င်းသည် 0-9 မှ ဂဏန်းများ၊ အထက်စာလုံးအသေး (az၊ AZ) နှင့် အထူးအက္ခရာများကို ပံ့ပိုးရန်အတွက် သိမ်းဆည်းနိုင်သော အက္ခရာတစ်ခုစီအတွက် သီးသန့်ဒွိနံပါတ်ကို သတ်မှတ်ပေးထားသည်။ $ + - ( ) @ < > , .
ASCII သည် ဇာတ်ကောင်အတွက် 7 bits ကိုအသုံးပြုထားသောကြောင့် ၎င်းသည် မတူညီသော စာလုံး 128 လုံးကိုသာ ကိုယ်စားပြုနိုင်သည်။
ASCII ၏ အကြီးမားဆုံးအားနည်းချက်မှာ အင်္ဂလိပ်မဟုတ်သော စာလုံးများကို ချန်လှပ်ထားခြင်းဖြစ်သည်။
ASCII ကို ယနေ့တိုင် အသုံးပြုနေဆဲဖြစ်ပြီး အထူးသဖြင့် ကြီးမားသော ပင်မဘောင်ကွန်ပြူတာစနစ်များတွင် အသုံးပြုနေဆဲဖြစ်သည်။
အနီးကပ်ကြည့်ရှုရန်အတွက် ကျွန်ုပ်တို့၏ ပြီးပြည့်စုံသော ASCII ကိုးကားချက်ကို လေ့လာပါ ။
Windows တွင်- Windows-1252
Windows-1252 သည် Windows 95 အထိ Windows တွင် သတ်မှတ်ထားသော မူရင်းဇာတ်ကောင်ဖြစ်သည်။
နိုင်ငံတကာအက္ခရာများပါရှိသော ASCII ၏ တိုးချဲ့မှုတစ်ခုဖြစ်သည်။
မတူညီသောစာလုံး 256 လုံးကိုကိုယ်စားပြုရန် full byte (8-bits) ကိုအသုံးပြုသည်။
Windows-1252 သည် Windows တွင် ပုံသေဖြစ်သောကြောင့်၊ ၎င်းကို ဘရောက်ဆာအားလုံးမှ ပံ့ပိုးထားသည်။
အနီးကပ်ကြည့်ရှုရန်အတွက်၊ ကျေးဇူးပြု၍ လေ့လာပါ- The Complete Windows-1252 Reference .
HTML 4: ISO-8859-1 တွင်
HTML 4 တွင် အများဆုံးအသုံးပြုသည့် စာလုံးသတ်မှတ်သည် ISO-8859-1 ဖြစ်သည်။
ISO-8859-1 သည် နိုင်ငံတကာအက္ခရာများပါရှိသော ASCII ၏ တိုးချဲ့မှုတစ်ခုဖြစ်သည်။
ဥပမာ
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
HTML 4 တွင်၊ ISO-8859-1 နှင့် ကွဲပြားသော စာလုံးအစုံကို <meta> တဂ်တွင် သတ်မှတ်နိုင်သည်-
ဥပမာ
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
HTML 4 ပရိုဆက်ဆာများအားလုံး UTF-8 ကိုလည်း ပံ့ပိုးပေးသည်-
ဥပမာ
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
ဘရောက်ဆာတစ်ခုမှ ISO-8859-1 ကိုတွေ့ရှိသောအခါ၊ Windows-1252 တွင် နိုင်ငံတကာစာလုံး ၃၂ လုံးပါရှိသောကြောင့် ၎င်းသည် ပုံမှန်အားဖြင့် Windows-1252 သို့ ပုံသေပြောင်းသွားပါသည်။
အနီးကပ်ကြည့်ရှုရန်အတွက်၊ အပြည့်အစုံ- ISO-8859-1 ကိုးကားချက်ကို လေ့လာပါ။
HTML5 တွင်- ယူနီကုဒ် UTF-8
HTML5 သတ်မှတ်ချက်သည် ဝဘ်ဆော့ဖ်ဝဲရေးသားသူများအား UTF-8 ဇာတ်ကောင်အစုံကို အသုံးပြုရန် အားပေးသည်။
ဥပမာ
<meta charset="UTF-8">
UTF-8 နှင့် ကွဲပြားသော စာလုံးအစုံကို <meta> တဂ်တွင် သတ်မှတ်နိုင်သည်-
ဥပမာ
<meta charset="ISO-8859-1">
Unicode Consortium မှ UTF-8 နှင့် UTF-16 စံနှုန်းများကို တီထွင်ခဲ့ခြင်းဖြစ်ပြီး ISO-8859 ဇာတ်ကောင်အစုံများသည် အကန့်အသတ်ရှိပြီး ဘာသာစကားမျိုးစုံသောပတ်ဝန်းကျင်တွင် တွဲဖက်အသုံးပြုနိုင်ခြင်းမရှိသောကြောင့်ဖြစ်သည်။
Unicode Standard သည် ကမ္ဘာပေါ်ရှိ စာလုံးများ၊ သတ်ပုံများနှင့် သင်္ကေတများအားလုံးကို (နီးပါး) အကျုံးဝင်ပါသည်။
HTML5 နှင့် XML ပရိုဆက်ဆာများအားလုံး UTF-8၊ UTF-16၊ Windows-1252 နှင့် ISO-8859 တို့ကို ပံ့ပိုးပေးသည်။
အနီးကပ်ကြည့်ရှုရန်အတွက် ကျေးဇူးပြု၍ လေ့လာပါ- အပြည့်အစုံ ယူနီကုဒ်အကိုးအ ကား ။