HTML Charsets

HTML Charsets HTML ASCII HTML WIN-1252 HTML ISO-8859 HTML သင်္ကေတများ HTML UTF-8

HTML UTF-8

လက်တင်အခြေခံ လက်တင် ဖြည့်စွက်စာ လက်တင်တိုးချဲ့ A လက်တင်တိုးချဲ့ B Modifier Letters Diacritical အမှတ်အသားများ ဂရိနှင့် ကော့ပတစ် Cyrillic အခြေခံ Cyrillic ဖြည့်စွက်စာ

HTML သင်္ကေတများ

အထွေထွေသတ်ပုံ ငွေကြေးသင်္ကေတများ အက္ခရာတူသော သင်္ကေတများ မြှားများ၊ သင်္ချာအော်ပရေတာများ သေတ္တာပုံများ Block Elements များ ဂျီဩမေတြီပုံစံများ ထွေလာသင်္ကေတများ Dingbats အီမိုဂျီ အီမိုဂျီ အပြုံးများ အီမိုဂျီ အသားအရောင်များ

HTML အကြောင်းအရာများ

HTML4 အကြောင်းအရာများ HTML5 အကြောင်းအရာများ A HTML5 Entities B HTML5 Entities C HTML5 Entities D HTML5 Entities E HTML5 Entities F HTML5 Entities G HTML5 Entities H HTML5 Entities I HTML5 Entities J HTML5 Entities K HTML5 Entities L HTML5 Entities M HTML5 Entities N HTML5 Entities O HTML5 Entities P HTML5 Entities Q HTML5 Entities R HTML5 Entities S HTML5 Entities T HTML5 Entities U HTML5 Entities V HTML5 Entities W HTML5 Entities X HTML5 အကြောင်းအရာများ Y HTML5 Entities Z

HTML အက္ခရာအစုံများ


HTML စာမျက်နှာကို မှန်ကန်စွာပြသရန်၊ ဘရောက်ဆာသည် အသုံးပြုရန် အက္ခရာသတ်မှတ်ထားသည် (ကုဒ်နံပါတ်) ကို သိရပါမည်။

ဥပမာ

<meta charset="UTF-8">

HTML အက္ခရာအစုံများ

HTML5 သတ်မှတ်ချက်သည် ဝဘ်ဆော့ဖ်ဝဲရေးသားသူများကို UTF-8 ဇာတ်ကောင်အစုံကို အသုံးပြုရန် အားပေးသည်။

ဒါက အမြဲတမ်းဖြစ်မလာဘူး။ အစောပိုင်း ဝဘ်အတွက် ဇာတ်ကောင်ကုဒ်ကုဒ်သည် ASCII ဖြစ်သည်။

နောက်ပိုင်းတွင်၊ HTML 2.0 မှ HTML 4.01 သို့ ISO-8859-1 ကို စံဇာတ်ကောင်သတ်မှတ်မှုအဖြစ် သတ်မှတ်ခဲ့သည်။

XML နှင့် HTML5 ဖြင့် UTF-8 သည် နောက်ဆုံးတွင်ရောက်ရှိလာပြီး စာလုံးအသွင်ဝှက်ခြင်းဆိုင်ရာ ပြဿနာများစွာကို ဖြေရှင်းပေးခဲ့သည်။


အစတွင်- ASCII

ကွန်ပျူတာဒေတာကို အီလက်ထရွန်းနစ်ပစ္စည်းများတွင် ဒွိကုဒ်များ (01000101) အဖြစ် သိမ်းဆည်းထားသည်။

စာသားသိမ်းဆည်းမှုကို စံသတ်မှတ်ရန်၊ သတင်းအချက်အလက်ဖလှယ်ခြင်းအတွက် အမေရိကန် စံကုဒ်နံပါတ် (ASCII) ကို ဖန်တီးခဲ့သည်။ ၎င်းသည် 0-9 မှ ဂဏန်းများ၊ အထက်စာလုံးအသေး (az၊ AZ) နှင့် အထူးအက္ခရာများကို ပံ့ပိုးရန်အတွက် သိမ်းဆည်းနိုင်သော အက္ခရာတစ်ခုစီအတွက် သီးသန့်ဒွိနံပါတ်ကို သတ်မှတ်ပေးထားသည်။ $ + - ( ) @ < > , .

ASCII သည် ဇာတ်ကောင်အတွက် 7 bits ကိုအသုံးပြုထားသောကြောင့် ၎င်းသည် မတူညီသော စာလုံး 128 လုံးကိုသာ ကိုယ်စားပြုနိုင်သည်။

ASCII ၏ အကြီးမားဆုံးအားနည်းချက်မှာ အင်္ဂလိပ်မဟုတ်သော စာလုံးများကို ချန်လှပ်ထားခြင်းဖြစ်သည်။

ASCII ကို ယနေ့တိုင် အသုံးပြုနေဆဲဖြစ်ပြီး အထူးသဖြင့် ကြီးမားသော ပင်မဘောင်ကွန်ပြူတာစနစ်များတွင် အသုံးပြုနေဆဲဖြစ်သည်။

အနီးကပ်ကြည့်ရှုရန်အတွက် ကျွန်ုပ်တို့၏ ပြီးပြည့်စုံသော ASCII ကိုးကားချက်ကို လေ့လာပါ ။


Windows တွင်- Windows-1252

Windows-1252 သည် Windows 95 အထိ Windows တွင် သတ်မှတ်ထားသော မူရင်းဇာတ်ကောင်ဖြစ်သည်။

နိုင်ငံတကာအက္ခရာများပါရှိသော ASCII ၏ တိုးချဲ့မှုတစ်ခုဖြစ်သည်။

မတူညီသောစာလုံး 256 လုံးကိုကိုယ်စားပြုရန် full byte (8-bits) ကိုအသုံးပြုသည်။

Windows-1252 သည် Windows တွင် ပုံသေဖြစ်သောကြောင့်၊ ၎င်းကို ဘရောက်ဆာအားလုံးမှ ပံ့ပိုးထားသည်။

အနီးကပ်ကြည့်ရှုရန်အတွက်၊ ကျေးဇူးပြု၍ လေ့လာပါ- The Complete Windows-1252 Reference .



HTML 4: ISO-8859-1 တွင်

HTML 4 တွင် အများဆုံးအသုံးပြုသည့် စာလုံးသတ်မှတ်သည် ISO-8859-1 ဖြစ်သည်။

ISO-8859-1 သည် နိုင်ငံတကာအက္ခရာများပါရှိသော ASCII ၏ တိုးချဲ့မှုတစ်ခုဖြစ်သည်။

ဥပမာ

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

HTML 4 တွင်၊ ISO-8859-1 နှင့် ကွဲပြားသော စာလုံးအစုံကို <meta> တဂ်တွင် သတ်မှတ်နိုင်သည်-

ဥပမာ

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

HTML 4 ပရိုဆက်ဆာများအားလုံး UTF-8 ကိုလည်း ပံ့ပိုးပေးသည်-

ဥပမာ

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

ဘရောက်ဆာတစ်ခုမှ ISO-8859-1 ကိုတွေ့ရှိသောအခါ၊ Windows-1252 တွင် နိုင်ငံတကာစာလုံး ၃၂ လုံးပါရှိသောကြောင့် ၎င်းသည် ပုံမှန်အားဖြင့် Windows-1252 သို့ ပုံသေပြောင်းသွားပါသည်။

အနီးကပ်ကြည့်ရှုရန်အတွက်၊ အပြည့်အစုံ- ISO-8859-1 ကိုးကားချက်ကို လေ့လာပါ။


HTML5 တွင်- ယူနီကုဒ် UTF-8

HTML5 သတ်မှတ်ချက်သည် ဝဘ်ဆော့ဖ်ဝဲရေးသားသူများအား UTF-8 ဇာတ်ကောင်အစုံကို အသုံးပြုရန် အားပေးသည်။

ဥပမာ

<meta charset="UTF-8">

UTF-8 နှင့် ကွဲပြားသော စာလုံးအစုံကို <meta> တဂ်တွင် သတ်မှတ်နိုင်သည်-

ဥပမာ

<meta charset="ISO-8859-1">

Unicode Consortium မှ UTF-8 နှင့် UTF-16 စံနှုန်းများကို တီထွင်ခဲ့ခြင်းဖြစ်ပြီး ISO-8859 ဇာတ်ကောင်အစုံများသည် အကန့်အသတ်ရှိပြီး ဘာသာစကားမျိုးစုံသောပတ်ဝန်းကျင်တွင် တွဲဖက်အသုံးပြုနိုင်ခြင်းမရှိသောကြောင့်ဖြစ်သည်။

Unicode Standard သည် ကမ္ဘာပေါ်ရှိ စာလုံးများ၊ သတ်ပုံများနှင့် သင်္ကေတများအားလုံးကို (နီးပါး) အကျုံးဝင်ပါသည်။

HTML5 နှင့် XML ပရိုဆက်ဆာများအားလုံး UTF-8၊ UTF-16၊ Windows-1252 နှင့် ISO-8859 တို့ကို ပံ့ပိုးပေးသည်။

အနီးကပ်ကြည့်ရှုရန်အတွက် ကျေးဇူးပြု၍ လေ့လာပါ- အပြည့်အစုံ ယူနီကုဒ်အကိုးအ ကား ။