DTD - XML တည်ဆောက်မှုတုံးများ
XML နှင့် HTML စာရွက်စာတမ်း နှစ်ခုလုံး၏ အဓိက အဆောက်အဦတုံးများသည် ဒြပ်စင်များဖြစ်သည်။
XML Documents များ၏ တည်ဆောက်မှု Blocks
DTD ရှုထောင့်မှကြည့်လျှင် XML စာရွက်စာတမ်းအားလုံးကို အောက်ပါအဆောက်အဦတုံးများဖြင့် ပြုလုပ်ထားပါသည်။
- ဒြပ်စင်
- ဂုဏ်တော်
- တခုနဲ့တခု
- PCDATA
- CDATA
ဒြပ်စင်
ဒြပ်စင်များသည် XML နှင့် HTML စာရွက်စာတမ်းများ နှစ်ခုလုံး ၏ အဓိက တည်ဆောက်မှုတုံးများ ဖြစ်သည်။
HTML ဒြပ်စင်များ၏ ဥပမာများမှာ "body" နှင့် "table" ဖြစ်သည်။ XML အစိတ်အပိုင်းများ၏ ဥပမာများသည် "မှတ်စု" နှင့် "မက်ဆေ့ခ်ျ" ဖြစ်နိုင်သည်။ ဒြပ်စင်များတွင် စာသား၊ အခြားဒြပ်စင်များ ပါဝင်နိုင်သည် သို့မဟုတ် ဗလာဖြစ်နေနိုင်သည်။ အလွတ် HTML ဒြပ်စင်များ၏ ဥပမာများမှာ "hr", "br" နှင့် "img" ဖြစ်သည်။
ဥပမာများ-
<body>some text</body>
<message>some text</message>
ဂုဏ်တော်
Attribute များသည် ဒြပ်စင်များအကြောင်း အပိုအချက်အလက်များကို ပေးဆောင်သည် ။
ရည်ညွှန်းချက်များသည် ဒြပ်စင်တစ်ခု၏ အဖွင့် tag တွင် အမြဲထည့်ထားသည်။ ရည်ညွှန်းချက်များသည် အမြဲတမ်းအမည်/တန်ဖိုးအတွဲများဖြစ်သည်။ အောက်ပါ "img" ဒြပ်စင်တွင် အရင်းအမြစ်ဖိုင်တစ်ခုအကြောင်း နောက်ထပ်အချက်အလက်များ ပါရှိသည်-
<img src="computer.gif" />
ဒြပ်စင်၏အမည်မှာ "img" ဖြစ်သည်။ attribute ၏အမည်မှာ "src" ဖြစ်သည်။ attribute ၏တန်ဖိုးမှာ "computer.gif" ဖြစ်သည်။ ဒြပ်စင်ကိုယ်တိုင်က ဗလာဖြစ်သောကြောင့် ၎င်းကို "/" ဖြင့် ပိတ်ထားသည်။
တခုနဲ့တခု
XML တဂ်တစ်ခု၏အစကို သတ်မှတ်သည့် သင်္ကေတအောက် (<) ကဲ့သို့ XML တွင် အထူးအဓိပ္ပါယ်ရှိသော စာလုံးအချို့ရှိသည်။
HTML entity - " " ကို အများစုက သိကြပါတယ်။ စာရွက်စာတမ်းတစ်ခုတွင် အပိုနေရာတစ်ခုထည့်သွင်းရန် ဤ "no-breaking-space" entity ကို HTML တွင် အသုံးပြုပါသည်။ စာရွက်စာတမ်းတစ်ခုကို XML ခွဲခြမ်းစိတ်ဖြာမှုဖြင့် ခွဲခြမ်းစိတ်ဖြာသည့်အခါ အကြောင်းအရာများကို ချဲ့ထွင်သည်။
အောက်ပါအကြောင်းအရာများကို XML တွင် ကြိုတင်သတ်မှတ်ထားပါသည်။
Entity References | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA ဆိုသည်မှာ ခွဲခြမ်းစိတ်ဖြာထားသော စာလုံးဒေတာကို ဆိုလိုသည်။
XML ဒြပ်စင်တစ်ခု၏ အစတဂ်နှင့် အဆုံးတက်ဂ်ကြားတွင် တွေ့ရသော စာသားအဖြစ် ဇာတ်ကောင်ဒေတာကို စဉ်းစားပါ။
PCDATA သည် parser တစ်ခုမှ ခွဲခြမ်းစိတ်ဖြာမည့် စာသား ဖြစ်သည်။ စာသားကို အကြောင်းအရာများနှင့် အမှတ်အသားပြုလုပ်ရန်အတွက် parser မှ စစ်ဆေးပါမည် ။
စာသားအတွင်းရှိ တဂ်များကို အမှတ်အသားအဖြစ် သတ်မှတ်မည်ဖြစ်ပြီး အကြောင်းအရာများကို ချဲ့ထွင်ပါမည်။
သို့ရာတွင်၊ ခွဲခြမ်းစိတ်ဖြာထားသော စာလုံးဒေတာတွင် မည်သည့် &, <, သို့မဟုတ် > စာလုံးများ မပါဝင်သင့်ပါ။ ဒါတွေကို & < နှင့် > အသီးသီး၊
CDATA
CDATA ဆိုသည်မှာ ဇာတ်ကောင်ဒေတာကို ဆိုလိုသည်။
CDATA သည် parser ဖြင့် ခွဲခြမ်းစိတ်ဖြာခြင်းမပြုသော စာသား ဖြစ်သည်။ စာသားအတွင်းရှိ တဂ်များကို အမှတ်အသားအဖြစ် သဘောထားမည်မဟုတ်ဘဲ အကြောင်းအရာများကို ချဲ့ထွင်မည်မဟုတ်ပါ။