Aturan Sintaks XML
Aturan sintaks XML sangat sederhana dan logis. Aturannya mudah dipelajari, dan mudah digunakan.
Dokumen XML Harus Memiliki Elemen Root
Dokumen XML harus berisi satu elemen root yang merupakan induk dari semua elemen lainnya:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
Dalam contoh ini <note> adalah elemen root:
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Prolog XML
Baris ini disebut prolog XML :
<?xml version="1.0" encoding="UTF-8"?>
Prolog XML adalah opsional. Jika ada, itu harus didahulukan dalam dokumen.
Dokumen XML dapat berisi karakter internasional, seperti Norwegia atau é Prancis.
Untuk menghindari kesalahan, Anda harus menentukan pengkodean yang digunakan, atau menyimpan file XML Anda sebagai UTF-8.
UTF-8 adalah pengkodean karakter default untuk dokumen XML.
Pengkodean karakter dapat dipelajari di Tutorial Kumpulan Karakter kami .
UTF-8 juga merupakan pengkodean default untuk HTML5, CSS, JavaScript, PHP, dan SQL.
Semua Elemen XML Harus Memiliki Tag Penutup
Dalam XML, menghilangkan tag penutup adalah ilegal. Semua elemen harus memiliki tag penutup:
<p>This is a paragraph.</p>
<br />
Catatan: Prolog XML tidak memiliki tag penutup! Ini bukan sebuah kesalahan. Prolog bukan merupakan bagian dari dokumen XML.
Tag XML peka huruf besar/kecil
Tag XML peka terhadap huruf besar/kecil. Tag <Letter> berbeda dengan tag <letter>.
Tag pembuka dan penutup harus ditulis dengan kasus yang sama:
<message>This is correct</message>
"Tag pembuka dan penutup" sering disebut sebagai "Tag awal dan akhir". Gunakan apa pun yang Anda suka. Ini adalah hal yang sama.
Elemen XML Harus Bersarang dengan Benar
Dalam HTML, Anda mungkin melihat elemen bersarang yang tidak tepat:
<b><i>This text is bold and italic</b></i>
Dalam XML, semua elemen harus bersarang dengan benar satu sama lain:
<b><i>This text is bold and italic</i></b>
Dalam contoh di atas, "Bersarang dengan benar" berarti bahwa karena elemen <i> dibuka di dalam elemen <b>, elemen tersebut harus ditutup di dalam elemen <b>.
Nilai Atribut XML Harus Selalu Dikutip
Elemen XML dapat memiliki atribut dalam pasangan nama/nilai seperti pada HTML.
Dalam XML, nilai atribut harus selalu dikutip:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
Referensi Entitas
Beberapa karakter memiliki arti khusus dalam XML.
Jika Anda menempatkan karakter seperti "<" di dalam elemen XML, itu akan menghasilkan kesalahan karena pengurai menafsirkannya sebagai awal dari elemen baru.
Ini akan menghasilkan kesalahan XML:
<message>salary < 1000</message>
Untuk menghindari kesalahan ini, ganti karakter "<" dengan referensi entitas :
<message>salary < 1000</message>
Ada 5 referensi entitas yang telah ditentukan sebelumnya dalam XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Hanya < dan & yang benar-benar ilegal dalam XML, tetapi merupakan kebiasaan yang baik untuk mengganti > dengan > demikian juga.
Komentar dalam XML
Sintaks untuk menulis komentar dalam XML mirip dengan HTML:
<!-- This is a comment -->
Dua tanda hubung di tengah komentar tidak diperbolehkan:
<!-- This is an invalid -- comment -->
Ruang putih Diawetkan dalam XML
XML tidak memotong beberapa spasi putih (HTML memotong beberapa spasi putih menjadi satu spasi tunggal):
XML: | Hello Tove |
HTML: | Hello Tove |
XML Menyimpan Baris Baru sebagai LF
Aplikasi Windows menyimpan baris baru sebagai: carriage return dan line feed (CR+LF).
Unix dan Mac OSX menggunakan LF.
Sistem Mac lama menggunakan CR.
XML menyimpan baris baru sebagai LF.
XML yang Dibentuk dengan Baik
Dokumen XML yang sesuai dengan aturan sintaks di atas dikatakan sebagai dokumen XML "Terbentuk dengan Baik".