Kumpulan Karakter HTML


Untuk menampilkan halaman HTML dengan benar, browser harus mengetahui set karakter (encoding) apa yang akan digunakan:

Contoh

<meta charset="UTF-8">

Kumpulan Karakter HTML

Spesifikasi HTML5 mendorong pengembang web untuk menggunakan rangkaian karakter UTF-8!

Hal ini tidak selalu yang jadi masalahnya. Pengkodean karakter untuk web awal adalah ASCII.

Kemudian, dari HTML 2.0 ke HTML 4.01, ISO-8859-1 dianggap sebagai kumpulan karakter standar.

Dengan XML dan HTML5, UTF-8 akhirnya tiba dan memecahkan banyak masalah pengkodean karakter.


Awalnya: ASCII

Data komputer disimpan sebagai kode biner (01000101) dalam elektronik.

Untuk membakukan penyimpanan teks, American Standard Code for Information Interchange (ASCII) telah dibuat. Ini mendefinisikan nomor biner unik untuk setiap karakter yang dapat disimpan untuk mendukung angka dari 0-9, alfabet huruf besar dan kecil (az, AZ), dan karakter khusus seperti ! $ + - ( ) @ < > , .

Karena ASCII menggunakan 7 bit untuk karakter, itu hanya bisa mewakili 128 karakter yang berbeda.

Kelemahan terbesar dengan ASCII, adalah bahwa ia mengecualikan huruf non-Inggris.

ASCII masih digunakan sampai sekarang, terutama di sistem komputer mainframe besar.

Untuk melihat lebih dekat, silakan pelajari Referensi ASCII Lengkap kami .


Di Windows: Windows-1252

Windows-1252 adalah set karakter default di Windows, hingga Windows 95.

Ini adalah perpanjangan dari ASCII, dengan tambahan karakter internasional.

Ini menggunakan byte penuh (8-bit) untuk mewakili 256 karakter yang berbeda.

Karena Windows-1252 telah menjadi default di Windows, ini didukung oleh semua browser.

Untuk melihat lebih dekat, silakan pelajari: Referensi Lengkap Windows-1252 .



Dalam HTML 4: ISO-8859-1

Kumpulan karakter yang paling sering digunakan dalam HTML 4 adalah ISO-8859-1.

ISO-8859-1 adalah perpanjangan dari ASCII, dengan tambahan karakter internasional.

Contoh

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Dalam HTML 4, set karakter yang berbeda dari ISO-8859-1 dapat ditentukan dalam tag <meta>:

Contoh

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Semua prosesor HTML 4 juga mendukung UTF-8:

Contoh

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

Ketika browser mendeteksi ISO-8859-1 biasanya default ke Windows-1252, karena Windows-1252 memiliki 32 karakter internasional lagi.

Untuk melihat lebih dekat, silakan pelajari: Referensi Lengkap ISO-8859-1


Dalam HTML5: Unicode UTF-8

Spesifikasi HTML5 mendorong pengembang web untuk menggunakan rangkaian karakter UTF-8.

Contoh

<meta charset="UTF-8">

Kumpulan karakter yang berbeda dari UTF-8 dapat ditentukan dalam tag <meta>:

Contoh

<meta charset="ISO-8859-1">

Konsorsium Unicode mengembangkan standar UTF-8 dan UTF-16, karena rangkaian karakter ISO-8859 terbatas, dan tidak kompatibel dengan lingkungan multibahasa.

Standar Unicode mencakup (hampir) semua karakter, tanda baca, dan simbol di dunia.

Semua prosesor HTML5 dan XML mendukung UTF-8, UTF-16, Windows-1252, dan ISO-8859.

Untuk melihat lebih dekat, silakan pelajari: Referensi Unicode Lengkap .