Pengkodean HTML (Set Karakter)
Untuk menampilkan halaman HTML dengan benar, browser web harus mengetahui set karakter mana yang akan digunakan.
Dari ASCII ke UTF-8
ASCII adalah standar pengkodean karakter pertama. ASCII mendefinisikan 128 karakter berbeda yang dapat digunakan di internet: angka (0-9), huruf Inggris (AZ), dan beberapa karakter khusus seperti ! $ + - ( ) @ < > .
ISO-8859-1 adalah set karakter default untuk HTML 4. Kumpulan karakter ini mendukung 256 kode karakter yang berbeda. HTML 4 juga mendukung UTF-8.
ANSI (Windows-1252) adalah set karakter Windows asli. ANSI identik dengan ISO-8859-1, kecuali ANSI memiliki 32 karakter tambahan.
Spesifikasi HTML5 mendorong pengembang web untuk menggunakan rangkaian karakter UTF-8, yang mencakup hampir semua karakter dan simbol di dunia!
Atribut charset HTML
Untuk menampilkan halaman HTML dengan benar, browser web harus mengetahui set karakter yang digunakan di halaman tersebut.
Ini ditentukan dalam <meta>
tag:
<meta charset="UTF-8">
Perbedaan Antara Set Karakter
Tabel berikut menampilkan perbedaan antara set karakter yang dijelaskan di atas:
Mati rasa | ASCII | ANSI | 8859 | UTF-8 | Keterangan |
---|---|---|---|---|---|
32 | ruang angkasa | ||||
33 | ! | ! | ! | ! | tanda seru |
34 | " | " | " | " | tanda kutip |
35 | # | # | # | # | tanda Nomor |
36 | $ | $ | $ | $ | tanda dollar |
37 | % | % | % | % | tanda persen |
38 | & | & | & | & | simbol untuk 'dan |
39 | ' | ' | ' | ' | apostrof |
40 | ( | ( | ( | ( | tanda kurung kiri |
41 | ) | ) | ) | ) | kurung kanan |
42 | * | * | * | * | asterisk |
43 | + | + | + | + | lebih banyak tanda |
44 | , | , | , | , | koma |
45 | - | - | - | - | tanda hubung-minus |
46 | . | . | . | . | titik |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | angka nol |
49 | 1 | 1 | 1 | 1 | angka satu |
50 | 2 | 2 | 2 | 2 | angka dua |
51 | 3 | 3 | 3 | 3 | angka tiga |
52 | 4 | 4 | 4 | 4 | angka empat |
53 | 5 | 5 | 5 | 5 | angka lima |
54 | 6 | 6 | 6 | 6 | angka enam |
55 | 7 | 7 | 7 | 7 | angka tujuh |
56 | 8 | 8 | 8 | 8 | angka delapan |
57 | 9 | 9 | 9 | 9 | angka sembilan |
58 | : | : | : | : | usus besar |
59 | ; | ; | ; | ; | titik koma |
60 | < | < | < | < | tanda kurang dari |
61 | = | = | = | = | tanda sama dengan |
62 | > | > | > | > | tanda lebih besar dari |
63 | ? | ? | ? | ? | tanda tanya |
64 | @ | @ | @ | @ | komersial di |
65 | SEBUAH | SEBUAH | SEBUAH | SEBUAH | huruf kapital latin A |
66 | B | B | B | B | huruf kapital latin B |
67 | C | C | C | C | huruf kapital latin C |
68 | D | D | D | D | huruf kapital latin D |
69 | E | E | E | E | huruf kapital latin E |
70 | F | F | F | F | huruf kapital latin F |
71 | G | G | G | G | huruf kapital latin G |
72 | H | H | H | H | huruf kapital latin H |
73 | Saya | Saya | Saya | Saya | huruf kapital latin I |
74 | J | J | J | J | huruf kapital latin J |
75 | K | K | K | K | huruf kapital latin K |
76 | L | L | L | L | huruf kapital latin L |
77 | M | M | M | M | huruf kapital latin M |
78 | n | n | n | n | huruf kapital latin N |
79 | ITU | ITU | ITU | ITU | huruf kapital latin O |
80 | P | P | P | P | huruf kapital latin P |
81 | Q | Q | Q | Q | huruf kapital latin Q |
82 | R | R | R | R | huruf kapital latin R |
83 | S | S | S | S | huruf kapital latin S |
84 | T | T | T | T | huruf kapital latin T |
85 | kamu | kamu | kamu | kamu | huruf kapital latin U |
86 | V | V | V | V | huruf kapital latin V |
87 | W | W | W | W | huruf kapital latin W |
88 | x | x | x | x | huruf kapital latin X |
89 | kamu | kamu | kamu | kamu | huruf kapital latin y |
90 | DENGAN | DENGAN | DENGAN | DENGAN | huruf kapital latin Z |
91 | [ | [ | [ | [ | kurung siku kiri |
92 | \ | \ | \ | \ | solidus terbalik |
93 | ] | ] | ] | ] | kurung siku kanan |
94 | ^ | ^ | ^ | ^ | aksen sirkumfleksa |
95 | _ | _ | _ | _ | garis rendah |
96 | ` | ` | ` | ` | aksen serius |
97 | sebuah | sebuah | sebuah | sebuah | huruf kecil latin a |
98 | B | B | B | B | huruf kecil latin b |
99 | C | C | C | C | huruf kecil latin c |
100 | D | D | D | D | huruf kecil latin d |
101 | e | e | e | e | huruf kecil latin e |
102 | F | F | F | F | huruf kecil latin f |
103 | G | G | G | G | huruf kecil latin g |
104 | H | H | H | H | huruf kecil latin h |
105 | Saya | Saya | Saya | Saya | huruf kecil latin i |
106 | J | J | J | J | huruf kecil latin j |
107 | k | k | k | k | huruf kecil latin k |
108 | aku | aku | aku | aku | huruf kecil latin l |
109 | M | M | M | M | huruf kecil latin m |
110 | n | n | n | n | huruf kecil latin n |
111 | Itu | Itu | Itu | Itu | huruf kecil latin o |
112 | P | P | P | P | huruf kecil latin p |
113 | Q | Q | Q | Q | huruf kecil latin q |
114 | R | R | R | R | huruf kecil latin r |
115 | S | S | S | S | huruf kecil latin s |
116 | T | T | T | T | huruf kecil latin t |
117 | kamu | kamu | kamu | kamu | huruf kecil latin u |
118 | v | v | v | v | huruf kecil latin v |
119 | w | w | w | w | huruf kecil latin w |
120 | x | x | x | x | huruf kecil latin x |
121 | kamu | kamu | kamu | kamu | huruf kecil latin y |
122 | dengan | dengan | dengan | dengan | huruf kecil latin z |
123 | { | { | { | { | kurung kurawal kiri |
124 | | | | | | | | | garis vertikal |
125 | } | } | } | } | kurung kurawal kanan |
126 | ~ | ~ | ~ | ~ | pasang surut |
127 | DARI | ||||
128 | € | tanda euro | |||
129 | | | | TIDAK DIGUNAKAN | |
130 | kan | tanda kutip rendah-9 tunggal | |||
131 | ƒ. | Huruf kecil latin f dengan kail | |||
132 | kan | tanda kutip ganda rendah-9 | |||
133 | … | elipsis horizontal | |||
134 | kan | belati | |||
135 | kan | belati ganda | |||
136 | Lalai | aksen sirkumfleksa huruf pengubah | |||
137 | kan | untuk seribu tanda | |||
138 | S | Huruf kapital latin S dengan caron | |||
139 | kan | tanda kutip sudut menunjuk kiri tunggal | |||
140 | Œ | Ligatur ibu kota Latin OE | |||
141 | | | | TIDAK DIGUNAKAN | |
142 | Ž | Huruf kapital latin Z dengan caron | |||
143 | | | | TIDAK DIGUNAKAN | |
144 | | | | TIDAK DIGUNAKAN | |
145 | ' | tanda kutip tunggal kiri | |||
146 | ' | tanda kutip tunggal kanan | |||
147 | “ | tanda kutip ganda kiri | |||
148 | ” | tanda kutip ganda kanan | |||
149 | • | peluru | |||
150 | – | dan lari | |||
151 | — | kamu lari | |||
152 | ~ | ombak kecil | |||
153 | ™ | tanda merek dagang | |||
154 | S | Huruf kecil latin s dengan caron | |||
155 | kan | tanda kutip sudut menunjuk kanan tunggal | |||
156 | œ | ligatur kecil latin oe | |||
157 | | | | TIDAK DIGUNAKAN | |
158 | ž | Huruf kecil latin z dengan caron | |||
159 | Ÿ. | Huruf kapital latin Y dengan diaeresis | |||
160 | ruang tanpa istirahat | ||||
161 | ¡ | ¡ | ¡ | tanda seru terbalik | |
162 | ¢. | ¢. | ¢. | tanda sen | |
163 | £ | £ | £ | tanda pound | |
164 | ¤. | ¤. | ¤. | tanda mata uang | |
165 | ¥ | ¥ | ¥ | tanda yen | |
166 | | | | | | | batang rusak | |
167 | kan | kan | kan | tanda bagian | |
168 | ¨. | ¨. | ¨. | diaeresis | |
169 | © | © | © | tanda hak cipta | |
170 | ª. | ª. | ª. | indikator ordinal feminin | |
171 | « | « | « | tanda kutip sudut ganda menunjuk ke kiri | |
172 | ¬. | ¬. | ¬. | tidak menandatangani | |
173 | | | | tanda hubung lembut | |
174 | ® | ® | ® | tanda terdaftar | |
175 | ¯ | ¯ | ¯ | garis makron | |
176 | ° | ° | ° | tanda derajat | |
177 | ± | ± | ± | tanda plus-minus | |
178 | ² | ² | ² | superskrip dua | |
179 | ³. | ³. | ³. | superskrip tiga | |
180 | ' | ' | ' | aksen akut | |
181 | μ. | μ. | μ. | tanda mikro | |
182 | kan | kan | kan | tanda pilcrow | |
183 | · | · | · | titik tengah | |
184 | ¸. | ¸. | ¸. | cedilla | |
185 | ¹. | ¹. | ¹. | superskrip satu | |
186 | º. | º. | º. | indikator ordinal maskulin | |
187 | » | » | » | tanda kutip sudut ganda menunjuk kanan | |
188 | ¼. | ¼. | ¼. | pecahan vulgar seperempat | |
189 | ½. | ½. | ½. | pecahan vulgar satu setengah | |
190 | ¾. | ¾. | ¾. | pecahan vulgar tiga perempat | |
191 | kan | kan | kan | tanda tanya terbalik | |
192 | PADA | PADA | PADA | Huruf kapital latin A dengan kuburan | |
193 | SEBUAH | SEBUAH | SEBUAH | Huruf kapital latin A dengan lancip | |
194 | SEBUAH | SEBUAH | SEBUAH | Huruf kapital latin A dengan sirkumfleksa | |
195 | SEBUAH | SEBUAH | SEBUAH | Huruf kapital latin A dengan tilde | |
196 | SEBUAH | SEBUAH | SEBUAH | Huruf kapital Latin A dengan diaeresis | |
197 | Oh | Oh | Oh | Huruf kapital Latin A dengan cincin di atas | |
198 | Æ. | Æ. | Æ. | Huruf kapital latin AE | |
199 | C | C | C | Huruf kapital latin C dengan cedilla | |
200 | ADALAH | ADALAH | ADALAH | Huruf kapital latin E dengan kuburan | |
201 | DIA | DIA | DIA | Huruf kapital Latin E dengan akut | |
202 | Ê. | Ê. | Ê. | Huruf kapital Latin E dengan sirkumfleksa | |
203 | E | E | E | Huruf kapital latin E dengan diaeresis | |
204 | SAYA | SAYA | SAYA | Huruf kapital latin I dengan kuburan | |
205 | SAYA | SAYA | SAYA | Huruf kapital latin I dengan akut | |
206 | SAYA | SAYA | SAYA | Huruf kapital latin I dengan circumflex | |
207 | SAYA | SAYA | SAYA | Huruf kapital latin I dengan diaeresis | |
208 | D | D | D | huruf kapital latin eth | |
209 | N | N | N | Huruf kapital latin N dengan tilde | |
210 | HAI | HAI | HAI | Huruf kapital latin O dengan kuburan | |
211 | Oh | Oh | Oh | Huruf kapital latin O dengan lancip | |
212 | PAYUNG | PAYUNG | PAYUNG | Huruf kapital latin O dengan sirkumfleksa | |
213 | HAI | HAI | HAI | Huruf kapital latin O dengan tilde | |
214 | HAI | HAI | HAI | Huruf kapital latin O dengan diaeresis | |
215 | × | × | × | tanda perkalian | |
216 | HAI | HAI | HAI | Huruf kapital latin O dengan guratan | |
217 | Ù. | Ù. | Ù. | Huruf kapital latin U dengan kuburan | |
218 | Ú. | Ú. | Ú. | Huruf kapital latin U dengan akut | |
219 | Û. | Û. | Û. | Huruf kapital latin U dengan circumflex | |
220 | Ü. | Ü. | Ü. | Huruf kapital latin U dengan diaeresis | |
221 | IDE | IDE | IDE | Huruf kapital latin Y dengan lancip | |
222 | TH | TH | TH | Huruf kapital Latin Thorn | |
223 | ß. | ß. | ß. | huruf kecil latin sharp s | |
224 | pada | pada | pada | Huruf kecil latin a dengan kuburan | |
225 | sebuah | sebuah | sebuah | Huruf kecil latin a dengan lancip | |
226 | sebuah | sebuah | sebuah | Huruf kecil latin a dengan circumflex | |
227 | sebuah | sebuah | sebuah | Huruf kecil latin a dengan tilde | |
228 | sebuah | sebuah | sebuah | Huruf kecil latin a dengan diaeresis | |
229 | sebuah | sebuah | sebuah | Huruf kecil latin a dengan cincin di atas | |
230 | æ. | æ. | æ. | huruf kecil latin ae | |
231 | C | C | C | Huruf kecil latin c dengan cedilla | |
232 | adalah | adalah | adalah | Huruf kecil latin e dengan kuburan | |
233 | Dia | Dia | Dia | Huruf kecil latin e dengan akut | |
234 | ê. | ê. | ê. | Huruf kecil latin e dengan circumflex | |
235 | e | e | e | Huruf kecil latin e dengan diaeresis | |
236 | Saya | Saya | Saya | Huruf kecil latin i dengan kuburan | |
237 | Saya | Saya | Saya | Huruf kecil latin i dengan akut | |
238 | Saya | Saya | Saya | Huruf kecil latin i dengan circumflex | |
239 | Saya | Saya | Saya | Huruf kecil latin i dengan diaeresis | |
240 | D | D | D | huruf kecil latin eth | |
241 | n | n | n | Huruf kecil latin n dengan tilde | |
242 | Hai | Hai | Hai | Huruf kecil latin o dengan kuburan | |
243 | Hai | Hai | Hai | Huruf kecil latin o dengan akut | |
244 | Payung | Payung | Payung | Huruf kecil latin o dengan circumflex | |
245 | Hai | Hai | Hai | Huruf kecil latin o dengan tilde | |
246 | Hai | Hai | Hai | Huruf kecil latin o dengan diaeresis | |
247 | ÷. | ÷. | ÷. | tanda pembagian | |
248 | Hai | Hai | Hai | Huruf kecil latin o dengan stroke | |
249 | ù. | ù. | ù. | Huruf kecil latin u dengan kuburan | |
250 | ú. | ú. | ú. | Huruf kecil latin u dengan akut | |
251 | dan | dan | dan | Huruf kecil latin dengan circumflex | |
252 | ü | ü | ü | Huruf kecil latin u dengan diaeresis | |
253 | ide | ide | ide | Huruf kecil latin y dengan akut | |
254 | th | th | th | Duri huruf kecil latin | |
255 | ÿ. | ÿ. | ÿ. | Huruf kecil latin y dengan diaeresis |
Set Karakter ASCII
ASCII menggunakan nilai dari 0 hingga 31 (dan 127) untuk karakter kontrol.
ASCII menggunakan nilai dari 32 hingga 126 untuk huruf, angka, dan simbol.
ASCII tidak menggunakan nilai dari 128 hingga 255.
Kumpulan Karakter ANSI (Windows-1252)
ANSI identik dengan ASCII untuk nilai dari 0 hingga 127.
ANSI memiliki seperangkat karakter eksklusif untuk nilai dari 128 hingga 159.
ANSI identik dengan UTF-8 untuk nilai dari 160 hingga 255.
Kumpulan Karakter ISO-8859-1
ISO-8859-1 identik dengan ASCII untuk nilai dari 0 hingga 127.
ISO-8859-1 tidak menggunakan nilai dari 128 hingga 159.
ISO-8859-1 identik dengan UTF-8 untuk nilai dari 160 hingga 255.
Kumpulan Karakter UTF-8
UTF-8 identik dengan ASCII untuk nilai dari 0 hingga 127.
UTF-8 tidak menggunakan nilai dari 128 hingga 159.
UTF-8 identik dengan ANSI dan 8859-1 untuk nilai dari 160 hingga 255.
UTF-8 melanjutkan dari nilai 256 dengan lebih dari 10.000 karakter berbeda.
Untuk melihat lebih dekat, pelajari Referensi Kumpulan Karakter HTML Lengkap kami .