DOCTYPE dan Charset UTF-8

DOCTYPE dan Charset UTF-8

Bagi teman-teman yang sudah terbiasa membangun sebuah web, tentunya sudah pasti mengenal DOCTYPE dan meta tag Charset UTF-8. Tapi mungkin sebagian teman-teman yang lain masih terasa asing, yuk kita cari tahu…

DOCTYPE, document type declaration sebuah keterangan, instruksi yang ditujukan untuk web browser bagaimana format penulisan atau aturan halaman tersebut akan ditampilkan.

” it is an instruction to the web browser about what version of HTML the page is written in”.

Bagaimana cara menuliskan DOCTYPE pada HTML 5 (versi saat HTML saat ini)?
Sebelumnya kita lihat dulu penulisan DOCTYPE pada HTML 4.01 Transitional

Jika kita perhatikan penulisannya sangat panjang bukan, hal ini berbeda jika kita menuliskan pada HTML 5

Sangat berbeda, sederhana dan simple untuk dituliskan di HTML 5.

Jika teman-teman tidak menuliskan DOCTYPE pada sebuah halaman web yang sedang dibangun, maka halaman tersebut akan tetap ditampilkan, namun web browser akan masuk ke dalam mode quirks mode.
Web yang tidak menyertakan DOCTYPE dianggap tidak mengikuti standar W3C.

Dulu Web browser seperti IE versi 4, Netscape 4 sangat sedikit atau bahkan tidak mengikuti standar W3C, mereka mengartikan sintaks CSS dengan versi mereka sendiri. Bagi seorang fron-end developer tentunya sangat menyulitkan kala itu, karena harus memilih salah satu dari browser yang ada, agar tampilan webnya sempurna.

Kendala tersebut dapat ditanggulangi dengan menambahkan DOCTYPE pada setiap halaman web, sehingga browser mengetahui bahwa standar penulisan sudah sesuai dengan W3C atau dikenal dengan istilah strict mode dan halaman web yang terdahulu yang tidak menuliskan DOCTYPE memiliki istilah quirks mode.

Kita lanjutkan ke meta tag Charset UTF-8

Pengertian meta tag itu sendiri, tag yang ada di halaman HTML yang berfungsi sebagai pemberi informasi metadata dari sebuah halaman web. Meta tag ini ditujukan kepada Browser atau mesin pencari (search engine).
Penulisan meta tag ini biasanya diikuti dengan atribut, misalnya atribut name, keyword, description dll.

Untuk kali ini kita akan membahas meta tag Charset UTF-8, karena hal ini sering kita jumpai pada saat membuat sebuah halaman web.

Berfungsi memberikan informasi atau perintah berupa instruksi kepada browser, untuk menterjemahkan karakter-karakter yang ada pada halaman web kedalamam UTF-8.

Karakter set paling sederhana dan juga paling awal digunakan adalah karakter set ASCII, (dalam HTML ditulis sebagai charset=”us-ascii”). Karakter set ini terbatas pada huruf latin (a-z, A-Z) dan beberapa karakter lain seperti angka, spasi, tab, dll dengan total hanya 128 karakter.

Karakter set “us-ascii” kemudian dikembangkan menjadi karakter ANSI, atau dikenal juga sebagai ISO-8859-1 (dalam HTML ditulis sebagai charset=”ISO-8859-1”). Karakter ANSI mendukung 256 karakter, dan umumnya digunakan pada HTML versi 2.0 sampai dengan HTML 4.01.

Pemasalahan pada karakter set ASCII maupun ANSI adalah tidak menyertakan karakter non-latin seperti huruf arab, cina, jepang, dll.

Pada awal perkembangan XHTML, diperkenalkan karakter set UTF-8 (Unicode Transformation Format-8) yang mendukung hampir seluruh karakter yang ada di dunia. Dalam perkembangan selanjutnya, HTML5 juga menggunakan UTF-8 sebagai charset standar. Dengan menggunakan UTF-8, kita tidak perlu khawatir mengenai karakter atau bahasa apa yang akan digunakan. UTF-8 mendukung hingga lebih dari 10.000 karakter.

Jadi teman-teman jangan lupa untuk selalu menyertakan meta tag Charset UTF-8, meskipun browser yang ada saat ini sudah sangat canggih, ketika kita lupa menuliskan meta tag tersebut (akan diencoding ke UTF-8).

Sekian dari kami, semoga artikel ini bermanfaat bagi teman-teman semua.

Comments are closed.