UTF singkatan dari Unicode Transformation Format mengacu pada beberapa jenis pengkodean karakter Unicode, termasuk UTF-7, UTF-8, UTF-16, dan UTF-32.
UTF-7 menggunakan 7 bit untuk setiap karakter yang di rancang untuk mewakili karakter ASCII dalam pesan email yang di perlukan untuk encoding Unicode
UTF-8 adalah jenis yang paling populer dari Unicode encoding menggunakan satu byte untuk huruf standar bahasa inggris dan simbol,dua byte untuk tambahan latin dan karakter timur tengah. dan tifa byte untuk karakter asia. Karakter tambahan dapat di representasikan dengan menggunakan empat byte. UTF - 8 juga kompatibel dengan ASCII.
UTF - 16 extension dari UCS - 2 unicode encoding yang menggunakan 2 byte untuk mewakili 65.536 karakter namun UTF - 16 juga mendukung empat byte untuk karakter tambahan samapai satu juta
UTF - 32 Encoding mutibyte yang mewakili masing masing karakter dengan 4 byte
Kebanyakan teks dalam dokumen dan halaman web di kodekan menggunakan salah satu pengkodena di atas. Banyak program pengolah kata tidak memungkinkan kita untuk melihat karakter encoding pada sebuah dokumen yang terbuka. Meskipun beberapa dokumen menampilkan pengkodean di bagian bawah jendela dokumen atau di dalam file properties. Jika ingin melihat pengkodean yang di gunakan oleh sebuah halaman web anda dapat memilih view - view source untuk melihat halaman HTML. Pengkoden karakter jika di tetapkan akan terletak di bagian header,di bagian atas source HTML. Halaman yang menggunakan UTF - 8 mungkin akan terlihat seperti ini
XHTML: <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
HTML 5: <meta charset="UTF-8">
0 comments:
Post a Comment