17
UNIVERSITAS ISLAM NEGERI MULTIMEDIA DATA TEKNOLOGI Yang diampuh oleh M.Ridha,ST Judul : Perbandingan ASCII Character Sets, Extended Charakter Sets, Unicode. FITRIANDINI (10751000174) ( [email protected] ) TEKNIK INFORMATIKA

Task MDT3 Charakter

Embed Size (px)

Citation preview

Page 1: Task MDT3 Charakter

UNIVERSITAS ISLAM NEGERI

MULTIMEDIA DATA TEKNOLOGIYang diampuh oleh M.Ridha,ST

Judul : Perbandingan ASCII Character Sets, Extended Charakter Sets, Unicode.

FITRIANDINI (10751000174)( [email protected] )

TEKNIK INFORMATIKASAINS DAN TEKNOLOGI

UIN SULTAN SYARIF QASIM2009

Page 2: Task MDT3 Charakter

Sejarah Text

Text atau simbol telah dikenal sebagai alat komunikasi sejak 6000 tahun yang lalu di Mesopotamia, Mesir, Sumeria dan Babilonia. Perkembangan yang paling fenomenal dari text adalah saat digunakan pada internet sebagai bagian yang menentukan tampilan pada layar monitor. Bahkan saat ini perkembangan HTML (Hypertext Markup Language) telah menjadi unsur penting dalam pembuatan presentasi apalagi yang berbasis multimedia.

Huruf, angka dan karakteristik-karakteristik khusus pada komputer direpresentasikan dengan skema pengkodean biner artinya, nilai off/on 0 dan 1 disusun dengan cara tertentu agar bisa merepresentasikan karakter, digit atau bentuk-bentuk lain.

Terdapat beberapa karakter yang saat ini digunakan pada komputer yaitu ASCII, Extended character sets dan Unicode. Kode ASCII merupakan suatu standard internasional yang dibuat oleh American National Standars Institute (ANSI) untuk mendefinisikan bagaimana komputer menulis dan membaca karakter (Seperti karakter untuk menandai akhir baris) Setiap karakter dipresentasikan dengan angka. ASCII lebih bersifat universal. Kode ASCII selalu digunakan pada komputer dan alat komunikasi lain untuk menunjukkan teks.

Keunggulan Unicode (16 bit) dari ASCII (8 bit) adalah kemampuanya untuk menyimpan symbol / karakter yang jauh lebih besar. Himpunan 256 karakter pertama dari Unicode merupakan pemetaan karakter ASCII 8 bit sehingga Unicode tetap kompatibel dengan ASCII. Selain mempresentasikan seluruh karakter ASCII, Unicode dapat mempresentasikan berbagai macam simbol diluar ASCII, seperti huruf Arab, Kanji, Hiragana, Katakana dan lain-lain.

Berikut merupakan penulisan karakter pada komputer.

ASCII ( red : ask-ee)

ASCII (American Standard Code for Information Interchange) adalah kode biner yang secara luas dipakai pada mikrokomputer. ASCII mempresentasikan setiap karakter sebagai 8 bit dimulai dari 0000 0000 hingga 1111 1111 maka total kombinasi yang dihasilkan sebanyak 256. Kode 0 hingga 255 dalam sistem bilangan desimal untuk menuliskan huruf, angka dan tanda baca standard dalam bahasa Inggris. ASCII versi baru bernama Extended ASCII yang bisa mencakup karakter semacam simbol matematis dan huruf-huruf Yunani. Namun,

Page 3: Task MDT3 Charakter

256 huruf ASCII tidak akan cukup untuk menangani bahasa-bahasa lain semacam bahasa Cina atau Jepang yang memiliki ribuan karakter.

Terdapat dua macam ASCII yang mempergunakan yaitu 7 bit dan 8 bit. Pada ASCII yang mempergunakan 7 bit, terdapat dua kelompok karakter, yaitu 1. Karakter Kontrol, digunakan untuk mengontrol pengiriman atau transmisi data 2. Karakter Informasi, merupakan karakter yang mewakili data

Tabel Karakter ASCIIKarakter   ASCII-8   Karakter   ASCII-8

A   0100 0001   N   0100 1110B   0100 0010   O   0100 1111C   0100 0011   P   0101 0000D   0100 0100   Q   0101 0001E   0100 0101   R   0101 0010F   0100 0110   S   0101 0011G   0100 0111   T   0101 0100H   0100 1000   U   0101 0101I   0100 1001   V   0101 0110J   0100 1010   W   0101 0111K   0100 1011   X   0101 1000L   0100 1100   Y   0101 1001M   0100 1101   Z   0101 1010             0   0011 0000   5   0011 01011   0011 0001   6   0011 01102   0011 0010   7   0011 01113   0011 0011   8   0011 10004   0011 0100   9   0011 1001!   0010 0001   ;   0011 1011

EXTENDED Character Sets

Tampilan karakter yang digunakan dalam berbagai abjad (Eropa dan Asia) dan simbol-simbol khusus. Untuk menampilkan salah satu karakter gunakan &#n; , dimana n adalah angka yang sesuai. Sejumlah bahasa mengunakan karakter yang lebih besar daripada kisaranyanya. Contoh nilai tipe char Jepang dan Cina. GNU C Library berisi dukungan untuk 2 mekanisme menangani rangkaian karakter diperpanjang yaitu multibyte dan karakter lebar. Berikut merupakan karakter extended HTML.

Tabel Karakter Extended Character Sets

ASCII char ASCII char ASCII Char ASCII char

Page 4: Task MDT3 Charakter

257 ā 258 Sebuah 259 Sebuah 260 Sebuah

261 sebuah 262 C 263 Ć 264 C

265 C 266 C 267 C 268 Č

269 č 270 D 271 D 272 ©

273 đ 274 E 275 E 276 E

277 E 278 E 279 E 280 E

281 ę 282 E 283 E 284 G

285 G 286 Ğ 287 Ğ 288 G

289 G 290 Ģ 291 Ģ 292 H

293 h 294 H 295 H 296 Ĩ

297 Ĩ 298 Ī 299 Ī 300 Aku

301 Aku 302 Į 303 Į 304 Aku

305 ı 306 IJ 307 IJ 308 J

309 J 310 Ķ 311 Ķ 312 ĸ

313 L 314 L 315 L 316 ļ

317 L 318 L 319 L 320 L

321 Ł 322 Ł 323 N 324 N

325 Ņ 326 Ņ 327 N 328 N

329 ʼn 330 Ŋ 331 Ŋ 332 O

333 ō 334 O 335 O 336 O

337 o 338 Π339 Π340 R

341 ŕ 342 R 343 R 344 R

345 R 346 S 347 Ś 348 S

349 s 350 Ş 351 Ş 352 Š

353 š 354 T 355 Ţ 356 T

357 ť 358 Ŧ 359 Ŧ 360 U

361 ũ 362 U 363 Ū 364 U

365 U 366 U 367 U 368 Ű

369 ű 370 U 371 U 372 W

373 w 374 Y 375 Y 376 Ÿ

377 Z 378 Z 379 Z 380 Z

381 Ž 382 ž 383 ſ 384 ƀ

385 Ɓ 386 Ƃ 387 Ƃ 388 Ƅ

389 ƅ 390 Ɔ 391 Ƈ 392 ƈ

393 Ɖ 394 Ɗ 395 Ƌ 396 ƌ

Page 5: Task MDT3 Charakter

397 ƍ 398 Ǝ 399 Ə 400 Ɛ

401 Ƒ 402 ƒ 403 Ɠ 404 Ɣ

405 ƕ 406 Ɩ 407 Ɨ 408 Ƙ

409 ƙ 410 ƚ 411 ƛ 412 Ɯ

413 Ɲ 414 ƞ 415 Ɵ 416 O

417 o 418 Ƣ 419 Ƣ 420 Ƥ

421 ƥ 422 Ʀ 423 Ƨ 424 ƨ

425 Σ 426 ƪ 427 ƫ 428 Ƭ

429 ƭ 430 Ʈ 431 U 432 U

433 Ʊ 434 Ʋ 435 Ƴ 436 ƴ

437 Z 438 Z 439 Ʒ 440 Ƹ

441 ƹ 442 ƺ 443 ƻ 444 Ƽ

445 ƽ 446 ƾ 447 Ƿ 448 |

449 ǁ 450 ǂ 451 ! 452 DŽ

453 DŽ 454 dž 455 LJ 456 LJ

457 lj 458 NJ 459 NJ 460 nj

461 Ǎ 462 ǎ 463 Ǐ 464 ǐ

465 Ǒ 466 ǒ 467 Ǔ 468 ǔ

469 Ǖ 470 ǖ 471 Ǘ 472 ǘ

473 Ǚ 474 ǚ 475 Ǜ 476 ǜ

477 ǝ 478 Ǟ 479 Ǟ 480 Ǡ

481 ǡ 482 Ǣ 483 Ǣ 484 Penilai

485 penilai 486 Ǧ 487 Ǧ 488 Ǩ

489 ǩ 490 Ǫ 491 Ǫ 492 Ǭ

493 ǭ 494 Ǯ 495 Ǯ 496 ǰ

497 DZ 498 DZ 499 dz 500 Dibolehkan

501 dibolehkan 502 Ƕ 503 Ƿ 504 Ǹ

505 ǹ 506 Ǻ 507 ǻ 508 Ǽ

509 ǽ 510 Ǿ 511 ǿ 512 Ȁ

513 ȁ 514 Ȃ 515 ȃ 516 Ȅ

517 ȅ 518 Ȇ 519 ȇ 520 Ȉ

521 ȉ 522 Ȋ 523 ȋ 524 Ȍ

525 ȍ 526 Ȏ 527 ȏ 528 Ȑ

529 ȑ 530 Ȓ 531 ȓ 532 Ȕ

Page 6: Task MDT3 Charakter

533 ȕ 534 Ȗ 535 ȗ 536 Ş

537 ş 538 T 539 Ţ 540 Ȝ

541 ȝ 542 Ȟ 543 ȟ 544 Ƞ

545 ȡ 546 Ȣ 547 ȣ 548 Ȥ

549 ȥ 550 Ȧ 551 ȧ 552 Ȩ

553 Ȩ 554 Ȫ 555 ȫ 556 Ȭ

557 ȭ 558Nomor ini sesuai dengan

559nomor ini sesuai dengan

560 Ȱ

561 Ȱ 562 Á 563 ȳ 564 ȴ

UNICODE

Dikembangkan pada awal tahun 1990. Diciptakan oleh konsorsium perusahaan seperti Apple, Microsoft, HP, Digital dan IBM kemudian digabungkan dengan standar ISO-10646 untuk menghasilkan satu standar pada tahun 1993. Unicode memakai 2 byte (16bit) untuk mempresentasika karakter, tidak hanya sekedar 1 byte (8 bit). Dengan Demikan, banyak karakter yang dapat dipresentasikan adalah 216 atau 65.536 karakter.

Unicode dirancang untuk mencakupi bahasa/teks yang ada dunia termasuk simbol-simbol ilmiah dan bahasa-bahasa pada subjek ilmiah. Ini meghilangkan kerumitan multibyte rangkaian karakter yang sedang digunakan pada UNIX dan Windows untuk mendukung bahasa Asia. Unicode sudah merupakan dasar untuk satu sistem operasi Windows / NT.

Unicode merupakan paket karakter standar yang digunakan pada NTFS dan menggantikan karakter older-single byte ASCII. Setiap karakter pada kebanyakan bahasa yang natural adalah direpresentasikan dengan double-byte number dalam paket karakter Unicode.

Set karakter Unicode disusun dalam urutan abjad dari nama referensi entitas terkait. Kita dapat menggunakan karakter seperti "β" secara langsung (dengan menyalin dan menyisipkan karakter) atau dapat memilih untuk referensi mereka dengan entitas referensi sebagai “β” dalam elemen token presentasi.

Tabel karakter UnicodeAkuIacute Í ic icirc î Icirc Î Dingin И dingin и

Page 7: Task MDT3 Charakter

dingin и Idot Aku iecy е IEcy Е iexcl ¡ IFF ⇔Ifr ℑ Igrave Ì igrave ì iiint ∭ iiota ℩ IJlig IJijlig ij Im ℑ Imacr Ī imacr ī gambar ℑ imagline ℐ

imagpart ℑ imath ı imof ⊷Menyiratkan

⇒ di ∈ incare ℅

infin ∞ inodot ı int ∫ Int ∬ intcal ⊺ bilangan ℤ

Integral ∫ intercal ⊺Persimpangan

⋂ intlarhk

⨗ InvisibleComma

IOcy Ё

iocy ё Iogon Į iogon įsedikitpun

ι iquest ¿ Iscr ℐ

isin ∈ isindot ⋵ isinE ⋹ isins ⋴ isinv ∈ Itilde ĨItilde Ĩ itilde Ĩ iukcy і Iukcy І Iuml Ï iuml ïJjcirc J jcy й jsercy ј Jsercy Ј Jukcy Є jukcy єKkappa κ kappav κ Kcedil Ķ kcedil ķ Kcy К kcy кkgreen ĸ khcy х KHcy Х KJcy Ќ kjcy ќ kcy кL

lacute L Lacute Llaemptyv

⦴ lagran ℒ lAarr ⇚ Lambda Λ

lambda λ Lang " lang < langd ⦑ langle <pangkuan

Laplacetrf ℒ laquo « larr ← Larr ↞ lArr ⇐ lArr ⇐larrb ⇤ larrbfs ⤟ larrfs ⤝ larrhk ↩ larrlp ↫ larrb ⇐larrtl ↢ lbbrk 〔 lbrace ( lbrack [ lbrke ⦋ lcaron L

lcaron L Lcaron L Lcedil L lcedil ļ lceil ⌈ lcub (Lcy Л lcy л ldquo " ldquor " le ≤ le ≦

LeftAngleBracket

<Leftarrow

⇐ Leftarrow

←Leftarrow

←LeftArrowBar

⇤LeftArrowRightArrow

leftarrowtail

↢ LeftCeiling

LeftDoubleBracket

[

LeftDownTeeVector

⥡ LeftDownVector

⇃LeftDownVectorBar

LeftFloor ⌊leftharpoondown

↽leftharpoonup

↼leftleftarrows

⇇ Leftrightarrow

⇔leftrightarrow

LeftFloor ⌊leftharpoondown

↽leftharpoonup

↼leftleftarrows

⇇ leftrightharpoons

⇋leftrightsquigarrow

leftrightharpoons

⇋ leftrightsquigarr

↭ LeftRightVe

⥎ LeftTee

⊣ LeftTeeArrow

↤ LeftTeeVector

Page 8: Task MDT3 Charakter

ow ctor

leftthreetimes

⋋ LeftTriangle

⊲LeftTriangleBar

⧏LeftTriangleEqual

⊴ LeftUpDownVector

⥑ LeftUpVector

kaki ⋚ kaki ⋚ leq ≤ leqq ≦ lessapprox ≲ lessdot ⋖

lesseqgtr ⋚ lesseqqgtr

⋚LessEqualGreater

⋚LessFullEqual

≦ LessGreater

≶ lessgtr ≶

lessgtr ≶ lesssim ≲ LessTilde

≲ lfloor ⌊ lg ≶ lhard ↽

lharu ↼ ljcy љ LJcy Љ LL ⋘ ll « llarr ⇇

llcorner ⌞ Lleftarrow

⇚ llhard ⥫ Lmidot

L lmidot L lmoust ⎰

lne ≨ lnE ≨ lneq ≨ lneqq ≨ lnsim ⋦ lobrk [

looparrowleft

↫ looparrowright

↬ lopar 〘 lowbar

_LowerLeftArrow

LowerRightArrow

Loz ◊ lpar ( lrarr ⇆ lrcorner

⌟ lrhar ⇋ lrtri ⊿

lscr ℓ Lscr ℒ lsh ↰ Lsh ↰ lsim ≲ lsqb [lsquo ' lsquor , lstrok Ł Lstrok Ł Lt « lt <ltdot ⋖ lthree ⋋ ltimes ⋉ ltri ◃ ltrie ⊴ ltrif ◂M

macr ¯ laki-laki ♂ malt ✠ Maltese

✠ peta ↦ mapsto ↦

mapstodown

↧ mapstoleft

↤ mapstoup

↥ marker

▮ MCv М mcomma ⨩

MCv м mdash --mDDot

∺measuredangle

∡ MediumSpace

  Mellintrf ℳ

Mfr 𝔐 mfr 𝔪 mho ℧ mikro μpertengahan

| midast *

midcir ⫰ middot · minus --minusb

⊟ minusd ∸ minusdu ⨪

MinusPlus ∓ mldr ...mnplus

∓ model ⊧ mp ∓ Mscr ℳ

mstpos ∾ mu μMultimap

⊸ mumap

Nnabla ∇ nacute N Nacute N nang ∠ ̸ tidur ≉ tengkuk ⩰ ̸

napid ≋ ̸ napos ʼnnapprox

≉ natur ♮ alam ♮ alami ℕ

nbsp   nbump ≎ ̸ nbumpe

≏ ̸ ncap ⩃ Ncaron N ncaron N

Page 9: Task MDT3 Charakter

Ncedil Ņ ncedil Ņ ncong ≇ ncongdot

⩭ ̸ ncup ⩂ ncy н

Ncy Н ndash -- ne ≠nearhk

⤤ neArr ⇗ nearr ↗

nearrow ↗ nedot ≠ nequiv ≢ nesear ⤨ nesim ≂ ̸NestedGreaterGreater

»

NestedLessLess

« Newline nexist ∄ nexists

∄ nge ≱ ngeqq ≱

ngeqslant ≱ nges ≱ ngsim ≵ NGT ≯\ NGT »̸ ngtr ≯\nharr ↮ nhArr ⇎ ni ∋ NIV ∋ njcy њ NJcy Њ

nlArr ⇍ nlarr ↚ nldr ‥ nlE ≰ nleftarrow ↚ nLeftarrow

nLeftrightarrow

⇎ nleftrightarrow

↮ nleq≰ ⃥ nleqq ≰ nleqslant ≰ nles ≰

nless <\ nlsim ≴ NLT <\ nltri ⋪ nltrie ⋬ nmid ∤

NoBreakNonBreakingSpace

  Nopf ℕ tidak ¬NotCongruent

≢ NotCupCap

NotDoubleVerticalBar

∦ NotElement

∉ NotEqual

≠NotExists

∄ NotGreater ≯\NotGreaterFullEqual

NotGreaterLess

≹NotGreaterSlantEqual

≱NotGreaterTilde

≵ notin ∉ NotLeftTriangle

⋪NotLeftTriangleEqual

NotLess <\NotLessGreater

≸NotLessSlantEqual

≰NotLessTilde

≴ notni ∌ notniva ∌

NotPrecedes

⊀NotPrecedesSlantEqual

⋠NotReverseElement

∌NotRightTriangle

⋫NotRightTriangleEqual

⋭NotSquareSubsetEqual

NotSquareSupersetEqual

⋣ NotSubset

⊄NotReverseElement

∌NotSubsetEqual

⊈ NotSucceeds

⊁NotSucceedsSlantEqual

NotSuperset

⊅NotSupersetEqual

⊉ NotTilde

≁NotTildeEqual

≄ NotTildeTilde

≉ NotVerticalBar

npar ∦ nparallel∦ NPR ⊀ nprcue

⋠ nprec ⊀ nrarr ↛

nrArr ⇏ nrightarrow

↛ nRightarrow

⇏ nrtri ⋫ nrtrie ⋭ nsc ⊁

nsccue ⋡ nsim ≁ nsime ≄ nsimeq

≄ nsqsube ⋢ nsqsupe ⋣

nsub ⊄ nsubE ⊈ nsube ⊈ nsubs ⊄ nsubseteq ⊈ nsubsete ⊈

Page 10: Task MDT3 Charakter

et qq

nsucc ⊁ nsup ⊅ nsupE ⊉ nsupe ⊉ nsupset ⊅ nsupseteq

nsupseteqq⊉ ntgl ≹ Ntilde Ñ ntilde ñ ntlg ≸ ntriangleleft

ntrianglelefteq

⋬ ntriangleright

⋫ntrianglerighteq

⋭ nu ν num # numero №

numsp   nVDash ⊯ nVdash

⊮ nvDash

⊭ nvdash ⊬ nvge ≱

nvgt ≯\ nvHarr ⇎ nvlArr ⇍ nvle ≰ nvlt <\ nvrArr ⇏

nwarr ↖ nwArr ⇖ nwarrow

↖nvle ≰ nvlt <\ nvrArr ⇏

OOacute Ó oacute ó oast ⊛ ocir ⊚ ocirc ô Ocirc ÔOcy О ocy о odash ⊝ odblaco Odblac O odot ⊙

OElig Œ oelig œ ogon ˛ograve

ò Ograve Ò ohm Ω

sendi ∮ olarr ↺ omacr ōOmacr

O Omega Ω omega ω

ominus ⊖OpenCurlyDoubleQuote

"OpenCurlyQuote

' oplus ⊕ atau ∨ orarr ↻

urutan ℴ orderof ℴ ordf ª ordm º origof ⊶ oS Ⓢoscr ℴ Oslash Ø oslash ø osol ⊘ Otilde Õ otilde õ

otimes ⊗ Ouml Ö ouml ö ovbar ⌽ OverBar ¯OverBrace

(

OverBar ¯OverBrace

(OverParenthesis

(

Ppar ∥ para ¶ paralel ∥ bagian∂ PartialD ∂ pcy п

Pcy П percnt %periode

. permil ‰ pelaku ⊥ pertenk ‱

pertenk ‱Phi Φ phi φ phiv φ phmmat ℳ telepon ☎Pi Π pi π garpu ⋔ PIV π planckh ℎ plankv ℏ

PIV π planckh ℎ plankv ℏ ditambah

+ plusb ⊞ PlusMinus

±

plusmn ± pm ±Poincareplane

ℌ Popf ℙ pon £ pr ≺

Prap ≾ prcue ≼ prec ≺ precapprox

≾ preccurlyeq

≼ Mendahului

PrecedesSl ≼ precnap ⋨ Preced ≾ precns⋨ precsim ≾ Perdana "

Page 11: Task MDT3 Charakter

antEqual proxesTilde

im

perdana ' prima ℙ prnap ⋨ prnE ⪵ prnsim ⋨ prod Π

Produk Π profalar ⌮ profline

⌒ profsurf

⌓ prop Α Proporsi ∷

Proporsional

Α propto Α prsim ≾ prurel ⊰ psi ψ Psi Ψ

QQfr 𝔔 qfr 𝔮 qint ⨌Qopf ℚ qopf 𝕢 qprime ⁗

Qscr 𝒬 quaternions

ℍ quatint ⨖ pencarian

? questeq ≟ quot "

Unicode memiliki cara untuk mensintesis sebuah karakter beraksen dengan cara menggabungkan aksen simbol dan karakter dasar. Misalnya, menggabungkan 'a' dan '~' membuat 'seorang' dengan tilde. Lebih dari dua aksen simbol dapat ditambahkan ke karakter dasar.

Bahasa seperti Thailand perlu mengkombinasikan karakter. Menggabungkan karakter adalah satu-satunya metode untuk mengekspresikan karakter dalam bahasa-bahasa. Namun, beberapa masalah muncul. Gandakan Encoding Ada beberapa cara untuk mengekspresikan karakter yang sama. Sebagai contoh, u dengan umlaut dapat dinyatakan sebagai u 00 fc dan juga sebagai u 0.075 + U 0.308.

Kelebihan Unicode character set dibandingkan dengan character set yang propietary:

Menyusun character set sendiri, harus membujuk-membujuk vendor operating system untuk mensupportnya.

Dengan Unicode, operating system pasti mensupportnya, tinggal supply file font dan keyboard driver.

Untuk di-golive-kan ke Internet Unicode juga bisa, Internet menggunakan UTF-8 (suatu varian Unicode) untuk pertukaran data.

Page 12: Task MDT3 Charakter

REFERENSI

www.google.com/translate

http://www.unicode.org

www.baliunicode-ufaq.com

www.wordpress.com/SukadiBlog

Suhanto@geeks.”ASCII.ANSI,ISO-8859-1,dan UTP-8”.20/10/2008

www.syopian.net