Unicode Nedir?

Unicode, dünya çapındaki yazılı dillerde kullanılan her karaktere benzersiz bir sayı (kod noktası olarak adlandırılır) atayan evrensel bir karakter kodlama standardıdır. Sadece 128 karakteri destekleyen eski kodlama sistemleri olan ASCII gibi sistemlerin aksine, Unicode 1,1 milyondan fazla karakteri—tüm alfabelerden harfler, semboller, emojiler ve özel karakterler dahil—temsil edebilir. Bu, farklı diller ve platformlar arasında çalışan yazılımlar geliştirmek için hayati öneme sahiptir.

Bir Unicode kod noktası genellikle U+ ardından bir onaltılık sayı şeklinde yazılır. Örneğin, “A” harfi U+0041, emoji 😀 ise U+1F600 şeklindedir. Farklı programlama dilleri ve sistemler bu kod noktalarını çeşitli biçimlerde temsil eder; bu yüzden biçimler arasında dönüşüm sıklıkla gereklidir.

Araç açıklaması

Bu araç, düz metin ile çeşitli Unicode temsil biçimleri arasında metin dönüşümü yapar. Altı farklı biçim arasında çift yönlü dönüşümü destekler: düz metin, Unicode kod noktaları, JavaScript kaçış dizileri, HTML sayısal varlıkları, onaltılık değerler ve ondalık değerler. Giriş ve çıkış biçimlerini seçmeniz yeterlidir; dönüşüm anında gerçekleşir.

Örnekler

Girdi Biçim Çıktı
Hello Kod Noktaları U+0048 U+0065 U+006C U+006C U+006F
Hello JS Escape \u0048\u0065\u006C\u006C\u006F
Hello HTML Varlıkları Hello
Hello Onaltılık 0048 0065 006C 006C 006F
Hello Ondalık 72 101 108 108 111
😀 Kod Noktaları U+1F600
Привет JS Escape \u041F\u0440\u0438\u0432\u0435\u0442

Özellikler

  • İkili yönlü dönüşüm tüm altı Unicode biçimi arasında
  • Tam Unicode desteği emoji ve Basic Multilingual Plane (BMP) dışındaki karakterler dahil
  • Surrogate çift işleme JavaScript kaçış dizileri için U+FFFF üzerindeki karakterler
  • Gerçek zamanlı dönüşüm yazarken anında sonuç
  • Kopyala ve takas işlevi dönüşümleri hızlıca tersine çevirmek için

Kullanım senaryoları

  • Web geliştirme: Özel karakterleri HTML varlıklarına dönüştürerek web sayfalarında güvenli görüntülenmesini sağlamak
  • JavaScript/JSON kodlaması: ASCII dışı karakterleri JavaScript dizgileri veya JSON dosyalarında kullanmak için kaçırmak
  • Kodlama sorunlarını ayıklama: Karakterlerin tam kod noktalarını inceleyerek metin kodlama problemlerini teşhis etmek
  • Çapraz platform metin işleme: Unicode'u yerel olarak desteklemeyen sistemler için karakterleri sayısal biçimlere dönüştürmek
  • Unicode öğrenme: Farklı karakterlerin çeşitli kodlama biçimlerinde nasıl temsil edildiğini keşfetmek