Co to jest Unicode?

Unicode jest uniwersalnym standardem kodowania znaków, który przypisuje unikalny numer (zwany punktem kodowym) każdemu znakowi używanemu w językach pisanych na całym świecie. W przeciwieństwie do starszych systemów kodowania, takich jak ASCII, które obsługiwały jedynie 128 znaków, Unicode może reprezentować ponad 1,1 miliona znaków — w tym litery ze wszystkich alfabetów, symbole, emotikony i znaki specjalne. Czyni to go niezbędnym przy tworzeniu oprogramowania działającego w różnych językach i na różnych platformach.

Punkt kodowy Unicode jest zazwyczaj zapisywany jako U+ po którym następuje liczba szesnastkowa. Na przykład litera "A" ma kod U+0041, a emotikona 😀 ma kod U+1F600. Różne języki programowania i systemy reprezentują te punkty kodowe w różnych formatach, dlatego konwersja między formatami jest często potrzebna.

Opis narzędzia

To narzędzie konwertuje tekst pomiędzy zwykłymi znakami a różnymi formatami reprezentacji Unicode. Obsługuje dwukierunkową konwersję pomiędzy sześcioma różnymi formatami: zwykły tekst, punkty kodowe Unicode, sekwencje ucieczki JavaScript, encje numeryczne HTML, wartości szesnastkowe i wartości dziesiętne. Wystarczy wybrać format wejściowy i wyjściowy, a konwersja odbywa się natychmiast.

Przykłady

Wejście Format Wyjście
Hello Punkty kodowe U+0048 U+0065 U+006C U+006C U+006F
Hello JS Escape \u0048\u0065\u006C\u006C\u006F
Hello Encje HTML Hello
Hello Szesnastkowy 0048 0065 006C 006C 006F
Hello Dziesiętny 72 101 108 108 111
😀 Punkty kodowe U+1F600
Привет JS Escape \u041F\u0440\u0438\u0432\u0435\u0442

Funkcje

  • Dwukierunkowa konwersja pomiędzy wszystkimi sześcioma formatami Unicode
  • Pełne wsparcie Unicode w tym emotikony i znaki spoza Basic Multilingual Plane (BMP)
  • Obsługa par zastępczych dla sekwencji ucieczki JavaScript z znakami powyżej U+FFFF