Что такое Unicode?

Unicode — это универсальный стандарт кодирования символов, который присваивает уникальный номер (называемый кодовой точкой) каждому символу, используемому в письменных языках мира. В отличие от старых систем кодирования, таких как ASCII, поддерживающих лишь 128 символов, Unicode может представлять более 1,1 млн символов — буквы всех алфавитов, знаки, эмодзи и специальные символы. Это делает его незаменимым для создания программного обеспечения, работающего с разными языками и платформами.

Кодовая точка Unicode обычно записывается как U+ и шестнадцатеричное число. Например, буква «A» — U+0041, а эмодзи 😀 — U+1F600. Разные языки программирования и системы представляют эти кодовые точки в различных форматах, поэтому часто требуется преобразование между форматами.

Описание инструмента

Этот инструмент преобразует текст между обычными символами и различными представлениями Unicode. Он поддерживает двунаправленное преобразование шести разных форматов: обычный текст, кодовые точки Unicode, escape‑последовательности JavaScript, числовые сущности HTML, шестнадцатеричные значения и десятичные значения. Просто выберите входной и выходной форматы — и преобразование произойдёт мгновенно.

Примеры

Ввод Формат Вывод
Hello Кодовые точки U+0048 U+0065 U+006C U+006C U+006F
Hello JS Escape \u0048\u0065\u006C\u006C\u006F
Hello HTML‑сущности Hello
Hello Шестнадцатеричный 0048 0065 006C 006C 006F
Hello Десятичный 72 101 108 108 111
😀 Кодовые точки U+1F600
Привет JS Escape \u041F\u0440\u0438\u0432\u0435\u0442

Возможности

  • Двунаправленное преобразование между всеми шестью форматами Unicode
  • Полная поддержка Unicode, включая эмодзи и символы за пределами Basic Multilingual Plane (BMP)
  • Обработка суррогатных пар для escape‑последовательностей JavaScript с символами выше U+FFFF