Что такое Unicode?

Unicode — это универсальный стандарт кодирования символов, который присваивает уникальный номер (называемый кодовой точкой) каждому символу, используемому в письменных языках мира. В отличие от старых систем кодирования, таких как ASCII, поддерживающих лишь 128 символов, Unicode может представлять более 1,1 млн символов — буквы всех алфавитов, знаки, эмодзи и специальные символы. Это делает его незаменимым для создания программного обеспечения, работающего с разными языками и платформами.

Кодовая точка Unicode обычно записывается как U+ и шестнадцатеричное число. Например, буква «A» — U+0041, а эмодзи 😀 — U+1F600. Разные языки программирования и системы представляют эти кодовые точки в различных форматах, поэтому часто требуется преобразование между форматами.

Описание инструмента

Этот инструмент преобразует текст между обычными символами и различными представлениями Unicode. Он поддерживает двунаправленное преобразование шести разных форматов: обычный текст, кодовые точки Unicode, escape‑последовательности JavaScript, числовые сущности HTML, шестнадцатеричные значения и десятичные значения. Просто выберите входной и выходной форматы — и преобразование произойдёт мгновенно.

Примеры

Ввод Формат Вывод
Hello Кодовые точки U+0048 U+0065 U+006C U+006C U+006F
Hello JS Escape \u0048\u0065\u006C\u006C\u006F
Hello HTML‑сущности Hello
Hello Шестнадцатеричный 0048 0065 006C 006C 006F
Hello Десятичный 72 101 108 108 111
😀 Кодовые точки U+1F600
Привет JS Escape \u041F\u0440\u0438\u0432\u0435\u0442

Возможности

  • Двунаправленное преобразование между всеми шестью форматами Unicode
  • Полная поддержка Unicode, включая эмодзи и символы за пределами Basic Multilingual Plane (BMP)
  • Обработка суррогатных пар для escape‑последовательностей JavaScript с символами выше U+FFFF
  • Преобразование в реальном времени — результаты появляются мгновенно при вводе
  • Функции копирования и обмена для быстрого обратного преобразования

Сценарии использования

  • Web‑разработка: преобразование специальных символов в HTML‑сущности для безопасного отображения на веб‑страницах
  • Кодирование JavaScript/JSON: экранирование не‑ASCII символов для использования в строках JavaScript или файлах JSON
  • Отладка проблем кодировки: просмотр точных кодовых точек символов для диагностики проблем с кодировкой текста
  • Кроссплатформенная обработка текста: преобразование символов в числовые форматы для систем, не поддерживающих Unicode напрямую
  • Изучение Unicode: исследование того, как разные символы представлены в различных форматах кодирования