Какво е Unicode?

Unicode е универсален стандарт за кодиране на знаци, който присвоява уникален номер (наречен кодова точка) на всеки знак, използван в писмените езици по целия свят. За разлика от по-старите системи за кодиране като ASCII, които поддържат само 128 знака, Unicode може да представи над 1,1 милиона знака—включително букви от всички азбуки, символи, емотикони и специални знаци. Това го прави съществен за разработката на софтуер, който работи на различни езици и платформи.

Кодовата точка на Unicode обикновено се записва като U+, последвана от шестнадесетично число. Например буквата "A" е U+0041, а емотиконът 😀 е U+1F600. Различните програмни езици и системи представят тези кодови точки в различни формати, което е причината конвертирането между формати често да е необходимо.

Описание на инструмента

Този инструмент конвертира текст между обикновени знаци и различни формати за представяне на Unicode. Поддържа двупосочно конвертиране между шест различни формата: обикновен текст, кодови точки на Unicode, JavaScript escape последователности, HTML числови сущности, шестнадесетични стойности и десетични стойности. Просто изберете входния и изходния формат, и конвертирането се извършва мигновено.

Примери

Вход Формат Изход
Hello Code Points U+0048 U+0065 U+006C U+006C U+006F
Hello JS Escape \u0048\u0065\u006C\u006C\u006F
Hello HTML Entities Hello
Hello Hexadecimal 0048 0065 006C 006C 006F
Hello Decimal 72 101 108 108 111
😀 Code Points U+1F600
Привет JS Escape \u041F\u0440\u0438\u0432\u0435\u0442

Функции

  • Двупосочно конвертиране между всичките шест Unicode формата
  • Пълна поддръжка на Unicode включително емотикони и знаци извън Basic Multilingual Plane (BMP)
  • Обработка на surrogate pairs за JavaScript escape последователности със знаци над U+FFFF