O que é Unicode?

Unicode é um padrão universal de codificação de caracteres que atribui um número único (chamado ponto de código) a cada caractere usado em línguas escritas em todo o mundo. Diferente de sistemas de codificação mais antigos, como ASCII, que suportavam apenas 128 caracteres, o Unicode pode representar mais de 1,1 milhão de caracteres — incluindo letras de todos os alfabetos, símbolos, emojis e caracteres especiais. Isso o torna essencial para desenvolver softwares que funcionam em diferentes idiomas e plataformas.

Um ponto de código Unicode é tipicamente escrito como U+ seguido de um número hexadecimal. Por exemplo, a letra “A” é U+0041, e o emoji 😀 é U+1F600. Diferentes linguagens de programação e sistemas representam esses pontos de código em vários formatos, razão pela qual a conversão entre formatos costuma ser necessária.

Descrição da ferramenta

Esta ferramenta converte texto entre caracteres simples e diversos formatos de representação Unicode. Ela oferece conversão bidirecional entre seis formatos diferentes: texto simples, pontos de código Unicode, sequências de escape JavaScript, entidades numéricas HTML, valores hexadecimais e valores decimais. Basta selecionar os formatos de entrada e saída, e a conversão ocorre instantaneamente.

Exemplos

Entrada Formato Saída
Hello Pontos de Código U+0048 U+0065 U+006C U+006C U+006F
Hello Escape JS \u0048\u0065\u006C\u006C\u006F
Hello Entidades HTML Hello
Hello Hexadecimal 0048 0065 006C 006C 006F
Hello Decimal 72 101 108 108 111
😀 Pontos de Código U+1F600
Привет Escape JS \u041F\u0440\u0438\u0432\u0435\u0442

Recursos

  • Conversão bidirecional entre todos os seis formatos Unicode
  • Suporte completo a Unicode, incluindo emojis e caracteres fora do Plano Multilíngue Básico (BMP)
  • Manipulação de pares substitutos para sequências de escape JavaScript com caracteres acima de U+FFFF
  • Conversão em tempo real enquanto você digita, com resultados instantâneos
  • Funcionalidade de copiar e trocar para reverter rapidamente as conversões

Casos de uso

  • Desenvolvimento web: Converter caracteres especiais em entidades HTML para exibição segura em páginas web
  • Codificação JavaScript/JSON: Escapar caracteres não-ASCII para uso em strings JavaScript ou arquivos JSON
  • Depuração de problemas de codificação: Inspecionar os pontos de código exatos dos caracteres para diagnosticar problemas de codificação de texto
  • Processamento de texto multiplataforma: Converter caracteres para formatos numéricos para sistemas que não suportam Unicode nativamente
  • Aprendendo Unicode: Explorar como diferentes caracteres são representados em vários formatos de codificação