Qu’est‑ce que Unicode ?

Unicode est une norme d’encodage de caractères universelle qui attribue un numéro unique (appelé point de code) à chaque caractère utilisé dans les langues écrites du monde entier. Contrairement aux anciens systèmes d’encodage comme ASCII, qui ne supportaient que 128 caractères, Unicode peut représenter plus de 1,1 million de caractères — y compris les lettres de tous les alphabets, les symboles, les emojis et les caractères spéciaux. Cela le rend indispensable pour créer des logiciels fonctionnant sur différentes langues et plateformes.

Un point de code Unicode est généralement écrit sous la forme U+ suivi d’un nombre hexadécimal. Par exemple, la lettre « A » est U+0041, et l’emoji 😀 est U+1F600. Différents langages de programmation et systèmes représentent ces points de code sous divers formats, ce qui explique pourquoi la conversion entre formats est souvent nécessaire.

Description de l’outil

Cet outil convertit du texte entre caractères simples et divers formats de représentation Unicode. Il prend en charge la conversion bidirectionnelle entre six formats différents : texte brut, points de code Unicode, séquences d’échappement JavaScript, entités numériques HTML, valeurs hexadécimales et valeurs décimales. Il suffit de sélectionner les formats d’entrée et de sortie, et la conversion s’effectue instantanément.

Exemples

Entrée Format Sortie
Hello Points de code U+0048 U+0065 U+006C U+006C U+006F
Hello Échappement JS \u0048\u0065\u006C\u006C\u006F
Hello Entités HTML Hello
Hello Hexadécimal 0048 0065 006C 006C 006F
Hello Décimal 72 101 108 108 111
😀 Points de code U+1F600
Привет Échappement JS \u041F\u0440\u0438\u0432\u0435\u0442

Fonctionnalités

  • Conversion bidirectionnelle entre les six formats Unicode
  • Prise en charge complète d'Unicode incluant les emojis et les caractères hors du Plan Multilingue de Base (BMP)
  • Gestion des paires de substituts pour les séquences d’échappement JavaScript avec des caractères supérieurs à U+FFFF
  • Conversion en temps réel pendant la saisie avec des résultats instantanés
  • Fonctionnalité de copie et d’échange pour inverser rapidement les conversions

Cas d’utilisation

  • Développement web : convertir les caractères spéciaux en entités HTML pour un affichage sécurisé sur les pages web
  • Encodage JavaScript/JSON : échapper les caractères non ASCII pour les utiliser dans des chaînes JavaScript ou des fichiers JSON
  • Débogage des problèmes d’encodage : inspecter les points de code exacts des caractères pour diagnostiquer les problèmes d’encodage de texte
  • Traitement de texte multiplateforme : convertir les caractères en formats numériques pour les systèmes qui ne prennent pas en charge Unicode nativement
  • Apprentissage d'Unicode : explorer comment différents caractères sont représentés dans divers formats d’encodage