Convertisseur de texte Unicode
Convertir le texte entre caractères simples et formats Unicode tels que les points de code (U+XXXX), les séquences d'échappement JavaScript, les entités HTML, les valeurs hexadécimales et décimales
Entrée
Sortie
Documentation
Qu’est‑ce que Unicode ?
Unicode est une norme d’encodage de caractères universelle qui attribue un numéro unique (appelé point de code) à chaque caractère utilisé dans les langues écrites du monde entier. Contrairement aux anciens systèmes d’encodage comme ASCII, qui ne supportaient que 128 caractères, Unicode peut représenter plus de 1,1 million de caractères — y compris les lettres de tous les alphabets, les symboles, les emojis et les caractères spéciaux. Cela le rend indispensable pour créer des logiciels fonctionnant sur différentes langues et plateformes.
Un point de code Unicode est généralement écrit sous la forme U+ suivi d’un nombre hexadécimal. Par exemple, la lettre « A » est U+0041, et l’emoji 😀 est U+1F600. Différents langages de programmation et systèmes représentent ces points de code sous divers formats, ce qui explique pourquoi la conversion entre formats est souvent nécessaire.
Description de l’outil
Cet outil convertit du texte entre caractères simples et divers formats de représentation Unicode. Il prend en charge la conversion bidirectionnelle entre six formats différents : texte brut, points de code Unicode, séquences d’échappement JavaScript, entités numériques HTML, valeurs hexadécimales et valeurs décimales. Il suffit de sélectionner les formats d’entrée et de sortie, et la conversion s’effectue instantanément.
Exemples
| Entrée | Format | Sortie |
|---|---|---|
| Hello | Points de code | U+0048 U+0065 U+006C U+006C U+006F |
| Hello | Échappement JS | \u0048\u0065\u006C\u006C\u006F |
| Hello | Entités HTML | Hello |
| Hello | Hexadécimal | 0048 0065 006C 006C 006F |
| Hello | Décimal | 72 101 108 108 111 |
| 😀 | Points de code | U+1F600 |
| Привет | Échappement JS | \u041F\u0440\u0438\u0432\u0435\u0442 |
Fonctionnalités
- Conversion bidirectionnelle entre les six formats Unicode
- Prise en charge complète d'Unicode incluant les emojis et les caractères hors du Plan Multilingue de Base (BMP)
- Gestion des paires de substituts pour les séquences d’échappement JavaScript avec des caractères supérieurs à U+FFFF
- Conversion en temps réel pendant la saisie avec des résultats instantanés
- Fonctionnalité de copie et d’échange pour inverser rapidement les conversions
Cas d’utilisation
- Développement web : convertir les caractères spéciaux en entités HTML pour un affichage sécurisé sur les pages web
- Encodage JavaScript/JSON : échapper les caractères non ASCII pour les utiliser dans des chaînes JavaScript ou des fichiers JSON
- Débogage des problèmes d’encodage : inspecter les points de code exacts des caractères pour diagnostiquer les problèmes d’encodage de texte
- Traitement de texte multiplateforme : convertir les caractères en formats numériques pour les systèmes qui ne prennent pas en charge Unicode nativement
- Apprentissage d'Unicode : explorer comment différents caractères sont représentés dans divers formats d’encodage