Text-Unicode-Konverter
Text zwischen einfachen Zeichen und Unicode-Formaten wie Codepunkten (U+XXXX), JavaScript-Escape-Sequenzen, HTML-Entitäten, hexadezimalen und dezimalen Werten konvertieren
Eingabe
Ausgabe
Readme
Was ist Unicode?
Unicode ist ein universeller Zeichenkodierungsstandard, der jedem in geschriebenen Sprachen weltweit verwendeten Zeichen eine eindeutige Nummer (genannt Code‑Punkt) zuweist. Im Gegensatz zu älteren Kodierungssystemen wie ASCII, das nur 128 Zeichen unterstützt, kann Unicode über 1,1 Millionen Zeichen darstellen — einschließlich Buchstaben aller Alphabete, Symbole, Emojis und Sonderzeichen. Das macht es unverzichtbar für die Entwicklung von Software, die in verschiedenen Sprachen und auf unterschiedlichen Plattformen funktioniert.
Ein Unicode‑Code‑Punkt wird typischerweise als U+ gefolgt von einer hexadezimalen Zahl geschrieben. Zum Beispiel ist der Buchstabe „A“ U+0041 und das Emoji 😀 ist U+1F600. Verschiedene Programmiersprachen und Systeme repräsentieren diese Code‑Punkte in unterschiedlichen Formaten, weshalb häufig eine Konvertierung zwischen den Formaten nötig ist.
Tool‑Beschreibung
Dieses Tool konvertiert Text zwischen einfachen Zeichen und verschiedenen Unicode‑Darstellungsformaten. Es unterstützt bidirektionale Konvertierung zwischen sechs verschiedenen Formaten: Klartext, Unicode‑Code‑Punkte, JavaScript‑Escape‑Sequenzen, HTML‑numerische Entitäten, hexadezimale Werte und dezimale Werte. Wählen Sie einfach die Eingabe‑ und Ausgabeformate aus, und die Konvertierung erfolgt sofort.
Beispiele
| Eingabe | Format | Ausgabe |
|---|---|---|
| Hello | Code‑Punkte | U+0048 U+0065 U+006C U+006C U+006F |
| Hello | JS‑Escape | \u0048\u0065\u006C\u006C\u006F |
| Hello | HTML‑Entitäten | Hello |
| Hello | Hexadezimal | 0048 0065 006C 006C 006F |
| Hello | Dezimal | 72 101 108 108 111 |
| 😀 | Code‑Punkte | U+1F600 |
| Привет | JS‑Escape | \u041F\u0440\u0438\u0432\u0435\u0442 |
Funktionen
- Bidirektionale Konvertierung zwischen allen sechs Unicode‑Formaten
- Vollständige Unicode‑Unterstützung einschließlich Emojis und Zeichen außerhalb des Basic Multilingual Plane (BMP)
- Surrogate‑Paar‑Verarbeitung für JavaScript‑Escape‑Sequenzen mit Zeichen über U+FFFF