Mikä on Unicode?

Unicode on universaali merkistökoodausstandardi, joka antaa jokaiselle maailmanlaajuisesti käytetylle kirjoitetulle merkille ainutlaatuisen numeron (kutsutaan koodipisteeksi). Toisin kuin vanhemmat koodausjärjestelmät kuten ASCII, jotka tukevat vain 128 merkkiä, Unicode voi esittää yli 1,1 miljoonaa merkkiä — mukaan lukien kaikkien aakkostojen kirjaimet, symbolit, emoji-merkinnät ja erikoismerkit. Tämä tekee siitä olennaisen ohjelmistojen rakentamisessa, jotka toimivat eri kielten ja alustojen välillä.

Unicode‑koodipiste kirjoitetaan tyypillisesti muodossa U+ ja sen perässä heksadesimaaliluku. Esimerkiksi kirjain “A” on U+0041, ja emoji 😀 on U+1F600. Eri ohjelmointikielet ja järjestelmät esittävät nämä koodipisteet erilaisissa muodoissa, minkä vuoksi muunnosformaattien välillä on usein tarpeen.

Työkalun kuvaus

Tämä työkalu muuntaa tekstiä tavallisten merkkien ja eri Unicode‑esitysmuotojen välillä. Se tukee kaksisuuntaista muunnosta kuudessa eri muodossa: tavallinen teksti, Unicode‑koodipisteet, JavaScript‑pakotussekvenssit, HTML‑numeeriset entiteetit, heksadesimaaliluvut ja desimaaliluvut. Valitse vain syöte‑ ja tulostusmuodot, ja muunnos tapahtuu välittömästi.

Esimerkit

Syöte Muoto Tuloste
Hello Code Points U+0048 U+0065 U+006C U+006C U+006F
Hello JS Escape \u0048\u0065\u006C\u006C\u006F
Hello HTML Entities Hello
Hello Hexadecimal 0048 0065 006C 006C 006F
Hello Decimal 72 101 108 108 111
😀 Code Points U+1F600
Привет JS Escape \u041F\u0440\u0438\u0432\u0435\u0442

Ominaisuudet

  • Kaksisuuntainen muunnos kaikissa kuudessa Unicode‑muodossa
  • Täysi Unicode‑tuki mukaan lukien emoji-merkinnät ja merkit, jotka sijaitsevat Basic Multilingual Plane (BMP) -alueen ulkopuolella
  • Surrogaattiparien käsittely JavaScript‑pakotussekvensseille, joissa merkit ovat suurempia kuin U+FFFF
  • Reaaliaikainen muunnos kirjoittaessasi, tulokset näkyvät heti
  • Kopioi‑ ja vaihda‑toiminto muunnosten nopeaan kääntämiseen

Käyttötapaukset

  • Web‑kehitys: Muunna erikoismerkit HTML‑entiteeteiksi turvallista näyttöä varten verkkosivuilla
  • JavaScript/JSON‑koodaus: Pakota ei‑ASCII‑merkit JavaScript‑merkkijonoihin tai JSON‑tiedostoihin
  • Koodausongelmien vianmääritys: Tarkastele merkkien tarkkoja koodipisteitä tekstikoodausongelmien diagnosointiin
  • Alustojen välinen tekstinkäsittely: Muunna merkit numeerisiin muotoihin järjestelmiin, jotka eivät tue Unicodea natiivisti
  • Unicode‑oppiminen: Tutki, miten eri merkit esitetään erilaisissa koodausmuodoissa