Hva er usynlige tegn?

Usynlige tegn er Unicode-kodepunkter som ikke har noen synlig glyf, men som fortsatt opptar plass i en streng og påvirker hvordan programvare behandler eller gjengivir tekst. De inkluderer kontrolltegn (som tabulator og linjeskift), formatteringstegn (som tegn med null bredde og retningsmerker), ulike mellomromsvarianter og spesielle markører som Byte Order Mark (BOM). Fordi de ser ut som ingenting, er de notorisk vanskelige å oppdage i en vanlig tekstredigerer og er en vanlig kilde til subtile feil, ødelagte oppsett og datafeilbehandling.

Verktøybeskrivelse

Invisible Characters Viewer er en interaktiv tekstredigerer som gjengivir hvert usynlig tegn som et synlig symbol, på stedet. Lim inn eller skriv inn hvilken som helst tekst, og hvert skjult tegn erstattes umiddelbart med en liten symbolsk glyf — tabulatorer vises som , mellomrom som ·, mellomrom med null bredde som ·, retningsmerker som / , BOM som , og så videre. Når du holder musepekeren over en glyf, vises et verktøytips med tegnet sitt fulle navn og Unicode-kodepunkt. Ingenting forlater redigereren; all gjengivelse skjer lokalt i nettleseren din.

Eksempler

Inntekst (rå) Hva du ser i visningen
Hello\u200BWorld (mellomrom med null bredde mellom ord) Hello·World med ·-glyfen som markerer U+200B
\u202Eright-to-left override →right-to-left override med retningsglyfen i starten
line one\r\nline two Vognretur- og linjeskiftglyfer før linjeskiftet
\uFEFFstart of file ▯start of file som viser BOM på posisjon 0

Funksjoner

  • Innebygd gjengivelse: Usynlige tegn vises som glyfer direkte inne i redigereren i stedet for i et eget panel, slik at du ser dem i sammenheng med omgivende tekst
  • Bred tegntabelldekning: Håndterer C0- og C1-kontrolltegn, alle navngitte Unicode-formatteringstegn, Unicode-mellomromsvarianter (en-mellomrom, em-mellomrom, hårmellemrom, smalt mellomrom uten linjeskift osv.), retningsformatteringstegn, variasjonsvelgere, taggertegn og BOM
  • Verktøytips: Når du holder musepekeren over en glyf, vises tegnet sitt fulle Unicode-navn og kodepunkt (f.eks. Zero Width Space — U+200B)
  • Uthevelse av standardmellomrom: Vanlige mellomrom og tabulatorer utheves ved hjelp av CodeMirrors innebygde mellomromsmarkører, noe som holder dem visuelt atskilt fra vanlig tekst
  • Ren tekstmodus: Redigereren forblir i ren tekstmodus, slik at spesialtegn aldri tolkes på nytt eller endres mens du skriver

Brukstilfeller

  • Feilsøking av kopier-lim-artefakter: Tekst kopiert fra PDF-er, nettsider eller ordbehandlere inneholder ofte mellomrom med null bredde, myke bindestreker eller mellomrom uten linjeskift som forårsaker uoverensstemmelser i strengsammenligninger og søkeresultater
  • Inspeksjon av datafiler: Lim inn CSV, JSON eller loggutdata for å finne uventede kontrolltegn (nullbytes, vognreturer, BOM) før du importerer data til en database eller parser
  • Web- og kodefeilsøking: Kontroller brukerleverte inndata eller API-svar for skjulte retningsmerker eller formatteringstegn som kan bryte gjengivelsen eller forårsake sikkerhetsproblemer

Hvordan det fungerer

Verktøyet bruker CodeMirror 6 med en egendefinert utvidelse som itererer over hvert tegn i redigeringens synlige visningsport. For hvert kodepunkt sjekker det en oppslagstabell over kjente usynlige tegn, tester mot Unicode-egenskapsklasser \p{Cc} (kontroll) og \p{Cf} (formattering), og oppdager variasjonsvelgere og taggertegnområder. Matchede tegn erstattes av innebygde dekorasjonswidgeter som viser den tilsvarende symbolglyfen. Vanlige mellomrom og tabulatorer delegeres til CodeMirrors innebygde highlightWhitespace-utvidelse.