Quali sono i caratteri confondibili?

I caratteri confondibili sono lettere, cifre e simboli che sembrano quasi identici in molti font ma sono in realtà caratteri diversi. Ad esempio, una "l" minuscola (elle), una "I" maiuscola (i), la cifra "1" e il simbolo pipe "|" possono essere quasi indistinguibili nei caratteri sans-serif come Arial o Helvetica. Allo stesso modo, la lettera maiuscola "O" e la cifra "0" vengono frequentemente confuse.

Queste ambiguità visive causano problemi reali. Nella programmazione, usare uno 0 (zero) invece di una O in un nome di variabile porta a bug estremamente difficili da individuare. In contesti di sicurezza, gli attaccanti sfruttano i caratteri confondibili per creare URL, nomi utente o password ingannevoli. Nella scrittura quotidiana, i lettori possono fraintendere parole o codici quando vengono scambiati caratteri simili.

A differenza degli omoglifi — che coinvolgono caratteri da script diversi (come una "а" cirillica che imita una "a" latina) — i caratteri confondibili esistono all'interno dello stesso set ASCII. Fanno parte della tua tastiera quotidiana, il che li rende ancora più facili da trascurare.

Descrizione dello strumento

Questo strumento scansiona il tuo testo e evidenzia ogni carattere che appartiene a un gruppo confondibile utilizzando sottolineature codificate per colore. Ogni gruppo di caratteri simili riceve il suo colore, rendendo facile individuare le ambiguità potenziali a colpo d'occhio. Passa il mouse su qualsiasi carattere evidenziato per vedere la sua identità esatta, incluso il suo nome completo e il punto di codice Unicode.

Puoi selezionare quali gruppi confondibili evidenziare utilizzando il menu a discesa multi-selezione, permettendoti di concentrarti sulle ambiguità specifiche che contano per il tuo caso d'uso.

Esempi

Input:

Il1|egal passw0rd: S5Z2B8

Cosa viene evidenziato:

  • I, l, 1, | — evidenziati in rosso (gruppo l / I / 1 / |)
  • 0 — evidenziato in blu (gruppo O / 0)
  • S, 5 — evidenziati in viola (gruppo S / 5)
  • Z, 2 — evidenziati in arancione (gruppo Z / 2)
  • B, 8 — evidenziati in teal (gruppo B / 8)

Esempio di tooltip al passaggio del mouse:

Passando il mouse su l viene visualizzato: Lowercase L (U+006C) Passando il mouse su I viene visualizzato: Uppercase I (U+0049)

Funzionalità

  • Evidenziazione codificata per colore per 14 gruppi di caratteri confondibili
  • Tooltip al passaggio del mouse che mostrano il nome esatto del carattere e il punto di codice Unicode
  • Gruppi selezionabili per concentrarsi su ambiguità specifiche
  • Evidenziazione in tempo reale mentre digiti
  • Pannello di riepilogo che mostra i gruppi rilevati e i conteggi delle occorrenze

Gruppi supportati

Gruppo Caratteri Confusione comune
l / I / 1 / | L minuscola, I maiuscola, cifra 1, pipe Più comune nei font sans-serif
O / 0 O maiuscola, cifra 0 Frequente nei codici e nelle password
rn / m r, n, m "rn" assomiglia a "m" in molti font
S / 5 S maiuscola, cifra 5 Curve simili
Z / 2 Z maiuscola, cifra 2 Somiglianza del tratto diagonale
B / 8 B maiuscola, cifra 8 Somiglianza del doppio anello
G / 6 G maiuscola, cifra 6 Sovrapposizione della forma curva
D / O / 0 D maiuscola Assomiglia a O e 0 nei font arrotondati
q / g q minuscola, g minuscola Confusione del discendente
cl / d c minuscola, d minuscola "cl" assomiglia a "d" con kerning stretto
vv / w v minuscola, w minuscola "vv" assomiglia a "w"
` / ' accento grave, apostrofo Quasi identici nella maggior parte dei font
; / : punto e virgola, due punti Differiscono solo per un punto rispetto a una virgola
- / – / — trattino, en dash, em dash Lunghezze di trattino variabili

Casi d'uso

  • Revisione del codice: Rileva l'uso accidentale di O invece di 0 o l invece di 1 nei nomi delle variabili, nelle chiavi API o nei valori di configurazione
  • Audit di sicurezza: Rileva testo potenzialmente ingannevole negli URL, negli indirizzi email o nei contenuti generati dagli utenti dove i caratteri confondibili potrebbero essere utilizzati per phishing o spoofing
  • Tipografia e correzione di bozze: Verifica che i caratteri corretti vengano utilizzati nei numeri di serie, nelle chiavi di licenza o in qualsiasi testo dove la precisione è importante

Suggerimenti

  • Usa un font monospazio nel tuo editor per ridurre l'ambiguità visiva durante la scrittura del codice
  • Se ti interessa solo una confusione specifica (ad esempio, l vs 1), deseleziona tutti gli altri gruppi per ridurre il rumore
  • Passa il mouse su qualsiasi carattere evidenziato per confermarne l'identità esatta tramite il tooltip