Cyrillisch naar Latijns Homoglief Converter
Converteer Cyrillische tekst naar visueel vergelijkbare Latijnse/ASCII-tekens (homoglyfen)
Invoer
Uitvoer
Readme
Wat zijn homoglyphen?
Homoglyphen zijn tekens uit verschillende schriftsystemen die identiek of bijna identiek aan elkaar lijken. Bijvoorbeeld, de Cyrillische letter "А" (U+0410) ziet er visueel ononderscheidbaar uit van de Latijnse letter "A" (U+0041), ondanks dat het volledig verschillende Unicode-tekens zijn. Deze visuele gelijkenis bestaat omdat veel Cyrillische letters historisch gezien afgeleid zijn van Griekse en Latijnse alfabetten.
Waarom zijn Cyrillisch-Latijnse homoglyphen belangrijk?
De visuele gelijkenis tussen Cyrillische en Latijnse tekens creëert zowel uitdagingen als kansen. Op het gebied van cyberveiligheid worden homoglyphen misbruikt in phishingaanvallen waarbij kwaadaardige URL's Cyrillische lookalikes gebruiken om legitieme domeinen na te bootsen. Bij tekstverwerking kunnen gemengde scriptinhoud problemen veroorzaken bij sorteren, zoeken en indexeren. Het begrijpen en detecteren van deze tekenvervanging is essentieel voor beveiligingsonderzoekers, contentmoderatoren en ontwikkelaars die met meertalige tekst werken.
Hoe werkt homoglyph-conversie?
Homoglyph-conversie vervangt tekens uit één script door visueel vergelijkbare tegenhangers uit een ander script. Dit hulpmiddel kaart Cyrillische tekens af op hun Latijnse equivalenten op basis van visuele verschijning in plaats van fonetische waarde. Bijvoorbeeld, de Cyrillische "Р" (die klinkt als "R") wordt omgezet naar de Latijnse "P" omdat ze er hetzelfde uitzien, niet omdat ze dezelfde klank vertegenwoordigen.
Hulpmiddelbeschrijving
Deze Cyrillisch naar Latijns homoglyph-converter transformeert tekst met Cyrillische tekens in visueel vergelijkbare Latijnse equivalenten. Het hulpmiddel gebruikt een uitgebreide mappingdatabase die meerdere Cyrillische alfabetten dekt, waaronder Russisch, Oekraïens, Wit-Russisch, Servisch, Macedonisch, Bulgaars, Kazachs, Kirgizisch en Mongoolse schriften. De conversie geeft prioriteit aan visuele gelijkenis, waardoor de output er zo dicht mogelijk uitziet op het origineel, maar dan alleen met Latijnse tekens.
Voorbeelden
| Cyrillische invoer | Latijnse uitvoer |
|---|---|
| самый | camblu |
| ответственность | oTBeTcTBeHHocTb |
| непосредственно | HenocpegcTBeHHo |
| событие | co6blTue |
Functies
- Converteert alle Cyrillische alfabetten, inclusief Russisch, Oekraïens, Wit-Russisch, Servisch, Macedonisch en Centraal-Aziatische varianten
- Gebruikt perfecte homoglyphen waar tekens visueel identiek zijn (А→A, С→C, О→O)
- Past dichte benaderingen toe voor tekens met hoge visuele gelijkenis
- Behoudt niet-Cyrillische tekens, inclusief Latijnse letters, cijfers en leestekens
- Ondersteunt uitgebreid Cyrillisch, inclusief historische en zeldzame tekens
Gebruiksgevallen
- Analyseren van mogelijk kwaadaardige tekst op homoglyph-gebaseerde spoofingpogingen
- Normaliseren van gemengde scriptinhoud voor consistente tekstverwerking
- Detecteren van Cyrillische tekeninjectie in gebruikersnamen, URL's of domeinnamen
- Converteren van Cyrillische tekst voor systemen die alleen Latijnse tekens ondersteunen
- Onderzoeks- en educatieve doeleinden in linguïstiek en typografie
Ondersteunde tekensets
Perfecte homoglyphen (visueel identiek):
- Hoofdletters: А→A, В→B, С→C, Е→E, Н→H, І→I, Ј→J, К→K, М→M, О→O, Р→P, Ѕ→S, Т→T, Х→X, У→Y
- Kleine letters: а→a, с→c, е→e, і→i, ј→j, о→o, р→p, ѕ→s, х→x, у→y
Dichte homoglyphen (hoge visuele gelijkenis):
- Met diakritische tekens: Ё→Ë, Ї→Ï, ё→ë, ї→ï
- Kazachs/Mongools: Ү→Y, Қ→K, Ң→H, Ғ→F
Benaderende homoglyphen (gematigde gelijkenis):
- Op basis van vorm: Б→6, Г→r, З→3, Ч→4, Ш→W
- Samengesteld: Ы→bl, Ю→io, Я→ᴙ
Conversiedetails
De converter verwerkt de tekst teken voor teken, waarbij elk wordt gecontroleerd tegen de homoglyph-mappingtabellen in prioriteitsvolgorde:
- Perfecte homoglyphen – Exacte visuele overeenkomsten tussen Cyrillisch en Latijns
- Dichte homoglyphen – Tekens met kleine visuele verschillen, vaak met diakritische tekens
- Benaderende homoglyphen – Beste visuele benadering met beschikbare tekens
- Doorlaten – Tekens die niet in de mappings worden gevonden, blijven ongewijzigd
Deze gelaagde aanpak zorgt voor maximale visuele trouw, terwijl er alternatieven worden geboden voor alle Cyrillische tekens.