Script‑detector
Detecteer automatisch schrijfsystemen (Cyrillisch, Latijn, Arabisch, CJK, enz.) en identificeer gemengde script‑tekst.
Invoer
Uitvoer
| Schrift | Tekens | Percentage | Voorbeelden |
|---|---|---|---|
| No data available | |||
Readme
Toolbeschrijving
De Script Detector is een krachtig hulpmiddel dat automatisch de schrijfsystemen (scripts) die in elke tekst worden gebruikt, identificeert en analyseert. Deze uitgebreide tekenreeks‑identificator kan meer dan 25 verschillende schrijfsystemen detecteren, waaronder Latin, Cyrillic, Arabisch, Hebreeuws, CJK (Chinees, Japans, Koreaans), Devanagari, Grieks, Thai, Georgisch, Armeens en nog veel meer. Of u nu een Cyrillic‑detector nodig heeft of tekenreeksen uit welke taal dan ook wilt identificeren, het hulpmiddel biedt gedetailleerde statistieken over de verdeling van tekens over verschillende scripts, waardoor het van onschatbare waarde is voor taalanalyse, contentmoderatie en tekstverwerking.
Functies
- Multi‑Script Detectie: Identificeert meer dan 25 schrijfsystemen, waaronder Latin, Cyrillic, Arabisch, Hebreeuws, CJK en diverse Indic‑scripts
- Melding van Gemengde Scripts: Detecteert automatisch wanneer een tekst meerdere schrijfsystemen bevat
- Gedetailleerde Statistieken: Toont het aantal tekens en de procentuele verdeling voor elk gedetecteerd script
Ondersteunde Scripts
Het hulpmiddel kan tekenreeksen identificeren en de volgende schrijfsystemen detecteren:
- Latin (inclusief uitgebreide varianten)
- Cyrillic (Russisch, Oekraïens, Bulgaars, Servisch, enz.) – Volledige Cyrillic‑detectorondersteuning
- Arabisch (inclusief Arabische supplementen en uitbreidingen)
- Hebreeuws
- Grieks (inclusief uitgebreid Grieks)
- CJK Unified Ideographs (Chinees, Japans Kanji)
- Hangul (Koreaans)
- Hiragana (Japans)
- Katakana (Japans)
- Devanagari (Hindi, Sanskriet, Marathi, Nepali)
- Bengaals
- Tamil
- Telugu
- Gujarati
- Kannada
- Malayalam
- Sinhala
- Thai
- Lao
- Myanmar (Birmaans)
- Khmer (Cambodjaans)
- Tibetaans
- Georgisch
- Armeens
- Ethiopisch (Amhaars, Tigrinya)
Wat is een Schrijfsysteem?
Een schrijfsysteem (of script) is een reeks symbolen die worden gebruikt om tekst in een bepaalde taal of groep talen weer te geven. Verschillende culturen en taalgemeenschappen hebben in de loop van duizenden jaren unieke schrijfsystemen ontwikkeld. Sommige talen gebruiken hetzelfde script (bijv. veel Europese talen gebruiken Latin), terwijl andere hun eigen onderscheidende scripts hebben (bijv. Arabisch, Chinees, Cyrillic).
Het begrijpen van de scriptcompositie van tekst en het kunnen identificeren van tekenreeksen is cruciaal voor:
- Correcte weergave en presentatie
- Tekstverwerking en normalisatie
- Taalidentificatie met behulp van script- en tekenreeksdetectie
- Beveiligingsanalyse (detectie van homografische aanvallen met Cyrillic of andere scriptdetectoren)
- Internationalisatie en lokalisatie