Descripción de la herramienta

El Detector de Escritura es una herramienta poderosa que identifica y analiza automáticamente los sistemas de escritura (scripts) usados en cualquier texto. Puede detectar más de 25 sistemas de escritura diferentes incluyendo Latino, Cirílico, Árabe, Hebreo, CJK (Chino, Japonés, Coreano), Devanagari, Griego, Tailandés, Georgiano, Armenio y muchos más. La herramienta proporciona estadísticas detalladas sobre la distribución de caracteres a través de diferentes escrituras, haciéndola invaluable para análisis lingüístico, moderación de contenido y procesamiento de texto.

Características

  • Detección Multi-escritura: Identifica más de 25 sistemas de escritura incluyendo Latino, Cirílico, Árabe, Hebreo, CJK y varias escrituras índicas
  • Alerta de Escritura Mixta: Detecta automáticamente cuando el texto contiene múltiples sistemas de escritura
  • Estadísticas Detalladas: Muestra conteo de caracteres y distribución porcentual para cada escritura detectada

Escrituras Soportadas

La herramienta puede detectar los siguientes sistemas de escritura:

  • Latino (incluyendo variantes extendidas)
  • Cirílico (Ruso, Ucraniano, Búlgaro, Serbio, etc.)
  • Árabe (incluyendo suplementos y extensiones árabes)
  • Hebreo
  • Griego (incluyendo griego extendido)
  • Ideogramas Unificados CJK (Chino, Kanji Japonés)
  • Hangul (Coreano)
  • Hiragana (Japonés)
  • Katakana (Japonés)
  • Devanagari (Hindi, Sánscrito, Marathi, Nepalí)
  • Bengalí
  • Tamil
  • Telugu
  • Gujarati
  • Kannada
  • Malayalam
  • Sinhala
  • Tailandés
  • Lao
  • Myanmar (Birmano)
  • Khmer (Camboyano)
  • Tibetano
  • Georgiano
  • Armenio
  • Etíope (Amárico, Tigriña)

¿Qué es un Sistema de Escritura?

Un sistema de escritura (o escritura) es un conjunto de símbolos usados para representar texto en un idioma particular o grupo de idiomas. Diferentes culturas y comunidades lingüísticas han desarrollado sistemas de escritura únicos a lo largo de milenios. Algunos idiomas usan la misma escritura (ej., muchos idiomas europeos usan Latino), mientras que otros tienen sus propias escrituras distintivas (ej., Árabe, Chino).

Comprender la composición de escritura del texto es crucial para:

  • Renderizado y visualización apropiados
  • Procesamiento y normalización de texto
  • Identificación de idioma
  • Análisis de seguridad (detectar ataques homográficos)
  • Internacionalización y localización