Descripción de la herramienta

El Detector de Escritura es una herramienta poderosa que identifica y analiza automáticamente los sistemas de escritura (scripts) usados en cualquier texto. Puede detectar más de 25 sistemas de escritura diferentes incluyendo Latino, Cirílico, Árabe, Hebreo, CJK (Chino, Japonés, Coreano), Devanagari, Griego, Tailandés, Georgiano, Armenio y muchos más. La herramienta proporciona estadísticas detalladas sobre la distribución de caracteres a través de diferentes escrituras, haciéndola invaluable para análisis lingüístico, moderación de contenido y procesamiento de texto.

Características

  • Detección Multi-escritura: Identifica más de 25 sistemas de escritura incluyendo Latino, Cirílico, Árabe, Hebreo, CJK y varias escrituras índicas
  • Alerta de Escritura Mixta: Detecta automáticamente cuando el texto contiene múltiples sistemas de escritura
  • Estadísticas Detalladas: Muestra conteo de caracteres y distribución porcentual para cada escritura detectada
  • Ejemplos de Caracteres: Muestra caracteres de muestra de cada sistema de escritura detectado
  • Análisis en Tiempo Real: Detección instantánea mientras escribe o pega texto
  • Soporte de Rango Unicode: Cubre rangos Unicode completos para detección precisa
  • Desglose Porcentual: Representación visual de porcentaje de distribución de escritura

Casos de Uso

  • Moderación de Contenido: Identifique contenido potencialmente sospechoso de escritura mixta (ej., ataques homográficos)
  • Análisis Lingüístico: Analice documentos multilingües y su composición
  • Calidad de Datos: Verifique que el contenido de texto coincida con sistemas de escritura esperados
  • Procesamiento de Texto: Pre-procese texto basado en escrituras detectadas antes de traducción o análisis
  • Análisis de Seguridad: Detecte intentos de suplantación usando caracteres visualmente similares de diferentes escrituras
  • Detección de Idioma: Detección preliminar de escritura antes de identificación completa de idioma
  • Investigación Académica: Estudie patrones de uso de escritura en corpus multilingües
  • Pruebas de Internacionalización: Verifique que las aplicaciones manejen varios sistemas de escritura correctamente

Escrituras Soportadas

La herramienta puede detectar los siguientes sistemas de escritura:

  • Latino (incluyendo variantes extendidas)
  • Cirílico (Ruso, Ucraniano, Búlgaro, Serbio, etc.)
  • Árabe (incluyendo suplementos y extensiones árabes)
  • Hebreo
  • Griego (incluyendo griego extendido)
  • Ideogramas Unificados CJK (Chino, Kanji Japonés)
  • Hangul (Coreano)
  • Hiragana (Japonés)
  • Katakana (Japonés)
  • Devanagari (Hindi, Sánscrito, Marathi, Nepalí)
  • Bengalí
  • Tamil
  • Telugu
  • Gujarati
  • Kannada
  • Malayalam
  • Sinhala
  • Tailandés
  • Lao
  • Myanmar (Birmano)
  • Khmer (Camboyano)
  • Tibetano
  • Georgiano
  • Armenio
  • Etíope (Amárico, Tigriña)

¿Qué es un Sistema de Escritura?

Un sistema de escritura (o escritura) es un conjunto de símbolos usados para representar texto en un idioma particular o grupo de idiomas. Diferentes culturas y comunidades lingüísticas han desarrollado sistemas de escritura únicos a lo largo de milenios. Algunos idiomas usan la misma escritura (ej., muchos idiomas europeos usan Latino), mientras que otros tienen sus propias escrituras distintivas (ej., Árabe, Chino).

Comprender la composición de escritura del texto es crucial para:

  • Renderizado y visualización apropiados
  • Procesamiento y normalización de texto
  • Identificación de idioma
  • Análisis de seguridad (detectar ataques homográficos)
  • Internacionalización y localización