Araç Açıklaması

Script Detector, herhangi bir metinde kullanılan yazı sistemlerini (scriptleri) otomatik olarak tanımlayan ve analiz eden güçlü bir araçtır. Bu kapsamlı karakter seti tanımlayıcı, Latin, Kiril, Arapça, İbranice, CJK (Çince, Japonca, Korece), Devanagari, Yunanca, Tay, Gürcü, Ermenice ve daha birçok dahil olmak üzere 25'ten fazla farklı yazı sistemini tespit edebilir. İster bir Kiril dedektörüne ihtiyacınız olsun, ister herhangi bir dilden karakter setlerini tanımlamak isteyin, araç farklı scriptler arasındaki karakter dağılımı hakkında ayrıntılı istatistikler sunar ve bu da dilbilimsel analiz, içerik denetimi ve metin işleme için vazgeçilmez kılar.

Özellikler

  • Çoklu Yazı Sistemi Algılama: Latin, Kiril, Arapça, İbranice, CJK ve çeşitli Hint scriptleri dahil 25'ten fazla yazı sistemini tanımlar
  • Karışık Yazı Sistemi Uyarısı: Metin birden fazla yazı sistemi içerdiğinde otomatik olarak algılar
  • Ayrıntılı İstatistikler: Her tespit edilen script için karakter sayısını ve yüzde dağılımını gösterir

Desteklenen Yazı Sistemleri

Bu araç karakter setlerini tanımlayabilir ve aşağıdaki yazı sistemlerini tespit edebilir:

  • Latin (genişletilmiş varyantlar dahil)
  • Kiril (Rusça, Ukraynaca, Bulgarca, Sırpça vb.) - Tam Kiril dedektör desteği
  • Arapça (Arapça ekleri ve uzantıları dahil)
  • İbranice
  • Yunanca (genişletilmiş Yunanca dahil)
  • CJK Birleşik Ideogramlar (Çince, Japonca Kanji)
  • Hangul (Korece)
  • Hiragana (Japonca)
  • Katakana (Japonca)
  • Devanagari (Hintçe, Sanskritçe, Marathi, Nepali)
  • Bengali
  • Tamil
  • Telugu
  • Gujarati
  • Kannada
  • Malayalam
  • Sinhala
  • Thai
  • Lao
  • Myanmar (Birmanya)
  • Khmer (Kamboçya)
  • Tibetçe
  • Gürcüce
  • Ermenice
  • Etiyopik (Amharca, Tigrinya)

Yazı Sistemi Nedir?

Yazı sistemi (veya script), belirli bir dil ya da dil grubundaki metni temsil etmek için kullanılan sembollerin bütünüdür. Farklı kültürler ve dil toplulukları binlerce yıl boyunca benzersiz yazı sistemleri geliştirmiştir. Bazı diller aynı scripti kullanır (ör. birçok Avrupa dili Latin kullanır), diğerleri ise kendine özgü scriptlere sahiptir (ör. Arapça, Çince, Kiril).

Metnin script bileşimini anlamak ve karakter setlerini tanımlayabilmek şu amaçlar için kritiktir:

  • Doğru renderleme ve görüntüleme
  • Metin işleme ve normalleştirme
  • Script ve karakter seti tespitiyle dil tanımlama
  • Güvenlik analizi (Kiril veya diğer script dedektörleriyle homograf saldırılarını tespit etme)
  • Uluslararasılaştırma ve yerelleştirme