GPT tokenleştirici
Metni farklı AI modelleri için tokenleştirin.
Girdi
Çıktı
Readme
AI dil modellerinde tokenizasyon nedir?
Tokenizasyon, metni AI dil modellerinin anlayıp işleyebileceği daha küçük birimler olan tokenlara bölme sürecidir. Bir token bir kelime, bir kelimenin bir bölümü ya da tek bir karakter olabilir. Örneğin, "hello" bir token iken "unprecedented" birden fazla tokena ayrılabilir: "un", "pre", "cedent" ve "ed". Tokenizasyonu anlamak çok önemlidir çünkü AI modellerinin giriş ve çıkışları için token limitleri vardır ve API maliyetleri genellikle kullanılan token sayısına göre hesaplanır.
Araç açıklaması
GPT Tokenizer aracı, OpenAI'nın çeşitli GPT modellerinin metin girişini nasıl tokenlaştırdığını tam olarak görmenizi sağlar. Herhangi bir metin istemi girebilir ve geniş bir GPT modeli yelpazesinden seçim yaparak token dağılımını renk kodlu görselleştirme ile görebilirsiniz. Her token benzersiz bir renkle vurgulanır, bu da modelin metninizi nasıl işlediğini anlamayı kolaylaştırır. Araç toplam token sayısını gösterir ve özel karakterleri (boşlukları nokta olarak ve satır sonlarını ok olarak) daha iyi görünürlük için gösterir.
Örnekler
Girdi:
- Model: GPT-5
- İstem: "Hello, how are you today?"
Çıktı:
- Tokenlar: 7
- Görselleştirme: Her kelime/noktalama işareti farklı renklerde gösterilir
Özellikler
- Çoklu Model Desteği: 30+ GPT ve OpenAI modelinden seçim yapabilirsiniz
- Gerçek zamanlı tokenizasyon: Yazarken tokenlar anında güncellenir
- Renk kodlu görselleştirme: Her token kolay tanımlama için benzersiz bir renge sahiptir
- Özel karakter gösterimi: Boşluklar nokta (·) ve satır sonları ok (↵) olarak gösterilir
- Token sayısı: Kullanılan toplam token sayısı gerçek zamanlı olarak görüntülenir
- Model‑spesifik kodlama: Her model kendi tokenizasyon kurallarını kullanır
Desteklenen Modeller
Araç aşağıdaki OpenAI modellerini destekler:
ChatGPT Serisi:
- ChatGPT-4o Latest
GPT-5 Serisi:
- GPT-5
- GPT-5 Pro
- GPT-5 mini
- GPT-5 nano
GPT-4.x Serisi:
- GPT-4.5 Preview
- GPT-4.1
- GPT-4.1 mini
- GPT-4.1 nano
GPT-4 Serisi:
- GPT-4o
- GPT-4o mini
- GPT-4
- GPT-4 turbo
GPT-3.5 Serisi:
- GPT-3.5 turbo
- GPT-3.5 turbo instruct
O-Serisi (Akıl Yürütme Modelleri):
- o4-mini
- o3
- o3-mini
- o3-pro
- o1
- o1-mini
- o1-preview
- o1-pro
Eski Modeller:
- text-davinci-003
- text-davinci-002
- text-davinci-001
Kullanım Alanları
- API Maliyet Tahmini: API çağrısı yapmadan önce token kullanımını hesaplayarak maliyet tahmini yapın
- İstem Optimizasyonu: Metnin nasıl tokenlaştırıldığını anlayarak token sayısını azaltın
- Bağlam Penceresi Planlaması: İstemlerinizin model token limitlerine uygun olduğundan emin olun
- AI Yanıtlarını Hata Ayıklama: Belirli girdilerin beklenmedik çıktılar üretmesinin nedenini anlayın
- Eğitim Amaçlı: Farklı modellerin tokenizasyonu nasıl farklılık gösterdiğini öğrenin
- İçerik Uzunluğu Planlaması: İçeriğinizi token kısıtlamalarına uygun şekilde planlayın