Токенизатор GPT
Токенизируйте текст для различных моделей ИИ.
Ввод
Вывод
Документация
Что такое токенизация в языковых моделях ИИ?
Токенизация — это процесс разбиения текста на более мелкие единицы, называемые токенами, которые языковые модели ИИ используют для понимания и обработки текста. Токеном может быть слово, часть слова или даже отдельный символ. Например, "привет" может быть одним токеном, а "беспрецедентный" может быть разделен на несколько токенов, таких как "бес", "прецедент", "ный". Понимание токенизации крайне важно, потому что модели ИИ имеют ограничения на количество токенов для входных и выходных данных, а стоимость API часто рассчитывается на основе количества использованных токенов.
Описание инструмента
Инструмент GPT Tokenizer позволяет увидеть, как именно различные модели GPT от OpenAI токенизируют текстовый ввод. Вы можете ввести любой текстовый промпт и выбрать из широкого спектра моделей GPT, чтобы увидеть разбивку на токены с цветовой визуализацией. Каждый токен выделен уникальным цветом, что облегчает понимание того, как модель обрабатывает ваш текст. Инструмент отображает общее количество токенов и показывает специальные символы (пробелы как точки, переносы строк как стрелки) для лучшей видимости.
Примеры
Ввод:
- Модель: GPT-5
- Промпт: "Привет, как дела сегодня?"
Вывод:
- Токены: количество зависит от модели
- Визуализация: Каждое слово/знак препинания отображается разными цветами
Функции
- Поддержка множества моделей: Выбор из более чем 30 моделей GPT и OpenAI
- Токенизация в реальном времени: Токены обновляются мгновенно при вводе
- Цветовая визуализация: Каждый токен получает уникальный цвет для легкой идентификации
Поддерживаемые модели
Инструмент поддерживает следующие модели OpenAI:
Серия ChatGPT:
- ChatGPT-4o Latest
Серия GPT-5:
- GPT-5
- GPT-5 Pro
- GPT-5 mini
- GPT-5 nano
Серия GPT-4.x:
- GPT-4.5 Preview
- GPT-4.1
- GPT-4.1 mini
- GPT-4.1 nano
Серия GPT-4:
- GPT-4o
- GPT-4o mini
- GPT-4
- GPT-4 turbo
Серия GPT-3.5:
- GPT-3.5 turbo
- GPT-3.5 turbo instruct
O-серия (модели рассуждения):
- o4-mini
- o3
- o3-mini
- o3-pro
- o1
- o1-mini
- o1-preview
- o1-pro
Устаревшие модели:
- text-davinci-003
- text-davinci-002
- text-davinci-001