Tokenizador GPT
Tokeniza texto para diferentes modelos de IA.
Entrada
Salida
Leerme
¿Qué es la tokenización en modelos de lenguaje de IA?
La tokenización es el proceso de descomponer el texto en unidades más pequeñas llamadas tokens, que los modelos de lenguaje de IA utilizan para comprender y procesar el texto. Un token puede ser una palabra, parte de una palabra o incluso un solo carácter. Por ejemplo, "hola" puede ser un token, mientras que "extraordinariamente" puede dividirse en varios tokens como "extra", "ordinaria", "mente". Comprender la tokenización es crucial porque los modelos de IA tienen límites de tokens para sus entradas y salidas, y los costos de API a menudo se calculan en función del número de tokens utilizados.
Descripción de la herramienta
La herramienta GPT Tokenizer te permite ver exactamente cómo los diversos modelos GPT de OpenAI tokenizan la entrada de texto. Puedes ingresar cualquier texto de prompt y seleccionar de una amplia gama de modelos GPT para ver el desglose de tokens con visualización codificada por colores. Cada token se resalta con un color único, lo que facilita comprender cómo el modelo procesa tu texto. La herramienta muestra el conteo total de tokens y muestra caracteres especiales (espacios como puntos y saltos de línea como flechas) para una mejor visibilidad.
Ejemplos
Entrada:
- Modelo: GPT-5
- Prompt: "Hola, ¿cómo estás hoy?"
Salida:
- Tokens: el número varía según el modelo
- Visualización: Cada palabra/puntuación mostrada en diferentes colores
Características
- Soporte de múltiples modelos: Elige entre más de 30 modelos GPT y OpenAI
- Tokenización en tiempo real: Ve los tokens actualizarse instantáneamente mientras escribes
- Visualización codificada por colores: Cada token obtiene un color único para una fácil identificación
Modelos compatibles
La herramienta admite los siguientes modelos de OpenAI:
Serie ChatGPT:
- ChatGPT-4o Latest
Serie GPT-5:
- GPT-5
- GPT-5 Pro
- GPT-5 mini
- GPT-5 nano
Serie GPT-4.x:
- GPT-4.5 Preview
- GPT-4.1
- GPT-4.1 mini
- GPT-4.1 nano
Serie GPT-4:
- GPT-4o
- GPT-4o mini
- GPT-4
- GPT-4 turbo
Serie GPT-3.5:
- GPT-3.5 turbo
- GPT-3.5 turbo instruct
Serie O (modelos de razonamiento):
- o4-mini
- o3
- o3-mini
- o3-pro
- o1
- o1-mini
- o1-preview
- o1-pro
Modelos heredados:
- text-davinci-003
- text-davinci-002
- text-davinci-001