¿Qué es TOON (Token-Oriented Object Notation)?

TOON es un formato de datos compacto y legible diseñado específicamente para trabajar con Modelos de Lenguaje Grandes (LLM). Reduce el uso de tokens en un 30-60% en comparación con JSON mientras mantiene la legibilidad y la estructura. TOON utiliza un formato basado en indentación similar a YAML y elimina la puntuación redundante declarando los nombres de campos una vez para datos tabulares, lo que lo hace ideal para transmitir datos estructurados a modelos de IA donde los costos de tokens importan.

Descripción de la herramienta

El generador TOON aleatorio crea datos de prueba realistas en formato TOON utilizando la biblioteca Faker.js. Define tu estructura de datos usando una plantilla JSON con marcadores de posición de Faker.js (como {{person.firstName}} o {{number.int(1,100)}}), y la herramienta genera múltiples registros de datos ficticios formateados como TOON eficiente en tokens. Perfecto para probar aplicaciones LLM, crear conjuntos de datos de muestra o generar respuestas API ficticias en un formato tanto amigable para IA como rentable.

Ejemplos

Plantilla de entrada:

[
  {
    "id": "{{string.uuid}}",
    "firstName": "{{person.firstName}}",
    "email": "{{internet.email}}",
    "age": "{{number.int(18,80)}}"
  }
]

Salida (5 registros con delimitador de coma):

[5]{id,firstName,email,age}:
  a1b2c3d4-e5f6-7890-abcd-ef1234567890,Alice,alice.smith@example.com,45
  b2c3d4e5-f6a7-8901-bcde-fa2345678901,Bob,bob.jones@test.org,28
  c3d4e5f6-a7b8-9012-cdef-ab3456789012,Charlie,charlie.brown@demo.net,67
  d4e5f6a7-b8c9-0123-defa-bc4567890123,Diana,diana.wilson@sample.io,33
  e5f6a7b8-c9d0-1234-efab-cd5678901234,Eve,eve.davis@mock.com,52

Características

  • Integración con Faker.js: Usa más de 100 métodos de Faker.js para datos ficticios realistas
  • Generación basada en plantillas: Define tu estructura de datos una vez usando JSON con marcadores de posición
  • Múltiples opciones de delimitadores: Elige entre coma (predeterminado), tabulación o barra vertical para una eficiencia óptima de tokens
  • Generación por lotes: Crea múltiples registros a la vez con fusión automática de arrays
  • Salida eficiente en tokens: Reduce los costos de tokens LLM en un 30-60% en comparación con datos JSON equivalentes

Casos de uso

  • Genera datos de usuario ficticios para probar chatbots de IA o aplicaciones LLM
  • Crea conjuntos de datos de muestra para entrenamiento o pruebas con costos de tokens reducidos
  • Genera datos de prueba para desarrollo de API que serán consumidas por LLMs
  • Crea datos de demostración realistas para presentaciones en formatos amigables para IA