Cos'è TOON (Token-Oriented Object Notation)?

TOON è un formato dati compatto e leggibile progettato specificamente per lavorare con i Large Language Models (LLM). Riduce l'uso dei token del 30-60% rispetto a JSON mantenendo leggibilità e struttura. TOON utilizza una formattazione basata su indentazione simile a YAML ed elimina la punteggiatura ridondante dichiarando i nomi dei campi una volta per i dati tabulari, rendendolo ideale per trasmettere dati strutturati ai modelli AI dove i costi dei token sono importanti.

Descrizione dello strumento

Il generatore TOON casuale crea dati fittizi realistici in formato TOON utilizzando la libreria Faker.js. Definisci la struttura dei dati usando un template JSON con segnaposto Faker.js (come {{person.firstName}} o {{number.int(1,100)}}), e lo strumento genera più record di dati fittizi formattati come TOON efficiente in termini di token. Perfetto per testare applicazioni LLM, creare dataset di esempio o generare risposte API fittizie in un formato sia amichevole per l'AI che economicamente vantaggioso.

Esempi

Template di input:

[
  {
    "id": "{{string.uuid}}",
    "firstName": "{{person.firstName}}",
    "email": "{{internet.email}}",
    "age": "{{number.int(18,80)}}"
  }
]

Output (5 record con delimitatore virgola):

[5]{id,firstName,email,age}:
  a1b2c3d4-e5f6-7890-abcd-ef1234567890,Alice,alice.smith@example.com,45
  b2c3d4e5-f6a7-8901-bcde-fa2345678901,Bob,bob.jones@test.org,28
  c3d4e5f6-a7b8-9012-cdef-ab3456789012,Charlie,charlie.brown@demo.net,67
  d4e5f6a7-b8c9-0123-defa-bc4567890123,Diana,diana.wilson@sample.io,33
  e5f6a7b8-c9d0-1234-efab-cd5678901234,Eve,eve.davis@mock.com,52

Funzionalità

  • Integrazione Faker.js: Usa oltre 100 metodi Faker.js per dati fittizi realistici
  • Generazione basata su template: Definisci la struttura dei dati una volta usando JSON con segnaposto
  • Opzioni di delimitatori multipli: Scegli tra virgola (predefinito), tabulazione o barra verticale per un'efficienza ottimale dei token
  • Generazione batch: Crea più record contemporaneamente con fusione automatica degli array
  • Output efficiente in termini di token: Riduci i costi dei token LLM del 30-60% rispetto ai dati JSON equivalenti

Casi d'uso

  • Genera dati utente fittizi per testare chatbot AI o applicazioni LLM
  • Crea dataset di esempio per training o testing con costi di token ridotti
  • Genera dati di test per lo sviluppo di API che saranno consumate dagli LLM
  • Crea dati demo realistici per presentazioni in formati amichevoli per l'AI