TOON‑validator
Valideer de syntaxis van TOON‑formaat (Token‑Oriented Object Notation) en analyseer de structuur. Controleer TOON‑gegevens op juistheid en bekijk gedetailleerde statistieken, waaronder teken‑aantal, regels, arrays, objecten en velden.
Invoer
Uitvoer
Resultaat
Geen waarde
Readme
Wat is TOON?
TOON (Token-Oriented Object Notation) is een compact, menselijk leesbaar gegevensserialisatieformaat dat specifiek is ontworpen voor grote taalmodellen (LLM's). In tegenstelling tot JSON, dat veldnamen voor elk object in een array herhaalt, declareert TOON veldnamen één keer en verzendt vervolgens gegevens in rijen – vergelijkbaar met CSV maar met een expliciete structuur. Dit ontwerp vermindert doorgaans het tokenverbruik met 30‑60 % ten opzichte van geformatteerde JSON, vooral voor uniforme object‑arrays. TOON combineert de inspring‑gebaseerde structuur van YAML voor geneste objecten met de tabulaire efficiëntie van CSV, geoptimaliseerd voor LLM‑contexten waar tokenkosten belangrijk zijn.
Toolbeschrijving
Deze validator controleert de TOON‑formaatsyntaxis op juistheid en biedt gedetailleerde statistieken over de gegevensstructuur. Hij parseert TOON‑invoer met behulp van de officiële @toon-format/toon‑bibliotheek, valideert de syntaxis en geeft uitgebreide metrische gegevens weer, waaronder het aantal tekens, het aantal regels, het aantal arrays, objecten, primitieve waarden en het totale aantal velden. Gebruik deze tool om de integriteit van TOON‑gegevens te verifiëren voordat ze naar LLM's worden verzonden of om de complexiteit van de TOON‑structuur te analyseren.
Functies
- Syntaxisvalidatie – Verifieert de correctheid van het TOON‑formaat met behulp van de officiële parser
- Aantal tekens – Totale aantal tekens in de invoer
- Aantal regels – Aantal regels in de TOON‑gegevens
- Array‑detectie – Telt alle array‑structuren in de gegevens
- Object‑detectie – Telt alle objectstructuren, inclusief geneste objecten
- Primitieve analyse – Telt strings, getallen, booleans en null‑waarden
- Veldtelling – Somt alle objectvelden op over de gehele structuur
- Realtime‑validatie – Directe feedback terwijl je typt
- Syntaxisaccentuering – TOON‑specifieke code‑accentuering voor betere leesbaarheid
- Foutmeldingen – Duidelijke foutbeschrijvingen voor ongeldige syntaxis
Toepassingsgevallen
- Pre‑submissievalidatie – Verifieer de TOON‑syntaxis voordat gegevens naar LLM‑API's worden verzonden om fouten en verspilde tokens te voorkomen
- Structuuranalyse – Begrijp de complexiteit van TOON‑gegevens door array‑, object‑ en veldtellingen te onderzoeken
- Formaat leren – Test TOON‑syntaxisvoorbeelden om het formaat te leren via trial‑and‑error met directe feedback
- Gegevenskwaliteitscontrole – Zorg ervoor dat TOON‑gegevens correct zijn opgemaakt na generatie of conversie vanuit andere formaten
- Tokenoptimalisatie – Analyseer de TOON‑structuur om mogelijkheden voor verdere tokenreductie te identificeren
Statistieken uitgelegd
Tekens: Totale tekenaantal inclusief witruimte en regeleinden. Handig voor het vergelijken van de compactheid van TOON met JSON.
Regels: Aantal regels in de invoer. Het tabulaire formaat van TOON gebruikt doorgaans minder regels dan geformatteerde JSON.
Arrays: Aantal array‑structuren. TOON's tabulaire arrays ([N]{fields}:) zijn token‑efficiënter dan JSON‑arrays voor uniforme gegevens.
Objecten: Aantal objectstructuren. Inclusief zowel root‑objecten als geneste objecten binnen de gegevenshiërarchie.
Primitieve waarden: Totale telling van alle niet‑composite waarden (strings, getallen, booleans, null). Geeft de gegevensdichtheid aan.
Totale velden: Som van alle objecteigenschappen over de gehele structuur. Hoge veldtellingen profiteren het meest van het TOON‑formaat.
Validatieproces
- Parse TOON‑invoer – Gebruikt de decode‑functie van
@toon-format/toonom de invoerstring te parseren - Valideer syntaxis – Als het parseren slaagt, is de TOON‑syntaxis geldig; als er een fout wordt gegooid, is de syntaxis ongeldig
- Analyseer structuur – Doorloopt recursief de geparseerde gegevens om arrays, objecten en primitieve waarden te tellen
- Bereken statistieken – Berekent het aantal tekens, het aantal regels en de totale velden
- Toon resultaten – Toont de validatiestatus en gedetailleerde statistieken in het uitvoerveld
Voordelen van het TOON‑formaat
- 30‑60 % minder tokens dan JSON voor uniforme tabulaire gegevens
- Expliciete structuur met arraylengtes en velddeclaraties
- LLM‑vriendelijk met waarborgen die validatie mogelijk maken
- Menselijk leesbaar met minimale syntaxis en duidelijke structuur
- Verliesvrij representatie van JSON‑gegevens zonder informatieverlies
Wanneer TOON te gebruiken
TOON blinkt uit bij:
- Grote datasets met uniforme array‑structuren
- Herhaalde objecten met dezelfde velden
- API‑responsen met consistente schema's
- Databasequeryresultaten met vaste kolommen
- Alle JSON‑gegevens waarbij tokenkosten van belang zijn
Voor sterk geneste of niet‑uniforme gegevens kan JSON nog steeds efficiënter zijn.