TOON バリデーター
TOON(Token-Oriented Object Notation)フォーマットのシンタックスを検証し、構造を分析します。TOONデータの正確性をチェックし、文字数、行数、アレイ、オブジェクト、フィールドを含む詳細な統計情報を表示します。
入力
出力
結果
値なし
Readme
TOON とは?
TOON (Token-Oriented Object Notation) は、大規模言語モデル (LLM) 向けに特別に設計されたコンパクトで人間が読みやすいデータシリアライゼーション形式です。配列内のすべてのオブジェクトに対してフィールド名を繰り返す JSON とは異なり、TOON はフィールド名を一度宣言してからデータを行で送信します。これは CSV に似ていますが、明示的な構造を持っています。この設計により、特に均一なオブジェクト配列の場合、フォーマット済み JSON と比べて通常 30~60% のトークン使用量削減が実現します。TOON は、ネストされたオブジェクト用の YAML のインデント構造と CSV の表形式の効率性を組み合わせており、トークンコストが重要な LLM コンテキストに最適化されています。
ツール説明
このバリデータは TOON 形式の構文の正確性をチェックし、データ構造に関する詳細な統計情報を提供します。公式の @toon-format/toon ライブラリを使用して TOON 入力を解析し、構文を検証し、文字数、行数、配列数、オブジェクト数、プリミティブ値数、および総フィールド数を含む包括的なメトリクスを出力します。このツールを使用して、LLM に送信する前に TOON データの整合性を確認するか、TOON 構造の複雑さを分析してください。
機能
- 構文検証 - 公式パーサーを使用して TOON 形式の正確性を検証
- 文字数カウント - 入力の総文字数
- 行数カウント - TOON データの行数
- 配列検出 - データ内のすべての配列構造をカウント
- オブジェクト検出 - ネストされたものを含むすべてのオブジェクト構造をカウント
- プリミティブ分析 - 文字列、数値、ブール値、null 値をカウント
- フィールドカウント - 構造全体のすべてのオブジェクトフィールドを合計
- リアルタイム検証 - 入力時に即座にフィードバック
- 構文ハイライト - より読みやすくするための TOON 固有のコードハイライト
- エラーメッセージ - 無効な構文に対する明確なエラー説明
ユースケース
- 送信前検証 - LLM API にデータを送信する前に TOON 構文を検証し、エラーとトークン無駄を回避
- 構造分析 - 配列、オブジェクト、フィールド数を調べることで TOON データの複雑さを理解
- 形式学習 - 即座にフィードバックを得ながら TOON 構文例をテストして、試行錯誤を通じて形式を学習
- データ品質チェック - 他の形式から生成または変換された後、TOON データが適切にフォーマットされていることを確認
- トークン最適化 - TOON 構造を分析して、さらなるトークン削減の機会を特定
統計情報の説明
文字数: 空白と改行を含む総文字数。TOON の JSON に対するコンパクト性を比較するのに便利です。
行数: 入力の行数。TOON の表形式は通常、フォーマット済み JSON より少ない行数を使用します。
配列: 配列構造のカウント。TOON の表形式配列 ([N]{fields}:) は、均一なデータの場合 JSON 配列よりトークン効率が高くなります。
オブジェクト: オブジェクト構造のカウント。データ階層内のルートオブジェクトとネストされたオブジェクトの両方を含みます。
プリミティブ値: すべての非複合値 (文字列、数値、ブール値、null) の総カウント。データ密度を示します。
総フィールド数: 構造全体のすべてのオブジェクトプロパティの合計。フィールド数が多いほど TOON 形式の恩恵を受けます。
検証プロセス
- TOON 入力を解析 -
@toon-format/toonデコード関数を使用して入力文字列を解析 - 構文を検証 - 解析が成功すれば TOON 構文は有効。エラーがスローされれば構文は無効
- 構造を分析 - 解析されたデータを再帰的にトラバースして、配列、オブジェクト、プリミティブをカウント
- 統計情報を計算 - 文字数、行数、フィールド合計を計算
- 結果を表示 - 検証ステータスと詳細な統計情報を出力領域に表示
TOON 形式の利点
- 均一な表形式データの場合、JSON より 30~60% 少ないトークン
- 配列長とフィールド宣言を備えた 明示的な構造
- ガードレールを備えた LLM フレンドリー で検証を有効化
- 最小限の構文と明確な構造を備えた 人間が読みやすい
- 情報損失なしの JSON データの ロスレス 表現
TOON を使用する場合
TOON は以下に最適です:
- 均一な配列構造を持つ大規模データセット
- 同じフィールドを持つ繰り返されるオブジェクト
- 一貫したスキーマを持つ API レスポンス
- 固定列を持つデータベースクエリ結果
- トークンコストが重要な JSON データ
深くネストされた、または不均一なデータの場合、JSON の方が効率的である可能性があります。