TOON(Token-Oriented Object Notation)とは?

TOONは、大規模言語モデル(LLM)での使用を目的に設計されたコンパクトで人間が読みやすいデータ形式です。JSONと比較して30~60%のtoken使用量を削減しながら、可読性と構造を維持します。TOONはYAMLに似たインデント形式を使用し、表形式データのフィールド名を一度だけ宣言することで冗長な句読点を排除するため、token コストが重要なAIモデルに構造化データを渡すのに最適です。

ツール説明

Random TOON Generatorは、Faker.jsライブラリを使用してTOON形式のリアルなモックデータを生成します。Faker.jsプレースホルダー({{person.firstName}}{{number.int(1,100)}}など)を含むJSONテンプレートを使用してデータ構造を定義すると、このツールは複数のダミーデータレコードをtoken効率的なTOON形式で生成します。LLMアプリケーションのテスト、サンプルデータセットの作成、またはAIフレンドリーでコスト効率的な形式でのモックAPIレスポンスの生成に最適です。

入力テンプレート:

[
  {
    "id": "{{string.uuid}}",
    "firstName": "{{person.firstName}}",
    "email": "{{internet.email}}",
    "age": "{{number.int(18,80)}}"
  }
]

出力(5レコード、カンマ区切り):

[5]{id,firstName,email,age}:
  a1b2c3d4-e5f6-7890-abcd-ef1234567890,Alice,alice.smith@example.com,45
  b2c3d4e5-f6a7-8901-bcde-fa2345678901,Bob,bob.jones@test.org,28
  c3d4e5f6-a7b8-9012-cdef-ab3456789012,Charlie,charlie.brown@demo.net,67
  d4e5f6a7-b8c9-0123-defa-bc4567890123,Diana,diana.wilson@sample.io,33
  e5f6a7b8-c9d0-1234-efab-cd5678901234,Eve,eve.davis@mock.com,52

機能

  • Faker.js統合: リアルなダミーデータ(名前、メール、住所、日付、数字など)用に100以上のFaker.jsメソッドを使用
  • テンプレートベースの生成: プレースホルダー付きJSONを使用してデータ構造を一度定義
  • 複数の区切り文字オプション: カンマ(デフォルト)、タブ、またはパイプ区切り文字を選択してtoken効率を最適化
  • バッチ生成: 複数のレコードを一度に作成し、自動的に配列をマージ
  • Token効率的な出力: JSONと同等のデータと比較してLLM token コストを30~60%削減
  • 表形式: 均一なデータ構造に対してTOONの効率的な表形式を自動的に使用
  • ライブプレビュー: テンプレートを変更するとTOON出力がリアルタイムで更新

ユースケース

  • AIチャットボットまたはLLMアプリケーションのテスト用にモックユーザーデータを生成
  • token コスト削減によるデータパイプラインのテストまたはトレーニング用サンプルデータセットを作成
  • LLMで使用されるAPIの開発用テストデータを生成
  • AI フレンドリー形式を使用してプレゼンテーションまたはドキュメント用のリアルなデモデータを作成
  • LLM駆動アプリケーションのプロトタイピング用モックデータベースを構築

サポートされているFaker.jsプレースホルダー

テンプレートで使用できる一般的なプレースホルダー:

  • Person: {{person.firstName}}{{person.lastName}}{{person.fullName}}{{person.jobTitle}}
  • Internet: {{internet.email}}{{internet.url}}{{internet.userName}}{{internet.ip}}
  • Location: {{location.city}}{{location.country}}{{location.zipCode}}{{location.streetAddress}}
  • Company: {{company.name}}{{company.catchPhrase}}{{company.industry}}
  • Finance: {{finance.amount}}{{finance.accountNumber}}{{finance.creditCardNumber}}
  • Date: {{date.past}}{{date.future}}{{date.recent}}
  • Numbers: {{number.int(min,max)}}{{number.float(min,max,precision)}}
  • Text: {{lorem.sentence}}{{lorem.paragraph}}{{lorem.words(count)}}
  • IDs: {{string.uuid}}{{string.alphanumeric(length)}}{{string.numeric(length)}}

利用可能なFaker.jsメソッドの完全なリストについては、https://fakerjs.dev/api/ を参照してください。

区切り文字オプション

  • カンマ(,): 標準的な区切り文字、ほとんどのユースケースに適しています
  • タブ(\t): 多くの場合、より効率的なtoken化、単一文字でよくtokenize されます
  • パイプ(|): 代替区切り文字、データにカンマが含まれている場合に便利です