ما هو TOON (Token-Oriented Object Notation)?

TOON هو تنسيق بيانات مضغوط وقابل للقراءة من قبل الإنسان صُمم خصيصًا للعمل مع نماذج اللغة الكبيرة (LLMs). يقلل من استهلاك الرموز بنسبة 30‑60٪ مقارنةً بـ JSON مع الحفاظ على القابلية للقراءة والبنية. يستخدم TOON تنسيقًا يعتمد على المسافات البادئة مشابهًا لـ YAML ويقضي على علامات الترقيم الزائدة عن طريق إعلان أسماء الحقول مرة واحدة للبيانات الجدولية، مما يجعله مثاليًا لتمرير البيانات المهيكلة إلى نماذج الذكاء الاصطناعي حيث تكاليف الرموز مهمة.

وصف الأداة

المولد العشوائي لـ TOON يُنشئ بيانات تجريبية واقعية بصيغة TOON باستخدام مكتبة Faker.js. عرّف بنية البيانات الخاصة بك باستخدام قالب JSON يحتوي على نائِبات Faker.js (مثل {{person.firstName}} أو {{number.int(1,100)}})، وستقوم الأداة بإنشاء سجلات متعددة من البيانات الوهمية بصيغة TOON ذات كفاءة عالية في استهلاك الرموز. مثالي لاختبار تطبيقات LLM، إنشاء مجموعات بيانات تجريبية، أو توليد ردود API تجريبية بصيغة صديقة للذكاء الاصطناعي وفعّالة من حيث التكلفة.

أمثلة

قالب الإدخال:

[
  {
    "id": "{{string.uuid}}",
    "firstName": "{{person.firstName}}",
    "email": "{{internet.email}}",
    "age": "{{number.int(18,80)}}"
  }
]

الناتج (5 سجلات بفاصل الفاصلة):

[5]{id,firstName,email,age}:
  a1b2c3d4-e5f6-7890-abcd-ef1234567890,Alice,alice.smith@example.com,45
  b2c3d4e5-f6a7-8901-bcde-fa2345678901,Bob,bob.jones@test.org,28
  c3d4e5f6-a7b8-9012-cdef-ab3456789012,Charlie,charlie.brown@demo.net,67
  d4e5f6a7-b8c9-0123-defa-bc4567890123,Diana,diana.wilson@sample.io,33
  e5f6a7b8-c9d0-1234-efab-cd5678901234,Eve,eve.davis@mock.com,52

الميزات

  • تكامل Faker.js: استخدم أكثر من 100 طريقة من Faker.js للحصول على بيانات وهمية واقعية (أسماء، بريد إلكتروني، عناوين، تواريخ، أرقام، إلخ)
  • إنشاء قائم على القالب: عرّف بنية البيانات مرة واحدة باستخدام JSON مع النائِبات
  • خيارات فواصل متعددة: اختر بين الفاصلة (الافتراضية)، علامة التبويب، أو الفاصل العمودي لتحقيق أقصى كفاءة في الرموز
  • إنشاء دفعي: أنشئ سجلات متعددة في آنٍ واحد مع دمج المصفوفات تلقائيًا
  • ناتج كفء في استهلاك الرموز: قلل تكاليف الرموز في LLM بنسبة 30‑60٪ مقارنةً ببيانات JSON المكافئة
  • تنسيق جدولي: يستخدم تلقائيًا تنسيق TOON الجدولي الفعال للبيانات ذات البنية الموحدة
  • معاينة مباشرة: شاهد ناتج TOON يتحديث فور تعديل القالب

حالات الاستخدام

  • إنشاء بيانات مستخدم تجريبية لاختبار روبوتات الدردشة أو تطبيقات LLM
  • إنشاء مجموعات بيانات تجريبية للتدريب أو اختبار خطوط البيانات مع تقليل تكاليف الرموز
  • توليد بيانات اختبار لتطوير API سيتم استهلاكها بواسطة نماذج اللغة
  • إنشاء بيانات عرض واقعية للعروض التقديمية أو الوثائق باستخدام تنسيقات صديقة للذكاء الاصطناعي
  • بناء قواعد بيانات تجريبية لنماذج أولية لتطبيقات مدعومة بـ LLM

المتغيرات المدعومة في Faker.js

المتغيرات الشائعة التي يمكنك استخدامها في القوالب:

  • الشخص: {{person.firstName}}, {{person.lastName}}, {{person.fullName}}, {{person.jobTitle}}
  • الإنترنت: {{internet.email}}, {{internet.url}}, {{internet.userName}}, {{internet.ip}}
  • الموقع: {{location.city}}, {{location.country}}, {{location.zipCode}}, {{location.streetAddress}}
  • الشركة: {{company.name}}, {{company.catchPhrase}}, {{company.industry}}
  • المالية: {{finance.amount}}, {{finance.accountNumber}}, {{finance.creditCardNumber}}
  • التاريخ: {{date.past}}, {{date.future}}, {{date.recent}}
  • الأرقام: {{number.int(min,max)}}, {{number.float(min,max,precision)}}
  • النص: {{lorem.sentence}}, {{lorem.paragraph}}, {{lorem.words(count)}}
  • المعرفات: {{string.uuid}}, {{string.alphanumeric(length)}}, {{string.numeric(length)}

للحصول على القائمة الكاملة للطرق المتاحة في Faker.js، زر: https://fakerjs.dev/api/

خيارات الفاصل

  • الفاصلة ( , ): الفاصل القياسي، مناسب لمعظم الحالات
  • علامة التبويب ( \t ): غالبًا ما تكون أكثر كفاءة في استهلاك الرموز، حرف واحد يتجزأ جيدًا
  • الخط العمودي ( | ): فاصل بديل، مفيد عندما تحتوي البيانات على فواصل**