Τι είναι το TOON (Token-Oriented Object Notation);

Το TOON είναι μια συμπαγής, ευανάγνωστη μορφή δεδομένων σχεδιασμένη ειδικά για εργασία με Large Language Models (LLMs). Μειώνει τη χρήση token κατά 30-60% σε σύγκριση με JSON διατηρώντας την αναγνωσιμότητα και τη δομή. Το TOON χρησιμοποιεί μορφοποίηση βασισμένη στη στοίχιση παρόμοια με YAML και εξαλείφει περιττή στίξη δηλώνοντας τα ονόματα πεδίων μία φορά για δεδομένα σε πίνακα, καθιστώντας το ιδανικό για τη μεταφορά δομημένων δεδομένων σε μοντέλα AI όπου το κόστος token έχει σημασία.

Περιγραφή εργαλείου

Ο Random TOON Generator δημιουργεί ρεαλιστικά mock δεδομένα σε μορφή TOON χρησιμοποιώντας τη βιβλιοθήκη Faker.js. Ορίστε τη δομή των δεδομένων σας χρησιμοποιώντας ένα JSON template με placeholders Faker.js (όπως {{person.firstName}} ή {{number.int(1,100)}}), και το εργαλείο δημιουργεί πολλαπλές εγγραφές δεδομένων dummy μορφοποιημένα ως token-efficient TOON. Τέλειο για δοκιμή εφαρμογών LLM, δημιουργία δειγματικών συνόλων δεδομένων ή δημιουργία mock API responses σε μορφή που είναι φιλική προς AI και οικονομική.

Παραδείγματα

Input template:

[
  {
    "id": "{{string.uuid}}",
    "firstName": "{{person.firstName}}",
    "email": "{{internet.email}}",
    "age": "{{number.int(18,80)}}"
  }
]

Output (5 εγγραφές με comma delimiter):

[5]{id,firstName,email,age}:
  a1b2c3d4-e5f6-7890-abcd-ef1234567890,Alice,alice.smith@example.com,45
  b2c3d4e5-f6a7-8901-bcde-fa2345678901,Bob,bob.jones@test.org,28
  c3d4e5f6-a7b8-9012-cdef-ab3456789012,Charlie,charlie.brown@demo.net,67
  d4e5f6a7-b8c9-0123-defa-bc4567890123,Diana,diana.wilson@sample.io,33
  e5f6a7b8-c9d0-1234-efab-cd5678901234,Eve,eve.davis@mock.com,52

Χαρακτηριστικά

  • Ενσωμάτωση Faker.js: Χρησιμοποιήστε 100+ μεθόδους Faker.js για ρεαλιστικά dummy δεδομένα (ονόματα, emails, διευθύνσεις, ημερομηνίες, αριθμούς, κ.λπ.)
  • Δημιουργία βασισμένη σε template: Ορίστε τη δομή των δεδομένων σας μία φορά χρησιμοποιώντας JSON με placeholders
  • Πολλαπλές επιλογές delimiter: Επιλέξτε μεταξύ comma (προεπιλογή), tab ή pipe delimiters για βέλτιστη token efficiency

Υποστηριζόμενα placeholders Faker.js

Κοινά placeholders που μπορείτε να χρησιμοποιήσετε σε templates:

  • Person: {{person.firstName}}, {{person.lastName}}, {{person.fullName}}, {{person.jobTitle}}
  • Internet: {{internet.email}}, {{internet.url}}, {{internet.userName}}, {{internet.ip}}
  • Location: {{location.city}}, {{location.country}}, {{location.zipCode}}, {{location.streetAddress}}
  • Company: {{company.name}}, {{company.catchPhrase}}, {{company.industry}}
  • Finance: {{finance.amount}}, {{finance.accountNumber}}, {{finance.creditCardNumber}}
  • Date: {{date.past}}, {{date.future}}, {{date.recent}}
  • Numbers: {{number.int(min,max)}}, {{number.float(min,max,precision)}}
  • Text: {{lorem.sentence}}, {{lorem.paragraph}}, {{lorem.words(count)}}
  • IDs: {{string.uuid}}, {{string.alphanumeric(length)}}, {{string.numeric(length)}

Για μια πλήρη λίστα διαθέσιμων μεθόδων Faker.js, επισκεφθείτε: https://fakerjs.dev/api/

Επιλογές delimiter

  • Comma (,): Τυπικό delimiter, καλό για τις περισσότερες περιπτώσεις
  • Tab (\t): Συχνά πιο token-efficient, ένας χαρακτήρας που tokenizes καλά
  • Pipe (|): Εναλλακτικό delimiter, χρήσιμο όταν τα δεδομένα περιέχουν κόμματα