Slumpmässig TOON‑generator
Generera slumpmässig TOON‑data (Token‑Oriented Object Notation) med realistiska dummy‑värden via Faker.js. Skapa token‑effektiv mock‑data för LLM‑testning med anpassningsbara mallar, flera poster och avgränsningsalternativ.
Inmatning
Utdata
Readme
Vad är TOON (Token-Oriented Object Notation)?
TOON är ett kompakt, människoläsbart dataformat som är speciellt utformat för att arbeta med Large Language Models (LLMs). Det minskar tokenanvändningen med 30–60 % jämfört med JSON samtidigt som läsbarhet och struktur bevaras. TOON använder indenteringsbaserad formatering liknande YAML och eliminerar överflödig interpunktion genom att deklarera fältnamn en gång för tabulära data, vilket gör det idealiskt för att skicka strukturerad data till AI‑modeller där tokenkostnader är viktiga.
Verktygsbeskrivning
Random TOON Generator skapar realistisk testdata i TOON‑format med hjälp av Faker.js‑biblioteket. Definiera din datastruktur med en JSON‑mall som innehåller Faker.js‑platshållare (t.ex. {{person.firstName}} eller {{number.int(1,100)}}), och verktyget genererar flera poster med dummy‑data formaterade som token‑effektiv TOON. Perfekt för att testa LLM‑applikationer, skapa exempel‑datasets eller generera mock‑API‑svar i ett format som både är AI‑vänligt och kostnadseffektivt.
Exempel
Inmatningsmall:
[
{
"id": "{{string.uuid}}",
"firstName": "{{person.firstName}}",
"email": "{{internet.email}}",
"age": "{{number.int(18,80)}}"
}
]Utdata (5 poster med kommadelimiterare):
[5]{id,firstName,email,age}:
a1b2c3d4-e5f6-7890-abcd-ef1234567890,Alice,alice.smith@example.com,45
b2c3d4e5-f6a7-8901-bcde-fa2345678901,Bob,bob.jones@test.org,28
c3d4e5f6-a7b8-9012-cdef-ab3456789012,Charlie,charlie.brown@demo.net,67
d4e5f6a7-b8c9-0123-defa-bc4567890123,Diana,diana.wilson@sample.io,33
e5f6a7b8-c9d0-1234-efab-cd5678901234,Eve,eve.davis@mock.com,52Funktioner
- Faker.js‑integration: Använd 100+ Faker.js‑metoder för realistisk dummy‑data (namn, e‑post, adresser, datum, siffror osv.)
- Mall‑baserad generering: Definiera din datastruktur en gång med JSON och platshållare
- Flera delimiter‑alternativ: Välj mellan kommadelimiterare (standard), tabb eller pipe‑delimiterare för optimal token‑effektivitet
- Batch‑generering: Skapa flera poster samtidigt med automatisk sammanslagning av arrayer
- Token‑effektiv utdata: Minska LLM‑tokenkostnader med 30–60 % jämfört med motsvarande JSON‑data
- Tabulärt format: Använder automatiskt TOON:s effektiva tabulära format för enhetliga datastrukturer
- Live‑förhandsgranskning: Se ditt TOON‑utdata uppdateras när du ändrar mallen
Användningsområden
- Generera mock‑användardata för testning av AI‑chatbots eller LLM‑applikationer
- Skapa exempel‑datasets för träning eller testning av datapipelines med minskade tokenkostnader
- Generera testdata för API‑utveckling som ska konsumeras av LLM‑modeller
- Skapa realistisk demodata för presentationer eller dokumentation med AI‑vänliga format
- Bygg mock‑databaser för prototypning av LLM‑drivna applikationer
Stödda Faker.js‑platshållare
Vanliga platshållare du kan använda i mallar:
- Person:
{{person.firstName}},{{person.lastName}},{{person.fullName}},{{person.jobTitle}} - Internet:
{{internet.email}},{{internet.url}},{{internet.userName}},{{internet.ip}} - Plats:
{{location.city}},{{location.country}},{{location.zipCode}},{{location.streetAddress}} - Företag:
{{company.name}},{{company.catchPhrase}},{{company.industry}} - Finans:
{{finance.amount}},{{finance.accountNumber}},{{finance.creditCardNumber}} - Datum:
{{date.past}},{{date.future}},{{date.recent}} - Nummer:
{{number.int(min,max)}},{{number.float(min,max,precision)}} - Text:
{{lorem.sentence}},{{lorem.paragraph}},{{lorem.words(count)}} - ID:n:
{{string.uuid}},{{string.alphanumeric(length)}},{{string.numeric(length)}
För en komplett lista över tillgängliga Faker.js‑metoder, besök: https://fakerjs.dev/api/
Delimiter‑alternativ
- Komma (,): Standarddelimiter, bra för de flesta användningsfall
- Tabb (\t): Ofta mer token‑effektiv, ett tecken som tokeniseras väl
- Pipe (|): Alternativ delimiter, användbart när data innehåller kommatecken