TOON XML konverter
Konverteeri TOON (Token-Oriented Object Notation) ja XML vormingute vahel. Muuta tokenitõhus TOON-andmed XML-märgistuseks ja vastupidi, kasutades JSON-i vaheformaadina usaldusväärseks konversiooniks.
Sisend
Väljund
Loe mind
Mis on TOON vorming?
TOON (Token-Oriented Object Notation) on kompaktne, inimloetav andmeserialiseerimise formaat, mis on loodud spetsiaalselt suurte keelemudelite (LLM‑de) jaoks. Erinevalt JSON‑ist, mis kordab iga massiivi objekti puhul väljanime, deklareerib TOON väljanimed üks kord ja seejärel voogesitab andmeid ridadena — sarnane CSV‑le, kuid selge struktuuriga. See disain vähendab tavaliselt tokenite kasutust 30‑60 % võrreldes vormindatud JSON‑iga, eriti ühtsete objektimassiivide puhul. TOON ühendab YAML‑i taandepõhise struktuuri pesastatud objektide jaoks CSV‑i tabelilise tõhususega, optimeeritud LLM‑i kontekstides, kus tokenite kulu on oluline.
Mis on XML?
XML (eXtensible Markup Language) on laialdaselt kasutatav märgistuskeel dokumentide kodeerimiseks vormingus, mis on nii inimloetav kui masinloetav. XML kasutab silte elementide ja atribuutide määratlemiseks, luues hierarhilise puustruktuuri. Seda kasutatakse sageli konfiguratsioonifailide, süsteemidevahelise andmevahetuse, veebiteenuste (SOAP), dokumendivormingute (Office Open XML) ja RSS‑voogude jaoks. Kuigi XML on sõnasõltuv ja eksplitsiitne, pakub see tugevaid valideerimisvõimalusi ja toetab keerukaid pesastatud struktuure.
Tööriista kirjeldus
See konverter teisendab andmeid kahepoolse suunaga TOON‑i ja XML‑i vormingute vahel, kasutades vaheformaadina JSON‑i. Teisendusprotsess on: TOON ↔ JSON ↔ XML. See lähenemine tagab usaldusväärse teisenduse, kasutades iga sammu jaoks hästi tõestatud teeke. Teisenda tokenite tõhus TOON‑i andmed standardseks XML‑i märgendiks süsteemidele, mis vajavad XML‑i sisendit, või muuda XML‑i andmed kompaktseks TOON‑i vorminguks, et vähendada tokenite kasutust LLM‑i rakendustes.
Näited
TOON → XML teisendus:
Input (TOON):
users[2]{id,name,role}:
1,Alice,admin
2,Bob,user
Output (XML):
<?xml version="1.0" encoding="UTF-8"?>
<root>
<users>
<id>1</id>
<name>Alice</name>
<role>admin</role>
</users>
<users>
<id>2</id>
<name>Bob</name>
<role>user</role>
</users>
</root>
XML → TOON teisendus:
Input (XML):
<?xml version="1.0" encoding="UTF-8"?>
<order>
<id>ORD-456</id>
<customer>John Doe</customer>
<total>99.99</total>
</order>
Output (TOON):
order:
id: ORD-456
customer: John Doe
total: 99.99
Funktsioonid
- Kahepoolne teisendus TOON‑i ja XML‑i vahel, säilitades kogu andmestiku
- JSON vaheformaadi kasutamine tagab usaldusväärse teisenduse, kasutades tõestatud teeke
- Toetab keerukaid struktuure, sealhulgas pesastatud elemente, atribuute ja massiive
- Automaatne vormingu tuvastamine ja optimaalse teisendusstrateegia
- Säilitab andmete hierarhia, hoides vanema‑lapse seoseid
- Tüübiteadlik teisendus, hoides numbreid, tõeväärtusi ja stringe muutumatuna
- Reaalajas teisendus kohese tulemustega
- Süntaksi esiletõstmine nii TOON‑i kui XML‑i vormingutes
Kasutusjuhtumid
- Legacy System Integration – teisenda kaasaegsed TOON‑i andmed XML‑i vormingusse, et tagada ühilduvus vanemate ettevõtte süsteemidega, mis nõuavad XML‑i sisendit
- API Data Transformation – muuda XML‑i API‑vastused tokenite tõhusaks TOON‑i vorminguks enne nende saatmist LLM‑idele töötlemiseks ja analüüsimiseks
- Configuration File Conversion – teisenda XML‑i konfiguratsioonifailid TOON‑i vormingusse, et vähendada tokenite kasutust LLM‑ide abil infrastruktuuri haldamisel
- Document Processing – muuda XML‑dokumente (RSS‑voogusid, SOAP‑vastuseid, Office‑dokumendeid) TOON‑iks, et võimaldada tõhusat LLM‑põhist analüüsi
- Data Migration – teisenda andmeid süsteemide vahel, mis kasutavad erinevaid vorminguid, kus TOON toimib tokenite tõhusa vaheesindusena
Teisendusprotsess
TOON → XML:
- Parseeri TOON vorming JavaScripti objektiks (kasutades
@toon-format/toondekodeerimist) - Konverteeri JavaScripti objekt XML‑i märgendiks (kasutades
xml2jsehitajat) - Väljasta vormindatud XML õige taandega
XML → TOON:
- Parseeri XML märgend JavaScripti objektiks (kasutades
xml2jsparserit) - Konverteeri JavaScripti objekt TOON vormingusse (kasutades
@toon-format/toonkodeerimist) - Väljasta kompaktne TOON esitus
XML struktuuri märkused
TOON → XML teisendamisel:
- Juurobjekti võtmed muutuvad XML elementideks
- Massiivid loovad mitu elementi sama sildi nimega
- Tabelilised TOON massiivid laienevad üksikuks XML elemendiks
- Objekti omadused muutuvad alamelementideks
- Väärtused konverteeritakse tekstisisuks
XML → TOON teisendamisel:
- XML elemendid muutuvad objektivõtmeteks
- Korduvad elemendid muutuvad massiivideks
- Atribuudid liidetakse elemendi sisuga
- Tekstisisu muutub stringi väärtuseks
- Tühjad elemendid muutuvad tühjaks stringiks või nulliks
Vormingu kaalutlused
XML sõnavõrdsus:
- XML on loomulikult sõnasõltuv, nõudes avamis- ja sulgemismärgendeid
- Iga element vajab nii algus- kui lõppmärgendit
- Atribuudid lisavad täiendavaid märke
- Sobib hästi dokumendi märgendamiseks ja valideerimiseks
TOON tõhusus:
- Oluliselt kompaktsem struktureeritud andmete jaoks
- Ideaalne tabelandmete jaoks, kus struktuurid korduvad
- Vähendab tokenite kasutust 30‑60 % võrreldes JSON‑iga
- Optimeeritud LLM‑ide tarbeks
Kompromissid:
- XML toetab atribuute ja segatud sisu (tekst + elemendid)
- TOON paistab silma ühtsete andmestruktuuride puhul
- XML-il on tugevamad valideerimisvõimalused
- TOON pakub paremat tokenite tõhusust LLM‑ide jaoks
Teisenduse kvaliteet
Vaheformaadi JSON tagab, et:
- Andmete terviklikkus – konversiooni käigus ei kaota andmeid
- Tüüpide säilitamine – numbrid, tõeväärtused ja null‑väärtused säilitatakse
- Struktuuri järjepidevus – pesastatud suhted säilitatakse
- Usaldusväärne teisendus – kasutades tõestatud teeke (
xml2jsja@toon-format/toon) - Vea käsitlemine – selged veateated vigase sisendi korral