GPT-tokenizer
Tokeniser tekst for forskjellige AI-modeller.
Inndata
Utdata
Les meg
Hva er tokenisering i AI-språkmodeller?
Tokenisering er prosessen med å dele tekst ned i mindre enheter kalt tokens, som AI-språkmodeller bruker til å forstå og behandle tekst. En token kan være et ord, en del av et ord, eller til og med et enkelt tegn. For eksempel kan "hei" være én token, mens "eksepsjonelt" kan deles inn i flere tokens som "eks", "epsjon", "elt". Å forstå tokenisering er avgjørende fordi AI-modeller har tokenbegrensninger for sine inndata og utdata, og API-kostnader beregnes ofte basert på antall tokens som brukes.
Verktøybeskrivelse
GPT Tokenizer-verktøyet lar deg se nøyaktig hvordan OpenAIs ulike GPT-modeller tokeniserer tekstinndata. Du kan skrive inn hvilken som helst tekst-prompt og velge fra et bredt spekter av GPT-modeller for å se token-nedbrytningen med fargekodet visualisering. Hver token er uthevet med en unik farge, noe som gjør det enkelt å forstå hvordan modellen behandler teksten din. Verktøyet viser det totale antallet tokens og viser spesialtegn (mellomrom som prikker og linjeskift som piler) for bedre synlighet.
Eksempler
Inndata:
- Modell: GPT-5
- Prompt: "Hei, hvordan har du det i dag?"
Utdata:
- Tokens: antallet varierer etter modell
- Visualisering: Hvert ord/tegnsetting vist i forskjellige farger
Funksjoner
- Støtte for flere modeller: Velg mellom over 30 GPT- og OpenAI-modeller
- Tokenisering i sanntid: Se tokens oppdateres umiddelbart mens du skriver
- Fargekodet visualisering: Hver token får en unik farge for enkel identifikasjon
Støttede modeller
Verktøyet støtter følgende OpenAI-modeller:
ChatGPT-serien:
- ChatGPT-4o Latest
GPT-5-serien:
- GPT-5
- GPT-5 Pro
- GPT-5 mini
- GPT-5 nano
GPT-4.x-serien:
- GPT-4.5 Preview
- GPT-4.1
- GPT-4.1 mini
- GPT-4.1 nano
GPT-4-serien:
- GPT-4o
- GPT-4o mini
- GPT-4
- GPT-4 turbo
GPT-3.5-serien:
- GPT-3.5 turbo
- GPT-3.5 turbo instruct
O-serien (resonnerende modeller):
- o4-mini
- o3
- o3-mini
- o3-pro
- o1
- o1-mini
- o1-preview
- o1-pro
Eldre modeller:
- text-davinci-003
- text-davinci-002
- text-davinci-001