Mis on Ollama API?

Ollama on avatud lähtekoodiga tööriist suurte keelemudelite (LLM-ide) lokaalseks käitamiseks oma masinas. See pakub REST API-t, mis võtab vastu HTTP päringuid, võimaldades suhelda mudelitega nagu Llama 3, Mistral, Gemma ja paljude teistega otse terminalist või rakenduse koodist. API järgib lihtsat JSON-põhist päringu/vastuse mustrit ning toetab teksti genereerimist, mitme vooruga vestlusi ja teksti embeddings-e.

cURL on kõige levinum viis Ollama API testimiseks ja sellega suhtlemiseks. Korrektse cURL-käsu koostamine kõigi vajalike parameetrite, päiste ja JSON-keha vormindusega võib aga olla tüütu ja veaohtlik, eriti mudeli parameetrite nagu temperatuur ja top-k valim häälestamisel.

Tööriista kirjeldus

See tööriist genereerib kasutamisvalmis cURL-käske Ollama API lõpp-punktide jaoks. Vali lõpp-punkt, seadista oma mudel ja parameetrid ning saa koheselt korrektselt vormindatud cURL-käsk. Genereeritud käsk sisaldab kõiki vajalikke päiseid, JSON-keha struktuuri ja mudeli valikuid — valmis terminali kleepimiseks.

Näited

Põhiline teksti genereerimine:

curl -X POST "http://localhost:11434/api/generate" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "llama3",
  "prompt": "Explain quantum computing in simple terms",
  "stream": true
}'

Vestlus süsteemi viipa ja kohandatud temperatuuriga:

curl -X POST "http://localhost:11434/api/chat" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "llama3",
  "messages": [
    { "role": "system", "content": "You are a helpful coding assistant." },
    { "role": "user", "content": "Write a Python function to reverse a string" }
  ],
  "stream": false,
  "options": {
    "temperature": 0.3
  }
}'

Embeddings-te genereerimine:

curl -X POST "http://localhost:11434/api/embeddings" \
  -H "Content-Type: application/json" \
  -d '{
  "model": "llama3",
  "prompt": "The quick brown fox jumps over the lazy dog",
  "stream": false
}'

Funktsioonid

  • Toetab kõiki kolme peamist Ollama lõpp-punkti: /api/generate, /api/chat ja /api/embeddings
  • Seadistatavad mudeli valikud: temperatuur, top-p, top-k, maksimaalne tokenite arv, korduse karistus ja seed
  • Süsteemi viipa tugi generate ja chat lõpp-punktide jaoks
  • JSON vastuse formaadi valik struktureeritud väljundi jaoks
  • Genereeritud käsu allalaadimine .sh failina

Valikute selgitus

Valik Kirjeldus Vaikeväärtus Vahemik
Temperatuur Juhib väljundi juhuslikkust. Madalamad väärtused toodavad fokuseeritumat teksti, kõrgemad väärtused suurendavad loovust. 0,7 0–2
Top P Tuuma valimi lävi. Mudel arvestab tokeneid, mille kumulatiivne tõenäosus jõuab selle väärtuseni. 0,9 0–1
Top K Piirab tokenite valikut K kõige tõenäolisema kandidaadiga igal sammul. 40 1–100
Maksimaalne tokenite arv Vastuses genereeritavate tokenite maksimaalne arv. Piiranguta seadistamiseks määra -1. 128 -1–4096
Korduse karistus Karistab korduvaid tokeneid. Väärtused üle 1,0 pärsivad kordamist. 1,1 0–2
Seed Fikseeritud seed korratava väljundi jaoks. Juhuslike tulemuste saamiseks jäta tühjaks. Suvaline täisarv
Vastuse formaat Määra JSON-iks, et sundida mudelit tagastama kehtivat JSON-väljundit. Puudub Puudub / JSON
Voog Kui lubatud, edastatakse vastus token tokenilt. Keela täieliku vastuse korraga saamiseks. Sees Sees / Väljas

Kasutusjuhud

  • Ollama API päringute kiire prototüüpimine ja testimine terminalist ilma JSON-i käsitsi kirjutamata
  • cURL-käskude genereerimine meeskonnakaaslastega jagamiseks või dokumentatsiooni lisamiseks
  • Erinevate mudeli parameetritega katsetamine, et leida oma kasutusjuhu jaoks optimaalsed seaded