Ollama cURL İstek Üreteci
Ollama API uç noktaları için cURL komutları oluşturun. Oluşturma, sohbet ve gömme istekleri için model, prompt, sıcaklık ve diğer parametreleri yapılandırın.
Girdi
Çıktı
Readme
Ollama API Nedir?
Ollama, büyük dil modellerini (LLM) yerel makinenizde çalıştırmak için kullanılan açık kaynaklı bir araçtır. HTTP isteklerini kabul eden bir REST API sağlayarak Llama 3, Mistral, Gemma ve daha pek çok modelle doğrudan terminalinizden veya uygulama kodunuzdan etkileşim kurmanıza olanak tanır. API, basit bir JSON tabanlı istek/yanıt yapısını izler ve metin üretimi, çok turlu sohbet konuşmaları ile metin gömme işlemlerini destekler.
cURL, Ollama API'si ile test yapmak ve etkileşim kurmak için en yaygın kullanılan yöntemdir. Ancak doğru parametreler, başlıklar ve JSON gövde biçimlendirmesiyle birlikte doğru cURL komutunu oluşturmak; özellikle sıcaklık ve top-k örnekleme gibi model seçeneklerini ayarlarken zahmetli ve hataya açık olabilir.
Araç Açıklaması
Bu araç, Ollama API uç noktaları için kullanıma hazır cURL komutları oluşturur. Bir uç nokta seçin, modelinizi ve parametrelerinizi yapılandırın; anında düzgün biçimlendirilmiş bir cURL komutu elde edin. Oluşturulan komut, gerekli tüm başlıkları, JSON gövde yapısını ve model seçeneklerini içerir — terminale yapıştırmaya hazırdır.
Örnekler
Temel metin üretimi:
curl -X POST "http://localhost:11434/api/generate" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3",
"prompt": "Explain quantum computing in simple terms",
"stream": true
}'Sistem istemi ve özel sıcaklık değeriyle sohbet:
curl -X POST "http://localhost:11434/api/chat" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3",
"messages": [
{ "role": "system", "content": "You are a helpful coding assistant." },
{ "role": "user", "content": "Write a Python function to reverse a string" }
],
"stream": false,
"options": {
"temperature": 0.3
}
}'Gömme vektörü oluşturma:
curl -X POST "http://localhost:11434/api/embeddings" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3",
"prompt": "The quick brown fox jumps over the lazy dog",
"stream": false
}'Özellikler
- Üç ana Ollama uç noktasını destekler:
/api/generate,/api/chatve/api/embeddings - Yapılandırılabilir model seçenekleri: sıcaklık, top-p, top-k, maksimum token sayısı, tekrar cezası ve seed
- Generate ve chat uç noktaları için sistem istemi desteği
- Yapılandırılmış çıktı için JSON yanıt biçimi seçeneği
- Oluşturulan komutu
.shdosyası olarak indirme
Seçeneklerin Açıklaması
| Seçenek | Açıklama | Varsayılan | Aralık |
|---|---|---|---|
| Sıcaklık (Temperature) | Çıktının rastgeleliğini kontrol eder. Düşük değerler daha odaklı metin üretir, yüksek değerler yaratıcılığı artırır. | 0,7 | 0–2 |
| Top P | Çekirdek örnekleme eşiği. Model, kümülatif olasılığı bu değere ulaşan token'ları değerlendirir. | 0,9 | 0–1 |
| Top K | Her adımda token seçimini en olası K adayla sınırlar. | 40 | 1–100 |
| Maksimum token sayısı | Yanıtta üretilecek maksimum token sayısı. Sınırsız için -1 olarak ayarlayın. | 128 | -1–4096 |
| Tekrar cezası (Repeat penalty) | Tekrarlanan token'ları cezalandırır. 1,0'ın üzerindeki değerler tekrarı engeller. | 1,1 | 0–2 |
| Seed | Tekrarlanabilir çıktı için sabit seed değeri. Rastgele sonuçlar için boş bırakın. | — | Herhangi bir tam sayı |
| Yanıt biçimi | Modeli geçerli JSON çıktısı döndürmeye zorlamak için JSON olarak ayarlayın. | Yok | Yok / JSON |
| Stream | Etkinleştirildiğinde yanıt token token olarak akışla iletilir. Tam yanıtı tek seferde almak için devre dışı bırakın. | Açık | Açık / Kapalı |
Kullanım Senaryoları
- Manuel olarak JSON yazmadan terminalden Ollama API çağrılarını hızlıca prototipleme ve test etme
- Ekip arkadaşlarıyla paylaşmak veya dokümantasyona eklemek için cURL komutları oluşturma
- Kullanım senaryonuz için en uygun ayarları bulmak amacıyla farklı model parametrelerini deneme