مولّد طلبات cURL لـ Ollama
توليد أوامر cURL لنقاط نهاية Ollama API. ضبط النموذج والمطالبة ودرجة الحرارة والمعاملات الأخرى لطلبات التوليد والمحادثة والتضمينات.
الإدخال
الإخراج
ملف القراءة
ما هو Ollama API؟
Ollama هو أداة مفتوحة المصدر لتشغيل نماذج اللغة الكبيرة (LLMs) محليًا على جهازك. يوفر REST API يقبل طلبات HTTP، مما يتيح لك التفاعل مع نماذج مثل Llama 3 وMistral وGemma وغيرها الكثير مباشرةً من الطرفية أو كود التطبيق الخاص بك. يتبع الـ API نمط طلب/استجابة بسيطًا مبنيًا على JSON، ويدعم توليد النصوص ومحادثات الدردشة متعددة الأدوار وتضمينات النصوص.
يُعدّ cURL الطريقة الأكثر شيوعًا لاختبار Ollama API والتفاعل معه. غير أن بناء أمر cURL الصحيح بجميع المعاملات والترويسات وتنسيق JSON المناسب قد يكون أمرًا مرهقًا وعرضةً للأخطاء، لا سيما عند ضبط خيارات النموذج مثل درجة الحرارة وأخذ العينات top-k.
وصف الأداة
تُنشئ هذه الأداة أوامر cURL جاهزة للاستخدام لنقاط نهاية Ollama API. اختر نقطة النهاية، وقم بتهيئة النموذج والمعاملات، واحصل فورًا على أمر cURL منسق بشكل صحيح. يتضمن الأمر المُنشأ جميع الترويسات اللازمة وبنية JSON وخيارات النموذج — جاهزًا للصقه في الطرفية مباشرةً.
أمثلة
توليد نص أساسي:
curl -X POST "http://localhost:11434/api/generate" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3",
"prompt": "Explain quantum computing in simple terms",
"stream": true
}'دردشة مع موجّه نظام ودرجة حرارة مخصصة:
curl -X POST "http://localhost:11434/api/chat" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3",
"messages": [
{ "role": "system", "content": "You are a helpful coding assistant." },
{ "role": "user", "content": "Write a Python function to reverse a string" }
],
"stream": false,
"options": {
"temperature": 0.3
}
}'توليد التضمينات:
curl -X POST "http://localhost:11434/api/embeddings" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3",
"prompt": "The quick brown fox jumps over the lazy dog",
"stream": false
}'الميزات
- يدعم نقاط النهاية الثلاث الرئيسية لـ Ollama:
/api/generateو/api/chatو/api/embeddings - خيارات نموذج قابلة للتهيئة: درجة الحرارة، وtop-p، وtop-k، والحد الأقصى للـ tokens، وعقوبة التكرار، والـ seed
- دعم موجّه النظام لنقطتَي نهاية generate وchat
- خيار تنسيق استجابة JSON للمخرجات المنظمة
- تنزيل الأمر المُنشأ كملف
.sh
شرح الخيارات
| الخيار | الوصف | الافتراضي | النطاق |
|---|---|---|---|
| درجة الحرارة | تتحكم في عشوائية المخرجات. القيم المنخفضة تُنتج نصًا أكثر تركيزًا، بينما تزيد القيم المرتفعة من الإبداع. | 0.7 | 0–2 |
| Top P | عتبة أخذ العينات النووية. يأخذ النموذج في الاعتبار الـ tokens التي يبلغ احتمالها التراكمي هذه القيمة. | 0.9 | 0–1 |
| Top K | يحصر اختيار الـ tokens في أكثر K مرشحًا احتمالًا في كل خطوة. | 40 | 1–100 |
| الحد الأقصى للـ tokens | الحد الأقصى لعدد الـ tokens المُولَّدة في الاستجابة. اضبطه على -1 لإزالة الحد. | 128 | -1–4096 |
| عقوبة التكرار | تُعاقب الـ tokens المتكررة. القيم الأعلى من 1.0 تُثبّط التكرار. | 1.1 | 0–2 |
| Seed | seed ثابت للحصول على مخرجات قابلة للتكرار. اتركه فارغًا للحصول على نتائج عشوائية. | — | أي عدد صحيح |
| تنسيق الاستجابة | اضبطه على JSON لإجبار النموذج على إرجاع مخرجات JSON صالحة. | لا شيء | لا شيء / JSON |
| البث | عند التفعيل، تُبثّ الاستجابة token بـ token. عطّله لاستقبال الاستجابة الكاملة دفعةً واحدة. | مفعّل | مفعّل / معطّل |
حالات الاستخدام
- النمذجة الأولية السريعة واختبار استدعاءات Ollama API من الطرفية دون الحاجة إلى كتابة JSON يدويًا
- توليد أوامر cURL لمشاركتها مع أعضاء الفريق أو تضمينها في التوثيق
- تجربة معاملات النماذج المختلفة للعثور على الإعدادات المثلى لحالة الاستخدام الخاصة بك