Γεννήτρια Αιτημάτων cURL για Ollama
Δημιουργήστε εντολές cURL για endpoints του Ollama API. Ρυθμίστε το μοντέλο, το prompt, τη θερμοκρασία και άλλες παραμέτρους για αιτήματα generate, chat και embeddings.
Είσοδος
Έξοδος
Readme
Τι είναι το Ollama API;
Το Ollama είναι ένα εργαλείο ανοιχτού κώδικα για την εκτέλεση μεγάλων γλωσσικών μοντέλων (LLMs) τοπικά στον υπολογιστή σας. Παρέχει ένα REST API που δέχεται HTTP αιτήματα, επιτρέποντάς σας να αλληλεπιδράτε με μοντέλα όπως το Llama 3, το Mistral, το Gemma και πολλά άλλα απευθείας από το τερματικό σας ή τον κώδικα της εφαρμογής σας. Το API ακολουθεί ένα απλό μοτίβο αιτήματος/απόκρισης βασισμένο σε JSON και υποστηρίζει δημιουργία κειμένου, συνομιλίες πολλαπλών γύρων και ενσωματώσεις κειμένου (text embeddings).
Το cURL είναι ο πιο συνηθισμένος τρόπος για να δοκιμάσετε και να αλληλεπιδράσετε με το Ollama API. Ωστόσο, η σύνταξη της σωστής εντολής cURL με όλες τις κατάλληλες παραμέτρους, επικεφαλίδες και μορφοποίηση του JSON body μπορεί να είναι κουραστική και επιρρεπής σε σφάλματα, ειδικά κατά τη ρύθμιση επιλογών μοντέλου όπως η θερμοκρασία (temperature) και η δειγματοληψία top-k.
Περιγραφή εργαλείου
Αυτό το εργαλείο δημιουργεί έτοιμες προς χρήση εντολές cURL για τα endpoints του Ollama API. Επιλέξτε ένα endpoint, διαμορφώστε το μοντέλο και τις παραμέτρους σας, και αποκτήστε αμέσως μια σωστά μορφοποιημένη εντολή cURL. Η παραγόμενη εντολή περιλαμβάνει όλες τις απαραίτητες επικεφαλίδες, τη δομή του JSON body και τις επιλογές μοντέλου — έτοιμη να επικολληθεί στο τερματικό σας.
Παραδείγματα
Βασική δημιουργία κειμένου:
curl -X POST "http://localhost:11434/api/generate" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3",
"prompt": "Explain quantum computing in simple terms",
"stream": true
}'Συνομιλία με system prompt και προσαρμοσμένη θερμοκρασία:
curl -X POST "http://localhost:11434/api/chat" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3",
"messages": [
{ "role": "system", "content": "You are a helpful coding assistant." },
{ "role": "user", "content": "Write a Python function to reverse a string" }
],
"stream": false,
"options": {
"temperature": 0.3
}
}'Δημιουργία embeddings:
curl -X POST "http://localhost:11434/api/embeddings" \
-H "Content-Type: application/json" \
-d '{
"model": "llama3",
"prompt": "The quick brown fox jumps over the lazy dog",
"stream": false
}'Χαρακτηριστικά
- Υποστηρίζει και τα τρία κύρια endpoints του Ollama:
/api/generate,/api/chatκαι/api/embeddings - Διαμορφώσιμες επιλογές μοντέλου: temperature, top-p, top-k, μέγιστος αριθμός tokens, repeat penalty και seed
- Υποστήριξη system prompt για τα endpoints generate και chat
- Επιλογή μορφής απόκρισης JSON για δομημένη έξοδο
- Λήψη της παραγόμενης εντολής ως αρχείο
.sh
Επεξήγηση επιλογών
| Επιλογή | Περιγραφή | Προεπιλογή | Εύρος |
|---|---|---|---|
| Temperature | Ελέγχει την τυχαιότητα της εξόδου. Χαμηλότερες τιμές παράγουν πιο εστιασμένο κείμενο, υψηλότερες τιμές αυξάνουν τη δημιουργικότητα. | 0.7 | 0–2 |
| Top P | Κατώφλι δειγματοληψίας πυρήνα. Το μοντέλο λαμβάνει υπόψη tokens των οποίων η αθροιστική πιθανότητα φτάνει αυτή την τιμή. | 0.9 | 0–1 |
| Top K | Περιορίζει την επιλογή token στους K πιο πιθανούς υποψηφίους σε κάθε βήμα. | 40 | 1–100 |
| Μέγιστος αριθμός tokens | Μέγιστος αριθμός tokens που θα παραχθούν στην απόκριση. Ορίστε -1 για απεριόριστο. | 128 | -1–4096 |
| Repeat penalty | Επιβάλλει ποινή στα επαναλαμβανόμενα tokens. Τιμές άνω του 1.0 αποθαρρύνουν την επανάληψη. | 1.1 | 0–2 |
| Seed | Σταθερό seed για αναπαραγώγιμη έξοδο. Αφήστε κενό για τυχαία αποτελέσματα. | — | Οποιοσδήποτε ακέραιος |
| Μορφή απόκρισης | Ορίστε σε JSON για να αναγκάσετε το μοντέλο να επιστρέψει έγκυρη έξοδο JSON. | Καμία | Καμία / JSON |
| Stream | Όταν είναι ενεργοποιημένο, η απόκριση μεταδίδεται token προς token. Απενεργοποιήστε το για να λάβετε την πλήρη απόκριση ταυτόχρονα. | Ενεργό | Ενεργό / Ανενεργό |
Περιπτώσεις χρήσης
- Γρήγορη δημιουργία πρωτοτύπων και δοκιμή κλήσεων Ollama API από το τερματικό χωρίς χειροκίνητη σύνταξη JSON
- Δημιουργία εντολών cURL για κοινοποίηση σε συναδέλφους ή ενσωμάτωση σε τεκμηρίωση
- Πειραματισμός με διαφορετικές παραμέτρους μοντέλου για την εύρεση των βέλτιστων ρυθμίσεων για την περίπτωση χρήσης σας