Επιθεωρητής Διανυσμάτων Ενσωμάτωσης
Επιθεωρήστε και αναλύστε διανύσματα ενσωμάτωσης: υπολογίστε στατιστικά όπως διαστάσεις, μέσο όρο, διάμεσο, νόρμες, αραιότητα και κορυφαίες ενεργοποιήσεις.
Είσοδος
Έξοδος
| Rank | Index | Value | Abs Value |
|---|---|---|---|
| — | |||
Readme
Τι είναι ένα διάνυσμα ενσωμάτωσης;
Ένα διάνυσμα ενσωμάτωσης είναι μια λίστα σταθερού μήκους αριθμών κινητής υποδιαστολής που αντιπροσωπεύει ένα κομμάτι δεδομένων — μια λέξη, πρόταση, εικόνα ή οποιαδήποτε άλλη είσοδο — σε έναν χώρο υψηλών διαστάσεων. Μοντέλα μηχανικής μάθησης όπως το BERT, τα μοντέλα ενσωμάτωσης κειμένου της OpenAI και οι κωδικοποιητές εικόνων παράγουν αυτά τα διανύσματα έτσι ώστε τα σημασιολογικά παρόμοια στοιχεία να καταλήγουν γεωμετρικά κοντά. Ένα μόνο διάνυσμα ενσωμάτωσης μπορεί να έχει οπουδήποτε από μερικές δεκάδες διαστάσεις έως αρκετές χιλιάδες.
Η κατανόηση των αριθμητικών ιδιοτήτων ενός διανύσματος ενσωμάτωσης είναι χρήσιμη κατά τον εντοπισμό σφαλμάτων μοντέλων, τη σύγκριση αναπαραστάσεων διανυσμάτων, την ανίχνευση ανωμαλιών ή τη βελτιστοποίηση της αποθήκευσης και ανάκτησης σε μια βάση δεδομένων διανυσμάτων.
Περιγραφή εργαλείου
Αυτό το εργαλείο δέχεται ένα JSON array αριθμών που αντιπροσωπεύουν ένα διάνυσμα ενσωμάτωσης και υπολογίζει αμέσως ένα σύνολο περιγραφικών στατιστικών: τον αριθμό διαστάσεων, τις ελάχιστες και μέγιστες τιμές, τον αριθμητικό μέσο όρο, την τυπική απόκλιση, τη νόρμα L2 (μέγεθος) και τη αραιότητα. Επίσης, εμφανίζει τις 10 κορυφαίες πιο επιδραστικές διαστάσεις κατάταξης κατά απόλυτη τιμή ενεργοποίησης.
Χαρακτηριστικά
- Άμεσα στατιστικά — διαστάσεις, ελάχιστο, μέγιστο, μέσο όρο, τυπική απόκλιση, νόρμα L2 και αραιότητα υπολογίζονται στο πρόγραμμα περιήγησης χωρίς αποστολή δεδομένων σε διακομιστή.
- Πίνακας κορυφαίων 10 ενεργοποιήσεων — παραθέτει τις δέκα διαστάσεις με τις μεγαλύτερες απόλυτες τιμές, ταξινομημένες κατά επίδραση, με το δείκτη τους, την ακατέργαστη τιμή και την απόλυτη τιμή.
- JSON επεξεργαστής με επισήμανση σύνταξης — επικολλήστε ή πληκτρολογήστε οποιοδήποτε έγκυρο JSON array απευθείας στον επεξεργαστή και λάβετε αποτελέσματα σε πραγματικό χρόνο.