Embedding Vector Inspector
Embedding vectors का निरीक्षण और विश्लेषण करें: आयाम, माध्य, माध्यिका, norms, sparsity, और top activations जैसे आंकड़े की गणना करें।
इनपुट
आउटपुट
| Rank | Index | Value | Abs Value |
|---|---|---|---|
| — | |||
रीडमी
एम्बेडिंग वेक्टर क्या है?
एम्बेडिंग वेक्टर एक निश्चित-लंबाई वाली फ्लोटिंग-पॉइंट संख्याओं की सूची है जो डेटा के एक टुकड़े — एक शब्द, वाक्य, छवि, या कोई अन्य इनपुट — को एक उच्च-आयामी गणितीय स्थान में प्रतिनिधित्व करती है। BERT, OpenAI के text-embedding मॉडल, और इमेज एनकोडर जैसे मशीन लर्निंग मॉडल ये वेक्टर बनाते हैं ताकि शब्दार्थ रूप से समान आइटम ज्यामितीय रूप से एक दूसरे के करीब हों। एक एकल एम्बेडिंग में कुछ दर्जन आयामों से लेकर कई हजार तक कहीं भी हो सकते हैं।
एम्बेडिंग के संख्यात्मक गुणों को समझना मॉडल को डीबग करते समय, वेक्टर प्रतिनिधित्व की तुलना करते समय, विसंगतियों का पता लगाते समय, या वेक्टर डेटाबेस में स्टोरेज और पुनर्प्राप्ति को अनुकूलित करते समय उपयोगी है।
टूल विवरण
यह टूल संख्याओं की एक JSON array को स्वीकार करता है जो एक एम्बेडिंग वेक्टर का प्रतिनिधित्व करता है और तुरंत वर्णनात्मक आंकड़ों का एक सेट गणना करता है: आयामों की संख्या, न्यूनतम और अधिकतम मान, अंकगणितीय माध्य, मानक विचलन, L2 norm (परिमाण), और विरलता। यह शीर्ष 10 सबसे प्रभावशाली आयामों को भी सामने लाता है जिन्हें निरपेक्ष सक्रियण मान द्वारा रैंक किया गया है।
विशेषताएं
- तत्काल आंकड़े — आयाम, न्यूनतम, अधिकतम, माध्य, मानक विचलन, L2 norm, और विरलता ब्राउज़र में बिना सर्वर को डेटा भेजे गणना की जाती है।
- शीर्ष 10 सक्रियण तालिका — सबसे बड़े निरपेक्ष मानों वाले दस आयामों को सूचीबद्ध करता है, प्रभाव के आधार पर क्रमबद्ध, उनके इंडेक्स, कच्चे मान, और निरपेक्ष मान के साथ।
- सिंटैक्स हाइलाइटिंग के साथ JSON संपादक — किसी भी वैध JSON array को सीधे संपादक में पेस्ट या टाइप करें और वास्तविक समय में परिणाम प्राप्त करें।