Embedding Vector Inspector
Embedding vektörlerini inceleyin ve analiz edin: boyutlar, ortalama, medyan, normlar, seyreklik ve en yüksek aktivasyonlar gibi istatistikleri hesaplayın.
Girdi
Çıktı
| Rank | Index | Value | Abs Value |
|---|---|---|---|
| — | |||
Readme
Embedding vektörü nedir?
Embedding vektörü, bir veri parçasını — bir kelimeyi, cümleyi, görüntüyü veya başka herhangi bir girişi — yüksek boyutlu matematiksel bir uzayda temsil eden sabit uzunluklu bir kayan nokta sayıları listesidir. BERT, OpenAI'nin metin embedding modelleri ve görüntü kodlayıcıları gibi makine öğrenmesi modelleri bu vektörleri üretir, böylece anlamsal olarak benzer öğeler geometrik olarak birbirine yakın konumlanır. Tek bir embedding, birkaç düzineden birkaç binlerce boyuta kadar değişebilir.
Bir embedding'in sayısal özelliklerini anlamak, modellerde hata ayıklanması, vektör temsillerinin karşılaştırılması, anormalliklerin tespit edilmesi veya bir vektör veritabanında depolama ve alma işlemlerinin optimize edilmesi sırasında faydalıdır.
Araç açıklaması
Bu araç, bir embedding vektörünü temsil eden bir JSON sayı dizisini kabul eder ve anında bir dizi tanımlayıcı istatistik hesaplar: boyut sayısı, minimum ve maksimum değerler, aritmetik ortalama, standart sapma, L2 normu (büyüklük) ve seyreklik. Ayrıca mutlak aktivasyon değerine göre sıralanmış en etkili 10 boyutu ortaya çıkarır.
Özellikler
- Anında istatistikler — boyutlar, minimum, maksimum, ortalama, standart sapma, L2 normu ve seyreklik tarayıcıda hesaplanır, veriler sunucuya gönderilmez.
- En iyi 10 aktivasyon tablosu — en büyük mutlak değerlere sahip on boyutu etkiye göre sıralanmış şekilde listeler, bunların indeksi, ham değeri ve mutlak değeri ile birlikte.
- Söz dizimi vurgulaması olan JSON editörü — geçerli herhangi bir JSON dizisini doğrudan editöre yapıştırın veya yazın ve sonuçları gerçek zamanlı olarak alın.