Какво е вектор на вграждане?

Векторът на вграждане е список с фиксирана дължина от числа с плаваща запетая, който представя част от данни — дума, изречение, изображение или всеки друг вход — в високомерно математическо пространство. Модели на машинното обучение като BERT, текстови модели за вграждане на OpenAI и кодери на изображения произвеждат тези вектори, така че семантично подобни елементи да се намират геометрично близо един до друг. Един вектор на вграждане може да има където от няколко десетки до няколко хиляди измерения.

Разбирането на числовите свойства на един вектор на вграждане е полезно при отстраняване на грешки в модели, сравняване на векторни представяния, открояване на аномалии или оптимизиране на съхранението и извличането в база данни с вектори.

Описание на инструмента

Този инструмент приема JSON масив от числа, представляващи вектор на вграждане, и незабавно изчислява набор от описателни статистики: броя на измеренията, минимални и максимални стойности, аритметична средна стойност, стандартно отклонение, L2 норма (величина) и разреденост. Той също така показва топ 10 най-влиятелни измерения, класирани по абсолютна стойност на активиране.

Функции

  • Незабавна статистика — измерения, минимум, максимум, средна стойност, стандартно отклонение, L2 норма и разреденост, изчислени в браузъра без изпращане на данни на сървър.
  • Таблица на топ 10 активирания — показва десетте измерения с най-големите абсолютни стойности, сортирани по влияние, с техния индекс, сурова стойност и абсолютна стойност.
  • JSON редактор със синтактично маркиране — поставете или въведете всеки валиден JSON масив директно в редактора и получете резултати в реално време.