Что такое вектор встраивания?

Вектор встраивания — это список фиксированной длины чисел с плавающей точкой, который представляет фрагмент данных — слово, предложение, изображение или любой другой ввод — в высокомерном математическом пространстве. Модели машинного обучения, такие как BERT, модели встраивания текста OpenAI и кодировщики изображений, создают эти векторы таким образом, чтобы семантически похожие элементы оказывались геометрически близко друг к другу. Одно встраивание может иметь от нескольких десятков до нескольких тысяч измерений.

Понимание числовых свойств встраивания полезно при отладке моделей, сравнении векторных представлений, обнаружении аномалий или оптимизации хранения и поиска в векторной базе данных.

Описание инструмента

Этот инструмент принимает JSON массив чисел, представляющих вектор встраивания, и мгновенно вычисляет набор описательной статистики: количество измерений, минимальное и максимальное значения, среднее арифметическое, стандартное отклонение, норму L2 (величину) и разреженность. Он также выделяет 10 наиболее влиятельных измерений, отранжированных по абсолютному значению активации.

Возможности

  • Мгновенная статистика — измерения, минимум, максимум, среднее значение, стандартное отклонение, норма L2 и разреженность вычисляются в браузере без отправки данных на сервер.
  • Таблица топ-10 активаций — список десяти измерений с наибольшими абсолютными значениями, отсортированный по влиянию, с их индексом, исходным значением и абсолютным значением.
  • JSON редактор с подсветкой синтаксиса — вставляйте или вводите любой допустимый JSON массив непосредственно в редактор и получайте результаты в реальном времени.