Инспектор векторов встраивания
Анализируйте векторы встраивания: вычисляйте статистику, такую как размерность, среднее значение, медиану, нормы, разреженность и топ активации.
Ввод
Вывод
| Rank | Index | Value | Abs Value |
|---|---|---|---|
| — | |||
Документация
Что такое вектор встраивания?
Вектор встраивания — это список фиксированной длины чисел с плавающей точкой, который представляет фрагмент данных — слово, предложение, изображение или любой другой ввод — в высокомерном математическом пространстве. Модели машинного обучения, такие как BERT, модели встраивания текста OpenAI и кодировщики изображений, создают эти векторы таким образом, чтобы семантически похожие элементы оказывались геометрически близко друг к другу. Одно встраивание может иметь от нескольких десятков до нескольких тысяч измерений.
Понимание числовых свойств встраивания полезно при отладке моделей, сравнении векторных представлений, обнаружении аномалий или оптимизации хранения и поиска в векторной базе данных.
Описание инструмента
Этот инструмент принимает JSON массив чисел, представляющих вектор встраивания, и мгновенно вычисляет набор описательной статистики: количество измерений, минимальное и максимальное значения, среднее арифметическое, стандартное отклонение, норму L2 (величину) и разреженность. Он также выделяет 10 наиболее влиятельных измерений, отранжированных по абсолютному значению активации.
Возможности
- Мгновенная статистика — измерения, минимум, максимум, среднее значение, стандартное отклонение, норма L2 и разреженность вычисляются в браузере без отправки данных на сервер.
- Таблица топ-10 активаций — список десяти измерений с наибольшими абсолютными значениями, отсортированный по влиянию, с их индексом, исходным значением и абсолютным значением.
- JSON редактор с подсветкой синтаксиса — вставляйте или вводите любой допустимый JSON массив непосредственно в редактор и получайте результаты в реальном времени.