埋め込みベクトルとは?

埋め込みベクトルは、単語、文、画像、またはその他の入力など、データの一部を高次元の数学空間で表現する固定長の浮動小数点数のリストです。BERT、OpenAIのテキスト埋め込みモデル、画像エンコーダーなどの機械学習モデルは、これらのベクトルを生成し、意味的に類似したアイテムが幾何学的に近い位置に配置されるようにします。単一の埋め込みは、数十次元から数千次元までの範囲を持つことができます。

埋め込みの数値特性を理解することは、モデルのデバッグ、ベクトル表現の比較、異常検出、またはベクトルデータベースのストレージと検索の最適化に役立ちます。

ツール説明

このツールは、埋め込みベクトルを表す数値のJSON配列を受け入れ、次元数、最小値と最大値、算術平均、標準偏差、L2ノルム(大きさ)、スパース性などの記述統計のセットを即座に計算します。また、絶対活性化値でランク付けされた最も影響力のある上位10次元を表示します。

機能

  • 即座の統計 — 次元数、最小値、最大値、平均値、標準偏差、L2ノルム、スパース性がブラウザで計算され、サーバーにデータを送信しません。
  • 上位10活性化テーブル — 最大の絶対値を持つ10次元をインデックス、生の値、絶対値とともに影響度でソートして一覧表示します。
  • 構文ハイライト付きJSONエディタ — 任意の有効なJSON配列をエディタに直接貼り付けまたは入力し、リアルタイムで結果を取得します。