Vad är en inbäddningsvektor?

En inbäddningsvektor är en lista med fast längd av flyttalstal som representerar en datamängd — ett ord, en mening, en bild eller någon annan inmatning — i ett högdimensionellt matematiskt rum. Machine learning-modeller som BERT, OpenAI:s textinbäddningsmodeller och bildkodare producerar dessa vektorer så att semantiskt liknande objekt hamnar geometriskt nära varandra. En enskild inbäddning kan ha allt från några dussin dimensioner till flera tusen.

Att förstå de numeriska egenskaperna hos en inbäddning är användbart när man felsöker modeller, jämför vektorrepresentationer, upptäcker avvikelser eller optimerar lagring och hämtning i en vektordatabas.

Verktygsbeskrivning

Det här verktyget accepterar en JSON-array med tal som representerar en inbäddningsvektor och beräknar omedelbar en uppsättning beskrivande statistik: antalet dimensioner, minimum- och maximumvärden, aritmetiskt medelvärde, standardavvikelse, L2-norm (magnitud) och sparsitet. Det visar också de 10 mest inflytelserika dimensionerna rankade efter absolut aktiveringsvärde.

Funktioner

  • Omedelbar statistik — dimensioner, min, max, medelvärde, standardavvikelse, L2-norm och sparsitet beräknade i webbläsaren utan att skicka data till en server.
  • Tabell över de 10 viktigaste aktiveringarna — listar de tio dimensioner med de största absolutvärdena, sorterade efter påverkan, med deras index, råvärde och absolut värde.
  • JSON-redigerare med syntaxmarkering — klistra in eller skriv en giltig JSON-array direkt i redigeraren och få resultat i realtid.