এমবেডিং ভেক্টর কী?

একটি এমবেডিং ভেক্টর হল একটি নির্দিষ্ট দৈর্ঘ্যের ফ্লোটিং-পয়েন্ট সংখ্যার তালিকা যা একটি ডেটার অংশ — একটি শব্দ, বাক্য, ছবি, বা অন্য কোনো ইনপুট — কে একটি উচ্চ-মাত্রিক গাণিতিক স্থানে প্রতিনিধিত্ব করে। BERT, OpenAI এর text-embedding মডেল এবং ইমেজ এনকোডারের মতো মেশিন লার্নিং মডেলগুলি এই ভেক্টরগুলি তৈরি করে যাতে অর্থগতভাবে একই রকম আইটেমগুলি জ্যামিতিকভাবে কাছাকাছি থাকে। একটি একক এমবেডিং এর কয়েক ডজন মাত্রা থেকে শুরু করে কয়েক হাজার পর্যন্ত যেকোনো জায়গায় থাকতে পারে।

এমবেডিং এর সংখ্যাগত বৈশিষ্ট্যগুলি বোঝা মডেলগুলি ডিবাগ করার সময়, ভেক্টর প্রতিনিধিত্ব তুলনা করার সময়, অস্বাভাবিকতা সনাক্ত করার সময়, বা একটি ভেক্টর ডাটাবেসে স্টোরেজ এবং পুনরুদ্ধার অপ্টিমাইজ করার সময় উপকারী।

টুল বর্ণনা

এই টুলটি একটি JSON অ্যারে গ্রহণ করে যা একটি এমবেডিং ভেক্টর প্রতিনিধিত্ব করে এমন সংখ্যাগুলি এবং তাৎক্ষণিকভাবে বর্ণনামূলক পরিসংখ্যানের একটি সেট গণনা করে: মাত্রার সংখ্যা, ন্যূনতম এবং সর্বোচ্চ মান, গাণিতিক গড়, মান বিচ্যুতি, L2 norm (মাত্রা), এবং sparsity। এটি পরম সক্রিয়করণ মান দ্বারা র‍্যাঙ্ক করা শীর্ষ ১০ সবচেয়ে প্রভাবশালী মাত্রাও প্রদর্শন করে।

বৈশিষ্ট্যগুলি

  • তাৎক্ষণিক পরিসংখ্যান — মাত্রা, ন্যূনতম, সর্বোচ্চ, গড়, মান বিচ্যুতি, L2 norm, এবং sparsity ব্রাউজারে গণনা করা হয় কোনো সার্ভারে ডেটা পাঠানো ছাড়াই।
  • শীর্ষ ১০ সক্রিয়করণ টেবিল — দশটি মাত্রা তালিকাভুক্ত করে যার সর্ববৃহৎ পরম মান রয়েছে, প্রভাব দ্বারা সাজানো, তাদের সূচক, কাঁচা মান এবং পরম মান সহ।
  • সিন্ট্যাক্স হাইলাইটিং সহ JSON সম্পাদক — সরাসরি সম্পাদকে যেকোনো বৈধ JSON অ্যারে পেস্ট বা টাইপ করুন এবং রিয়েল টাইমে ফলাফল পান।