ভেক্টর সাদৃশ্য কী?

ভেক্টর সাদৃশ্য পরিমাপ করে যে দুটি ভেক্টর বহু-মাত্রিক স্থানে কতটা একই রকম। ভেক্টর হল সংখ্যার ক্রমবদ্ধ তালিকা যা ডেটা পয়েন্টগুলি প্রতিনিধিত্ব করে — এগুলি মেশিন লার্নিং এম্বেডিং, সুপারিশ সিস্টেম, প্রাকৃতিক ভাষা প্রক্রিয়াকরণ, ছবি স্বীকৃতি এবং বৈজ্ঞানিক কম্পিউটিংয়ে প্রদর্শিত হয়। দুটি ভেক্টর তুলনা করা আপনাকে বলে যে অন্তর্নিহিত ডেটা পয়েন্টগুলি কতটা কাছাকাছি বা সম্পর্কিত।

দুটি মূল ধারণা ব্যবহার করা হয়:

  • সাদৃশ্য: একটি স্কোর যা নির্দেশ করে দুটি ভেক্টর কতটা একই রকম। উচ্চতর মান সাধারণত আরও সাদৃশ্যপূর্ণ অর্থ (যেমন, কোসাইন সাদৃশ্য ১ মানে অভিন্ন দিক)।
  • দূরত্ব: দুটি ভেক্টর কতদূর আলাদা তার একটি পরিমাপ। নিম্নতর মান সাধারণত আরও সাদৃশ্যপূর্ণ অর্থ (যেমন, ইউক্লিডীয় দূরত্ব ০ মানে অভিন্ন ভেক্টর)।

সরঞ্জাম বর্ণনা

এই সরঞ্জামটি তথ্য তত্ত্ব, পরিসংখ্যান এবং জ্যামিতি থেকে ৫০টিরও বেশি সুপরিচিত পদ্ধতি ব্যবহার করে দুটি সংখ্যাসূচক ভেক্টরের মধ্যে সাদৃশ্য বা দূরত্ব গণনা করে। দুটি ভেক্টর প্রবেশ করুন, সাদৃশ্য বা দূরত্ব ট্যাব থেকে একটি পদ্ধতি বেছে নিন এবং ফলাফল আপনার ব্রাউজারে তাৎক্ষণিকভাবে গণনা করা হয়।

উদাহরণ

ইনপুট

ভেক্টর A: 1, 2, 3
ভেক্টর B: 4, 5, 6
পদ্ধতি ফলাফল
কোসাইন সাদৃশ্য 0.9746318461970762
ইউক্লিডীয় দূরত্ব 5.196152422706632
ম্যানহাটন দূরত্ব 16.5

গৃহীত ইনপুট ফর্ম্যাট

নিম্নলিখিত সবগুলি সমতুল্য:

1, 2, 3
[1, 2, 3]
(1 2 3)
1;2;3

বৈশিষ্ট্য

  • ৫০+ পদ্ধতি — দূরত্ব (ইউক্লিডীয়, ম্যানহাটন, চেবিশেভ, কোসাইন, কুলব্যাক-লেইবলার, জেনসেন-শ্যানন এবং আরও অনেক কিছু) বা সাদৃশ্য (কোসাইন, জ্যাকার্ড, ডাইস, তানিমোটো এবং আরও অনেক কিছু) থেকে বেছে নিন
  • নমনীয় ইনপুট — কমা-, স্থান- বা সেমিকোলন-বিচ্ছিন্ন মান গ্রহণ করে বন্ধনী সহ বা ছাড়াই
  • তাৎক্ষণিক ফলাফল — সমস্ত গণনা ক্লায়েন্ট-সাইডে চলে কোনো ডেটা সার্ভারে পাঠানো হয় না

সমর্থিত পদ্ধতি

সাদৃশ্য পদ্ধতি

পদ্ধতি বর্ণনা
কোসাইন দুটি ভেক্টরের মধ্যে কোণ পরিমাপ করে; NLP এবং সুপারিশ সিস্টেমে ব্যাপকভাবে ব্যবহৃত
কুমার-হাসেব্রুক জ্যাকার্ড এবং কোসাইন একত্রিত করে সাধারণীকৃত সাদৃশ্য
ডাইস উপাদান গণনার যোগফল দ্বারা বিভক্ত ছেদের দ্বিগুণ
তানিমোটো ক্রমাগত ভেক্টরের জন্য সম্প্রসারিত জ্যাকার্ড সহগ
ছেদ উপাদান-ভিত্তিক ন্যূনতমের যোগফল
চেজানোভস্কি ন্যূনতমের যোগফলের দ্বিগুণকে মোট যোগফল দ্বারা ভাগ করার অনুপাত
মোটিকা সমস্ত উপাদানের যোগফল দ্বারা বিভক্ত ছেদ
কুলচিনস্কি নির্ভুলতা এবং স্মরণ-সদৃশ অনুপাতের সুরেলা গড়
বর্গীকৃত জ্যা উপাদান পণ্যের বর্গমূলের উপর ভিত্তি করে
পিয়ারসন দুটি ভেক্টরের মধ্যে রৈখিক সম্পর্ক সহগ

দূরত্ব পদ্ধতি

পদ্ধতি বর্ণনা
ইউক্লিডীয় n-মাত্রিক স্থানে সরল-রেখা দূরত্ব
বর্গীকৃত ইউক্লিডীয় বর্গমূল ছাড়াই ইউক্লিডীয় দূরত্ব
ম্যানহাটন (শহর ব্লক) পরম উপাদান-ভিত্তিক পার্থক্যের যোগফল
চেবিশেভ সমস্ত মাত্রা জুড়ে সর্বোচ্চ পরম পার্থক্য
ক্যানবেরা শূন্যের কাছাকাছি মানের প্রতি সংবেদনশীল ওজনযুক্ত ম্যানহাটন দূরত্ব
সোরেনসেন সমস্ত মানের যোগফল দ্বারা বিভক্ত পরম পার্থক্যের যোগফল
গোয়ার পরম পার্থক্যের স্বাভাবিক গড়
সোয়ার্গেল উপাদান-ভিত্তিক সর্বোচ্চ দ্বারা বিভক্ত পরম পার্থক্যের অনুপাত
লোরেনজিয়ান পরম পার্থক্য প্লাস এক এর প্রাকৃতিক লগের যোগফল
ক্লার্ক যোগফলের উপর পরম পার্থক্য ব্যবহার করে ওজনযুক্ত দূরত্ব
ওয়েভ হেজেস উপাদান-ভিত্তিক সর্বোচ্চ দ্বারা বিভক্ত পরম পার্থক্যের যোগফল
চেজানোভস্কি চেজানোভস্কি সহগের দূরত্ব ফর্ম
মোটিকা মোটিকা সহগের দূরত্ব ফর্ম
কুলচিনস্কি কুলচিনস্কি সহগের দূরত্ব ফর্ম
তানিমোটো তানিমোটো সহগের দূরত্ব ফর্ম
রুজিকা রুজিকা সাদৃশ্যের পরিপূরক
অভ্যন্তরীণ পণ্য দূরত্ব পরিমাপ হিসাবে নেতিবাচক ডট পণ্য
সুরেলা গড় উপাদান জোড়ার সুরেলা মানের উপর ভিত্তি করে দূরত্ব
জ্যাকার্ড অ-মিলিত উপাদানের অনুপাত
ডাইস ডাইস সহগের দূরত্ব ফর্ম
বিশ্বস্ততা উপাদান পণ্যের বর্গমূলের উপর ভিত্তি করে (ভট্টাচার্য-সম্পর্কিত)
ভট্টাচার্য দুটি সম্ভাব্যতা বিতরণের মধ্যে ওভারল্যাপ পরিমাপ করে
হেলিঞ্জার ভট্টাচার্য দূরত্বের বর্গমূল
মাতুসিতা বর্গমূলের বর্গীকৃত পার্থক্যের যোগফলের অর্ধেকের বর্গমূল
বর্গীকৃত জ্যা বর্গীকৃত জ্যা সহগের দূরত্ব ফর্ম
পিয়ারসন পিয়ারসন সম্পর্ক সহগের দূরত্ব ফর্ম
নেইম্যান চি-বর্গীকৃত-ধরনের বিচ্যুতি
বর্গীকৃত বর্গীকৃত চি-বর্গীকৃত দূরত্ব
সম্ভাব্যতামূলক প্রতিসম চি-বর্গীকৃত বিচ্যুতির প্রতিসম সংস্করণ
বিচ্যুতি দ্বিগুণ ওজনযুক্ত বর্গীকৃত দূরত্ব
সংযোজক প্রতিসম নেইম্যান এবং পিয়ারসন চি-বর্গীকৃত বিচ্যুতির গড়
কুলব্যাক-লেইবলার বিতরণের মধ্যে তথ্য-তাত্ত্বিক বিচ্যুতি
জেফ্রিজ প্রতিসম কুলব্যাক-লেইবলার বিচ্যুতি
K বিচ্যুতি গড় বিতরণের উপর ভিত্তি করে অপ্রতিসম বিচ্যুতি
টপসো জেনসেন-শ্যানন বিচ্যুতির দ্বিগুণ
জেনসেন-শ্যানন কুলব্যাক-লেইবলারের মসৃণ, প্রতিসম সংস্করণ
জেনসেন পার্থক্য উত্তল ফাংশনের জন্য জেনসেন অসমতার উপর ভিত্তি করে
তানেজা পাটিগণিত-জ্যামিতিক গড় বিচ্যুতি
কুমার-জনসন সমান শক্তির বর্গীকৃত পার্থক্যের উপর ভিত্তি করে
ছেদ ছেদ সাদৃশ্যের পরিপূরক
গড় (শহর ব্লক + চেবিশেভ) ম্যানহাটন এবং চেবিশেভ দূরত্বের গড়

এটি কীভাবে কাজ করে

সরঞ্জামটি প্রতিটি ভেক্টর ইনপুটকে সংখ্যার একটি ক্রমে বিশ্লেষণ করে, ঐচ্ছিক বন্ধনী সরিয়ে দেয় এবং কমা, স্থান বা সেমিকোলনে বিভক্ত করে। এটি তখন উভয় অ্যারেকে ml-distance লাইব্রেরি থেকে নির্বাচিত ফাংশনে পাস করে, যা বিশুদ্ধ JavaScript-এ গণনা সম্পাদন করে। উভয় ভেক্টরের অবশ্যই একই সংখ্যক মাত্রা থাকতে হবে; অন্যথায় সরঞ্জামটি একটি যাচাইকরণ ত্রুটি দেখায়।

সীমাবদ্ধতা

  • কিছু পদ্ধতি (যেমন, কুলব্যাক-লেইবলার, ভট্টাচার্য) সমস্ত মান কঠোরভাবে ইতিবাচক এবং ১-এ যোগ করার প্রয়োজন (সম্ভাব্যতা বিতরণ)। নির্বিচারে ভেক্টর ব্যবহার করা Infinity বা NaN উৎপাদন করতে পারে, যা সরঞ্জামটি একটি গণনা ত্রুটি হিসাবে বিবেচনা করে।
  • খুব বড় ভেক্টর (হাজার হাজার মাত্রা) সমর্থিত কিন্তু নির্বাচিত পদ্ধতির উপর নির্ভর করে একটি সংক্ষিপ্ত বিলম্ব হতে পারে।