কনটেন্টে যান
গ্লোসারি

ভেক্টর অনুসন্ধান

ভেক্টর অনুসন্ধান সঠিক শব্দের পরিবর্তে অর্থ দিয়ে বিষয়বস্তু খুঁজে পায়। টেক্সট উচ্চ-মাত্রিক এম্বেডিংয়ে রূপান্তরিত হয়, এবং কোসাইন দূরত্বের মতো একটি সাদৃশ্য-মেট্রিক সংরক্ষিত ভেক্টরগুলোকে কোয়েরি-ভেক্টরের কতটা কাছে তা দিয়ে র‍্যাঙ্ক করে, কোনো কীওয়ার্ড না মিললেও ধারণাগতভাবে সম্পর্কিত অনুচ্ছেদ ফেরত দেয়।

সমার্থক: semantic search, similarity search, nearest-neighbor search, embedding search

ভেক্টর অনুসন্ধান শব্দার্থগত পুনরুদ্ধারকে শক্তি দেয়: স্ট্রিং মেলানোর পরিবর্তে, এটি অর্থ মেলায়। একটি কোয়েরি সূচিবদ্ধ বিষয়বস্তুর একই ভেক্টর-স্থানে এম্বেড করা হয়, এবং সূচি একটি দূরত্ব-মেট্রিক দিয়ে নিকটতম ভেক্টর ফেরত দেয়। স্কেলে দ্রুত থাকার জন্য, উৎপাদন-সিস্টেম আনুমানিক নিকটতম-প্রতিবেশী সূচি ব্যবহার করে যা বড় বিলম্ব-লাভের জন্য অতি-ক্ষুদ্র নির্ভুলতা-আপস গ্রহণ করে। ভেক্টর অনুসন্ধান সবচেয়ে কার্যকর হয় যখন একটি হাইব্রিড পুনরুদ্ধারকারীতে কীওয়ার্ড অনুসন্ধানের সাথে জোড়া দেওয়া হয়, যাতে সঠিক শনাক্তকারী বিশুদ্ধ শব্দার্থগত মিলের কাছে হারিয়ে না যায়।

সাধারণ জিজ্ঞাসা

ভেক্টর অনুসন্ধানে এম্বেডিং কী?
এম্বেডিং একটি সংখ্যাসূচক ভেক্টর যা টেক্সটের একটি অংশের অর্থ উপস্থাপন করে, একটি এম্বেডিং মডেল দ্বারা উৎপাদিত। সমান অর্থের টেক্সট ভেক্টর-স্থানে একে অপরের কাছাকাছি অবতরণ করে।
আনুমানিক নিকটতম প্রতিবেশী (ANN) অনুসন্ধান কী?
ANN অনুসন্ধান অল্প পরিমাণ নির্ভুলতা বড় গতি-লাভের বিনিময়ে দেয়, সূচি-কাঠামো ব্যবহার করে যাতে সংরক্ষিত ভেক্টরের সংখ্যা লক্ষ লক্ষে বাড়লেও সাদৃশ্য-অনুসন্ধান দ্রুত থাকে।