এম্বেডিং
এম্বেডিং হলো একটি সংখ্যাসূচক ভেক্টর যা একটি উচ্চ-মাত্রিক স্থানে টেক্সট, ছবি বা অন্যান্য ডেটার অর্থ উপস্থাপন করে। সমান অর্থের আইটেম এমন ভেক্টর তৈরি করে যা একে অপরের কাছাকাছি বসে, যা সিস্টেমগুলোকে সঠিক মিলের পরিবর্তে শব্দার্থগত সাদৃশ্যে বিষয়বস্তু তুলনা, ক্লাস্টার ও পুনরুদ্ধার করতে দেয়।
সমার্থক: vector embedding, text embedding, semantic vector, dense representation
এম্বেডিং হলো মানব-ভাষা ও সাদৃশ্য-গণিতের মধ্যে সেতু। একটি এম্বেডিং মডেল প্রতিটি ইনপুটকে একটি নির্দিষ্ট-দৈর্ঘ্য ভেক্টরে ম্যাপ করে যাতে শব্দার্থগতভাবে সম্পর্কিত আইটেমগুলো একসাথে ক্লাস্টার হয়, যা ভেক্টর অনুসন্ধান, ক্লাস্টারিং, শ্রেণিবিন্যাস ও ডিডুপ্লিকেশন সক্ষম করে। একটি পুনরুদ্ধার পাইপলাইনে, সূচিবদ্ধ চাঙ্ক ও আগত কোয়েরি উভয়ই একই মডেল দিয়ে এম্বেড করা হয় যাতে দূরত্ব অর্থপূর্ণ হয়। যেহেতু এম্বেডিং মডেল স্থানটি সংজ্ঞায়িত করে, এর সংস্করণ এমন মেটাডেটা যা পুনরুৎপাদনযোগ্যতা ও নিয়ন্ত্রিত পুনঃসূচিবদ্ধকরণের জন্য ট্র্যাক করা মূল্যবান।