انتقل إلى المحتوى
مسرد

البحث المتجهي

يجد البحث المتجهي المحتوى بالمعنى بدلاً من الكلمات الدقيقة. يُحوَّل النص إلى تضمينات عالية الأبعاد، ويرتّب مقياس تشابه كمسافة جيب التمام المتجهات المُخزَّنة بحسب قربها من متجه الاستعلام، مُرجِعًا مقاطع مرتبطة مفاهيميًا حتى عند عدم تطابق أي كلمة مفتاحية.

مرادفات: semantic search, similarity search, nearest-neighbor search, embedding search

يُشغّل البحث المتجهي الاسترجاع الدلالي: فبدلاً من مطابقة السلاسل، يطابق المعنى. يُضمَّن الاستعلام في الفضاء المتجهي نفسه للمحتوى المفهرس، ويُرجع الفهرس أقرب المتجهات بمقياس مسافة. وللبقاء سريعًا على نطاق واسع، تستخدم أنظمة الإنتاج فهارس الجار الأقرب التقريبي التي تقبل مقايضات دقة ضئيلة لقاء مكاسب كبيرة في زمن الاستجابة. ويكون البحث المتجهي أكثر فعالية عند اقترانه بالبحث بالكلمات المفتاحية في مُسترجِع هجين، بحيث لا تُفقَد المعرّفات الدقيقة لصالح المطابقة الدلالية البحتة.

الأسئلة الشائعة

ما التضمين في البحث المتجهي؟
التضمين متجه عددي يمثّل معنى قطعة من النص، يُنتجه نموذج تضمين. وتقع النصوص المتشابهة في المعنى قريبة بعضها من بعض في الفضاء المتجهي.
ما البحث عن الجار الأقرب التقريبي (ANN)؟
يقايض بحث ANN قدرًا صغيرًا من الدقة بمكاسب كبيرة في السرعة، مستخدمًا بنى فهرسة حتى تبقى عمليات بحث التشابه سريعة مع نمو عدد المتجهات المُخزَّنة إلى الملايين.