सामग्री पर जाएँ

हाइब्रिड रिट्रीवल: वेक्टर + कीवर्ड + मेटाडेटा

लचीला हाइब्रिड रिट्रीवल बनाना: वेबसाइट RAG के लिए वेक्टर, शाब्दिक, मेटाडेटा और सामयिक संकेतों का मिश्रण।

retrieval • hybrid • search • rag

एकल-मोडैलिटी रिट्रीवल किनारे के मामलों में विफल हो जाता है: सघन वेक्टर दुर्लभ टोकन और ID को चूक जाते हैं; शुद्ध शाब्दिक खोज व्याख्या और अर्थगत समानता को चूक जाती है। हाइब्रिड रिट्रीवल पूरक संकेतों को जोड़ता है—सघन अर्थगत, विरल शाब्दिक, संरचित मेटाडेटा, सामयिक ताज़गी—ताकि स्थिर, उच्च-परिशुद्धता वाले उम्मीदवार सेट तैयार किए जा सकें। यह लेख आर्किटेक्चर, सामान्यीकरण, स्कोर संलयन, विफलता प्रबंधन और मूल्यांकन का विवरण देता है।

प्रेरणा

विफलता के परिदृश्य:

  • सघन मॉडल द्वारा छूट जाने वाले व्यक्तिवाचक संज्ञाएँ / SKU कोड।
  • सामयिक बूस्ट के अभाव में बासी स्नैपशॉट खींचने वाली मूल्य-परिवर्तन क्वेरीज़।
  • केवल-विरल सिस्टम में स्टॉपवर्ड्स पर अति-भारित लंबे प्राकृतिक भाषा प्रश्न।
  • शाब्दिक एंकरिंग के अभाव में अर्थगत रूप से व्यापक पृष्ठों (मार्केटिंग की भरमार) पर वेक्टर के मिथ्या-सकारात्मक।

हाइब्रिड दृष्टिकोण लंबवत साक्ष्य आयामों को पकड़कर इसे कम करता है।

घटक स्तरीकरण

अनुशंसित प्रवाह:

  1. क्वेरी एम्बेडिंग → ANN खोज (k_vec)
  2. शाब्दिक खोज (BM25 / SPLADE / Elasticsearch) (k_lex)
  3. संघ → स्कोर सामान्यीकरण (प्रति-स्रोत स्केलिंग)
  4. मेटाडेटा फ़िल्टर पास (locale, access_tier, page_type)
  5. विविधता और ताज़गी समायोजन
  6. वैकल्पिक क्रॉस/मोनो री-रैंकर
  7. अंतिम ट्रंकेशन (टॉप K)

ऑडिट के लिए कच्चे पूर्व-संलयन स्कोर बनाए रखें।

क्वेरी सामान्यीकरण

चरण:

  • Unicode सामान्यीकरण NFKC
  • लोअरकेस (यदि आवश्यक हो तो उत्तर स्वरूपण के लिए केसिंग स्नैपशॉट सुरक्षित रखें)
  • टोकनाइज़ करें और स्टॉपवर्ड्स सुरक्षित रखें (अर्थगत एम्बेडिंग संदर्भ का लाभ उठा सकती हैं)
  • पर्यायवाची / उपनाम विस्तार: आंतरिक उत्पाद कोडनाम मैपिंग के लिए वैकल्पिक टोकन जोड़ें (मॉडल प्रॉम्प्ट में नहीं डाले जाते; केवल विरल रिट्रीवल के लिए उपयोग होते हैं)।
  • संख्या और संस्करण निष्कर्षण: लक्षित शाब्दिक स्कोरिंग के लिए X.Y.Z पैटर्न पकड़ें।

मेटाडेटा और विशेषता फ़िल्टर

प्रारंभिक उम्मीदवार संघ के बाद लागू किए गए फ़िल्टर रिकॉल हानि को कम करते हैं। सामान्य फ़ील्ड: locale, access_tier, page_type, product_area, updated_bucket। लीकेज को री-रैंकिंग को प्रभावित करने से रोकने के लिए स्कोर संलयन से पहले सुरक्षा फ़िल्टर (tenant / tier) लागू करें। निरीक्षण के लिए filtered_out सेट लौटाने वाला डिबग मोड प्रदान करें।

री-रैंकिंग रणनीति

टॉप N (10–20) पर एक हल्के क्रॉस-एनकोडर (डिस्टिल्ड मॉडल) का उपयोग करें। यदि लेटेंसी > बजट हो, तो डाउनग्रेड करें: री-रैंक छोड़ें या शाब्दिक भार बढ़ाते हुए उम्मीदवार संख्या घटाएँ। लागत को उचित ठहराने के लिए re_rank_delta = MRR_post - MRR_pre को ट्रैक करें। एक छोटी TTL के भीतर समान संघ सेट के लिए री-रैंक परिणाम कैश करें।

ताज़गी और सामयिक संकेत

freshness_weight = exp(-lambda * age_days) की गणना करें, जहाँ lambda को सामग्री प्रकार के अनुसार ट्यून किया जाता है (मूल्य के लिए अधिक, स्थिर API के लिए कम)। संयोजित करें: final_score = w_sem * sem_score + w_lex * lex_score + w_fresh * freshness_weight + w_meta * meta_priors। प्रभुत्व से बचने के लिए पहले प्रत्येक घटक को सामान्यीकृत करें (z-score या min-max)।

विफलता के तरीके

विफलताकारणशमन
लोकप्रियता पूर्वाग्रहशाब्दिक tf-idf का अति-भारटर्म फ़्रीक्वेंसी योगदान की सीमा तय करें
बासी परिणामताज़गी भार गलत ट्यूनमूल्यांकन सेट से lambda पुनः अंशांकित करें
Locale लीकेजफ़िल्टर देर से लागू होनासुरक्षा फ़िल्टर पहले ले जाएँ
अर्थगत बहावएम्बेडिंग मॉडल अपग्रेडरोलआउट से पहले दोहरा-इंडेक्स और A/B तुलना
अति-संलयन शोरअसीमित संघ आकारसंघ सीमित करें, विविधता प्रूनिंग

मूल्यांकन ढाँचा

प्रयोग:

  • एब्लेशन: (केवल वेक्टर, केवल शाब्दिक, बिना री-रैंक हाइब्रिड, पूर्ण) Recall@k, MRR मापता है।
  • संलयन भार ट्यूनिंग: सत्यापन गोल्ड सेट का उपयोग करके भारों की ग्रिड खोज।
  • लेटेंसी बजट: प्रति कॉन्फ़िगरेशन औसत + P95 रिट्रीवल लेटेंसी को ट्रैक करें।
  • बहाव: हेड बनाम टेल क्वेरीज़ के लिए रिकॉल में साप्ताहिक सापेक्ष परिवर्तन की निगरानी करें।

कॉन्फ़िगरेशन हैश के साथ मूल्यांकन मैनिफ़ेस्ट बनाए रखें।

अनुकूलन लूप

चक्र:

  1. रिट्रीवल ट्रेस लॉग करें (query, candidates, scores, source_tag)।
  2. गलत-हिट पहचानें (डाउनस्ट्रीम कम फ़ेथफ़ुलनेस या कम साइटेशन गिनती) → मूल कारण वर्गीकृत करें (अनुपस्थित शाब्दिक उम्मीदवार, अर्थगत मिथ्या-सकारात्मक, बासी सामग्री)।
  3. भार / थ्रेशोल्ड समायोजित करें; ऑफ़लाइन सूट चलाएँ।
  4. एक feature flag के पीछे नए संलयन भारों को कैनरी करें।
  5. सांख्यिकीय रूप से महत्वपूर्ण सुधार पर प्रचारित करें।

मुख्य बातें

  • हाइब्रिड रिट्रीवल समायोज्य डायल का एक सिस्टम है—अथक रूप से इंस्ट्रूमेंट करें।
  • सुरक्षा और एक्सेस फ़िल्टर जल्दी लागू करें; स्कोरिंग में लीकेज से बचें।
  • री-रैंकिंग को मापने योग्य MRR / Recall वृद्धि के माध्यम से लेटेंसी को उचित ठहराना चाहिए।
  • सामयिक क्षय पुरानी, उच्च-प्राधिकार वाली पृष्ठों को हावी होने से रोकता है।
  • संलयन परिवर्तनों को कोड की तरह मानें: संस्करण बनाएँ, मूल्यांकन करें, आगे बढ़ाएँ या वापस लौटाएँ।