مواد پر جائیں
لغت

Embedding

embedding ایک numeric vector ہے جو text، images، یا other data کے meaning کو high-dimensional space میں represent کرتا ہے۔ similar meaning والے items ایسے vectors بناتے ہیں جو قریب بیٹھتے ہیں، جس سے systems exact matches کے بجائے semantic similarity سے compare، cluster، اور retrieve کر سکتے ہیں۔

مترادفات: vector embedding, text embedding, semantic vector, dense representation

Embeddings human language اور similarity math کے بیچ bridge ہیں۔ embedding model ہر input کو fixed-length vector میں map کرتا ہے تاکہ semantically related items ایک ساتھ cluster ہوں، جس سے vector search، clustering، classification، اور deduplication enable ہوتے ہیں۔ retrieval pipeline میں indexed chunks اور incoming query دونوں اسی model سے embedded ہوتے ہیں تاکہ distances meaningful ہوں۔ چونکہ embedding model space define کرتا ہے، اس کا version reproducibility اور controlled reindexing کے لیے track کرنے کے قابل metadata ہے۔

اکثر پوچھے جانے والے سوالات

embedding model version کیوں اہم ہے؟
different models سے vectors comparable نہیں ہوتے۔ ہر embedding کے ساتھ model version store کرنے سے drift detect ہوتا ہے اور embedding model upgrade پر safe reindex ممکن ہوتا ہے۔
کیا embeddings original text میں reverse ہو سکتی ہیں؟
بالکل نہیں، مگر embeddings sensitive information leak کر سکتی ہیں، اس لیے انہیں source content جیسے tenant isolation اور access controls inherit کرنے چاہئیں۔