Embedding
embedding ایک numeric vector ہے جو text، images، یا other data کے meaning کو high-dimensional space میں represent کرتا ہے۔ similar meaning والے items ایسے vectors بناتے ہیں جو قریب بیٹھتے ہیں، جس سے systems exact matches کے بجائے semantic similarity سے compare، cluster، اور retrieve کر سکتے ہیں۔
مترادفات: vector embedding, text embedding, semantic vector, dense representation
Embeddings human language اور similarity math کے بیچ bridge ہیں۔ embedding model ہر input کو fixed-length vector میں map کرتا ہے تاکہ semantically related items ایک ساتھ cluster ہوں، جس سے vector search، clustering، classification، اور deduplication enable ہوتے ہیں۔ retrieval pipeline میں indexed chunks اور incoming query دونوں اسی model سے embedded ہوتے ہیں تاکہ distances meaningful ہوں۔ چونکہ embedding model space define کرتا ہے، اس کا version reproducibility اور controlled reindexing کے لیے track کرنے کے قابل metadata ہے۔