Embedding
Embedding ni vector ya nambari inayowakilisha maana ya maandishi, picha, au data nyingine katika nafasi yenye vipimo vingi. Vipengee vyenye maana inayofanana hutengeneza vectors zilizo karibu, jambo linalowezesha mifumo kulinganisha, kupanga makundi, na kurejesha maudhui kwa ufanano wa maana badala ya mlingano kamili wa maneno.
Visawe: vector embedding, text embedding, semantic vector, dense representation
Embeddings ni daraja kati ya lugha ya binadamu na hesabu za ufanano. Embedding model hugeuza kila ingizo kuwa vector ya urefu thabiti ili vipengee vinavyohusiana kimaana vikaribiane, kuwezesha vector search, clustering, classification, na deduplication. Katika retrieval pipeline, chunks zilizo kwenye index na swali linaloingia hu-embed-iwa kwa model ile ile ili umbali uwe na maana. Kwa kuwa embedding model ndiyo hufafanua nafasi hiyo, toleo lake ni metadata inayofaa kufuatiliwa kwa reproducibility na reindexing inayodhibitiwa.