Ruka hadi kwenye maudhui
Kamusi

Vector search

Vector search hupata maudhui kwa maana badala ya maneno halisi. Maandishi hugeuzwa kuwa embeddings zenye vipimo vingi, na kipimo cha ufanano kama cosine distance hupanga vectors zilizohifadhiwa kwa ukaribu wake na query vector, zikirejesha passages zinazohusiana kidhana hata bila keywords kufanana.

Visawe: semantic search, similarity search, nearest-neighbor search, embedding search

Vector search huendesha semantic retrieval: badala ya kulinganisha strings, hulinganisha maana. Query hu-embed-iwa kwenye vector space ile ile kama maudhui yaliyo kwenye index, na index hurudisha vectors zilizo karibu zaidi kwa kipimo cha umbali. Ili kubaki haraka katika scale, mifumo ya production hutumia approximate nearest-neighbor indexes zinazokubali hasara ndogo sana ya accuracy kwa faida kubwa ya latency. Vector search huwa na nguvu zaidi ikiunganishwa na keyword search kwenye hybrid retriever, ili vitambulisho halisi visipotee kwenye ulinganishaji wa maana pekee.

Maswali yanayoulizwa mara kwa mara

Embedding ni nini katika vector search?
Embedding ni vector ya nambari inayowakilisha maana ya kipande cha maandishi, inayotengenezwa na embedding model. Maandishi yenye maana inayofanana huangukia karibu kwenye vector space.
Approximate nearest neighbor (ANN) search ni nini?
ANN search hubadilisha kiasi kidogo cha usahihi kwa ongezeko kubwa la kasi, kwa kutumia miundo ya index ili similarity lookups zibaki za haraka kadiri idadi ya vectors zilizohifadhiwa inavyokua hadi mamilioni.