Lewati ke konten
Glosarium

Pencarian Vektor

Pencarian vektor menemukan konten berdasarkan makna, bukan kata persis. Teks diubah menjadi embedding berdimensi tinggi, lalu metrik kemiripan seperti cosine distance merangking vektor tersimpan berdasarkan kedekatannya dengan vektor query, mengembalikan passage yang terkait secara konseptual meskipun tidak ada keyword yang cocok.

Sinonim: semantic search, similarity search, nearest-neighbor search, embedding search

Pencarian vektor menggerakkan retrieval semantik: alih-alih mencocokkan string, ia mencocokkan makna. Query dibuat embedding ke ruang vektor yang sama dengan konten terindeks, dan indeks mengembalikan vektor terdekat berdasarkan metrik jarak. Agar tetap cepat pada skala besar, sistem produksi menggunakan indeks approximate nearest-neighbor yang menerima trade-off akurasi kecil untuk kemenangan latensi besar. Pencarian vektor paling efektif ketika dipasangkan dengan keyword search dalam retriever hibrida, sehingga identifier persis tidak hilang karena pencocokan semantik murni.

Pertanyaan yang sering diajukan

Apa itu embedding dalam pencarian vektor?
Embedding adalah vektor numerik yang merepresentasikan makna sebuah teks, dihasilkan oleh model embedding. Teks dengan makna serupa jatuh berdekatan di ruang vektor.
Apa itu approximate nearest neighbor (ANN) search?
ANN search menukar sedikit akurasi dengan peningkatan kecepatan besar, menggunakan struktur indeks agar lookup kemiripan tetap cepat saat jumlah vektor tersimpan tumbuh hingga jutaan.