Przejdź do treści
Glosariusz

Vector Search

Vector search znajduje treści według znaczenia, a nie dokładnych słów. Tekst jest przekształcany w embeddingi wysokowymiarowe, a metryka podobieństwa, taka jak odległość kosinusowa, szereguje zapisane wektory według bliskości do wektora zapytania, zwracając pojęciowo powiązane fragmenty nawet bez pasujących słów kluczowych.

Synonimy: wyszukiwanie semantyczne, wyszukiwanie podobieństwa, nearest-neighbor search, embedding search

Vector search napędza retrieval semantyczny: zamiast dopasowywać ciągi znaków, dopasowuje znaczenie. Zapytanie jest osadzane w tej samej przestrzeni wektorowej co indeksowana treść, a indeks zwraca najbliższe wektory według metryki odległości. Aby zachować szybkość w skali, systemy produkcyjne używają indeksów approximate nearest-neighbor, które akceptują drobne kompromisy dokładności dla dużych zysków opóźnienia. Vector search jest najskuteczniejszy w parze z keyword search w hybrydowym retrieverze, aby dokładne identyfikatory nie ginęły w czysto semantycznym dopasowaniu.

Najczęściej zadawane pytania

Czym jest embedding w vector search?
Embedding to wektor liczbowy reprezentujący znaczenie fragmentu tekstu, wytworzony przez model embeddingów. Teksty o podobnym znaczeniu trafiają blisko siebie w przestrzeni wektorowej.
Czym jest approximate nearest neighbor (ANN) search?
ANN search wymienia niewielką część dokładności na duży wzrost szybkości, używając struktur indeksu, aby lookup podobieństwa pozostawał szybki, gdy liczba zapisanych wektorów rośnie do milionów.