Ga naar inhoud
Woordenlijst

Vector Search

Vector search vindt content op betekenis in plaats van exacte woorden. Tekst wordt omgezet in hoog-dimensionale embeddings, en een similarity metric zoals cosinusafstand rangschikt opgeslagen vectoren op hoe dicht ze bij de queryvector liggen, waardoor conceptueel verwante passages terugkomen zelfs wanneer geen trefwoorden overeenkomen.

Synoniemen: semantische search, similarity search, nearest-neighbor search, embedding search

Vector search drijft semantische retrieval aan: in plaats van strings te matchen, matcht het betekenis. Een query wordt ingebed in dezelfde vectorruimte als de geïndexeerde content, en de index geeft de dichtstbijzijnde vectoren terug volgens een afstandsmetric. Om op schaal snel te blijven gebruiken productiesystemen approximate nearest-neighbor-indexen die minieme nauwkeurigheidsoffers accepteren voor grote latencywinst. Vector search is het effectiefst in combinatie met keyword search in een hybride retriever, zodat exacte identifiers niet verloren gaan door puur semantische matching.

Veelgestelde vragen

Wat is een embedding in vector search?
Een embedding is een numerieke vector die de betekenis van een stuk tekst weergeeft, geproduceerd door een embeddingmodel. Teksten met vergelijkbare betekenis komen dicht bij elkaar in de vectorruimte terecht.
Wat is approximate nearest neighbor (ANN) search?
ANN search ruilt een kleine hoeveelheid nauwkeurigheid voor grote snelheidswinst, met indexstructuren waardoor similarity lookups snel blijven terwijl het aantal opgeslagen vectoren naar miljoenen groeit.