Vektorsuche
Die Vektorsuche findet Inhalte nach Bedeutung statt nach exakten Wörtern. Text wird in hochdimensionale Embeddings umgewandelt, und eine Ähnlichkeitsmetrik wie die Kosinus-Distanz ordnet gespeicherte Vektoren danach, wie nahe sie dem Anfragevektor liegen, und gibt konzeptuell verwandte Passagen zurück, selbst wenn kein Schlüsselwort übereinstimmt.
Synonyme: semantic search, similarity search, nearest-neighbor search, embedding search
Die Vektorsuche treibt den semantischen Abruf an: Statt Zeichenketten abzugleichen, gleicht sie Bedeutung ab. Eine Anfrage wird in denselben Vektorraum wie der indexierte Inhalt eingebettet, und der Index gibt die nächstgelegenen Vektoren nach einer Distanzmetrik zurück. Um im großen Maßstab schnell zu bleiben, verwenden Produktionssysteme Indizes für approximative nächste Nachbarn, die winzige Genauigkeitskompromisse für große Latenzgewinne in Kauf nehmen. Die Vektorsuche ist am wirksamsten, wenn sie in einem hybriden Retriever mit der Schlüsselwortsuche kombiniert wird, sodass exakte Bezeichner nicht der rein semantischen Übereinstimmung zum Opfer fallen.