Glossar

Vektorsuche

Die Vektorsuche findet Inhalte nach Bedeutung statt nach exakten Wörtern. Text wird in hochdimensionale Embeddings umgewandelt, und eine Ähnlichkeitsmetrik wie die Kosinus-Distanz ordnet gespeicherte Vektoren danach, wie nahe sie dem Anfragevektor liegen, und gibt konzeptuell verwandte Passagen zurück, selbst wenn kein Schlüsselwort übereinstimmt.

Synonyme: semantic search, similarity search, nearest-neighbor search, embedding search

Die Vektorsuche treibt den semantischen Abruf an: Statt Zeichenketten abzugleichen, gleicht sie Bedeutung ab. Eine Anfrage wird in denselben Vektorraum wie der indexierte Inhalt eingebettet, und der Index gibt die nächstgelegenen Vektoren nach einer Distanzmetrik zurück. Um im großen Maßstab schnell zu bleiben, verwenden Produktionssysteme Indizes für approximative nächste Nachbarn, die winzige Genauigkeitskompromisse für große Latenzgewinne in Kauf nehmen. Die Vektorsuche ist am wirksamsten, wenn sie in einem hybriden Retriever mit der Schlüsselwortsuche kombiniert wird, sodass exakte Bezeichner nicht der rein semantischen Übereinstimmung zum Opfer fallen.

Was ist ein Embedding in der Vektorsuche?

Ein Embedding ist ein numerischer Vektor, der die Bedeutung eines Textstücks darstellt und von einem Embedding-Modell erzeugt wird. Texte mit ähnlicher Bedeutung landen im Vektorraum nahe beieinander.

Was ist die Suche nach approximativem nächsten Nachbarn (ANN)?

Die ANN-Suche tauscht ein kleines Maß an Genauigkeit gegen große Geschwindigkeitsgewinne und nutzt Indexstrukturen, damit Ähnlichkeitsabfragen schnell bleiben, wenn die Zahl der gespeicherten Vektoren in die Millionen wächst.

Vektorsuche

Häufig gestellte Fragen

Verwandte Begriffe