Ricerca vettoriale
La ricerca vettoriale trova contenuti per significato invece che per parole esatte. Il testo viene convertito in embedding ad alta dimensionalità, e una metrica di somiglianza come la distanza coseno ordina i vettori salvati in base alla vicinanza al vettore della query, restituendo passaggi concettualmente correlati anche quando nessuna parola chiave coincide.
Sinonimi: semantic search, similarity search, nearest-neighbor search, embedding search
La ricerca vettoriale alimenta il recupero semantico: invece di confrontare stringhe, confronta significati. Una query viene trasformata in embedding nello stesso spazio vettoriale del contenuto indicizzato, e l’indice restituisce i vettori più vicini secondo una metrica di distanza. Per restare veloce su larga scala, i sistemi di produzione usano indici approximate nearest-neighbor che accettano minuscoli compromessi di accuratezza per grandi benefici di latenza. La ricerca vettoriale è più efficace se affiancata alla ricerca per parole chiave in un retriever ibrido, così gli identificatori esatti non si perdono nel matching puramente semantico.