Vai al contenuto
Glossario

Ricerca vettoriale

La ricerca vettoriale trova contenuti per significato invece che per parole esatte. Il testo viene convertito in embedding ad alta dimensionalità, e una metrica di somiglianza come la distanza coseno ordina i vettori salvati in base alla vicinanza al vettore della query, restituendo passaggi concettualmente correlati anche quando nessuna parola chiave coincide.

Sinonimi: semantic search, similarity search, nearest-neighbor search, embedding search

La ricerca vettoriale alimenta il recupero semantico: invece di confrontare stringhe, confronta significati. Una query viene trasformata in embedding nello stesso spazio vettoriale del contenuto indicizzato, e l’indice restituisce i vettori più vicini secondo una metrica di distanza. Per restare veloce su larga scala, i sistemi di produzione usano indici approximate nearest-neighbor che accettano minuscoli compromessi di accuratezza per grandi benefici di latenza. La ricerca vettoriale è più efficace se affiancata alla ricerca per parole chiave in un retriever ibrido, così gli identificatori esatti non si perdono nel matching puramente semantico.

Domande frequenti

Che cos'è un embedding nella ricerca vettoriale?
Un embedding è un vettore numerico che rappresenta il significato di un frammento di testo, prodotto da un modello di embedding. Testi con significato simile atterrano vicini nello spazio vettoriale.
Che cos'è la ricerca approximate nearest neighbor (ANN)?
La ricerca ANN scambia una piccola quantità di accuratezza con grandi guadagni di velocità, usando strutture di indice affinché le ricerche di somiglianza restino rapide mentre il numero di vettori salvati cresce fino a milioni.