Búsqueda vectorial
La búsqueda vectorial encuentra contenido por significado en lugar de por palabras exactas. El texto se convierte en incrustaciones de alta dimensión, y una métrica de similitud como la distancia coseno clasifica los vectores almacenados según su cercanía al vector de consulta, devolviendo pasajes conceptualmente relacionados aunque no coincida ninguna palabra clave.
Sinónimos: semantic search, similarity search, nearest-neighbor search, embedding search
La búsqueda vectorial impulsa la recuperación semántica: en lugar de coincidir cadenas, coincide significados. Una consulta se incrusta en el mismo espacio vectorial que el contenido indexado, y el índice devuelve los vectores más cercanos según una métrica de distancia. Para mantenerse rápidos a escala, los sistemas de producción usan índices de vecino más cercano aproximado que aceptan diminutos compromisos de precisión a cambio de grandes mejoras de latencia. La búsqueda vectorial es más eficaz cuando se combina con la búsqueda por palabras clave en un recuperador híbrido, de modo que los identificadores exactos no se pierdan ante la coincidencia puramente semántica.