Tìm kiếm vector
Tìm kiếm vector tìm nội dung theo ý nghĩa thay vì từ chính xác. Văn bản được chuyển thành embeddings nhiều chiều, và một thước đo tương đồng như cosine distance xếp hạng các vector đã lưu theo mức gần với vector query, trả về các đoạn liên quan về khái niệm ngay cả khi không có keyword nào khớp.
Từ đồng nghĩa: semantic search, similarity search, nearest-neighbor search, embedding search
Tìm kiếm vector cung cấp sức mạnh cho truy xuất ngữ nghĩa: thay vì khớp chuỗi, nó khớp ý nghĩa. Một query được embedding vào cùng không gian vector với nội dung đã lập chỉ mục, và chỉ mục trả về các vector gần nhất theo thước đo khoảng cách. Để nhanh ở quy mô lớn, hệ thống sản xuất dùng chỉ mục approximate nearest-neighbor chấp nhận đánh đổi chính xác rất nhỏ để giảm mạnh độ trễ. Tìm kiếm vector hiệu quả nhất khi đi cùng keyword search trong retriever lai, để định danh chính xác không bị mất trong khớp ngữ nghĩa thuần túy.