Vector Search
Vector search ค้นหาเนื้อหาด้วยความหมายแทนคำที่ตรงกัน ข้อความถูกแปลงเป็น embeddings มิติสูง และ similarity metric เช่น cosine distance จะจัดอันดับเวกเตอร์ที่เก็บไว้ตามความใกล้กับ query vector โดยคืน passage ที่เกี่ยวข้องเชิงแนวคิดแม้ไม่มี keyword ตรงกัน
คำพ้องความหมาย: semantic search, similarity search, nearest-neighbor search, embedding search
Vector search ขับเคลื่อน semantic retrieval: แทนที่จะจับคู่ string มันจับคู่ความหมาย query ถูก embedding เข้าไปใน vector space เดียวกับเนื้อหาที่จัดทำดัชนี และ index คืนเวกเตอร์ที่ใกล้ที่สุดตาม distance metric เพื่อให้เร็วเมื่อ scale ระบบ production ใช้ approximate nearest-neighbor indexes ที่ยอมรับ trade-off ความแม่นยำเล็กน้อยเพื่อชนะ latency อย่างมาก Vector search มีประสิทธิภาพที่สุดเมื่อจับคู่กับ keyword search ใน hybrid retriever เพื่อไม่ให้ identifier ที่ตรงเป๊ะสูญหายใน semantic matching ล้วน ๆ