ข้ามไปยังเนื้อหา
อภิธานศัพท์

Vector Search

Vector search ค้นหาเนื้อหาด้วยความหมายแทนคำที่ตรงกัน ข้อความถูกแปลงเป็น embeddings มิติสูง และ similarity metric เช่น cosine distance จะจัดอันดับเวกเตอร์ที่เก็บไว้ตามความใกล้กับ query vector โดยคืน passage ที่เกี่ยวข้องเชิงแนวคิดแม้ไม่มี keyword ตรงกัน

คำพ้องความหมาย: semantic search, similarity search, nearest-neighbor search, embedding search

Vector search ขับเคลื่อน semantic retrieval: แทนที่จะจับคู่ string มันจับคู่ความหมาย query ถูก embedding เข้าไปใน vector space เดียวกับเนื้อหาที่จัดทำดัชนี และ index คืนเวกเตอร์ที่ใกล้ที่สุดตาม distance metric เพื่อให้เร็วเมื่อ scale ระบบ production ใช้ approximate nearest-neighbor indexes ที่ยอมรับ trade-off ความแม่นยำเล็กน้อยเพื่อชนะ latency อย่างมาก Vector search มีประสิทธิภาพที่สุดเมื่อจับคู่กับ keyword search ใน hybrid retriever เพื่อไม่ให้ identifier ที่ตรงเป๊ะสูญหายใน semantic matching ล้วน ๆ

คำถามที่พบบ่อย

embedding ใน vector search คืออะไร?
embedding คือเวกเตอร์ตัวเลขที่แทนความหมายของข้อความชิ้นหนึ่ง ผลิตโดย embedding model ข้อความที่มีความหมายคล้ายกันจะอยู่ใกล้กันใน vector space
approximate nearest neighbor (ANN) search คืออะไร?
ANN search ยอมแลกความแม่นยำเล็กน้อยกับความเร็วที่เพิ่มขึ้นมาก โดยใช้โครงสร้าง index เพื่อให้ similarity lookup ยังเร็วเมื่อจำนวนเวกเตอร์ที่เก็บเพิ่มเป็นล้าน