Embedding
Embedding adalah vektor numerik yang merepresentasikan makna teks, gambar, atau data lain di ruang berdimensi tinggi. Item dengan makna serupa menghasilkan vektor yang berdekatan, sehingga sistem dapat membandingkan, mengelompokkan, dan mengambil konten berdasarkan kemiripan semantik alih-alih kecocokan persis.
Sinonim: vector embedding, text embedding, semantic vector, dense representation
Embedding adalah jembatan antara bahasa manusia dan matematika kemiripan. Model embedding memetakan setiap input ke vektor panjang tetap sehingga item yang terkait secara semantik berkumpul berdekatan, memungkinkan vector search, clustering, classification, dan deduplication. Dalam pipeline retrieval, chunk yang diindeks dan query yang masuk dibuat embedding dengan model yang sama agar jaraknya bermakna. Karena model embedding mendefinisikan ruang tersebut, versinya adalah metadata yang layak dilacak untuk reproduksibilitas dan reindexing yang terkendali.