Embedding
Een embedding is een numerieke vector die de betekenis van tekst, afbeeldingen of andere data in een hoog-dimensionale ruimte weergeeft. Items met vergelijkbare betekenis leveren vectoren op die dicht bij elkaar liggen, waardoor systemen content kunnen vergelijken, clusteren en ophalen op basis van semantische gelijkenis in plaats van exacte overeenkomsten.
Synoniemen: vectorembedding, tekstembedding, semantische vector, dense representatie
Embeddings vormen de brug tussen menselijke taal en similarity math. Een embeddingmodel zet elke invoer om in een vector met vaste lengte, zodat semantisch verwante items samen clusteren en vector search, clustering, classificatie en deduplicatie mogelijk worden. In een retrievalpipeline worden zowel de geïndexeerde chunks als de binnenkomende query met hetzelfde model ingebed, zodat afstanden betekenisvol zijn. Omdat het embeddingmodel de ruimte definieert, is de versie metadata die het waard is te volgen voor reproduceerbaarheid en gecontroleerde herindexering.