Hallucinatie
Een hallucinatie is een zelfverzekerde maar niet-ondersteunde of verzonnen output van een taalmodel, een claim die aannemelijk klinkt maar geen basis heeft in het geleverde bewijs of de werkelijkheid. Hallucinaties zijn het centrale risico bij het automatiseren van kenniswerk, en grounding met geciteerd bewijs is de belangrijkste mitigatie.
Synoniemen: AI-hallucinatie, fabricatie, confabulatie, niet-onderbouwde output
Hallucinatie ontstaat wanneer vloeiendheid de waarheid voorbijloopt. Omdat een model optimaliseert voor aannemelijke vervolgen, kan het specifieke namen, getallen of citaties produceren die nooit echt waren. Bij laag-risico schrijfwerk is dat hinderlijk; bij governede werkautomatisering is het een harde fout die een beslissing kan misleiden of een verkeerde actie kan activeren. De verdediging is architecturaal: haal echt bewijs op, begrens generatie daartoe, voeg citaties toe en ontwerp een expliciet pad voor weigeren of escaleren wanneer het bewijs een antwoord niet ondersteunt.