Question 1

Perché i modelli linguistici allucinano?

Accepted Answer

I modelli predicono testo probabile, non fatti verificati. Senza evidenza recuperata che li vincoli, riempiono i vuoti con affermazioni statisticamente plausibili ma non verificate.

Question 2

Come si riduce l'allucinazione?

Accepted Answer

Fondare le risposte su fonti recuperate, richiedere citazioni, verificare le affermazioni contro l'evidenza e indirizzare a una persona i casi a bassa confidenza o non supportati invece di restituire un'ipotesi.

Question 3

In che cosa l'AEO è diversa dalla SEO?

Accepted Answer

La SEO ottimizza per apparire come link cliccabile in una pagina di risultati. L'AEO ottimizza per essere selezionati, citati e attribuiti dentro una risposta generata da AI, premiando definizioni precise, dati strutturati e feed puliti leggibili dalle macchine.

Question 4

Quali segnali aiutano un motore di risposta a citare una pagina?

Accepted Answer

Scrittura che parte dalla definizione, dati strutturati schema.org validi, un indice llms.txt, markup FAQ e URL canonici stabili rendono i contenuti più facili da recuperare e attribuire.

Question 5

Quali tipi di intake possono essere automatizzati?

Accepted Answer

Email, messaggi chat, moduli web, documenti caricati e record sincronizzati da sistemi collegati possono essere tutti normalizzati nella stessa forma strutturata per la gestione a valle.

Question 6

L'automazione dell'intake sostituisce le persone?

Accepted Answer

No. Rimuove il carico di inserimento manuale e triage, così le persone si concentrano su eccezioni ad alto giudizio, approvazioni e decisioni ad alto rischio che la policy indirizza a loro.

Question 7

Che cosa rende buono un chunk?

Accepted Answer

Un buon chunk è semanticamente autosufficiente, dimensionato in modo che un singolo fatto non venga diviso tra confini, e porta metadati stabili per poter essere filtrato, aggiornato e citato in modo affidabile.

Question 8

In che modo il chunking influisce sulla qualità delle risposte?

Accepted Answer

Chunk troppo grandi diluiscono la rilevanza e sprecano token, mentre chunk troppo piccoli fratturano il contesto e perdono significato. Le scelte sui confini modellano direttamente recall e fondatezza delle risposte generate.

Question 9

Che cosa dovrebbe includere una citazione?

Accepted Answer

Come minimo l'identificatore della fonte e il passaggio esatto usato, idealmente con un link stabile e un timestamp, così i revisori possono confermare che l'evidenza fosse attuale quando la risposta è stata prodotta.

Question 10

Perché le citazioni sono essenziali per l'automazione governata?

Accepted Answer

Le citazioni rendono verificabile una risposta. Senza di esse una risposta automatizzata non è responsabile; con esse un revisore può verificare il grounding e un audit trail può provare quale evidenza ha guidato una decisione.

Question 11

Perché la classificazione dell'intento è importante?

Accepted Answer

Decide l'intero percorso a valle. Una richiesta classificata male recupera l'evidenza sbagliata e applica la policy sbagliata, quindi l'accuratezza della classificazione governa la qualità di tutto ciò che segue.

Question 12

Come si misura l'accuratezza della classificazione?

Accepted Answer

Con gate di valutazione su un insieme etichettato, tracciando precisione e recall per intento e controllando la confusione tra categorie simili prima che un workflow vada live.

Question 13

Che cosa definisce l'ambito di una delega?

Accepted Answer

Le capacità che l'agente può usare, il tenant in cui può agire, le azioni che può proporre o eseguire e una scadenza, così l'autorità resta stretta, limitata nel tempo e revocabile.

Question 14

Come resta responsabile la delega?

Accepted Answer

Ogni azione delegata viene attribuita sia all'agente sia al principale che l'ha delegata e registrata nell'audit trail, mentre le azioni sensibili passano comunque attraverso la policy di approvazione.

Question 15

Perché la versione del modello di embedding è importante?

Accepted Answer

I vettori prodotti da modelli diversi non sono confrontabili. Salvare la versione del modello con ogni embedding permette di rilevare drift e reindicizzare in sicurezza quando si aggiorna il modello di embedding.

Question 16

Gli embedding sono reversibili nel testo originale?

Accepted Answer

Non esattamente, ma gli embedding possono far trapelare informazioni sensibili, quindi dovrebbero ereditare lo stesso isolamento tenant e gli stessi controlli di accesso del contenuto sorgente che rappresentano.

Question 17

Come si applica il grounding nella pratica?

Accepted Answer

Il recupero fornisce al modello solo passaggi sorgente rilevanti, il prompt gli ordina di rispondere da quell'evidenza e un passaggio di verifica respinge le affermazioni prive di una citazione di supporto.

Question 18

Che cosa succede quando non c'è evidenza per il grounding?

Accepted Answer

Un sistema grounded ben progettato rifiuta di rispondere o scala a una persona invece di inventare una risposta, mostrando una lacuna esplicita invece di un'ipotesi sicura.

Question 19

Quando un passaggio dovrebbe essere human-in-the-loop?

Accepted Answer

Ogni volta che una decisione è ad alto rischio, irreversibile, a bassa confidenza o governata da policy. I passaggi di routine, ben fondati e a basso rischio possono procedere automaticamente con revisione umana sulle eccezioni.

Question 20

In che cosa è diverso dall'automazione completa?

Accepted Answer

L'automazione completa agisce senza revisione. Human-in-the-loop inserisce un checkpoint esplicito in cui una persona può approvare, modificare o respingere la proposta, preservando la responsabilità sugli esiti sensibili.

Question 21

Come viene applicato l'isolamento tenant durante il recupero?

Accepted Answer

Ogni query è circoscritta al tenant richiedente, e il contenuto salvato porta un identificatore tenant, così ricerca vettoriale e per parole chiave possono restituire solo l'evidenza propria di quel tenant.

Question 22

L'isolamento riguarda solo i dati?

Accepted Answer

No. Copre anche configurazione, policy, embedding e audit log, così nessun aspetto del lavoro di un tenant trapela in quello di un altro, anche su infrastruttura condivisa.

Question 23

Che cosa espone un server MCP?

Accepted Answer

Strumenti tipizzati che il modello può invocare e risorse che può leggere, ciascuno descritto con schema e annotazioni affinché un client possa scoprire le capacità e chiamarle in sicurezza.

Question 24

Perché MCP conta per l'automazione governata?

Accepted Answer

Offre agli assistenti esterni un modo standard, descritto da schema, per agire su una piattaforma, così le chiamate agli strumenti possono essere validate, circoscritte a un tenant e instradate attraverso la stessa policy di approvazione di ogni altra azione.

Question 25

Perché usare MongoDB Atlas Search per il recupero di conoscenza?

Accepted Answer

MongoDB Atlas Search offre ricerca rapida per somiglianza vettoriale con la possibilità di combinare query vettoriali e tradizionali, filtraggio metadati integrato e scalabilità fluida dentro l'infrastruttura MongoDB esistente.

Question 26

Quali metadati contano?

Accepted Answer

Salva tenant ID, lingua, URL, hash del contenuto, timestamp di aggiornamento e versione del modello per abilitare filtraggio, controlli di freschezza e reindicizzazione controllata.

Question 27

In che cosa un pacchetto di lavoro è diverso da un WorkItem?

Accepted Answer

Un WorkItem è il record tracciato della richiesta stessa. Un pacchetto di lavoro è il contesto assemblato, cioè evidenza, policy e proposte, raccolto attorno a quel record per guidare una risposta o un'azione.

Question 28

Perché raccogliere il contesto in un pacchetto?

Accepted Answer

Un pacchetto autosufficiente permette a un modello o a un revisore di prendere una decisione senza cercare tra sistemi, e conserva esattamente quale evidenza era disponibile al momento della decisione per l'audit trail.

Question 29

Che cosa configura un pack verticale?

Accepted Answer

Gli intenti che riconosce, i campi che estrae, l'evidenza su cui fonda le risposte, le policy di approvazione che applica e le azioni governate che può proporre per quel dominio di lavoro.

Question 30

I pack possono essere personalizzati?

Accepted Answer

Sì. Un pack è una configurazione di partenza che i team adattano in Studio, regolando intenti, prompt, fonti di evidenza e policy, così si adatta ai loro processi reali.

Question 31

Perché proporre un'azione invece di eseguirla direttamente?

Accepted Answer

Proporre prima separa l'intento dall'effetto. Permette alla policy di approvazione e ai revisori di ispezionare l'operazione e i parametri precisi, evitando che un errore automatizzato raggiunga un sistema di registrazione.

Question 32

Che cosa contiene una proposta di azione?

Accepted Answer

L'integrazione di destinazione, l'operazione da eseguire, i parametri risolti, l'evidenza di supporto e la decisione di policy sul fatto che serva approvazione prima dell'esecuzione.

Question 33

In che cosa A2A è diverso da MCP?

Accepted Answer

MCP collega un modello a strumenti e dati. A2A collega gli agenti tra loro, definendo come un agente passa un'attività a un altro e ne segue lo stato, invece di descrivere come un modello chiama un singolo strumento.

Question 34

Come vengono tracciate le attività A2A?

Accepted Answer

Un'attività A2A viene mappata su un record di lavoro tracciato, così il suo ciclo di vita, l'evidenza e l'esito sono verificabili come il lavoro originato da una persona o da un modulo.

Question 35

Perché combinare ricerca vettoriale e ricerca per parole chiave?

Accepted Answer

La ricerca vettoriale può mancare termini esatti rari come SKU o codici errore, mentre la ricerca per parole chiave manca le parafrasi. Fondere entrambe recupera i punti di forza di ciascuna e aumenta il recall sulle query reali.

Question 36

Come vengono combinati i due insiemi di risultati?

Accepted Answer

Un metodo di fusione come reciprocal rank fusion o una miscela ponderata di punteggi riordina i candidati uniti, spesso seguito da un reranker cross-encoder per la precisione finale.

Question 37

Perché usare RAG invece del fine-tuning?

Accepted Answer

RAG mantiene la conoscenza in uno store esterno che si può aggiornare immediatamente, così le risposte restano attuali e ogni affermazione può essere ricondotta a una fonte. Il fine-tuning incorpora conoscenza nei pesi, più lento da aggiornare e più difficile da attribuire.

Question 38

Che cosa include una pipeline RAG?

Accepted Answer

Tipicamente ingestione e chunking, embedding, un indice per ricerca vettoriale o ibrida, un retriever e un passaggio di generazione che condiziona il modello sui passaggi recuperati e restituisce evidenza citata.

Question 39

Che cos'è un embedding nella ricerca vettoriale?

Accepted Answer

Un embedding è un vettore numerico che rappresenta il significato di un frammento di testo, prodotto da un modello di embedding. Testi con significato simile atterrano vicini nello spazio vettoriale.

Question 40

Che cos'è la ricerca approximate nearest neighbor (ANN)?

Accepted Answer

La ricerca ANN scambia una piccola quantità di accuratezza con grandi guadagni di velocità, usando strutture di indice affinché le ricerche di somiglianza restino rapide mentre il numero di vettori salvati cresce fino a milioni.

Question 41

Perché SSO conta per piattaforme shell-and-pack?

Accepted Answer

Centralizza l'identità, applica policy di sicurezza enterprise come MFA e accesso condizionale, e accelera il provisioning utenti attraverso shell, pack e workspace governati.

Question 42

SAML vs OIDC?

Accepted Answer

SAML è basato su XML ed è comune negli stack enterprise più datati; OIDC, costruito su OAuth2, è più leggero e moderno. Supportare entrambi massimizza la compatibilità con gli IdP dei clienti.

Question 43

Come vengono rilevate automaticamente le violazioni SLA?

Accepted Answer

Ogni WorkItem porta i propri timer di impegno, e il sistema confronta il tempo trascorso con le soglie, generando escalation mentre una scadenza si avvicina e registrando la violazione se viene mancata.

Question 44

Che cosa succede quando una violazione è imminente?

Accepted Answer

La policy può elevare il WorkItem, notificare i responsabili o riprioritizzare la coda, così l'attenzione si sposta sul lavoro a rischio prima che l'impegno venga effettivamente mancato.

Question 45

Che cosa può attivare un requisito di approvazione?

Accepted Answer

I requisiti possono essere applicati per workflow, canale, classe di rischio, soglia economica o tipo di azione, così solo i passaggi che richiedono davvero supervisione si fermano per un revisore.

Question 46

Come resta verificabile un workflow di approvazione?

Accepted Answer

Ogni richiesta, approvazione, modifica e rifiuto viene registrato con attore e timestamp, producendo una traccia end-to-end che dimostra chi ha autorizzato ogni azione governata.

Question 47

In che cosa un WorkItem è diverso da un ticket di supporto?

Accepted Answer

Un ticket di solito traccia una conversazione. Un WorkItem traccia il lavoro stesso: intento classificato, campi estratti, evidenza che fonda ogni risposta e azioni governate intraprese, tutto verificabile end-to-end.

Question 48

Attraverso quale ciclo di vita passa un WorkItem?

Accepted Answer

L'intake normalizza la richiesta, la classificazione dell'intento la instrada, il recupero dell'evidenza fonda una risposta proposta e ogni azione passa attraverso la policy di approvazione prima che il WorkItem venga risolto e registrato.

Glossario

Allucinazione

Answer Engine Optimization (AEO)

Automazione dell'intake

Chunking

Citazione dell'evidenza

Classificazione dell'intento

Delega dell'agente

Embedding

Grounding

Human-in-the-Loop

Isolamento tenant

Model Context Protocol (MCP)

MongoDB Vector Search

Pacchetto di lavoro

Pack verticale

Proposta di azione

Protocollo Agent2Agent (A2A)

Recupero ibrido

Retrieval-Augmented Generation (RAG)

Ricerca vettoriale

Single Sign-On (SSO)

Violazione SLA

Workflow di approvazione

WorkItem