Vai al contenuto

Glossario

Definizioni dei termini che contano quando si costruiscono sistemi responsabili di automazione del lavoro con AI.

Allucinazione

ai

Un'allucinazione è un output sicuro ma non supportato o inventato da un modello linguistico: un'affermazione che sembra plausibile ma non ha base nell'evidenza fornita o nella realtà. Le allucinazioni sono il rischio centrale nell'automatizzare il lavoro di conoscenza, e il grounding con evidenza citata è la mitigazione principale.

Sinonimi: AI hallucination, fabrication, confabulation, ungrounded output

Perché i modelli linguistici allucinano?
I modelli predicono testo probabile, non fatti verificati. Senza evidenza recuperata che li vincoli, riempiono i vuoti con affermazioni statisticamente plausibili ma non verificate.
Come si riduce l'allucinazione?
Fondare le risposte su fonti recuperate, richiedere citazioni, verificare le affermazioni contro l'evidenza e indirizzare a una persona i casi a bassa confidenza o non supportati invece di restituire un'ipotesi.

Answer Engine Optimization (AEO)

marketing

L'answer engine optimization è la pratica di strutturare i contenuti perché motori di risposta AI e assistenti chat possano trovarli, citarli e riassumerli con accuratezza. Dove la SEO mira ai link classificati, l'AEO mira alla risposta sintetizzata, ottimizzando definizioni chiare, dati strutturati e file sorgente leggibili dalle macchine.

Sinonimi: AEO, generative engine optimization, GEO, AI search optimization

In che cosa l'AEO è diversa dalla SEO?
La SEO ottimizza per apparire come link cliccabile in una pagina di risultati. L'AEO ottimizza per essere selezionati, citati e attribuiti dentro una risposta generata da AI, premiando definizioni precise, dati strutturati e feed puliti leggibili dalle macchine.
Quali segnali aiutano un motore di risposta a citare una pagina?
Scrittura che parte dalla definizione, dati strutturati schema.org validi, un indice llms.txt, markup FAQ e URL canonici stabili rendono i contenuti più facili da recuperare e attribuire.

Automazione dell'intake

platform

L'automazione dell'intake è il processo che trasforma richieste in ingresso non strutturate in record strutturati e leggibili dalle macchine senza inserimento manuale dei dati. Classifica la richiesta, estrae i campi importanti e indirizza il risultato in un workflow perché il lavoro possa essere risposto o azionato in modo coerente.

Sinonimi: request intake, automated triage, intake processing, request normalization

Quali tipi di intake possono essere automatizzati?
Email, messaggi chat, moduli web, documenti caricati e record sincronizzati da sistemi collegati possono essere tutti normalizzati nella stessa forma strutturata per la gestione a valle.
L'automazione dell'intake sostituisce le persone?
No. Rimuove il carico di inserimento manuale e triage, così le persone si concentrano su eccezioni ad alto giudizio, approvazioni e decisioni ad alto rischio che la policy indirizza a loro.

Chunking

ai

Il chunking è il processo di suddivisione dei documenti sorgente in unità di recupero più piccole prima di trasformarle in embedding. La dimensione del chunk e la strategia dei confini determinano quanto precisamente un retriever può trovare un fatto rilevante, bilanciando recall, precisione e costo degli embedding in una knowledge base.

Sinonimi: text chunking, document segmentation, passage splitting, chunk strategy

Che cosa rende buono un chunk?
Un buon chunk è semanticamente autosufficiente, dimensionato in modo che un singolo fatto non venga diviso tra confini, e porta metadati stabili per poter essere filtrato, aggiornato e citato in modo affidabile.
In che modo il chunking influisce sulla qualità delle risposte?
Chunk troppo grandi diluiscono la rilevanza e sprecano token, mentre chunk troppo piccoli fratturano il contesto e perdono significato. Le scelte sui confini modellano direttamente recall e fondatezza delle risposte generate.

Citazione dell'evidenza

ai

La citazione dell'evidenza è la pratica di allegare riferimenti sorgente verificabili a ogni affermazione fatta da un sistema AI. Ogni passaggio citato rimanda al documento, record o asset di conoscenza da cui proviene, così una persona può confermare che la risposta sia fondata prima di fidarsi o agire.

Sinonimi: citation, source attribution, evidence linking, answer provenance

Che cosa dovrebbe includere una citazione?
Come minimo l'identificatore della fonte e il passaggio esatto usato, idealmente con un link stabile e un timestamp, così i revisori possono confermare che l'evidenza fosse attuale quando la risposta è stata prodotta.
Perché le citazioni sono essenziali per l'automazione governata?
Le citazioni rendono verificabile una risposta. Senza di esse una risposta automatizzata non è responsabile; con esse un revisore può verificare il grounding e un audit trail può provare quale evidenza ha guidato una decisione.

Classificazione dell'intento

ai

La classificazione dell'intento è il passaggio che determina che cosa una richiesta in ingresso stia davvero chiedendo, mappando testo non strutturato a una categoria definita di lavoro. Una classificazione accurata indirizza ogni WorkItem al workflow, alle fonti di evidenza e alla policy corretti, diventando la base dell'automazione affidabile.

Sinonimi: intent detection, request classification, intent recognition, routing classification

Perché la classificazione dell'intento è importante?
Decide l'intero percorso a valle. Una richiesta classificata male recupera l'evidenza sbagliata e applica la policy sbagliata, quindi l'accuratezza della classificazione governa la qualità di tutto ciò che segue.
Come si misura l'accuratezza della classificazione?
Con gate di valutazione su un insieme etichettato, tracciando precisione e recall per intento e controllando la confusione tra categorie simili prima che un workflow vada live.

Delega dell'agente

security

La delega dell'agente è la concessione controllata di un'autorità circoscritta e limitata nel tempo a un agente AI, perché agisca per conto di un utente o di un altro agente. La delega specifica esattamente quali capacità, tenant e azioni sono consentiti, così l'agente opera entro limiti espliciti, revocabili e verificabili.

Sinonimi: delegated authority, scoped delegation, agent authorization, agent grant

Che cosa definisce l'ambito di una delega?
Le capacità che l'agente può usare, il tenant in cui può agire, le azioni che può proporre o eseguire e una scadenza, così l'autorità resta stretta, limitata nel tempo e revocabile.
Come resta responsabile la delega?
Ogni azione delegata viene attribuita sia all'agente sia al principale che l'ha delegata e registrata nell'audit trail, mentre le azioni sensibili passano comunque attraverso la policy di approvazione.

Embedding

ai

Un embedding è un vettore numerico che rappresenta il significato di testo, immagini o altri dati in uno spazio ad alta dimensionalità. Elementi con significato simile producono vettori vicini tra loro, permettendo ai sistemi di confrontare, raggruppare e recuperare contenuti per somiglianza semantica invece che per corrispondenze esatte.

Sinonimi: vector embedding, text embedding, semantic vector, dense representation

Perché la versione del modello di embedding è importante?
I vettori prodotti da modelli diversi non sono confrontabili. Salvare la versione del modello con ogni embedding permette di rilevare drift e reindicizzare in sicurezza quando si aggiorna il modello di embedding.
Gli embedding sono reversibili nel testo originale?
Non esattamente, ma gli embedding possono far trapelare informazioni sensibili, quindi dovrebbero ereditare lo stesso isolamento tenant e gli stessi controlli di accesso del contenuto sorgente che rappresentano.

Grounding

ai

Il grounding è la pratica di vincolare l'output di un modello AI a evidenza sorgente verificabile invece che alla sua memoria parametrica. Una risposta fondata è supportata da passaggi recuperati che possono essere citati e controllati, ed è la difesa principale contro risposte inventate o sbagliate con sicurezza.

Sinonimi: grounded AI, evidence grounding, source grounding, factual grounding

Come si applica il grounding nella pratica?
Il recupero fornisce al modello solo passaggi sorgente rilevanti, il prompt gli ordina di rispondere da quell'evidenza e un passaggio di verifica respinge le affermazioni prive di una citazione di supporto.
Che cosa succede quando non c'è evidenza per il grounding?
Un sistema grounded ben progettato rifiuta di rispondere o scala a una persona invece di inventare una risposta, mostrando una lacuna esplicita invece di un'ipotesi sicura.

Human-in-the-Loop

governance

Human-in-the-loop è un modello di progettazione in cui le persone rivedono, approvano o correggono le proposte di un sistema AI prima che abbiano effetto. Mantiene il giudizio umano nel percorso critico per decisioni ad alto rischio o bassa confidenza, mentre l'automazione gestisce il volume di routine.

Sinonimi: HITL, human in the loop, human oversight, human review

Quando un passaggio dovrebbe essere human-in-the-loop?
Ogni volta che una decisione è ad alto rischio, irreversibile, a bassa confidenza o governata da policy. I passaggi di routine, ben fondati e a basso rischio possono procedere automaticamente con revisione umana sulle eccezioni.
In che cosa è diverso dall'automazione completa?
L'automazione completa agisce senza revisione. Human-in-the-loop inserisce un checkpoint esplicito in cui una persona può approvare, modificare o respingere la proposta, preservando la responsabilità sugli esiti sensibili.

Isolamento tenant

security

L'isolamento tenant è la garanzia che i dati e la configurazione di ciascun cliente in un sistema multi-tenant restino logicamente separati e inaccessibili agli altri tenant. Viene applicato a ogni livello, storage, recupero e controllo accessi, così un'organizzazione non può mai vedere o influenzare il lavoro di un'altra.

Sinonimi: multi-tenant isolation, tenant scoping, data partitioning, tenancy boundary

Come viene applicato l'isolamento tenant durante il recupero?
Ogni query è circoscritta al tenant richiedente, e il contenuto salvato porta un identificatore tenant, così ricerca vettoriale e per parole chiave possono restituire solo l'evidenza propria di quel tenant.
L'isolamento riguarda solo i dati?
No. Copre anche configurazione, policy, embedding e audit log, così nessun aspetto del lavoro di un tenant trapela in quello di un altro, anche su infrastruttura condivisa.

Model Context Protocol (MCP)

ai

Il Model Context Protocol è uno standard aperto che permette agli assistenti AI di collegarsi a strumenti esterni e fonti dati tramite un'interfaccia uniforme. Un server MCP espone strumenti e risorse tipizzati che un client modello può scoprire e chiamare, così le capacità possono essere aggiunte senza codice su misura per ogni integrazione.

Sinonimi: MCP, model context protocol, MCP server, tool protocol

Che cosa espone un server MCP?
Strumenti tipizzati che il modello può invocare e risorse che può leggere, ciascuno descritto con schema e annotazioni affinché un client possa scoprire le capacità e chiamarle in sicurezza.
Perché MCP conta per l'automazione governata?
Offre agli assistenti esterni un modo standard, descritto da schema, per agire su una piattaforma, così le chiamate agli strumenti possono essere validate, circoscritte a un tenant e instradate attraverso la stessa policy di approvazione di ogni altra azione.

Pacchetto di lavoro

platform

Un pacchetto di lavoro è il bundle di contesto assemblato attorno a un WorkItem perché possa essere ragionato e azionato: la richiesta originale, i campi estratti, l'evidenza recuperata, la policy applicabile e le eventuali azioni proposte. È il briefing completo e autosufficiente per un singolo pezzo di lavoro.

Sinonimi: work bundle, context packet, task packet, work context

In che cosa un pacchetto di lavoro è diverso da un WorkItem?
Un WorkItem è il record tracciato della richiesta stessa. Un pacchetto di lavoro è il contesto assemblato, cioè evidenza, policy e proposte, raccolto attorno a quel record per guidare una risposta o un'azione.
Perché raccogliere il contesto in un pacchetto?
Un pacchetto autosufficiente permette a un modello o a un revisore di prendere una decisione senza cercare tra sistemi, e conserva esattamente quale evidenza era disponibile al momento della decisione per l'audit trail.

Pack verticale

platform

Un pack verticale è una configurazione pacchettizzata che adatta la piattaforma a uno specifico dominio di lavoro: intenti, campi di estrazione, fonti di evidenza, policy e azioni. I pack permettono a un team di lanciare un workflow focalizzato, come accesso IT o vendor security, senza ricostruire il motore sottostante.

Sinonimi: pack, vertical pack, solution pack, domain pack

Che cosa configura un pack verticale?
Gli intenti che riconosce, i campi che estrae, l'evidenza su cui fonda le risposte, le policy di approvazione che applica e le azioni governate che può proporre per quel dominio di lavoro.
I pack possono essere personalizzati?
Sì. Un pack è una configurazione di partenza che i team adattano in Studio, regolando intenti, prompt, fonti di evidenza e policy, così si adatta ai loro processi reali.

Proposta di azione

platform

Una proposta di azione è un suggerimento strutturato e revisionabile per modificare un sistema aziendale collegato, creato dall'automazione ma non ancora eseguito. Indica il sistema di destinazione, l'operazione e i parametri esatti, così una persona o una policy può approvarla, modificarla o respingerla prima che accada qualcosa.

Sinonimi: proposed action, action suggestion, draft action, pending action

Perché proporre un'azione invece di eseguirla direttamente?
Proporre prima separa l'intento dall'effetto. Permette alla policy di approvazione e ai revisori di ispezionare l'operazione e i parametri precisi, evitando che un errore automatizzato raggiunga un sistema di registrazione.
Che cosa contiene una proposta di azione?
L'integrazione di destinazione, l'operazione da eseguire, i parametri risolti, l'evidenza di supporto e la decisione di policy sul fatto che serva approvazione prima dell'esecuzione.

Protocollo Agent2Agent (A2A)

ai

Il protocollo Agent2Agent è uno standard aperto che permette agli agenti autonomi di scoprirsi a vicenda, scambiarsi attività e coordinare il lavoro oltre i confini organizzativi. Definisce come un agente pubblica le proprie capacità e come un altro agente delega un'attività e ne segue il completamento.

Sinonimi: A2A, agent2agent, agent-to-agent protocol, agent interoperability

In che cosa A2A è diverso da MCP?
MCP collega un modello a strumenti e dati. A2A collega gli agenti tra loro, definendo come un agente passa un'attività a un altro e ne segue lo stato, invece di descrivere come un modello chiama un singolo strumento.
Come vengono tracciate le attività A2A?
Un'attività A2A viene mappata su un record di lavoro tracciato, così il suo ciclo di vita, l'evidenza e l'esito sono verificabili come il lavoro originato da una persona o da un modulo.

Recupero ibrido

ai

Il recupero ibrido combina ricerca vettoriale semantica e ricerca lessicale per parole chiave per recuperare passaggi rilevanti. La ricerca vettoriale coglie significato e parafrasi, la ricerca per parole chiave coglie termini e identificatori esatti, e un passaggio di fusione unisce entrambi gli insiemi di risultati così non si perdono né token precisi né corrispondenze concettuali.

Sinonimi: hybrid search, dense-sparse retrieval, vector plus keyword search, fusion retrieval

Perché combinare ricerca vettoriale e ricerca per parole chiave?
La ricerca vettoriale può mancare termini esatti rari come SKU o codici errore, mentre la ricerca per parole chiave manca le parafrasi. Fondere entrambe recupera i punti di forza di ciascuna e aumenta il recall sulle query reali.
Come vengono combinati i due insiemi di risultati?
Un metodo di fusione come reciprocal rank fusion o una miscela ponderata di punteggi riordina i candidati uniti, spesso seguito da un reranker cross-encoder per la precisione finale.

Retrieval-Augmented Generation (RAG)

ai

La retrieval-augmented generation è una tecnica che fonda l'output di un modello linguistico su documenti sorgente recuperati invece di affidarsi solo alla sua memoria parametrica. Il sistema recupera passaggi rilevanti da una knowledge base, li fornisce come contesto e chiede al modello di rispondere usando solo quell'evidenza.

Sinonimi: RAG, retrieval augmented generation, grounded generation, context augmentation

Perché usare RAG invece del fine-tuning?
RAG mantiene la conoscenza in uno store esterno che si può aggiornare immediatamente, così le risposte restano attuali e ogni affermazione può essere ricondotta a una fonte. Il fine-tuning incorpora conoscenza nei pesi, più lento da aggiornare e più difficile da attribuire.
Che cosa include una pipeline RAG?
Tipicamente ingestione e chunking, embedding, un indice per ricerca vettoriale o ibrida, un retriever e un passaggio di generazione che condiziona il modello sui passaggi recuperati e restituisce evidenza citata.

Single Sign-On (SSO)

security

Un metodo di autenticazione che permette agli utenti di accedere a più applicazioni con un solo insieme di credenziali tramite protocolli di federazione dell'identità come SAML o OpenID Connect.

Sinonimi: saml, oidc, federated login, enterprise sso

Perché SSO conta per piattaforme shell-and-pack?
Centralizza l'identità, applica policy di sicurezza enterprise come MFA e accesso condizionale, e accelera il provisioning utenti attraverso shell, pack e workspace governati.
SAML vs OIDC?
SAML è basato su XML ed è comune negli stack enterprise più datati; OIDC, costruito su OAuth2, è più leggero e moderno. Supportare entrambi massimizza la compatibilità con gli IdP dei clienti.

Violazione SLA

operations

Una violazione SLA si verifica quando il lavoro manca un impegno definito in un service-level agreement, come una scadenza di risposta o risoluzione. Rilevare ed elevare automaticamente le violazioni mantiene visibile la responsabilità e assicura che il lavoro a rischio raggiunga le persone giuste prima che gli impegni vengano mancati.

Sinonimi: service level breach, SLA violation, missed SLA, deadline breach

Come vengono rilevate automaticamente le violazioni SLA?
Ogni WorkItem porta i propri timer di impegno, e il sistema confronta il tempo trascorso con le soglie, generando escalation mentre una scadenza si avvicina e registrando la violazione se viene mancata.
Che cosa succede quando una violazione è imminente?
La policy può elevare il WorkItem, notificare i responsabili o riprioritizzare la coda, così l'attenzione si sposta sul lavoro a rischio prima che l'impegno venga effettivamente mancato.

Workflow di approvazione

governance

Un workflow di approvazione è una sequenza governata di checkpoint che una proposta di azione deve superare prima dell'esecuzione. Ogni passaggio indirizza la decisione al revisore giusto in base a rischio, ruolo o policy, registrando chi ha approvato cosa perché l'esito sia pienamente responsabile.

Sinonimi: approval flow, review workflow, authorization workflow, sign-off process

Che cosa può attivare un requisito di approvazione?
I requisiti possono essere applicati per workflow, canale, classe di rischio, soglia economica o tipo di azione, così solo i passaggi che richiedono davvero supervisione si fermano per un revisore.
Come resta verificabile un workflow di approvazione?
Ogni richiesta, approvazione, modifica e rifiuto viene registrato con attore e timestamp, producendo una traccia end-to-end che dimostra chi ha autorizzato ogni azione governata.

WorkItem

platform

Un WorkItem è l'unità di lavoro in Threada: una singola richiesta in ingresso, da email, chat, documento o modulo, normalizzata in un record strutturato e tracciabile. Ogni WorkItem porta il proprio intento, i campi estratti, l'evidenza e una cronologia completa di ogni decisione e azione eseguita su di esso.

Sinonimi: work item, task record, tracked request, unit of work

In che cosa un WorkItem è diverso da un ticket di supporto?
Un ticket di solito traccia una conversazione. Un WorkItem traccia il lavoro stesso: intento classificato, campi estratti, evidenza che fonda ogni risposta e azioni governate intraprese, tutto verificabile end-to-end.
Attraverso quale ciclo di vita passa un WorkItem?
L'intake normalizza la richiesta, la classificazione dell'intento la instrada, il recupero dell'evidenza fonda una risposta proposta e ogni azione passa attraverso la policy di approvazione prima che il WorkItem venga risolto e registrato.