Team di Agenti AI per Threat Intelligence: report velocissimi, ma rischio “allucinazioni” e zero grounding
Featured

Team di Agenti AI per Threat Intelligence: report velocissimi, ma rischio “allucinazioni” e zero grounding

Le Structured Analytical Techniques (SAT) sono metodi usati nella intelligence analysis e nella cyber threat intelligence per ridurre bias e scorciatoie cognitive. Sono particolarmente utili quando si lavora su attribution analysis, scenari geopolitici, forecasting e valutazioni operative, ma richiedono tempo, competenze e lavoro di gruppo.

Per questo molte aziende faticano ad applicarle con continuità. Da qui nasce l’idea di costruire un team di agenti di intelligenza artificiale in grado di seguire l’intero ciclo di intelligence e produrre un report in modo rapido.

L’architettura proposta è una pipeline con ruoli separati.

  • Agente iniziale: raccoglie il requisito informativo attraverso una conversazione con lo stakeholder, chiarendo scopo, decisioni da supportare e domande principali e secondarie.
  • Collection planner: assegna compiti di raccolta a fonti diverse, con punteggi di affidabilità, cercando di evitare dipendenza da una sola fonte e di ridurre il confirmation bias.
  • Collector: recupera informazioni in forma verbatim senza interpretarle.
  • Coordinatore: seleziona le tecniche analitiche più adatte e attiva agenti analisti specializzati.
  • Reporter: trasforma l’output in un documento leggibile con approccio BLUF, cioè bottom line up front.

La parte più ambiziosa è il loop analitico strutturato, con generazione di scenari, refutazione, identificazione di gap di raccolta, analisi di ipotesi concorrenti (ACH), pesatura delle evidenze e verifica delle assunzioni chiave. In teoria questo dovrebbe portare a scenari alternativi solidi e a una valutazione finale con livello di confidenza motivato.

Nei test, però, emergono criticità tipiche dell’AI nella intelligence analysis. Le sotto-domande risultano ridondanti e soprattutto formulate in modo anticipatorio, quindi poco adatte alla fase di raccolta che dovrebbe cercare fatti osservabili. Anche i task di collection possono essere troppo ampi o mal definiti. Il problema più grave è la mancanza di grounding: il modello tende a riempire i vuoti con conoscenza appresa in addestramento, producendo report coerenti nella forma ma non supportati dai materiali raccolti. In ambito cyber security questo rischio aumenta perché molte narrazioni online sono dominate da hype e paura, e un sistema multi-agente può amplificare queste inferenze invece di fermarsi e dichiarare insufficienza di dati.