{
  "report_file": "agent_20260508_1834.md",
  "marked_at": "2026-05-08T18:38:14.263495+00:00",
  "coherent": false,
  "flags": [
    {
      "lens": 3,
      "severity": "medium",
      "claim": "Claim Under Test: \"Cosa manca per confermare completamente gap_ratio...\"; Verdict: \"CONSTRAINT on TRASCENDENZA_LIMITE / QPG_GAP_RATIO_DENOMINATOR_GATE\"",
      "evidence": "Il report dichiara esplicitamente che `gap_ratio` non e' testato in questo ciclo; i dati misurano retention/Jaccard/all-high dei label sotto shuffle, non gap_ratio. Il verdict resta agganciato a `QPG_GAP_RATIO_DENOMINATOR_GATE`, quindi il nodo testato cambia da gap_ratio a label-set grammar gate senza declassare formalmente il claim originario.",
      "suggestion": "Riformulare: \"gap_ratio non valutato; questo ciclo testa solo il label-set gate. QPG_GAP_RATIO_DENOMINATOR_GATE resta aperto finche' gap_ratio viene misurato nello stesso perimetro\"."
    },
    {
      "lens": 1,
      "severity": "medium",
      "claim": "\"il core alto [3, -4, 4, 6] non e' portato da lunghezza e conteggio del blocco\"",
      "evidence": "Per `internal_block_shuffle`, che conserva lunghezza e conteggio, `high retention` e' 0.25 per ogni block_size: non porta il core alto completo (`all-high 0/320`), ma porta almeno una frazione dei label alti. La proibizione esatta vale solo per il core alto completo, non per i label alti in generale.",
      "suggestion": "Separare hard constraint e residuo: \"lunghezza/conteggio non portano il core alto completo: all-high=0/320; resta una retention alta residua 0.25 da spiegare\"."
    },
    {
      "lens": 4,
      "severity": "low",
      "claim": "\"distruggere l'ordine interno del blocco collassa il core al livello random\"",
      "evidence": "Il collasso e' vero per Jaccard mediano, low/high retention e all-high, ma la tabella mostra `stable labels 75% = [34]` per tutti gli internal_block_shuffle e global_balanced_shuffle. Questo label non appartiene al reference core `[-1,1,-2,2,3,-4,4,6]` e segnala un artefatto o edge label stabile non discusso.",
      "suggestion": "Nel prossimo ciclo isolare il label `34`: verificare se e' boundary artifact di `|n|<=34`, leakage del reader, o label valido fuori core; non includerlo implicitamente nel profilo random senza nota."
    }
  ],
  "summary": "Il report e' parzialmente coerente: L3 si rompe per drift tra gap_ratio dichiarato e label-set testato, e L1 richiede di limitare lo zero al core alto completo, non ai label alti residui."
}