{
  "report_file": "agent_20260508_2013.md",
  "marked_at": "2026-05-08T20:18:28.425556+00:00",
  "coherent": false,
  "flags": [
    {
      "lens": 4,
      "severity": "high",
      "claim": "\"Il high-core aligned non batte il same-length misaligned in ... hit entro 2 siti (... `195/563` vs `189/551` seedcheck)\"",
      "evidence": "Nel seedcheck high-core, `supertile_shuffle` ha hit rate `195/563 = 0.3464`, mentre `same_length_contiguous_shuffle` ha `189/551 = 0.3430`: aligned batte misaligned, anche se di poco. Non e' lecito formularlo come 'non batte' senza soglia di equivalenza dichiarata.",
      "suggestion": "Riformulare: 'nel seedcheck aligned supera misaligned sugli hit entro 2 di 0.0034, scarto sotto soglia operativa; la non-separazione richiede una soglia/effect size predefinita o bootstrap/permutation test'."
    },
    {
      "lens": 2,
      "severity": "medium",
      "claim": "\"Order 8 favorisce misaligned negli hit (`60/139` vs `44/132`), order 9 e' quasi pari, order 10 ha stessa distanza mediana `21.0`, order 11 resta quasi pari (`35.0` vs `34.0`)\"",
      "evidence": "Il confronto degli hit per ordine usa denominatori diversi: order 8 `44/132` vs `60/139`, order 9 `65/138` vs `67/142`, order 10 `51/148` vs `51/135`, order 11 `15/148` vs `18/140`. Le percentuali possono cambiare solo per variazione del denominatore; il report non dichiara count assoluti attesi, intervalli, o test su differenze di proporzioni.",
      "suggestion": "Nel prossimo ciclo riportare differenza assoluta di hit, differenza di proporzione con CI/permutation test, e una soglia ex ante per 'quasi pari' o 'favorisce'."
    },
    {
      "lens": 3,
      "severity": "low",
      "claim": "\"CONSTRAINT on TRASCENDENZA_LIMITE / QPG_GAP_RATIO_DENOMINATOR_GATE\" insieme a \"`gap_ratio` non e' testato\"",
      "evidence": "Il Claim Under Test riguarda boundary/Ostrowski/Zeckendorf, mentre il verdict nomina `QPG_GAP_RATIO_DENOMINATOR_GATE`; subito dopo dichiara che `gap_ratio` non e' testato. Non e' una falsificazione dei risultati, ma introduce drift nominale nel nodo del claim.",
      "suggestion": "Separare il constraint: 'CONSTRAINT on TRASCENDENZA_LIMITE / OSTROWSKI_BOUNDARY_GATE'; lasciare `QPG_GAP_RATIO_DENOMINATOR_GATE` fuori dal verdict o marcarlo come parent non testato."
    }
  ],
  "summary": "Il report e' parzialmente coerente, ma L4 si rompe: il verdict dice che aligned non batte misaligned sugli hit seedcheck mentre i dati mostrano un controesempio piccolo ma non nullo."
}