TAG

# evals

← Tutti i tag · 1 articolo

2026-06-08

Il settore AI ha abbracciato gli evals collettivamente — evitando però la vera domanda

Nel 2026, costruire un 'sistema di valutazione' per l'AI è diventata la nuova ortodossia: dataset gold-standard, scorer automatici, LLM-as-judge, gate CI. Viene venduto come disciplina ingegneristica per rendere l'AI affidabile. Ma tolta la verniciatura tecnica, un eval è solo una risposta a due domande — chi definisce cosa è buono, e chi se ne assume la responsabilità — e queste non si esternalizzano.