2026-06-08
Die Branche schwört auf evals – und weicht dabei der eigentlichen Frage aus
2026 ist „Evaluierungssysteme für AI bauen" zum Pflichtprogramm geworden – Goldstandard-Datensätze, Scorer, LLM-als-Richter, CI-Gates, das volle Programm. Wer die Ingenieursschale abzieht, erkennt: evals sind im Kern die Frage, wer gut definiert und wer dafür geradestehen muss – und genau das lässt sich nicht outsourcen.