# LLM-as-a-Judge: Qualitätskontrolle für KI-Agenten zwischen Skalierung, Risiko und Kosten Der Begriff **LLM-as-a-Judge** beschreibt ein Muster, bei dem ein großes Sprachmodell nicht nur Inhalte erzeugt, sondern zusätzlich die Ergebnisse eines anderen Modells bewertet. Vereinfacht gesagt: Ein Modell produziert, ein zweites Modell prüft. Diese Prüfinstanz bewertet zum Beispiel Korrektheit, Vollständigkeit, Stil, Regelkonformität oder die Einhaltung eines gewünschten Ausgabeformats.