In der Praxis scheitern Agenten-Systeme selten an „fehlender Intelligenz“, sondern an unzuverlässigen Abläufen: unklare Ziele, falsche Prioritäten, fehlende Checks, und am Ende niemand weiß, was eigentlich passiert ist. Ein robustes, exam-taugliches Standardpattern ist daher: triage → execute → validate → summarize. Du kannst es als minimalen „Produktions-Workflow“ verstehen, der aus einer unscharfen Aufgabe eine überprüfbare, dokumentierte Lieferung macht.
Triage heißt: Was ist wirklich gefragt, wie riskant ist es, und was brauche ich dafür? Typische Schritte:
Exam-Perspektive: Triage zeigt, dass du Governance und Fehlerrisiken aktiv managst (statt blind auszuführen).
Execute ist die eigentliche Arbeit – aber mit einem Fokus auf Reproduzierbarkeit:
Wichtig: Execute ohne Triage führt zu „busy work“; Execute ohne Validate führt zu Halluzinations- oder Integrationsfehlern.
Validate ist der Schritt, der aus „klingt gut“ ein prüfbares Ergebnis macht:
In Agentic-Architekturen ist Validate oft ein eigener „Evaluator“-Pass (auch mit separatem Prompt/Modell), um Selbstbestätigung zu reduzieren.
Summarize ist nicht „netter Abschluss“, sondern Operations-Interface:
Damit werden Handoffs an Menschen oder andere Agenten möglich – und du bekommst Auditability.
1. Triage reduziert Ambiguität und entscheidet über Risiko, Scope und Human-in-the-loop.
2. Validate liefert Beweise (Checks/Tests/API-Responses) statt „klingt plausibel“.
3. Summarize macht das Ergebnis operierbar: Status, Artefakte, Entscheidungen, nächste Schritte.
Du baust einen Agenten, der automatisch Änderungen in einem Repo umsetzt. In den Logs sieht man oft „Change applied“, aber später stellt sich heraus, dass der Patch nicht committed wurde oder Tests fehlschlagen. In welchem Workflow-Schritt liegt die primäre Lücke – und wie würdest du sie konkret schließen?
Die Lücke liegt in Validate (und teilweise in Summarize). Schließe sie durch deterministische Checks: `git status`/`git diff`, Commit-Existenz verifizieren, CI/Testlauf lokal oder via Pipeline triggern und das Ergebnis als Beweis in der Zusammenfassung ausgeben. Summarize sollte den finalen Status (committed? tests green?) explizit reporten, nicht nur „applied“.