Coding Plan – KI-Agenten übernehmen die Ausführung

Im Mai 2026 passiert etwas, das wir alle kommen sahen, aber niemand aussprechen wollte: Coding Agents schreiben nicht nur Code. Sie planen, recherchieren, testen, iterieren und liefern ab. Kostenlos. Werbefinanziert. Rund um die Uhr. Und die Frage ist nicht mehr, welches Tool besser ist. Die Frage ist, ob der klassische Entwickler-Job, wie wir ihn kennen, gerade vor unseren Augen verdampft.

Drei Launches in einer einzigen Woche machen das überdeutlich: Grok Build von xAI, Hermes Agent 0.14 und Free Buff – ein werbefinanzierter Coding Agent, der keinen Cent kostet. [1] [2] [3] Jedes dieser Tools kann eigenständig einen Coding Plan erstellen, ihn in Teilaufgaben zerlegen und ausführen. Nicht als Demo. In echten Repositories.

Wer jetzt noch glaubt, es gehe um Tool-Vergleiche und Feature-Listen, hat die Pointe verpasst.

Der Coding Plan gehört nicht mehr dem Entwickler

Das zentrale Feature, das alle drei Tools teilen, ist ein Modus, der alles verändert: Plan Mode. Grok Build nennt es explizit so – der Agent inspiziert das Repository, erstellt einen strukturierten Plan, der kommentiert und angepasst werden kann, bevor die Ausführung beginnt. [1] Hermes Agent geht mit dem /goal-Befehl noch weiter: Ein persistentes Ziel über mehrere Sessions hinweg, mit einem dedizierten Judge-Modell, das entscheidet, wann das Ziel erreicht ist. [4]

Free Buff empfiehlt sogar einen expliziten Workflow: /interview, /plan, /implement, /review. [3] Vier Schritte, vier spezialisierte Sub-Agenten. Der Mensch gibt das Briefing, der Agent macht den Rest.

Das ist kein Auto-Complete. Das ist eine vollständige Inversion der Arbeitsteilung.

Jahrzehntelang war der Coding Plan das Erste, was ein Entwickler machte: Architektur skizzieren, Aufgaben aufteilen, Reihenfolge festlegen. Diese kognitive Arbeit war der Kern unserer Wertschöpfung. Jetzt macht sie ein Agent – und zwar nicht schlechter, sondern systematischer, konsistenter und ohne die kreativen Ausreden, die wir „technische Schulden" nennen.

Die Kostenbarriere ist gefallen

Was diese Welle anders macht als jede vorherige: Die Kosten tendieren gegen null.

Free Buff finanziert sich über Textanzeigen in der CLI. Keine API-Keys, keine Konfiguration, npm install -g freebuff und los. [3] Das Tool nutzt neun spezialisierte Sub-Agenten – darunter DeepSeek V4 Pro, Gemini 3.1 Flashlight und optional GPT 5.4 – und routet Aufgaben an das jeweils passende Modell. Die Qualität ist nicht perfekt. Aber sie ist gut genug für 80 Prozent der Aufgaben, die Junior-Entwickler heute erledigen.

Hermes Agent lässt sich komplett kostenlos betreiben: lokale Modelle via Ollama, kostenlose Cloud-Tiers von Groq und OpenRouter, oder Google AI Studio. [5] Die Foundation-Release 0.14 hat den Kaltstart beschleunigt und die Installation auf ein PyPI-Paket reduziert. [2]

Selbst Grok Build, das als Super-Grok-Heavy-Exklusivprodukt für 300 Dollar im Monat startete, lässt sich über die offene config.toml mit beliebigen OpenAI-kompatiblen Modellen betreiben – also praktisch kostenlos. [1]

Die Implikation ist brutal: Wenn die Fähigkeit, einen Coding Plan zu erstellen und auszuführen, ein frei verfügbares Gut wird, dann ist der Wert des Menschen, der genau das tut, nicht mehr an seine Fähigkeit gebunden – sondern an seine Unersetzbarkeit. Und die schrumpft mit jedem Release.

Agentic Engineering: Die neue Jobbeschreibung

Mickey, ein Senior Developer, der 95 Prozent seines Codes von KI schreiben lässt, bringt es auf den Punkt: „Agentic Engineering" ist das Paradigma, nicht „Vibe Coding". Der Mensch denkt vor und steuert, die Agenten führen als Junior-Developer aus. [6]

Das klingt nach einer Beförderung. Ist es aber nicht.

Denn die Fähigkeiten, die „Agentic Engineering" erfordert, sind fundamental andere als die, die wir gelernt haben. Es geht nicht mehr darum, ein Problem in Code zu übersetzen. Es geht darum:

  • Kontext-Engineering: Die Qualität der KI-Ausgabe hängt direkt davon ab, wie präzise und minimal der gegebene Kontext ist. Ein überladenes Context Window macht den Agenten dümmer. [6]
  • Briefing-Kompetenz: Wer nicht klar formulieren kann, was er will, bekommt exakt das: unklar formulierten Code.
  • Validierung: Den Output eines Agenten zu überprüfen, erfordert tieferes Verständnis als ihn selbst zu schreiben – denn man muss Fehler in fremder Logik finden.
  • Orchestrierung: Wer wie Alex Finn mehrere Agenten parallel betreibt – Hermes als CEO, Codex CLI als CTO – braucht Systemdenken, kein Syntax-Wissen. [7]

Die unbequeme Wahrheit: Unsere Informatik-Ausbildung bereitet auf keine dieser Fähigkeiten vor. Wir bilden Codierer aus, keine Kuratoren.

Autonome Coding Agents am Arbeitsplatz der Zukunft

Die Parallele, die niemand sehen will

Was gerade mit Software-Entwicklern passiert, ist exakt das, was mit Grafikdesignern, Textern und Übersetzern bereits passiert ist. Die Technologie hat nicht den Beruf abgeschafft – sie hat den Beruf umdefiniert. Und bei der Umdefinition hat sie die Mehrheit aussortiert.

Ein Grafikdesigner, der Canva bedient, ist kein Grafikdesigner. Er ist ein Canva-Bediener. Ein Entwickler, der Cursor bedient, ist kein Entwickler. Er ist ein Cursor-Bediener. Der Unterschied zwischen beiden: Der eine versteht die Prinzipien hinter dem Output. Der andere drückt Knöpfe.

Die Industrie-Prognose, dass 90 Prozent des Codes bis Ende 2026 KI-generiert sein wird, klingt dramatisch. [8] Aber sie verfehlt den Punkt. Nicht die Menge des generierten Codes ist das Problem. Das Problem ist, dass die verbleibenden 10 Prozent – Architektur, Systemdesign, Edge Cases – Fähigkeiten erfordern, die nur durch jahrelange Erfahrung im manuellen Coding entstehen. Eine Erfahrung, die die nächste Generation nicht mehr sammeln wird.

Das ist das eigentliche Paradox: Wir brauchen Senior-Entwickler, die validieren können, was Agenten produzieren. Aber wir produzieren keine neuen Senior-Entwickler mehr, weil der Weg dahin – jahrelanges Junior-Coding – gerade automatisiert wird.

Der Wert verschiebt sich: Vom Code zur Entscheidung

Databricks nutzt GPT-5.5 für Enterprise-Agent-Workflows. Sea Limited hat Codex in alle Abteilungen integriert – nicht nur Engineering, sondern Finance, Sales, Data Science. [9] OpenAI gründet mit DeployCo eine eigene Beratungstochter, die Unternehmen beim Deployment von KI-Agenten unterstützt. [9]

Die Botschaft ist klar: Code ist kein Differenzierungsmerkmal mehr. Jede Abteilung kann jetzt „coden" – oder zumindest coden lassen. Was differenziert, ist die Fähigkeit zu entscheiden: Welches Problem lohnt sich? Welcher Ansatz minimiert Risiko? Wann ist der Agent-Output gut genug – und wann ist er gefährlich?

Ein Developer, der Linear als „zweites Gehirn" nutzt und Claude Code autonom Tasks abarbeiten lässt, ist 10x produktiver als einer, der jede Zeile selbst schreibt. [10] Aber er ist auch 10x abhängiger von einem System, das er nicht vollständig versteht. Und genau hier liegt die Bruchstelle.

Die Debatte, die wir führen müssen

Die Tech-Szene diskutiert, ob Grok Build besser ist als Claude Code, ob Hermes Agent Codex CLI schlägt, ob Free Buff für ernsthafte Projekte taugt. Das ist die falsche Debatte.

Die richtige Debatte:

Wie definieren wir den Wert menschlicher Arbeit in einer Welt, in der der Agent den Coding Plan ausführt, nicht wir?

Die Antwort ist nicht „wir werden alle Prompt-Engineers". Prompt Engineering ist bereits ein Commodity – jedes dieser Tools hat es in seine Workflows eingebaut. Die Antwort ist auch nicht „wir werden alle Architekten" – denn dafür brauchen wir eine Ausbildung, die es noch nicht gibt.

Die ehrliche Antwort: Wir wissen es noch nicht. Und das ist in Ordnung. Was nicht in Ordnung ist, ist so zu tun, als würde sich nichts ändern. Als wären diese Tools nur bessere IDEs. Als wäre ein Coding Plan, den ein Agent erstellt und ausführt, qualitativ anders als einer, den ein Mensch erstellt und ausführt.

Er ist es nicht. Und je schneller wir das akzeptieren, desto schneller können wir die eigentlich wichtige Frage stellen: Nicht was kann die Maschine – sondern was bleibt für uns?

Elon Musk schreibt auf X, dass sich Grok Build „fast täglich verbessert". [11] Hermes Agent hat in drei Major-Releases eine Halluzinationsbarriere, persistente Ziele und ein Multi-Agenten-Kanban-System eingebaut. [4] Free Buff gibt es seit Wochen – kostenlos, werbefinanziert, mit neun Sub-Agenten.

Die KI-Dämmerung ist kein Sonnenuntergang für Entwickler. Aber es ist definitiv das Ende der Nacht, in der wir uns einreden konnten, dass Code schreiben allein einen Job rechtfertigt.

Der Coding Plan gehört jetzt dem Agenten. Die Frage ist, was wir mit der freien Zeit anfangen. Und ob die Antwort mehr wert ist als das, was wir gerade abgeben.

Referenzen

  1. Grok Build: XAI's neuer Terminal-Coding-Agent mit Plan Mode und offener Modell-Konfiguration, Mai 2026
    https://www.youtube.com/watch?v=XLH_WLrmwfk
  2. Hermes Agent 0.14 Foundation Release: Stabilität, PyPI-Paket und OpenAI-kompatibler Proxy, Mai 2026
    https://www.youtube.com/watch?v=He2sVUuDeOU
  3. Free Buff: Kostenloser, werbefinanzierter KI-Coding-Agent mit neun Sub-Agenten, Mai 2026
    https://www.youtube.com/watch?v=A7p20mU3uDc
  4. Hermes Agent /goal-Feature und autonome Codex-Sub-Agenten, Mai 2026
    https://www.youtube.com/watch?v=9oOZ3PB6n4Y
  5. Hermes Agent mit kostenlosen lokalen Modellen auf DGX Spark, Mai 2026
    https://www.youtube.com/watch?v=7JRHSo2F-Wk
  6. Agentic Engineering: Stop Vibe Coding, Start Agentic Engineering – Kontext-Engineering und neue Entwicklerrolle, Mai 2026
    https://www.youtube.com/watch?v=PzVV4X37ihg
  7. Hermes Agent und OpenClaw: Parallelbetrieb mit Shared Memory für Agenten-Orchestrierung, Mai 2026
    https://www.youtube.com/watch?v=Gz_uZcnCDLs
  8. The Impact of AI Coding in 2026: 90% AI-Generated Code – Developer Productivity Revolution, 2026
    https://trigidigital.com/blog/ai-coding-impact-2026/
  9. OpenAI Updates: Codex Enterprise-Workflows, DeployCo und GPT-5.5 Agent-Einsatz, Mai 2026
    https://openai.com/news/rss.xml
  10. Linear als zweites Gehirn für autonomes Coding mit Claude Code und Codex, Mai 2026
    https://www.youtube.com/watch?v=VQPWyS2KGt0
  11. Elon Musk über Grok Build Beta: Tägliche Verbesserungen und Feedback-Aufruf, X/Twitter, Mai 2026
    https://x.com/elonmusk