
Inhaltsverzeichnis
In meiner fortlaufenden Serie über KI-Agenten und deren Einfluss auf den Entwicklungsprozess präsentiere ich heute den vierten Teil: Vibe Coding mit einem asynchronen Assistenten wie OpenAI Codex. Während das Konzept des Vibe Codings, das ich bereits in früheren Artikeln ausführlicher beleuchtet habe, darauf abzielt, den Entwicklungsfluss zu optimieren, möchte ich heute zeigen, wie OpenAI Codex als asynchroner Partner diesen Flow auf eine neue Ebene hebt.
Ich hatte kürzlich die Gelegenheit, OpenAI Codex intensiv bei der Entwicklung einer Browser-Extension einzusetzen, und die Ergebnisse waren beeindruckend. Es geht nicht nur um Code-Vervollständigung, sondern um eine tiefere Integration, die den gesamten Entwicklungsprozess verändert.
Was ist Vibe Coding? (Kurzfassung)
Wie ich bereits in früheren Blog-Posts detailliert beschrieben habe, ist Vibe Coding ein Programmieransatz, bei dem der Entwickler in einem kontinuierlichen, intuitiven Fluss arbeitet, unterstützt durch intelligente Tools, die den Kontext verstehen und proaktiv Hilfestellung leisten, ohne den Denkprozess zu unterbrechen. Es ist das Gegenteil von "Stop-and-Go"-Entwicklung, bei der man ständig zwischen Dokumentation, Suchmaschinen und der IDE wechseln muss.
Im Kern geht es darum, die Reibung im Entwicklungsprozess zu minimieren. Ein entscheidender Faktor hierbei ist die Art und Weise, wie KI-Assistenten integriert sind. Für eine tiefere Einführung in das Konzept empfehle ich meine vorherigen Artikel zu diesem Thema.
OpenAI Codex: Der asynchrone Assistent im Detail
Im Gegensatz zu vielen "Copilot"-ähnlichen Tools, die oft direkt im Editor Vorschläge machen und manchmal den Tippfluss unterbrechen können, verfolgt OpenAI Codex einen asynchronen Ansatz. Was bedeutet das genau?
Zu Beginn präsentiert Codex dann dem Nutzer einige Beispiele zum Losstarten.
Ist das erste Projekt angelegt dann legt Codex direkt mal mit einem Code-Review der ganzen Codebase los und gibt Vorschläge zur Verbesserung aus.
Funktionsweise des asynchronen Assistenten
OpenAI Codex arbeitet im Hintergrund. Es analysiert den Code, den du schreibst, den Kontext deines Projekts und deine Absichten, ohne dabei direkt in Echtzeit Vorschläge in deinen Code einzufügen, die du explizit annehmen oder ablehnen musst. Stattdessen werden die Vorschläge und Erkenntnisse in einem separaten Bereich der IDE präsentiert, oft als Chat-Interface oder als dedizierte Tool-Fenster.
Dieser asynchrone Modus hat mehrere entscheidende Vorteile:
- Nicht-blockierend: Dein Tippfluss wird nicht unterbrochen. Du kannst deine Gedanken zu Ende formulieren und dann bei Bedarf auf die Vorschläge von Codex zurückgreifen.
- Proaktives Lernen: Codex kann den Code über längere Zeiträume analysieren und tiefere Muster erkennen, anstatt nur auf die unmittelbar eingegebene Zeile zu reagieren.
- Kontextuelles Verständnis: Durch die kontinuierliche Analyse des gesamten Projekts kann Codex relevantere und komplexere Vorschläge machen, die über einfache Snippets hinausgehen.
- "Sparringspartner"-Rolle: Es fühlt sich weniger wie ein Diktat und mehr wie eine kollaborative Zusammenarbeit an. Du stellst Fragen, Codex liefert Ideen, und du entscheidest, was du übernimmst.
Meine Erfahrungen mit OpenAI Codex im Vergleich zu anderen Agenten
Im Vergleich zu anderen Agenten, die ich getestet habe, wie beispielsweise Google Jules, zeigte sich OpenAI Codex als besonders leistungsfähig. Während Google Jules schnell für kleinere Tasks geeignet war, konnte Codex auch größere, komplexere Aufgaben zuverlässig bearbeiten. Das ist ein entscheidender Vorteil, wenn es darum geht, nicht nur einzelne Funktionen, sondern ganze Projektteile zu entwickeln oder zu refaktorieren.
Ein weiteres Highlight ist die nahtlose Integration in den GitHub-Workflow. Codex ist in der Lage, bestehende Branches und sogar Pull Requests zu aktualisieren. Dabei erstellt der Agent Commits mit mir als Autor, was die Nachvollziehbarkeit und Ownership des Codes gewährleistet.
Lediglich ein spezielles Label auf GitHub weist darauf hin, dass Codex bei der Erstellung oder Aktualisierung des Codes beteiligt war.
Aktuell ist die Nutzung von Codex ausschließlich in Verbindung mit einem GitHub Repository möglich.
Transparenz und Verifizierung im Workflow
Was mir persönlich sehr gut gefallen hat und Vertrauen schafft, ist das Protokoll, das Codex während seiner Arbeit erstellt. Wenn der Agent loslegt, kann man in diesem Protokoll seine "Gedanken" nachvollziehen. Es liest sich wie ein menschliches Selbstgespräch, in dem Codex seine Schritte, Überlegungen und Entscheidungen dokumentiert. Das macht den Prozess transparent und verständlich.
Hier mal ein Beispile für so ein Protokoll:
Darüber hinaus ist Codex in der Lage, iterativ und automatisch Tests auszuführen, um seine Arbeit zu verifizieren, sofern man dies im Basisprompt vorgibt. Diese Fähigkeit zur Selbstverifizierung ist ein enormer Produktivitätsgewinn und erhöht die Qualität des generierten Codes.
Die Sandbox-Umgebung von Codex
Codex arbeitet in einer isolierten Sandbox-Umgebung, die man über ein Shell-Script provisionieren kann. Das ermöglicht die Installation spezifischer Tools und Abhängigkeiten. Das Besondere ist jedoch, dass in dieser Sandbox bereits eine Vielzahl von Laufzeitumgebungen und Tools für gängige Programmiersprachen wie Python, NodeJS oder Golang vorinstalliert sind. Das bedeutet, dass man nicht immer einen eigenen Toolstack installieren muss, was den Start erheblich beschleunigt. Die Sandbox basiert auf Ubuntu und erlaubt das Nachinstallieren weiterer Pakete über apt.
Auf der Roadmap von OpenAI Codex scheint es zudem zu stehen, dass bald spezialisierte Images verfügbar sein sollen, die dann für bestimmte Programmiersprachen eine noch spezifischere und optimierte Umgebung bereitstellen. Auch Interpreter-Versionen, beispielsweise für Python, lassen sich teilweise direkt in den Einstellungen konfigurieren, was eine hohe Flexibilität bietet.
Es können auch mehrere Projekte verwaletet werden. Dazu legt man einfach für jedes Projekt eine Sandbox an, die dann in der Liste erscheint.
Verfügbarkeit von OpenAI Codex
OpenAI Codex ist ein leistungsstarkes Modell, das über die OpenAI API zugänglich ist. Für Nutzer, die bereits ein ChatGPT Plus Konto besitzen, ist der Zugriff auf Codex in der Regel integriert oder über spezifische Features verfügbar. Weitere Informationen zu OpenAI Codex und seinen Einsatzmöglichkeiten findest du direkt auf der offizieller Webseite: https://openai.com/codex/
Der Entwicklungsprozess mit Codex
Mein Workflow mit Codex unterschied sich deutlich von dem, den ich mit synchronen KI-Assistenten erlebt habe:
- Ideenfindung und initiale Struktur: Ich begann damit, Codex meine grobe Idee für die Extension zu beschreiben. Codex half mir dabei, die notwendigen Manifest-Berechtigungen zu identifizieren und eine grundlegende Dateistruktur vorzuschlagen. Es war wie ein Brainstorming mit einem sehr gut informierten Kollegen.
- Codex als Sparringspartner: Bei der Implementierung der Kernfunktionalität – dem Senden von HTTP-Anfragen, dem Speichern von Konfigurationen im Browser-Storage und dem Reagieren auf Browser-Events – war Codex von unschätzbarem Wert. Anstatt nach der genauen Syntax für chrome.storage.sync oder chrome.tabs.onUpdated zu suchen, konnte ich Codex einfach fragen: "Wie speichere ich Daten persistent in der Extension?" oder "Wie reagiere ich auf das Laden einer neuen Seite?". Codex lieferte präzise Code-Beispiele und Erklärungen, die ich direkt anpassen konnte.
- Iteratives Vorgehen und Feedbackschleifen: Ich habe Codex nicht einfach blind vertraut. Stattdessen habe ich die Vorschläge kritisch geprüft, in meinen Code integriert und bei Bedarf weitere Fragen gestellt oder um Alternativen gebeten. Diese iterative Schleife aus "Schreiben, Fragen, Anpassen" hat den Entwicklungsprozess extrem beschleunigt.
- Fehlerbehebung und Optimierung: Auch bei kleineren Fehlern oder Optimierungen war Codex hilfreich. Wenn ein API-Aufruf nicht funktionierte, konnte ich den Fehlercode oder die Symptome beschreiben, und Codex half bei der Diagnose und bot Lösungsansätze an.
Praxisbeispiel 1: Eine Browser-Extension mit Codex entwickeln
Um das Konzept des Vibe Codings mit OpenAI Codex zu testen, habe ich eine Firefox/Chrome Extension namens web-ext-webhook-trigger entwickelt. Die Idee war, eine einfache Erweiterung zu erstellen, die Webhooks aus dem Browser heraus triggern kann – nützlich für Automatisierungen oder schnelle Benachrichtigungen.
Das Projekt ist auf GitHub verfügbar: https://github.com/muench-dev/web-ext-webhook-trigger
Und das Beste: Die Extension hat es sogar in den Chrome Web Store geschafft! Du findest sie hier: https://chromewebstore.google.com/detail/webhook-trigger/finanbjnojdckpeklepocgcngcikdlfe
Praxisbeispiel 2: n98-magerun2 GitHub Issues abarbeiten lassen
Ich habe Codex einfach als Kollegen genutzt und ganz naiv einfach Aufgaben deligiert. Vorzugsweise haben ich Codex dann sehr lange herumliegende Github Issues gegeben.
Dazu reicht es aus dem Agenten einfach zu schreiben, dass er das "Ticket 4711" bearbeiten soll. Codex holt sich dann über die api.github.com einfach alle Informationen und legt los.
Das hat insgesamt sehr gut funktioniert. Ihr könnt euch selbst einen Eindruck machen indem ihr den folgende Url öffnet: https://github.com/netz98/n98-magerun2/pulls?q=is%3Apr%20label%3Acodex%20is%3Aclosed
Zu sehen gibt es dann alle von Codex bearbeitete Tickets die ich bereits geschlossen habe.
Die Issues sind ein guter Mix aus kleinen Tasks, Bugfixes und auch Features. Manche haben auch mehrer Iterationen gehabt wie bei https://github.com/netz98/n98-magerun2/pull/1687. Aber hierbei handelt es sich auch um ein nicht ganz kleines Feature.
Auf Github selbst sieht es so aus als ob ich selbst den Code geschrieben habe. Im Gegensatz zu Jules ist der Commit Autor nicht der Agent selbst.
Vibe Coding in der Realität: Mehr als nur Code-Vervollständigung
Die Erfahrung mit Codex ging weit über die reine Code-Vervollständigung hinaus. Es war ein echtes Vibe Coding:
- Reduzierung von Kontextwechseln: Ich musste viel seltener die IDE verlassen, um in der Dokumentation zu suchen oder auf Stack Overflow nach Lösungen zu forschen. Codex hatte das Wissen direkt parat. Das hielt mich im Flow.
- Lernen und Entdecken: Codex schlug manchmal API-Methoden oder Best Practices vor, die ich noch nicht kannte. Es war eine ständige Lernkurve, die meine eigenen Fähigkeiten erweiterte.
- Wissensbasis: Für die spezifischen APIs von Browser-Extensions, die man nicht täglich nutzt, war Codex eine hervorragende Wissensbasis, die mir half, schnell die richtigen Funktionen zu finden und anzuwenden.
Herausforderungen und Best Practices
Natürlich ist auch ein asynchroner Assistent kein Allheilmittel. Es gibt Herausforderungen und Best Practices, um das Beste herauszuholen:
- Über-Vertrauen vermeiden: Auch wenn Codex beeindruckend ist, bleibt der Entwickler die letzte Instanz. Code-Vorschläge müssen immer kritisch geprüft und getestet werden.
- Klare Prompts: Je präziser deine Fragen und Anweisungen an Codex sind, desto relevanter und hilfreicher werden die Antworten sein. Alternativ kann auch ein GitHub Issue als Context dienen da Codex sich dann die Inhalte von dort zieht. Aber auch das GitHub Issue sollte auch etwas Context bieten.
- Iteratives Verfeinern: Betrachte die Interaktion mit Codex als einen Dialog. Wenn die erste Antwort nicht perfekt ist, verfeinere deine Frage oder gib mehr Kontext. Codex arbeitet gerne ein paar Minuten. Man muss das Ergebnis aber nicht direkt aktzeptzieren und kann Codex auch Nachbessern lassen.
- Die Balance finden: Es geht nicht darum, sich von der KI den gesamten Code schreiben zu lassen. Es geht darum, die KI als Werkzeug zu nutzen, um repetitive Aufgaben zu automatisieren, Wissen schnell abzurufen und neue Lösungsansätze zu entdecken, während man selbst die kreative Kontrolle behält.
Fazit: Die Zukunft des Codings ist kollaborativ
Meine Erfahrung mit OpenAI Codex und der Entwicklung der web-ext-webhook-trigger Extension hat mir gezeigt, dass asynchrone KI-Assistenten das Potenzial haben, den Entwicklungsprozess grundlegend zu verändern. Sie fördern einen "Vibe Coding"-Ansatz, der intuitiver, flüssiger und letztendlich produktiver ist.
Die Zukunft des Codings ist nicht nur automatisiert, sondern kollaborativ. Tools wie OpenAI Codex sind keine reinen Code-Generatoren, sondern intelligente Partner, die uns helfen, im Flow zu bleiben, schneller zu lernen und bessere Software zu entwickeln. Ich bin gespannt, wie sich diese Technologie weiterentwickeln wird und welche neuen Möglichkeiten sie uns eröffnen wird.
Hast du schon Erfahrungen mit asynchronen KI-Assistenten gemacht? Teile deine Gedanken in den Kommentaren!