GPT-5.4 kann jetzt meinen Computer bedienen – ich bin gleichzeitig beeindruckt und leicht beunruhigt

eyecatcher 2278

KI generiert

Vor zwei Tagen hat OpenAI still und leise GPT-5.4 rausgeworfen. Ich sage „still und leise“, obwohl es natürlich eine große Pressemitteilung gab – aber mittlerweile ist man so an KI-Releases gewöhnt, dass man fast schon den Kalender braucht, um den Überblick zu behalten. Gefühlt erscheint alle drei Wochen ein neues Modell, das das vorherige „übertrifft“. Die Branche hat das Gefühl für Superlative verloren.

Aber diesmal ist tatsächlich etwas passiert, das ich nicht einfach ignorieren kann: GPT-5.4 kann jetzt Computer bedienen.

Computer-Use: Die KI greift zur Maus

Kein Witz. Das neue Modell kann eigenständig Software öffnen, in Programmen klicken, Fehler erkennen und sich selbst korrigieren – in einer Schleife, die OpenAI charmant „Build-Run-Verify-Fix“ nennt. Auf Deutsch: Die KI baut, führt aus, prüft, repariert. Und wiederholt das, bis es klappt.

Ich habe das kurz auf mich wirken lassen. Eine KI, die selbstständig meinen Bildschirm bedient. Meinen Ordner mit „FINAL_v3_WIRKLICHFINAL.psd“ öffnet. Mein 47-Tab-Browserfenster sieht. Meine Passwort-Notizen findet, die ich in einer Textdatei namens „Einkaufsliste2.txt“ versteckt habe.

Ich bin gleichzeitig beeindruckt und froh, dass ich das erstmal nur für Coding-Workflows nutzen will.

Das Kontextfenster: 1 Million Token

Nebenbei unterstützt GPT-5.4 jetzt ein Kontextfenster von einer Million Tokens. Das klingt abstrakt, also mal konkret: Du kannst dem Modell theoretisch eine ganze Codebasis, mehrere lange Dokumente und eine Stunde Transkript gleichzeitig hinwerfen – und es verliert den Faden nicht. Früher musste man sorgfältig überlegen, was man der KI „zeigt“. Jetzt kippt man einfach alles rein und hofft auf das Beste. Klassischer Fortschritt.

Was ich davon halte

Ich nutze KI täglich für meine Videos – das ist kein Geheimnis, ich sage das sogar ziemlich laut. Was mich an GPT-5.4 ehrlich gesagt mehr interessiert als die Computer-Use-Funktion: Es soll 33% weniger faktische Fehler machen als der Vorgänger. Das klingt unspektakulär, ist aber für die Praxis der eigentliche Gamechanger. Nichts nervt mehr als eine KI, die selbstsicher Dinge erfindet. Weniger Halluzinationen bedeutet mehr Vertrauen – und mehr Vertrauen bedeutet, dass ich weniger Zeit damit verbringe, Outputs gegenzuchecken.

Probiere ich GPT-5.4 aus? Ja, klar. Gebe ich ihm Zugriff auf meinen Desktop? Noch nicht. Manche Entwicklungen brauchen Zeit – und ich brauche noch ein bisschen davon, um mich an die Idee zu gewöhnen, dass eine KI meine Tabs sieht.

Dieser Beitrag wurde mit Hilfe von KI recherchiert und strukturiert – weil ich das eben so mache. Den Witz mit den Tabs habe ich selbst erfunden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert