OpenAI heeft een update uitgebracht voor de beeldgeneratie in ChatGPT. De functie heet ChatGPT Images en draait op het nieuwe model GPT Image 1.5. Volgens het bedrijf ligt de nadruk op hogere snelheid, betere nauwkeurigheid bij bewerkingen en meer consistentie in gegenereerde beelden.
De update markeert een verdere uitbreiding van ChatGPT van tekstgebaseerde assistent naar een omgeving voor visuele creatie. OpenAI meldt dat het nieuwe beeldmodel tot vier keer sneller afbeeldingen kan genereren dan eerdere versies. Daarmee moet het maken en aanpassen van beelden minder wachttijd vergen tijdens het creatieve proces.
Een belangrijke wijziging zit in de manier waarop het model instructies opvolgt. Bij eerdere generaties leidde een kleine aanpassing vaak tot een volledig gewijzigde afbeelding. Met ChatGPT Images kunnen gebruikers gerichte wijzigingen doorvoeren, zoals het aanpassen van kleding, lichtinval of het toevoegen van een object, terwijl andere elementen in beeld gelijk blijven. Volgens OpenAI geldt dit ook voor gezichten en composities van personages.
Daarnaast introduceert het bedrijf meerdere functies die gericht zijn op visuele samenhang. Zo is het mogelijk om meerdere bronafbeeldingen te combineren tot één scène. Het model is ook beter in het weergeven van tekst in afbeeldingen, inclusief kleinere en complexere teksten. Dit moet het maken van bijvoorbeeld posters en infographics vereenvoudigen. Verder is het eenvoudiger geworden om dezelfde stijl of hetzelfde personage consequent te laten terugkeren in meerdere beelden.
Naast het model zelf is ook de interface aangepast. In de webversie en mobiele app van ChatGPT is een aparte Images-tab toegevoegd. In deze omgeving zijn eerdere creaties terug te vinden en kunnen gebruikers voorbeelden bekijken via zogeheten trending prompts. Ook zijn er vooraf ingestelde stijlen en filters beschikbaar, zonder dat een uitgebreide tekstprompt nodig is.
De uitrol van ChatGPT Images is gestart voor consumenten, zowel voor gratis als betaalde accounts. Voor zakelijke varianten zoals Business en Enterprise volgt de update in de komende weken. Ontwikkelaars krijgen via de API direct toegang tot GPT Image 1.5. OpenAI geeft aan dat het nieuwe model ook lagere kosten per generatie heeft dan de vorige versie.
Met deze stap vergroot OpenAI de concurrentie met andere aanbieders van multimodale modellen, waaronder Google, dat recent een update aankondigde rond Gemini 3 Flash.


