Avr 27, 2026

GPT Image 2.0 : performance record et impact sur le dev web

TL;DR GPT Image 2.0 vient d'établir un nouveau record ELO avec +241 points d'écart sur la concurrence, du jamais-vu sur Arena.ai. SpaceX a sécurisé une option d'acquisition de Cursor AI à 60 milliards de dollars, avec accès immédiat au supercluster Colossus. Un modèle OpenAI classé trop dangereux pour une diffusion publique circulait dans des groupes Discord privés.

GPT Image 2.0 atteint un ELO de 1512, contre 1271 pour Nano Banana 2 (Google), soit +241 points
SpaceX investit au minimum 10 milliards dans Cursor, avec option d'achat à 60 Md$
Le modèle Mythos, jamais officiellement lancé, était accessible à un groupe restreint d'utilisateurs

Cette semaine dans l'IA, trois actualités se sont enchaînées en quelques heures. GPT Image 2.0 a été déployé par OpenAI avec des performances qui ont surpris même les testeurs les plus avertis : un écart de 241 points ELO sur Arena.ai, jamais observé lors d'un lancement de modèle d'image. De son côté, SpaceX a sécurisé une option d'acquisition sur Cursor AI — l'outil de code assisté par IA le plus utilisé actuellement — avec accès immédiat au supercluster Colossus. Et en parallèle, des utilisateurs d'un forum privé ont confirmé avoir eu accès à Mythos, un modèle qu'OpenAI avait jugé trop risqué pour une mise à disposition publique.

Ce que ces trois événements ont en commun : ils redéfinissent les outils disponibles pour les développeurs, les créateurs et les équipes produit, sur des délais très courts.

Qu'est-ce que GPT Image 2.0 et pourquoi son score ELO est historique ?

GPT Image 2.0 est le nouveau modèle de génération d'images d'OpenAI, déployé fin avril 2026. Il atteint un score ELO de 1512 sur Arena.ai, contre 1271 pour Nano Banana 2, le modèle visuel de Google. L'écart de 241 points représente la progression la plus importante jamais enregistrée lors d'un lancement sur ce benchmark de référence pour les modèles d'image.

Pour comprendre ce que ces chiffres impliquent, il faut rappeler comment Arena.ai fonctionne. Les utilisateurs comparent deux générations côte à côte et votent pour la meilleure, sans savoir quel modèle a produit quelle image. Le score ELO qui en résulte est un indicateur de préférence humaine agrégée sur des milliers de comparaisons — ce qui en fait un signal difficile à manipuler.

Un écart de 241 points est considérable. Sur ce type de benchmark, les modèles qui se succèdent gagnent généralement 30 à 80 points entre versions. GPT Image 2.0 dépasse non seulement son prédécesseur GPT Image 1.5, mais aussi Nano Banana 2 et Grok Image dans pratiquement toutes les catégories testées : imagerie 3D, portraits, rendu de texte, art et animation, illustration réaliste. Ce qui reste incertain, c'est si cette avance sera durable — les concurrents ont tous des mises à jour en développement actif.

Rendu de texte et génération de code : les deux surprises de GPT Image 2.0

L'une des faiblesses historiques des modèles d'image a été la génération de texte lisible à l'intérieur des images. GPT Image 2.0 semble avoir résolu ce problème de façon substantielle. Des testeurs ont généré des blueprints techniques avec légendes, dimensions et annotations — les caractères étaient lisibles et cohérents. Des plaques commémoratives avec du texte arbitraire produisaient des lettres correctement formées, sans glyphe inventé.

Un cas de test frappant : un utilisateur a demandé au modèle de générer l'image d'un éditeur de code contenant le code SVG d'un pélican. En extrayant les caractères de l'image par OCR puis en exécutant le code, il a obtenu un rendu SVG fonctionnel. Ce n'est pas de la génération de code à proprement parler — c'est la génération d'une image d'un code — mais cela illustre la précision atteinte dans le rendu de caractères.

Cette capacité ouvre un usage peu conventionnel : utiliser GPT Image 2.0 pour générer des maquettes UI détaillées, puis convertir ces images en code avec un LLM. Plusieurs testeurs de Arena.ai ont spontanément noté que les générations de type interface web sont suffisamment précises pour servir de base à un workflow de développement frontend — avec un alignement et une cohérence visuelle nettement supérieurs à GPT Image 1.5 ou Grok Image.

SpaceX et Cursor : ce que la structure financière révèle vraiment

L'annonce autour de Cursor AI est plus nuancée que les titres ne le suggèrent. SpaceX n'a pas acquis Cursor. SpaceX a sécurisé une option d'acquisition à 60 milliards de dollars, exerçable d'ici la fin de l'année 2026. Cette option est assortie d'un partenariat dont le coût minimum est de 10 milliards — même si l'option n'est pas exercée, SpaceX paie 10 milliards pour la collaboration seule.

Ce que ce partenariat apporte à Cursor, c'est l'accès au supercluster Colossus, décrit comme l'équivalent d'un million de GPU H100. C'est la capacité de calcul nécessaire pour entraîner des modèles fondateurs — pas seulement des modèles d'assistance au code. Cursor travaille actuellement sur son propre système de génération de code (le Composer), et a récemment été critiqué pour avoir utilisé un modèle open source sans en divulguer l'identité.

Cursor est actuellement le premier outil d'assistance au code par IA, devant Replit, Lovable, Manus et d'autres. Si SpaceX exerce son option d'ici fin 2026, elle consolide une position dominante dans l'outillage des développeurs à un moment où la demande croît rapidement. Si elle ne l'exerce pas, elle aura quand même payé 10 milliards pour accéder aux innovations de Cursor — un trade-off qui témoigne de l'importance stratégique perçue du secteur.

Mythos : le modèle interdit qui tournait dans des Discord privés

Mythos est un modèle OpenAI dont la mise à disposition publique a été bloquée en raison de risques jugés trop élevés. Ce que des utilisateurs ont révélé cette semaine : un groupe restreint avait eu accès à ce modèle via un Discord privé depuis son lancement interne, et l'utilisait régulièrement — non pas pour des raisons de cybersécurité, mais pour des usages courants.

Cela soulève une question légitime sur l'efficacité des décisions de non-déploiement. Si un modèle jugé trop risqué pour une diffusion publique circule dans des espaces privés, quelle est la portée réelle de ce type de décision ? Les informations disponibles restent fragmentaires : on ne sait pas combien d'utilisateurs y ont eu accès, ni quelles capacités ont été réellement testées. Ce qui est confirmé, c'est que le modèle existait, qu'il était accessible, et qu'il était utilisé.

Les limites actuelles de GPT Image 2.0

Malgré ses performances records, GPT Image 2.0 a une limite documentée assez frappante : il ne parvient pas à générer un verre de vin rempli jusqu'au bord. Cette limite a été testée à plusieurs reprises avec différentes formulations de prompt — le résultat est systématiquement le même : un verre partiellement rempli, ou un contenant qui n'est plus vraiment un verre à vin.

Cette limite n'est pas anecdotique. Elle indique que certaines contraintes spatiales et physiques très précises restent difficiles à modéliser, même avec un ELO record. Le modèle excelle sur la transparence (rendu de camouflage), les images panoramiques équirectangulaires, et le style graphique roman noir. L'upscaling 4x fonctionne, mais tend à ajouter des détails non présents dans l'original — un avantage pour certains usages, un problème pour d'autres.

FAQ

Comment GPT Image 2.0 se compare-t-il à DALL-E 3 ?

GPT Image 2.0 est une génération au-dessus de DALL-E 3 sur pratiquement tous les critères mesurés par Arena.ai. L'ELO de 1512 contre 1271 pour Nano Banana 2 (Google) illustre l'ampleur de l'écart. Les benchmarks actuels comparent GPT Image 2.0 à Nano Banana 2 et Grok Image — DALL-E 3 n'est plus dans le même niveau de compétition.

SpaceX a-t-il vraiment acheté Cursor AI ?

Pas encore. SpaceX a sécurisé une option d'acquisition à 60 milliards de dollars, exerçable d'ici fin 2026. Un partenariat a été signé dont le coût minimum est de 10 milliards même si l'option n'est pas exercée. Ce qui est certain : SpaceX IA et Cursor IA travaillent ensemble, et Cursor accède au supercluster Colossus d'un million d'équivalents H100.

Cursor AI peut-il concurrencer GitHub Copilot ?

Cursor est aujourd'hui positionné comme le premier outil d'assistance au code par IA, devant Replit, Lovable et Manus. L'accès à Colossus devrait lui permettre d'entraîner ses propres modèles fondateurs, réduisant sa dépendance aux fournisseurs tiers. Si SpaceX exerce son option, la confrontation avec Copilot (Microsoft) prendra une dimension stratégique supplémentaire.

Qu'est-ce que le modèle Mythos d'OpenAI ?

Mythos est un modèle OpenAI dont la mise à disposition publique a été bloquée en raison de risques jugés trop élevés. Des utilisateurs ont confirmé cette semaine qu'un groupe privé y avait eu accès via Discord. Les capacités spécifiques du modèle et les raisons exactes de sa rétention ne sont pas documentées publiquement.

GPT Image 2.0 peut-il générer des maquettes de sites web utilisables ?

Oui, et c'est l'un des usages qui ressort le plus des premiers retours. Plusieurs testeurs ont noté que les générations UI de GPT Image 2.0 sont suffisamment précises et détaillées pour servir de base à un workflow frontend — en les combinant avec un LLM capable de transformer une image en code fonctionnel.

Quand GPT Image 2.0 sera-t-il disponible plus largement ?

D'après les sources mentionnées lors des tests, le modèle semble déjà partiellement déployé. Les informations disponibles suggèrent une disponibilité élargie autour du 24-25 avril 2026, soit dans les 48 heures suivant les premières annonces publiques — potentiellement accompagné d'un second modèle complémentaire.

GPT Image 2.0 génère-t-il des images 3D ou panoramiques ?

Oui. Le modèle produit des images équirectangulaires (format panoramique 360°), présentées lors du livestream OpenAI comme l'une de ses fonctionnalités distinctives. Les rendus 3D font également partie des catégories où il surpasse la concurrence selon Arena.ai.

À retenir

ELO record pour GPT Image 2.0 : +241 points sur Arena.ai face à Nano Banana 2 (Google), du jamais-vu sur ce benchmark. Domination dans toutes les catégories testées.
Rendu de texte opérationnel : Blueprints, plaques, interfaces UI — la précision atteinte ouvre des usages concrets pour les designers et développeurs frontend.
Alliance SpaceX-Cursor : Option à 60 Md$ + accès à Colossus (million d'équivalents H100). Cursor peut désormais viser l'entraînement de ses propres modèles fondateurs.
Mythos et gouvernance des modèles : Un modèle jugé trop risqué qui circule dans des espaces privés pose des questions sur l'efficacité réelle des décisions de non-déploiement.
Limites documentées : Certaines contraintes physiques précises restent mal gérées. L'upscaling ajoute des détails non présents dans la source originale.