Vulnérabilité ChatGPhish dans ChatGPT
Des chercheurs en cybersécurité ont découvert une vulnérabilité dans ChatGPT d'OpenAI qui exploite la confiance accordée par la plateforme aux liens et images Markdown, permettant ainsi des attaques par injection de code et ouvrant de nouvelles perspectives pour le phishing. Cette technique, baptisée ChatGPhish, illustre comment la synthèse automatique par IA peut être manipulée pour diffuser du contenu malveillant directement via une interface de confiance.
Le problème provient de la manière dont le moteur de rendu de ChatGPT traite les éléments Markdown provenant de pages web tierces. Lorsque le chatbot résume un contenu externe, il fait automatiquement confiance aux liens Markdown intégrés et aux URL d'images, téléchargeant les images distantes et affichant les liens comme des éléments actifs et cliquables dans l'interface de l'assistant.
Table des matières
Les mécanismes à l’origine de l’attaque
Un acteur malveillant peut intégrer un petit programme malveillant dans une page web, lequel sera ensuite analysé par ChatGPT. Lors du rendu, des images contrôlées par l'attaquant peuvent être automatiquement chargées, exposant potentiellement des informations telles que l'adresse IP de la victime, son agent utilisateur et les détails de la page de référence.
Outre la fuite d'informations, cette vulnérabilité permet de présenter du contenu malveillant de manière très convaincante. Les attaquants peuvent intégrer des liens d'hameçonnage directement dans les réponses de ChatGPT, afficher de fausses alertes de sécurité système et présenter des codes QR hébergés sur une infrastructure qu'ils contrôlent. Ces codes QR peuvent inciter les utilisateurs à les scanner avec leurs appareils mobiles, contournant ainsi le filtrage des URL et les contrôles de sécurité des entreprises.
Ce qui rend ChatGPhish particulièrement remarquable, ce n'est pas tant l'injection de requêtes en elle-même, mais plutôt le fait que le système d'IA exécute fidèlement les instructions intégrées et présente le contenu résultant comme faisant partie d'un résumé fiable. Une page web en apparence ordinaire peut ainsi générer des liens d'hameçonnage, des alertes de comptes frauduleux, des images distantes et des codes QR malveillants directement dans la réponse d'un assistant IA.
La surface de menace croissante de la navigation assistée par l’IA
Cette découverte met en lumière un défi de sécurité plus vaste : la synthèse automatique est devenue une nouvelle surface d’attaque. En mars 2026, des chercheurs ont démontré que des courriels spécialement conçus pouvaient manipuler Microsoft Copilot par injection croisée (XPIA), influençant ainsi les résumés générés par l’IA grâce à des instructions cachées.
À mesure que les organisations s'appuient de plus en plus sur les outils d'IA pour la recherche et l'analyse de contenu, toute page web malveillante traitée par un assistant IA peut introduire des instructions contrôlées par un attaquant dans le contexte du modèle. Cela représente un changement majeur dans les tactiques d'hameçonnage. Au lieu d'exiger des utilisateurs qu'ils ouvrent des pièces jointes suspectes ou interagissent avec des courriels malveillants, les attaquants peuvent exploiter les activités de navigation habituelles et les processus de synthèse de l'IA.
La migration des attaques des environnements de messagerie électronique vers les interactions IA via navigateur web élargit considérablement la surface d'attaque disponible. Une simple demande de résumé d'une page web peut suffire à exposer les utilisateurs à du contenu malveillant généré par des techniques d'injection indirecte de requêtes.
Une vague croissante de techniques de contournement de la sécurité de l’IA
La découverte de la faille ChatGPhish intervient dans un contexte de nombreuses recherches révélant de nouvelles méthodes d'attaque ciblant les systèmes d'intelligence artificielle. Parmi les découvertes récentes :
- La technique de jailbreak Involuntary In-Context Learning (IICL), qui exploite les conflits entre l'apprentissage en contexte et l'alignement de sécurité pour contourner les restrictions de GPT-5.4 ; les stratégies de conversation à plusieurs tours qui contournent progressivement les protections des grands modèles de langage ; les attaques par injection d'invites typographiques qui dissimulent des instructions dans des images visuellement déformées ; les attaques Neural Exec combinées à des techniques de remplacement Unicode de droite à gauche pour contourner les protections d'Apple Intelligence ; et WebPromptTrap, une vulnérabilité d'injection d'invites indirecte affectant BrowserOS qui manipulait les utilisateurs via des résumés générés par l'IA de contenu apparemment légitime.
- Des failles de sécurité affectent les écosystèmes d'IA et les frameworks d'agents, notamment une vulnérabilité dans le code Anthropic Claude permettant l'interception des communications MCP (Multi-Create Platform) via OAuth grâce à un package npm malveillant ; un scénario d'abus du mécanisme de mise à jour à distance ciblant les compétences OpenClaw ; des campagnes d'hameçonnage par texte caché conçues pour tromper les solutions de sécurité de messagerie basées sur l'IA ; la vulnérabilité ClaudeBleed permettant aux extensions de navigateur d'envoyer des commandes non autorisées à Claude ; des vulnérabilités critiques dans le noyau sémantique Microsoft (CVE-2026-25592 et CVE-2026-26030) capables d'étendre les injections de requêtes jusqu'à l'exécution de code à distance au niveau de l'hôte ; des failles de sécurité généralisées dans les dépôts d'agents ClawHub et skills.sh ; et des attaques contre la pile de référence NemoClaw de NVIDIA permettant l'exfiltration de données OpenClaw via des dépôts GitHub et des packages npm malveillants.
L’avenir des cybermenaces alimentées par l’IA
À mesure que les modèles d'IA avancés gagnent en maturité, les cybercriminels expérimentent de plus en plus leurs capacités offensives. Les acteurs malveillants exploitent de vastes modèles de langage pour développer des logiciels malveillants plus adaptatifs, capables de modifier leur comportement afin de contourner les mécanismes de détection.
De plus, les systèmes d'IA sont intégrés aux processus de décision des logiciels malveillants. Ces capacités permettent aux logiciels malveillants d'évaluer les environnements compromis, de déterminer la valeur des cibles et de décider si les conditions sont propices au déploiement de charges utiles supplémentaires.
L'étude ChatGPhish nous rappelle une fois de plus que les technologies d'IA soulèvent des problématiques de sécurité inédites. À mesure que les assistants IA s'intègrent profondément aux processus métier des entreprises, la protection contre les injections de requêtes indirectes, les résumés manipulés et les abus d'interface basés sur la confiance deviendra un élément de plus en plus crucial des stratégies de cybersécurité.