Un nouveau rapport a découvert que Google Gemini AI a paniqué en jouant à un jeu Pokémon classique, compromettant sa capacité à raisonner et à prendre des décisions.
Bien que l’IA soit généralement utilisée pour résoudre des énigmes et répondre à une pléthore de questions, il s’avère que, tout comme les humains, cette série de 1 et de 0 peut aussi « paniquer », ce qui les amène à devenir irrationnels et à faire des choses douteuses.
Au début de cette année, un développeur indépendant non affilié à Google, Joel Zhang, a lancé un stream Twitch intitulé “Gemini Plays Pokemon”, qui, comme son nom l’indique, fait jouer le modèle d’IA Gemini à Pokémon Bleu afin de « comprendre » à quel point il peut progresser dans le jeu complet.
Dans un rapport du 18 juin de Google DeepMind, qui met en lumière une étude de cas sur ledit canal, l’équipe Gemini a trouvé un comportement intéressant, qu’ils ont appelé “Agent Panic.”
Google Gemini AI paniqué et désireux de s’échapper en jouant à Pokémon

Ash, Misty, Brock, et Pikachu avec des expressions choquées dans l’anime Pokémon Soleil & Lune
Selon le rapport, tout au long de la partie, le modèle d’IA Gemini 2.5 Pro se retrouvait dans “diverses situations” qui le poussaient à “simuler la panique.”
Un exemple était lorsque la santé des Pokémon dans l’équipe était basse, les pensées du modèle faisaient soit appel à une guérison immédiate de l’équipe, soit à une évasion répétée du donjon en cours. Son comportement a également été décrit comme utilisant « célèbrement » le mouvement CREUSER ou un objet FIL ÉVASION pendant le jeu.
Comme indiqué dans le rapport, on dit également que le modèle éprouve une “dégradation” de sa “capacité de raisonnement” dans ce mode, car il oubliait complètement de “utiliser l’outil de parcours dans des segments de jeu pendant que cette condition persistait.”
Ce type de comportement s’est également produit dans “suffisamment d’instances séparées” pour que les spectateurs sur Twitch le remarquent lorsqu’il se produisait. Au final, il a fallu à l’IA un total incroyable de 813 heures pour terminer le jeu.
Comme l’a remarqué TechCrunch, un comportement similaire peut également être observé avec le modèle Claude, où le personnage joueur “se réveille” et retourne à un Centre Pokémon une fois que tous ses Pokémon sont à court de santé.
De plus, les spectateurs ont dû regarder le stream avec horreur alors que l’IA faisait intentionnellement s’évanouir tous ses Pokémon lorsqu’elle était bloquée dans la grotte du Mont Lune, pensant qu’elle pourrait être transportée au Centre Pokémon de la ville suivante, ce qui n’est pas le cas dans le jeu, car vous retourneriez au centre que vous aviez utilisé récemment.