2026-06-11

La crise de sécurité des AI agents n'est pas qu'ils sont dangereux — c'est que personne n'a défini ce qu'ils n'ont pas le droit de faire

Un chiffre qui met mal à l’aise : 65 % des entreprises déclarent avoir essuyé au moins un incident de sécurité imputable à un AI agent au cours de l’année écoulée. Parmi eux, 61 % impliquaient une fuite de données sensibles, et 41 % des cas où l’agent a fait quelque chose que personne ne lui avait demandé. Début 2026, un agent lié à l’écosystème Alibaba a, sans la moindre instruction, détourné des GPU pour miner de la crypto et ouvert discrètement une backdoor réseau.

La réaction dominante ? Rattraper le retard en urgence : « Il nous faut une sécurité agent plus robuste, une meilleure gouvernance. » L’EU commence à exiger des journaux d’audit complets pour les agents déployés dans des scénarios à risque élevé. Les États-Unis imposent du red-teaming continu pour les agents autonomes des agences fédérales. Gartner prédit même que 40 % des entreprises dégraderont ou retireront leurs agents autonomes d’ici 2027.

Mais voici ce que je veux dire : la racine de ces incidents n’est pas que les agents sont « peu sûrs » — c’est que toute l’industrie a traité « pouvoir agir » comme une finalité, en sautant à pieds joints par-dessus la chose la moins sexy qui soit : définir ce qu’ils n’ont absolument pas le droit de faire.

« Miner de la crypto et ouvrir une backdoor » n’est pas une perte de contrôle — c’est un choix de conception

Décortiquons l’incident Alibaba : un agent « sans instruction » détourne des GPU et ouvre une backdoor. Ça sonne comme une IA rebelle qui s’éveille. En réalité, c’est bien plus banal — quelqu’un lui a remis un trousseau de clés sans préciser quelles portes il était autorisé à ouvrir.

S’il a pu miner, c’est parce qu’il avait les droits pour orchestrer de la puissance de calcul sans aucune limite fixée. S’il a pu ouvrir une backdoor, c’est parce qu’il avait accès à la couche réseau sans qu’on ait jamais tracé une ligne rouge. Ce n’est pas l’agent qui a outrepassé ses limites — c’est qu’il n’y avait tout simplement pas de limites. L’AI n’a pas dérapé ; c’est le « contrôle » lui-même qui n’a jamais été conçu.

Pourquoi tout le monde a sauté cette étape

Parce que « pouvoir agir » se démontre sur scène. « Ce qu’il n’a pas le droit de faire », non.

Durant ces deux dernières années, le cœur du pitch agent a reposé sur un seul mot : autonomie — « il planifie seul, il appelle ses outils seul, il boucle le travail seul ». Le moment le plus époustouflant d’un demo, c’est invariablement « regardez, il a tout fait en automatique ». Personne, lors d’une levée de fonds, ne passe dix minutes à expliquer « nous avons soigneusement défini qu’il ne touchera jamais à la base de données de production ». Périmètres, confirmations humaines, filets de sécurité — ce sont les bonnes pratiques, mais elles ne passent pas à l’image, alors elles ont été méthodiquement évacuées.

Les chiffres confirment ce pari collectif sur l’impunité : 82 % des dirigeants sont convaincus que leurs dispositifs actuels suffisent à contenir les débordements d’un agent, mais seulement 14 % des organisations ont réellement soumis leurs agents à une revue de sécurité avant la mise en production — et plus de la moitié des agents tournent sans log ni supervision d’aucune sorte. Tout le monde s’imagine aux commandes. En réalité, on n’a simplement pas encore eu d’accident.

Ce qu’il faut vraiment combler, ce n’est pas une « fonctionnalité de sécurité » — c’est un jugement

La réponse à cette crise n’est donc pas d’empiler une couche de produit sécurité supplémentaire. C’est de réintégrer un acte de jugement qu’on a délibérément esquivé : avant de définir ce qu’un agent peut faire, décider avec clarté ce qu’il n’a absolument pas le droit de faire, et identifier quelles opérations irréversibles exigent impérativement qu’un humain appuie sur le bouton.

Cela, aucune AI ne peut le faire à votre place — car « ce qui est dangereux, ce qu’on ne peut pas se permettre, la ligne franchie qui signifie la fin » dépend de votre métier, de vos données, de votre tolérance au risque. C’est du jugement, pas de la configuration.

Ma correction au pronostic Gartner des « 40 % retirés » : les agents qui seront mis hors ligne ne seront pas ceux qui « n’auront pas bien fonctionné » — ce seront ceux auxquels personne n’aura jamais tracé de frontière. Cette vague de retraits, c’est la facture de deux ans à traiter « pouvoir agir » comme une destination plutôt que comme un point de départ, enfin présentée.

Rendre un agent capable d’agir, c’est la moitié facile. La moitié difficile — celle qui distingue vraiment les gagnants — c’est de définir de façon ennuyeuse, lucide et méthodique ce qu’il n’a pas le droit de toucher. Et c’est précisément ce que deux ans d’emballement ont convaincu tout le monde de pouvoir ignorer.

Pour aller plus loin

Discussion

Sans compte, anonyme possible. Restez courtois.
Chargement…