Le battage médiatique face à la réalité
Lancez-vous dans n'importe quelle conversation tech ces temps-ci et vous entendrez le mot « agent » jeté à tout-va, comme des confettis. Mais il existe un fossé énorme entre ce que les gens imaginent être un agent IA et ce que ces systèmes font réellement aujourd'hui. Un chatbot n'est pas un agent. Un simple appel d'API vers Claude ou GPT-4 n'est pas un agent. Et ce n'est pas parce qu'un système s'appuie sur un LLM qu'il est autonome pour autant.
Saisir cette nuance n'est pas qu'une question de vocabulaire : elle détermine quels problèmes vous pouvez raisonnablement résoudre et où vous risquez de perdre votre temps à courir après de fausses promesses.
Ce qui se passe réellement : la boucle de l'agent
Un véritable agent IA est fondamentalement une boucle composée de quatre rouages :
1. Perception — L'agent observe le monde qui l'entoure (lire un e-mail, consulter un fichier, parcourir une base de données). C'est l'entrée.
2. Planification — L'agent réfléchit à ce qu'il doit faire ensuite, généralement en raisonnant à partir d'objectifs et de contraintes. « Je dois planifier une réunion. Pour cela, je dois vérifier les agendas, trouver un créneau et envoyer les invitations. »
3. Action — L'agent utilise des outils — il ne se contente pas de générer du texte, il appelle réellement des API, exécute du code ou déclenche des systèmes externes. Il envoie un e-mail. Il modifie un tableur. Il crée un ticket Jira.
4. Retour d'information — L'agent observe le résultat de son action, en tire un enseignement et reboucle. L'e-mail est-il parti ? L'agenda a-t-il accepté le créneau ? Si non, il essaie une autre approche.
Cette boucle s'exécute de façon répétée jusqu'à ce que l'objectif soit atteint ou que l'agent reconnaisse qu'il ne peut pas continuer. C'est cette itération qui distingue un agent d'une transaction ponctuelle.
Exemple concret : la différence
Pas un agent : Vous demandez à ChatGPT « Devrais-je investir dans l'entreprise X ? ». Il rédige une réponse réfléchie. Vous fermez l'onglet. Terminé.
Un agent : Vous dites à un système IA « Achète les meilleures actions disponibles à moins de 100 $ qui correspondent à mon profil de risque ». Le système :
- Se connecte à l'API de votre courtier pour comprendre votre compte et vos contraintes
- Parcourt des sources de données financières pour repérer des candidats
- Récupère les derniers rapports de résultats et le sentiment des analystes
- Calcule les rendements ajustés au risque
- Vous demande confirmation avant d'exécuter l'ordre
- Surveille les achats et vous alerte en cas de fluctuation des cours
Chaque étape implique un appel d'outil. Chaque résultat alimente la décision suivante. L'agent ne fait pas que réfléchir au problème : il agit dessus, observe le retour d'information et s'adapte.
Là où les agents excellent aujourd'hui
Les agents donnent le meilleur d'eux-mêmes dans les domaines où :
Les objectifs sont clairs. « Réserve ce vol » ou « Trouve et corrige les bugs de ce code » ont des critères de réussite objectifs.
Les outils sont disponibles et fiables. Plus l'accès aux API est bon, meilleur est l'agent. Un agent de support client ayant accès à un CRM, à un système de tickets et à une base de connaissances peut véritablement résoudre des problèmes.
L'environnement est prévisible. Les agents peinent quand les règles changent d'un instant à l'autre. Ils s'épanouissent dans des workflows structurés.
L'essai-erreur est sans danger. Le développement interne, l'analyse de données et les tests sont des terrains de jeu sûrs. Les opérations en contact direct avec le client sont plus risquées.
Des réussites bien réelles :
- Génération et débogage de code (avec relecture humaine)
- Analyse de données et génération de rapports
- Recherche et synthèse de documents internes
- Recherche et collecte d'informations
- Automatisation de workflows au sein de systèmes fermés (bots Slack, outils internes)
Là où les agents échouent — et continuent d'échouer
Soyons d'une honnêteté brutale : les agents ont aujourd'hui des limites bien réelles.
Ils hallucinent et affabulent. Un agent ayant accès à une base de données peut, avec aplomb, inventer des données qui semblent plausibles s'il ne trouve pas ce qu'il cherche. Il ne sait pas ce qu'il ne sait pas, alors il devine.
Ils sont fragiles face à l'inédit. Confrontez un agent à un scénario pour lequel il n'a pas été entraîné, et il déraille souvent. Il peut retenter cinq fois la même action ratée au lieu d'essayer autre chose. Ou commettre un acte destructeur parce qu'il a mal interprété le contexte.
Ils prennent de mauvaises décisions à grande échelle. Un agent peut exécuter des milliers d'appels d'API en poursuivant un objectif, faisant grimper les coûts ou créant des effets de bord que personne ne voulait. Sans garde-fous stricts, la situation dégénère.
Ils ne comprennent pas vraiment le contexte comme le font les humains. Un agent peut suivre les instructions à la lettre tout en passant à côté du pourquoi. Il envoie un e-mail d'excuses sincère à un client qui appelait en réalité pour vous féliciter. Il écrit du code fonctionnel qui résout le mauvais problème.
Ils sont lents pour les tâches simples. Si vous voulez juste une réponse rapide, demander à un agent de boucler à travers des outils, d'appeler des API et de raisonner de manière itérative prend plus de temps qu'un appel LLM direct. La surcharge est bien réelle.
Ils échouent rarement avec élégance. Les humains reconnaissent les objectifs impossibles et savent renoncer. Les agents continuent de boucler, d'essayer, de consommer des ressources.
Là où les agents ne devraient pas encore opérer
- Les décisions médicales. La marge d'erreur est trop faible. Les hallucinations tuent.
- Les transactions financières à grande échelle. Tant que le problème de la confiance n'est pas résolu.
- Les décisions de jugement au contact du client. Licencier quelqu'un, refuser une indemnisation, accepter un contrat — tout cela exige une supervision humaine.
- Tout ce qui a des conséquences irréversibles. Un agent qui supprime la mauvaise base de données parce qu'il a mal lu une requête n'a pas droit à une seconde chance.
Le constat honnête
Ce que nous avons aujourd'hui, c'est de l'autonomie assistée, pas de véritables agents autonomes. Les meilleurs systèmes en production sont en réalité :
Des agents avec garde-fous. Des agents de code qui génèrent des pull requests, sans les fusionner. Des agents de recherche qui suggèrent des sources, validées par des humains. Des agents d'automatisation qui marquent une pause pour validation aux étapes à haut risque.
Des agents avec des voies de repli. Ils connaissent leurs limites. Si un outil échoue trois fois, ils escaladent vers un humain plutôt que de retenter indéfiniment.
Des agents dans des domaines restreints. Plus la tâche est spécifique, plus l'agent est fiable. Planifier des réunions dans votre agenda, c'est faisable. Optimiser l'ensemble de votre vie, non.
Des agents avec un humain dans la boucle. Les meilleurs schémas actuels ne sont pas entièrement autonomes : ce sont des collaborations agent + humain. L'agent abat le gros du travail, l'humain prend la décision.
Ce qui se profile
La frontière se déplace vers :
- Un meilleur raisonnement. Des modèles qui planifient plus soigneusement avant d'agir, qui estiment leur degré de confiance, qui savent quand s'arrêter.
- Une conscience de l'environnement en temps réel. Des agents qui suivent l'état du système et remarquent quand leurs hypothèses s'effondrent.
- Une planification hiérarchique. Décomposer de grands objectifs en sous-objectifs plus petits et les exécuter dans l'ordre, avec retour en arrière possible.
- Une véritable gestion de l'incertitude. Au lieu d'halluciner, des agents qui disent « Je ne suis pas sûr » et demandent des précisions.
À retenir
Si quelqu'un vous dit avoir construit un agent IA, demandez :
- Boucle-t-il ? Réessaie-t-il quand les choses échouent ?
- À quels outils a-t-il accès ?
- Peut-il réellement agir sur le monde, ou seulement générer du texte ?
- Que se passe-t-il lorsqu'il rencontre une situation pour laquelle il n'a pas été conçu ?
- Quelle part de supervision humaine y a-t-il dans la boucle ?
Les réponses séparent les vrais agents des chatbots déguisés en grands sorciers. Et pour l'instant, l'essentiel de ce qu'on appelle « agent » reste très largement de la seconde catégorie.
La technologie avance vite. Mais avancer vite et fonctionner de manière fiable sont deux choses bien différentes.



