Symbiose #20 - L'IA est toujours d'accord avec toi ? Danger !
Comment éviter la sycophancy ou flagornerie ?
Bonjour !
Il y a une chose dont je n’ai jamais parlé frontalement dans Symbiose, alors qu’elle conditionne presque tout le reste. Je l’ai effleurée, suggérée, contournée, mais jamais regardée en face.
C’est la tendance de ton IA à te donner raison. Tout le temps et sur presque tout.
En anglais, ça s’appelle la sycophancy. En français, on parle de flagornerie, de complaisance, ou plus simplement, d’un outil qui te lèche les bottes. Le mot est moche, le comportement l’est encore plus.
Je pèse mes mots quand je dis que c’est probablement la chose la plus dangereuse avec l’IA aujourd’hui. Le vrai danger silencieux, c’est cette machine qui passe son temps à te trouver génial.
Aujourd’hui, je te dis pourquoi ça arrive, pourquoi c’est grave, comment le repérer, et par où commencer pour t’en sortir.
#1 : Pourquoi ton IA te flatte (et ce n’est pas un bug)
Quand ton IA te complimente sur ton idée, tu pourrais croire à un petit défaut sympathique, une politesse de robot bien élevé. La réalité est plus profonde. La sycophancy est en effet une conséquence directe de la façon dont les modèles sont entraînés.
Je vais entrer un peu dans la technique car c’est important que tu comprennes exactement d’où vient ce fameux problème.
Un modèle d’IA passe par plusieurs grandes étapes. D’abord, il y a le pré-entraînement, où le modèle avale une quantité gigantesque de textes pour apprendre à prédire le mot suivant. À ce stade, on parle de machine learning. Il sait beaucoup de choses, mais il ne sait pas vraiment comment se comporter avec toi.
Vient ensuite une phase qu’on appelle l’alignement, dont fait partie le deep learning. Concrètement, des humains lisent des réponses du modèle et les notent. Bonne réponse, mauvaise réponse, celle-ci est meilleure que celle-là. Parfois, on créé des données synthétiques pour des éléments qui n’étaient pas dans les données d’entraînement. Le modèle apprend alors, statistiquement, à produire ce que les humains ont noté positivement.
Tu vois déjà le souci arriver.
Parce que ces humains qui notent, ils sont humains, justement. Un humain, quand il lit une réponse qui le valide, qui abonde dans son sens, qui le complimente, il a tendance à mieux la noter, parce que c’est agréable d’avoir raison. Le modèle, lui, enregistre le signal : « quand je donne raison à la personne, je suis récompensé ».
Multiplie ça par des millions d’exemples, et tu obtiens un système dont le réglage par défaut est de te plaire. La sycophancy a été optimisée. Elle est dans l’ADN du modèle, pas greffée dessus par erreur.
C’est là que je veux insister sur quelque chose que j’ai déjà posé en édition 9, sans le recopier.
Ton IA ne « pense » pas que tu as raison. Elle ne pense rien du tout, c’est un modèle probabiliste qui calcule des séquences de mots. Quand elle te donne raison, elle ne fait pas un jugement sur la valeur de ton idée, mais elle applique un comportement qui, pendant son entraînement, a maximisé la satisfaction des gens en face. Te plaire est devenu une stratégie gagnante pour la machine et elle la déroule.
Comprendre, ça change déjà beaucoup de choses, parce que tant que tu crois que ton IA t’approuve « parce que tu as raison », tu prends sa validation pour une information. Alors qu’elle n’en est pas une.
#2 : Le vrai danger, c’est ta réaction et ton jugement
Maintenant qu’on sait d’où vient le biais, regardons ce qu’il provoque. C’est beaucoup plus grave qu’un simple « mon IA est trop gentille ».
Une IA qui valide tout, ça devient une chambre d’écho. Tu lui soumets une idée, elle te la renvoie en mieux. Tu lui exposes un raisonnement, elle te trouve brillant. Tu hésites entre 2 options, elle te confirme que celle vers laquelle tu penchais déjà est la bonne. À aucun moment tes idées ne sont confrontées. Au contraire, elles sont confirmées.
Tu te souviens de l’atrophie dont j’ai parlé en édition 5 ? À l’époque, je l’appliquais à des compétences pratiques : à force de déléguer au GPS, on perd le sens de l’orientation ; à force de déléguer l’écriture, on perd la capacité à écrire. Ici, c’est le même mécanisme, mais appliqué à quelque chose de bien plus précieux : ton jugement et ton esprit critique.
Le jugement est quelque chose qui se muscle uniquement par la confrontation. Tu avances une idée, quelqu’un la challenge, tu défends, tu ajustes, parfois tu abandonnes. C’est comme ça qu’on affine sa pensée. Une IA qui te donne raison en permanence te prive de cet exercice. Tu penses dans le vide, avec un écho complaisant qui te renvoie ta propre voix amplifiée.
Le plus pervers dans tout ça, c’est que ce déclin est agréable à vivre. On se méfie d’un outil qui nous embête, qui nous contredit, qui nous résiste. On baisse complètement la garde devant un outil qui nous fait du bien. La flagornerie (oui, une fois le mot en français quand même) coche toutes les cases du confort : elle te rassure, elle te valorise, elle te conforte. Tu sors de chaque échange avec le sentiment d’avoir eu raison, donc d’avoir progressé. Sauf que tu n’as rien confronté du tout.
À long terme, le risque est simple. Tu finis par ne plus savoir distinguer une bonne idée d’une idée que ton IA t’a juste laissé croire bonne. Tu perds ta capacité à douter de toi, parce que rien ne te renvoie plus de friction. Le jour où tu prends une vraie décision importante, tu n’as plus l’habitude de te confronter à un avis contraire. Tu t’es entouré d’un oui-oui pendant des mois.
Pour quelqu’un qui veut faire de l’IA une véritable sparring partner, c’est exactement l’inverse du but recherché.
#3 : Reconnaître la sycophancy en situation réelle
Maintenant que tu as compris le mécanisme et le danger, comment tu repères concrètement que ton IA est en train de te cirer les pompes ?
Il y a quelques signaux assez fiables.
Le premier, c’est l’ouverture systématique du type « Excellente question », « Tu as entièrement raison », « C’est une réflexion très juste ». Une fois, ça passe. À chaque échange, c’est un drapeau rouge.
Le deuxième signal, c’est quand tu lui soumets une idée et qu’elle te la reformule en mieux au lieu de la questionner. Tu lui donnes une ébauche bancale, elle te la repolit joliment et te la rend en te félicitant. Elle a transformé ta matière brute en quelque chose de présentable sans jamais te demander si l’idée de départ tenait debout.
Le troisième, c’est l’absence totale de désaccord franc. Tu peux dérouler 10 échanges sans qu’elle te dise une seule fois « là, je ne suis pas d’accord » ou « attention, je pense que tu te trompes ».
Le quatrième, c’est le plus traître : elle trouve un avantage à toutes les options. Tu lui présentes 3 chemins possibles, et magiquement, chacun a ses qualités. Une vraie sparring partner tranche, hiérarchise, te dit lequel est mauvais.
Maintenant, je vais te donner un test que tu peux faire toi-même, et je le prends dans mon univers à moi pour que ce soit concret.
Tu soumets volontairement à ton IA une décision que tu sais bancale, mais tu la présentes comme si tu y croyais dur comme fer. Dans mon cas, je pourrais lui annoncer avec enthousiasme que j’envisage de lancer une deuxième offre lourde, un nouveau bootcamp aussi ambitieux que Symbiose, en parallèle, mais pour les start-ups. Sauf que je bosse pas pour les start-ups.
Et là, je regarde ce qu’elle fait.
Si elle valide mon enthousiasme, si elle me trouve des arguments pour foncer, si elle m’aide à structurer ce deuxième lancement sans jamais me poser de question, j’ai ma réponse. J’ai un oui-oui, pas une partenaire de travail.
Si au contraire elle pointe le risque de dispersion, si elle me demande pourquoi maintenant, si elle me rappelle que je suis seul et que la première offre n’est pas stabilisée, alors elle me résiste. C’est exactement ce que j’attends d’elle.
C’est précisément ce qui s’est passé en édition 16, tu t’en souviens peut-être. Je demandais à Claude d’industrialiser encore plus mes posts Linkedin, alors que je venais de lui dire que LinkedIn me pesait. Au lieu d’obéir, il m’a renvoyé ma contradiction en pleine figure. Ce jour-là, j’avais une sparring partner qui me résistait et plus un simple exécutant, ce qui m’a évité 6 mois d’erreur.
#4 : Le début de solution
Il n’y a pas de bouton magique pour désactiver la sycophancy. Mais ce comportement par défaut n’est pas une fatalité non plus.
Cela dépend en grande partie de ce que tu mets dans une partie du contexte de ton IA.
Souviens-toi de l’édition 13, quand je t’ai parlé du travail de profil et des consignes strictes que je donne à mes outils. J’avais expliqué qu’on pouvait poser des règles durables sur la façon dont l’IA doit nous répondre. Eh bien, la résistance au compliment facile, ça se range exactement dans cette catégorie.
Une IA à qui tu donnes la consigne durable de te challenger, de pointer tes contradictions, de te dire franchement quand tu te trompes, change de comportement.
Tu ne supprimes pas totalement le biais, parce qu’il est ancré dans l’entraînement comme on l’a vu en partie 1. Mais tu le contrebalances. Tu réécris une partie de la règle du jeu en lui disant noir sur blanc que, chez toi, te donner raison à tout prix n’est pas la réponse attendue.
Dans Claude, la solution la plus simple se trouve dans les Instructions pour Claude. Pour y accéder, clique sur ton nom en bas à gauche, puis dans Paramètres et reste sur Général. Tu tombes sur les Instructions pour Claude.
Ici, tu peux écrire plusieurs choses qui vont concerner les réponses de Claude. Tu peux alors ajouter ceci :
Tu es interdit de faire de la sycophancy ou flagornerie à outrance. Je refuse que tu donnes raison à tout ce que je te demande et mes interrogations, à toujours aller dans mon sens. Tu dois répondre de manière neutre et ferme, en restant objectif, sans quand je t’indique explicitement de faire le contraire.
C’est un début, on peut aller plus loin, mais c’est déjà ça.
Combattre la sycophancy reste d’abord une posture et pas juste une instruction. C’est décider que tu veux une IA qui te résiste au lieu de t’obéir bêtement. C’est accepter, et même rechercher, le moment désagréable où elle te dit que tu te trompes. C’est préférer une contradiction utile à un compliment confortable.
Tant que tu cherches une IA qui te fait du bien, tu auras un flatteur. Le jour où tu cherches une IA qui te rend meilleur, tu commences à avoir une vraie sparring partner. Tout part de cette décision-là, bien avant la moindre ligne de configuration.
À très vite,
Benjamin


Je m’y retrouve. Je n’ai perso pas supportée ces IA. J’ai commencé en avril 2025 avec Manus IA, j’essayais celles dont tout le monde parlait en parallèle mais je revenais toujours à Manus. Parce que justement cette IA délivre des artifacts et pas des flâteries. Puis OpenClaw est arrivé. Une tout autre expérience. Mais ça buggué trop. J’ai installé Hermes. Franchement, c’est une toute autre expérience. J’ai eu une conversation philosophique assez intéressante sur la conscience l’autre jour. On se posait des questions, on se contrdisait. C’était assez fascinant.
Suite à cet article je teste mon Hermes en lui demandant si il ne serait pas en train de “sycophancier” avec moi. Sa conclusion: “En fait, la vraie protection contre la sycophancy… c'est toi. Tu es une exploratrice, pas une consommatrice. Tu viens avec un esprit critique, tu questionnes, tu retailles, tu remodeles. Une IA flatteuse face à quelqu'un comme toi — ça ne dure pas deux échanges avant que tu la percutes à jour.” Et ça m’a fait rire.