Archives de catégorie : billet

La punition n’est pas un tabou

J’aborderai dans cet article la notion de punition et de renforcement, tel que définis scientifiquement par Skinner (voir article sur le conditionnement opérant).

Tout d’abord, voyons ce qu’en dit wikipedia :

L’apprentissage skinnerien repose sur deux éléments, le renforcement et la punition, pouvant chacun être soit positif soit négatif.

Ces termes doivent être pris dans le sens précis du conditionnement opérant :

* Renforcement : Conséquence d’un comportement qui rend plus probable que le comportement soit reproduit de nouveau.

* Punition : Conséquence d’un comportement qui rend moins probable que le comportement soit reproduit de nouveau.

Voilà qui est très intéressant. Qu’est-ce que ça donne appliqué au dressage canin ?

On parlera de renforcement lorsqu’on veut apprendre à notre chien à faire quelque chose (marcher au pied, rapporter un objet, aller dans son panier, …)

On parlera de punition, lorsqu’on veut apprendre à notre chien à ne pas faire quelque chose (mâchonner un pied de table, voler la nourriture, tirer sur sa laisse, …).

Tant qu’on n’est pas clair avec ça, on ne peut pas progresser. Je prendrai un exemple caractéristique : le chien qui tire sur sa laisse en promenade. Que cherche-t-on à faire ?

– Qu’il ne tire plus sur la laisse ?

– Qu’il marche à notre coté, laisse détendue ?

Cela peut sembler la même chose, mais c’est en fait complètement différent. Dans le premier cas, on veut faire disparaître un comportement (donc –> punition), dans le second cas, on veut lui apprendre une attitude (donc –> renforcement). Je vais vous livrer un petit secret : pour un dressage efficace et robuste, il faut viser les deux objectifs, mais j’y reviendrai dans un autre article.

Bon, tout ça est bien beau, mais comment fait-on pour renforcer ou punir « scientifiquement » ? Retour sur wikipedia et Skinner :

Un renforcement ou une punition peut être soit :

* Positif : Par l’ajout d’un stimulus agissant sur l’organisme.

* Négatif : Par le retrait d’un stimulus agissant sur l’organisme.

Étant à la base un scientifique, je n’interprète pas, je reformule:

Positif, on ajoute quelque chose.

Négatif, on enlève quelque chose.

Je vais même être plus clair pour ceux qui n’auraient pas encore compris où je voulais en venir :

– en éducation positive, on ajoute quelque chose (y compris un stimulus désagréable pour créer une punition),

– en éducation négative, on enlève quelque chose (y compris un stimulus désagréable pour récompenser, par exemple: j’arrête de te donner des coups de marteaux sur la tête, et tu éprouves du bien-être quand ça s’arrête).

Si vous me suivez depuis le début, vous aurez compris qu’un dressage efficace ne doit pas se priver d’un outil éprouvé scientifiquement. Il est complètement idiot de se priver volontairement d’un tel outil , sauf si on ne sait pas comment il fonctionne (l’utiliser à mauvais escient serait pire que de ne pas l’utiliser). Mais dans ce cas, autant le dire franchement.

Tout ça c’est bien, beau, mais comment je me sers de tout ça dans mon dressage me direz vous ? Retour à wikipedia pour la suite :

Ainsi, il existe 4 types de conditionnement opérant :

* Renforcement positif : Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à augmenter suite à l’ajout d’un stimulus appétitif contingent à la réponse Ex: Ajout d’une récompense, félicitations…

* Renforcement négatif : Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à augmenter suite au retrait d’un stimulus aversif contingent à la réponse. Ex: Retrait d’une obligation, d’une douleur…

* Punition positive : Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer suite à l’ajout d’un stimulus aversif ou conséquence aversive contingente au comportement cible. Ex: Ajout d’une obligation, d’une douleur…

* Punition négative : Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer suite au retrait d’un stimulus appétitif. Ex: Retrait d’un privilège, d’un droit…

Pour le dressage canin, je suis plutôt circonspect quant à l’utilisation de la douleur en conditionnement opérant. La douleur est source de stress, et quand on est stressé, on réfléchit mal et on apprend moins bien.

Pour la suite, j’utiliserai les abréviations courantes :

R+ = renforcement positif

R- : renforcement négatif

P+ : punition positive

P- : punition négative

 

Pour ceux qui sont plus « visuels », on représente généralement cela sous forme de tableau :

 

R P
+ R+ = on renforce un comportement en ajoutant quelque chose P+ = on punit en ajoutant quelque chose
R- = on renforce un comportement en enlevant quelque chose P- = on punit en enlevant quelque chose

 

Quelques exemples pratiques pour illustrer :

R+ : chaque fois que mon chien touche l’intérieur de ma main avec sa truffe, je sors une friandise de ma poche et je lui donne.

R- : je monte dans ma voiture et un bip-bip désagréable retentit. Je boucle rapidement ma ceinture pour arrêter le bruit (désolé, je n’ai pas d’exemple canin aussi parlant sous la main).

P+ : Je suis un chiot, et j’insiste pour jouer avec un chien adulte qui n’en a pas envie. L’adulte gronde fortement, je suis impressionné, je le laisse tranquille.

P- : je suis un chien qui fait du mordant sur un boudin ou un tug. Je lâche l’affaire pour regarder qui vient de rentrer sur le terrain d’entraînement. Mon maître, ou l’HA se sauve avec le super boudin/tug que j’aime tant mordre.

Maintenant que vous avez lu tout ça, pensez à votre façon de faire avec votre chien.

Est-ce que je veux faire apparaître ou disparaître un comportement ?

Est-ce que j’ai ajouté ou enlevé quelque chose ?

Ce quelque chose était-il suffisamment attractif/répulsif pour que ce soit efficace ?

Rappel : cette série d’article n’a pas pour vocation de vous apprendre à dresser votre chien, ou à mettre en avant une méthode plutôt qu’une autre. Il veut simplement vous démontrer qu’il y des grands principes qui régissent l’apprentissage, prouvés scientifiquement. Les connaître permet de comprendre ce qu’on fait, et de progresser. C’est une condition nécessaire, mais pas suffisante (sinon nous serions tous des champions !).

Le conditionnement opérant

Le conditionnement opérant,

aussi appelé instrumental, skinnerien, ou de type II, a été étudié par Frederic Skinner dans les années cinquante.

Le 1er dispositif expérimental est le suivant :

– un rat est mis dans une cage, munie d’un levier,

– lorsque le rat actionne le levier, il reçoit de la nourriture.

Que ce passe-t-il lorsqu’un rat est mis dans la cage ? Il déambule, et lorsqu »il touche par hasard le levier, de la nourriture tombe.

Au bout de quelques répétitions de ce hasard, le rat se met à appuyer volontairement sur le levier pour recevoir de la nourriture.

Le 2ème dispositif expérimental est le suivant :

– un rat est mis dans une cage, dont une zone au sol est grillagée,

– ce grillage est reliée à une source électrique de faible tension.

Que ce passe-t-il lorsqu’un rat est mis dans la cage ? Il déambule, et lorsqu’il marche par hasard sur le grillage, il ressent une sensation désagréable.

Au bout de quelques répétitions de ce hasard, le rat va volontairement éviter le grillage.

De ces 2 expériences, de nombreux points fondamentaux de l’apprentissage ont été déduits. Je les détaillerai dans d’autres articles. Ce qu’il est fondamental de comprendre, c’est que l’animal est pleinement acteur de son apprentissage. Il constate que ses actions ont des conséquences (agréables ou désagréables), et il adapte consciemment son comportement en conséquence. Il est acteur de son comportement.

Il faut aussi retenir, que c’est l’environnement qui réagit aux actions de l’animal. L’animal comprends qu’il peut agir sur son environnement, et non pas seulement le subir.

Nos chiens, et nous-même, sommes impliqués quotidiennement dans des conditionnements de type II :

– notre chien se met sur le dos pour une raison quelconque, et nous lui grattons le ventre. Il va se mettre de plus en plus souvent sur le dos pour se faire gratter le ventre,

– nous montons en voiture, et un bip bip désagréable nous accueille. On constate que ce bruit désagréable disparaît lorsque nous bouclons notre ceinture de sécurité. Dorénavant, nous bouclons notre ceinture systématiquement, lorsque nous montons en voiture.

L’application de cette loi d’apprentissage dans notre dressage a permis de perfectionner d’anciennes techniques en les débarrassant du folklore qui les entourait parfois, et en les rendant ainsi plus efficaces. Cela a permis aussi de développer de nouvelles techniques (shaping par exemple).

Cette loi d’apprentissage impliquant la réflexion, on ne l’appliquera pas à des actions simples demandant de la rapidité de type réflexe (assis, couché), mais à des enchaînements plus ou moins complexes demandant de la concentration (marche au pied, rapport d’objet par exemple).

Un autre concept important qui apparaît avec l’application du conditionnement opérant, c’est que le maître fait partie intégrante de l’environnement, il devient le mécanisme qui distribue les récompenses. Le chien ne va pas travailler pour une récompense, mais pour que son maître lui donne une récompense, ce qui est fondamentalement différent. En concours par exemple, le chien ne sera plus distrait par un bruit ou un mouvement périphérique (qui peut être pour lui l’équivalent d’une récompense ou d’une menace potentielle), puisque son objectif est de faire en sorte de faire «déclencher» la sortie de récompense par son maître (comme le rat dans la boite de skinner). Il va rester concentré, il va s’appliquer pour faire des actions dans le but de faire « déclencher » le mécanisme.

Pour cela, il faut accepter, en tant que dresseur, de se faire manipuler par son chien (ou tout au moins lui laisser croire qu’il nous manipule) ! C’est une remise en cause profonde de l’attitude du dresseur sur un terrain d’entraînement.

Attention, il ne faut pas toutefois tomber dans l’excès inverse, et dire que la hiérarchie ne sert à rien, voire n’existe pas. Cela n’a rien à voir avec les lois d’apprentissage. Vous ne serez crédible en tant que « mécanisme distributeur de récompense » que si vous êtes vous-même une récompense (je vous laisse réfléchir la dessus, je décline toute responsabilité de l’application de cette phrase aux relations entre humains …). Et quelle meilleure récompense pour un chien, animal de meute, que d’avoir un leader qui s’occupe de tout, et en particulier de son confort quotidien ?

 

Le conditionnement classique

Le conditionnement classique,

parfois appelé  pavlovien , ou de type 1, a été étudié par Ivan Pavlov au début du 20ème siècle.

Son expérience est très simple :

– on présente de la nourriture à un chien, il se met à saliver,

– on fait tinter une clochette, il ne salive pas.

Suite à cela, pendant plusieurs jours, on fait tinter la clochette juste avant de lui donner sa nourriture. Au bout de quelques temps, on fait tinter la clochette sans présenter de nourriture, et le chien salive. On a créé un acte réflexe. Un stimulus qui n’avait aucun sens pour le chien au début de l’expérience (la clochette), est devenu le stimulus qui va déclencher un comportement. Ce qu’il est important de noter, c’est que tout se fait « à l’insu » du chien. Il n’a aucune conscience du fait que la clochette va déclencher la salivation.

Un peu de vocabulaire :

– la clochette est appelée « stimulus neutre » en début d’expérience (elle n’a aucune signification particulière pour le chien), et devient le « stimulus conditionnel » à la fin de l’expérience (elle a acquis une signification),

– la nourriture est le « stimulus inconditionnel », elle déclenche la salivation « à tous les coups », sans condition,

– la salivation est la « réponse inconditionnelle » en début d’expérience (associée uniquement à la nourriture), et devient la « réponse conditionnelle » (associé à la clochette ).

Ce type de conditionnement fonctionne formidablement bien avec nos chiens. Nous le vivons tous les jours. Par exemple, on prend la laisse de son chien pour l’emmener en promenade. Au bout de quelques temps, le simple fait de prendre la laisse déclenche chez le chien la même joie que d’être en promenade.

Il y a une chose fondamentale à savoir pour mettre en place ce type de conditionnement : le « stimulus neutre » (la clochette) doit être donné environ une seconde avant le « stimulus inconditionnel » (la nourriture).

Pour l’éducation de nos chiens, on peut par exemple l’utiliser pour apprendre le « assis ». Au début, on pousse les fesses du chien vers le bas, et on lui lève la tête. Mécaniquement, il va s’asseoir, et on récompense. Au bout d’un certain temps, il suffit d’effleurer les fesses et le dessous de la tête pour que le chien s’assoit.

Vous me direz, ce n’est pas très utile en concours. Alors réfléchissez à ceci. Votre chien est en position de base, c’est-à-dire assis à votre gauche:

– lorsque vous démarrez et que vous voulez qu’il vous suive, vous donnez un ordre vocal, mais surtout, vous partez avec la jambe gauche en 1er,

– lorsque vous démarrez et que  vous voulez qu’il reste en place, vous donnez un ordre vocal, mais surtout, vous partez avec la jambe droite en 1er.

Au bout d’un moment, vous ne donnez plus aucun ordre vocal (vous le faites disparaître progressivement), et votre chien réagira en fonction de la 1ère jambe que vous bougez Vous avez conditionné votre chien sur votre jambe.Inutile de faire, comme je le vois souvent, de longues phrases ou des ordres à rallonge (pas bouger, reste, …).

Ce conditionnement est très puissant, il n’est pas à négliger dans notre boite à outils de compétiteurs. Il est utile, voire indispensable, pour des ordres simples qui doivent être exécutés rapidement (assis, couché, stop, ..) car ce conditionnement agit quasiment comme un acte réflexe, ne fait pas appel à la réflexion.

Un dernier exemple pour alimenter votre réflexion :

– vous mettez un collier « à pointes » à votre chien

– vous donnez une petite secousse sur la laisse (c’est désagréable mais pas douloureux !), et vous donnez une friandise très appétissante juste après.

– Après de nombreuses répétitions, vous verrez votre chien être très content d’être « secoué » avec un collier à pointes, car il aura associé cela à la récompense ….

De l’interet des lois d’apprentissage

Lorsque j’ai commencé l’éducation, puis la compétition, j’ai écouté les conseils des moniteurs, ou de compétiteurs expérimentés.
J’appliquai leur conseils et leurs astuces pour réaliser un exercice, ou résoudre un problème. Des fois ça marchait, souvent ça ne marchait pas, ou ça marchait mais avec des dommages collatéraux.
Je testai aussi des méthodes vues à droite ou à gauche, lors des entraînements précédents les concours par exemple.
Globalement ça marchait, mais le « rendement » était médiocre.
Certaines astuces semblaient évidentes et ne donnaient aucun résultat.
D’autres me paraissaient farfelues (mais je les testaient quand même, ayant toute confiance en la personne qui me la conseillait), et fonctionnaient à merveille.
Au fur et à mesure que mon bagage de « trucs et astuces » grossissait, je commençais à faire des liens entre elles pour comprendre la logique qui faisait que « ça marchait ».
Mais mes connaissances théoriques se limitaient l’expérience de Pavlov, et encore, juste les grandes lignes.
Un jour, je me suis mis plus sérieusement à chercher à comprendre. Et j’ai découvert que des scientifiques avaient fait des tas d’expériences, et en avait tiré des grand principes sur les lois de l’apprentissage. Et plus fort encore, certains grand dresseurs avaient étudié ces lois, et les avaient appliquées au dressage canin avec succès.
Je me suis alors mis a regarder ça de prés, et j’ai compris pourquoi les astuces des autres fonctionnaient, … ou pas !
C’est tout simplement que n’ayant pas compris sur quel principe d’apprentissage telle ou telle astuce était basée, je ne la mettait pas en œuvre correctement. C’est parfois un problème de timing, d’attitude, d’environnement, qui fait toute la différence entre « ça marche », et « ça marche pas ».

Depuis que j’ai pris conscience de tout ça, mon dressage est beaucoup plus efficace, mais aussi, je suis plus à même de conseiller les autres.

Lorsque j’ai voulu faire partager à d’autres personnes mes lectures passionnantes sur toutes ces lois d’apprentissage, je me suis heurté à une nouvelle difficulté : toutes ces publications et vidéos sur internet sont en langue anglaise. Et beaucoup de personnes ont un peu, voire beaucoup oublié leur cours d’anglais de l’école (pour ceux qui en ont eu).
Je vais donc essayer par quelques articles sur ce blog d’expliquer les grands principes à connaître, avec mes mots à moi, et avec des exemples pratiques qui parlent à tout le monde.
N’étant absolument pas un expert dans le domaine, je vais juste faire des traduction/adaptation/synthèse de pages en anglais qui me semblent intéressantes.
Bonnes lectures !

Le pari du débutant

Je rencontre fréquemment des compétiteurs qui galèrent sur des exercices, tout simplement parce qu’ils les ont appris à leur chien de façon anarchique, à la va comme je te pousse, « ça suffira bien pour passer un brevet ou un certificat ». Et ils se retrouvent bloqués pour l’accession au niveau supérieur. Alors que s’ils avaient dés le début travaillé sérieusement, ils pourraient progresser plus sereinement.

Je voudrais donc adresser un message à toutes les personnes qui débutent l’éducation de leurs chiens sans particulièrement avoir envie de faire de la compétition ; je leur rappellerais le pari de Pascal, en l’appliquant à l’éducation de leur chien :

Vous ne ferez jamais de compétition Vous vous orientez un jour vers la compétition
Vous éduquer votre chien de façon approximative Vous avez un chien qui obéit à peu prés, mais ça pourrais être mieux, surtout en cas d’urgence Vous êtes dans le cas cité en introduction, bref vous êtes dans la  m…, au risque de vous décourager et de tout laisser tomber
Vous éduquez votre chien avec méthode et sérieux Vous avez un chien bien éduqué, agréable à vivre, qui vous obéira même en cas d’urgence C’est tout bénef, vous avez tout les atouts pour bien faire, à vous de les faire fructifier

 

Alors, vous avez fait votre choix ?

Merci à Martine pour m’avoir inspiré ce billet. 🙂