La punition n’est pas un tabou

J’aborderai dans cet article la notion de punition et de renforcement, tel que définis scientifiquement par Skinner (voir article sur le conditionnement opérant).

Tout d’abord, voyons ce qu’en dit wikipedia :

L’apprentissage skinnerien repose sur deux éléments, le renforcement et la punition, pouvant chacun être soit positif soit négatif.

Ces termes doivent être pris dans le sens précis du conditionnement opérant :

* Renforcement : Conséquence d’un comportement qui rend plus probable que le comportement soit reproduit de nouveau.

* Punition : Conséquence d’un comportement qui rend moins probable que le comportement soit reproduit de nouveau.

Voilà qui est très intéressant. Qu’est-ce que ça donne appliqué au dressage canin ?

On parlera de renforcement lorsqu’on veut apprendre à notre chien à faire quelque chose (marcher au pied, rapporter un objet, aller dans son panier, …)

On parlera de punition, lorsqu’on veut apprendre à notre chien à ne pas faire quelque chose (mâchonner un pied de table, voler la nourriture, tirer sur sa laisse, …).

Tant qu’on n’est pas clair avec ça, on ne peut pas progresser. Je prendrai un exemple caractéristique : le chien qui tire sur sa laisse en promenade. Que cherche-t-on à faire ?

– Qu’il ne tire plus sur la laisse ?

– Qu’il marche à notre coté, laisse détendue ?

Cela peut sembler la même chose, mais c’est en fait complètement différent. Dans le premier cas, on veut faire disparaître un comportement (donc –> punition), dans le second cas, on veut lui apprendre une attitude (donc –> renforcement). Je vais vous livrer un petit secret : pour un dressage efficace et robuste, il faut viser les deux objectifs, mais j’y reviendrai dans un autre article.

Bon, tout ça est bien beau, mais comment fait-on pour renforcer ou punir « scientifiquement » ? Retour sur wikipedia et Skinner :

Un renforcement ou une punition peut être soit :

* Positif : Par l’ajout d’un stimulus agissant sur l’organisme.

* Négatif : Par le retrait d’un stimulus agissant sur l’organisme.

Étant à la base un scientifique, je n’interprète pas, je reformule:

Positif, on ajoute quelque chose.

Négatif, on enlève quelque chose.

Je vais même être plus clair pour ceux qui n’auraient pas encore compris où je voulais en venir :

– en éducation positive, on ajoute quelque chose (y compris un stimulus désagréable pour créer une punition),

– en éducation négative, on enlève quelque chose (y compris un stimulus désagréable pour récompenser, par exemple: j’arrête de te donner des coups de marteaux sur la tête, et tu éprouves du bien-être quand ça s’arrête).

Si vous me suivez depuis le début, vous aurez compris qu’un dressage efficace ne doit pas se priver d’un outil éprouvé scientifiquement. Il est complètement idiot de se priver volontairement d’un tel outil , sauf si on ne sait pas comment il fonctionne (l’utiliser à mauvais escient serait pire que de ne pas l’utiliser). Mais dans ce cas, autant le dire franchement.

Tout ça c’est bien, beau, mais comment je me sers de tout ça dans mon dressage me direz vous ? Retour à wikipedia pour la suite :

Ainsi, il existe 4 types de conditionnement opérant :

* Renforcement positif : Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à augmenter suite à l’ajout d’un stimulus appétitif contingent à la réponse Ex: Ajout d’une récompense, félicitations…

* Renforcement négatif : Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à augmenter suite au retrait d’un stimulus aversif contingent à la réponse. Ex: Retrait d’une obligation, d’une douleur…

* Punition positive : Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer suite à l’ajout d’un stimulus aversif ou conséquence aversive contingente au comportement cible. Ex: Ajout d’une obligation, d’une douleur…

* Punition négative : Procédure par laquelle la probabilité de fréquence d’apparition d’un comportement tend à diminuer suite au retrait d’un stimulus appétitif. Ex: Retrait d’un privilège, d’un droit…

Pour le dressage canin, je suis plutôt circonspect quant à l’utilisation de la douleur en conditionnement opérant. La douleur est source de stress, et quand on est stressé, on réfléchit mal et on apprend moins bien.

Pour la suite, j’utiliserai les abréviations courantes :

R+ = renforcement positif

R- : renforcement négatif

P+ : punition positive

P- : punition négative

 

Pour ceux qui sont plus « visuels », on représente généralement cela sous forme de tableau :

 

R P
+ R+ = on renforce un comportement en ajoutant quelque chose P+ = on punit en ajoutant quelque chose
R- = on renforce un comportement en enlevant quelque chose P- = on punit en enlevant quelque chose

 

Quelques exemples pratiques pour illustrer :

R+ : chaque fois que mon chien touche l’intérieur de ma main avec sa truffe, je sors une friandise de ma poche et je lui donne.

R- : je monte dans ma voiture et un bip-bip désagréable retentit. Je boucle rapidement ma ceinture pour arrêter le bruit (désolé, je n’ai pas d’exemple canin aussi parlant sous la main).

P+ : Je suis un chiot, et j’insiste pour jouer avec un chien adulte qui n’en a pas envie. L’adulte gronde fortement, je suis impressionné, je le laisse tranquille.

P- : je suis un chien qui fait du mordant sur un boudin ou un tug. Je lâche l’affaire pour regarder qui vient de rentrer sur le terrain d’entraînement. Mon maître, ou l’HA se sauve avec le super boudin/tug que j’aime tant mordre.

Maintenant que vous avez lu tout ça, pensez à votre façon de faire avec votre chien.

Est-ce que je veux faire apparaître ou disparaître un comportement ?

Est-ce que j’ai ajouté ou enlevé quelque chose ?

Ce quelque chose était-il suffisamment attractif/répulsif pour que ce soit efficace ?

Rappel : cette série d’article n’a pas pour vocation de vous apprendre à dresser votre chien, ou à mettre en avant une méthode plutôt qu’une autre. Il veut simplement vous démontrer qu’il y des grands principes qui régissent l’apprentissage, prouvés scientifiquement. Les connaître permet de comprendre ce qu’on fait, et de progresser. C’est une condition nécessaire, mais pas suffisante (sinon nous serions tous des champions !).

CC BY-NC-ND 4.0 La punition n’est pas un tabou par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *