L’empoisonnement du commandement

Traduction de http://www.clickertraining.com/node/164

Pourquoi clic et correction ne se mélangent pas.

Les analystes comportementaux  se réfèrent à un stimulus appris qui déclenche un comportement opérant en tant que «stimulus discriminatif." Les comportementalistes ne font pas la différence , autant que je le sache, entre un stimulus discriminatif qui a été acquis par renforcement positif, et celui qui a été acquis par renforcement négatif.

En pratique, cependant, il existe une différence significative. Dans le  clicker training (conditionnement opérant avec signal  marqueur) le comportement est d'abord développé en tant que comportement librement proposé dans l'attente d'un renforcement positif. Le stimulus discriminatif est ensuite associé avec celui-ci pour fonctionner comme un indicateur d'une opportunité de renforcement. Chaque stimulus discriminatif signale la possibilité de gagner un renforcement  pour un comportement ou une suite de comportements particuliers.

Ce stimulus discriminatif utilisé toujours  positivement "ouvre la porte" à un renforcement positif. Si le comportement ne se produit pas, la seule conséquence est l'absence de renforcement. Lorsque le comportement se produit, le renforcement est garanti. (Nous appelons parfois ce genre de signal : un commandement ; pour le différencier du terme traditionnel : un ordre.)

Dès que l'animal comprend ce que signifie un commandement donné, celui ci, stimulus discriminatif positif, devient lui aussi un renforçateur positif conditionné , comme le clic. Grâce à cela, un commandement peut être utilisé comme un renforcateur pour un comportement qui se produit lorsque le commandement est donné. On peut par exemple utiliser le  commandement positif bien établi pour un comportement afin de façonner un autre comportement, ou de renforcer le comportement précédent dans une chaîne. Le signal peut également être utilisé comme signal de marquage, comme si c'était un simple clic, afin de marquer plus particulièrement les bons aspects d'un autre comportement. Il semble aussi probable que la réponse émotionnelle souhaitée, que nous savons être associée avec le clic, accompagne également la présentation de ces stimuli conditionnés positivement.

Un comportement qui a été entraîné par la correction peut également être associé à un stimulus discriminant qui indique quand le comportement spécifique va se produire. Cependant, ces discriminateurs, ou ces commandements, peuvent ou non conduire à un renforcement positif. Si l'animal ne parvient pas à effectuer le comportement, ou l'effectue de manière incorrecte, le stimulus peut conduire à l'inconfort (habituellement appelé «correction»). Le stimulus discriminatif négatif, habituellement appelé un commandement, est maintenant un renforçateur négatif conditionné, signalant la possibilité d'échapper à la punition .

Même si le comportement a été formé entièrement avec le renforcement positif, si l'on clique maintenant pour un comportement correct après un discriminateur (un repère, une commande ou un signal), mais qu'on donne aussi une correction aversive (coup sur la laisse, réprimande verbale, etc.) pour un comportement incorrect après le même stimulus, le stimulus perd immédiatement sa valeur de renforcement positif. Il est, au mieux, ambigu en termes de renforcement. Il n'est pas un clic. Il ne déclenche plus automatiquement les émotions positives associées aux renforcements positifs conditionnés. Il ne peut plus être utilisé à l'intérieur d'une chaîne afin de renforcer le comportement précédent.

Même si  les renforçateurs primaires, comme l'approbation, les jouets et les friandises, sont fournis en abondance pendant ou après l'entraînement ou la performance, les stimuli discriminants eux-mêmes, les commandements, sont maintenant des menaces autant que des promesses. Le comportement tend à se déliter, curieusement, à la fois avant et après ces stimuli ambigus:
- avant, parce que le comportement précédent peut commencer à s'éteindre en raison du manque de renforcement positif qui est maintenant un stimulus aversif,
- après , parce que le comportement qui pourrait être puni tend à être évité.
 Le changement devient visible dans l'attitude de l'apprenant, qui passe de l'empressement attentif à la réticence, souvent avec des manifestations visibles de stress. Même si la réponse positive à un stimulus discriminatoire donné est toujours suivie par la récompense, si l'échec est maintenant suivie par la punition, vous avez créé ce stimulus discriminant ambigu en terme de résultat prévisible. 
Il n'est plus «sûr». Vous avez empoisonné votre commandement.

Karen Pryor

CC BY-NC-ND 4.0 L’empoisonnement du commandement par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *