Dopamine: utilisation conjointe de la récompense et de la punition

Dopamine: utilisation conjointe de la récompense et de la punition

Rappel des épisodes précédents

Nous avons vu dans les deux précédents articles le rôle que jouait la dopamine dans la recherche de la récompense. Et dans le cas de la punition, elle active le centre du plaisir sans stimuler la motricité.
Dans cette partie, nous allons étudier l’utilisation conjointe de renforçateurs (récompenses) et de punition (stimulus aversif).
Commençons par un petit rappel de vocabulaire.

  • Un stimulus dont l’ajout va avoir tendance à renforcer un comportement sera appelé un renforçateur positif (R+).
  • Un stimulus dont le retrait va avoir tendance à renforcer un comportement sera appelé un renforçateur négatif (R-)
  • Un stimulus dont l’ajout va avoir tendance à réduire, voire faire disparaître, un comportement sera appelé une punition (P+)
  • Un conditionnement, c’est lorsqu’on associe un stimulus neutre (une lampe, une sonnerie) avec un renforçateur ou une punition. Le stimulus, neutre à l’origine, devient alors lui-même renforçateur ou punition.

De nombreuses expériences ont été faites sur les renforçateurs et sur les punitions utilisés séparément.
Je cherchais depuis quelques temps déjà un article scientifique  qui analyserait l’utilisation simultanée de renforçateur et de punition. La troisième partie de l’article traite justement de cela, je vais en faire un résumé, en ajoutant quelques exemples canins.

L’approche classique et l’état de l’art

Les études sur ce sujet portent généralement sur l’utilisation punitions et de récompenses utilisées simultanément. Ces études arrivent à la conclusion que les 2 stimulus s’annulent mutuellement, ou à minima, un des 2 perd de son influence. Et c’est quasiment toujours la punition qui prend le dessus sur le renforçateur, voire pire, sa conséquence s’en trouve augmentée.
Pas très encourageant pour une utilisation en dressage canin.

Mais d’autres études basées sur le pré-conditionnement ont montré que renforçateur et punition pouvaient interagir de façon efficaces. Ces études utilisent 4 « motivateurs »:

  • La prédiction de la récompenses (espoir)
  • La prédiction de la punition (peur)
  • L’omission de la récompense espérée (frustration)
  • L’omission de la punition (soulagement)

Certaines associations se renforcent, d’autres s’inhibent (voir graphique suivant)

image-association

Les pointillés indiquent les renforcements et les traits pleins les inhibitions.

Certaines inhibitions sont simples à comprendre. Par exemple, si le chien a systématiquement une récompense, il ne sera pas frustré par l’absence de l’arrivée de la récompense. Au contraire, cela sera vécu comme une punition (retrait d’une récompense qui est estimée comme étant due).

Les 2 combinaisons qui se renforcent mutuellement sont :

  • Espoir / soulagement
  • Peur / frustration

Arrêtons-nous un instant sur cela, et prenons un exemple canin.
Pour empêcher un chien de courir après les chats, on le punit à chaque fois qu’il démarre. Le chien étant têtu, et aimant particulièrement courir après les chats, il va sans arrêt recommencer, même en sachant qu’il sera puni systématiquement. Sa peur de la punition renforce sa frustration de ne pas courir après le chat, ce qui le motive encore plus à le faire.

Mais un jour, on se laisse surprendre, et il n’a pas la punition attendue (soulagement). Cela va renforcer son espoir de récompense (attraper le chat) , et donc renforcer son envie de courir après les chats …
Dans tous les cas, le maître est perdant.

Prenons un autre exemple : le chien connaît parfaitement un exercice, et sait qu’il débouche parfois sur une récompense (espoir). Mais un jour, il se laisse distraire, et sait qu’il risque d’être parfois puni pour cela (peur). Mais la punition n’arrive pas (soulagement), et il se remet alors sur l’exercice avec encore plus de motivation. Le soulagement a renforcé son espoir …. Le jour où vous vivez cette situation, je peux vous assurer que vous êtes fier de votre toutou, et vous pouvez être fier de votre dressage …..

 

Fin de cette partie sur l’état de l’art. La prochaine partie portera sur l’expérience réalisée par les auteurs.

http://edoc.bibliothek.uni-halle.de/servlets/MCRFileNodeServlet/HALCoRe_derivate_00004321/Dissertation_Anton_fina__copy_for_the_library.pdf

 

CC BY-NC-ND 4.0 Dopamine: utilisation conjointe de la récompense et de la punition par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *