Optimisation du renforcement

Optimisation du renforcement

Résumé

La carrière d’un chien de sport est courte, et le nombre de choses à lui apprendre est élevé. Il est donc indispensable d’aller au plus efficace. J’ai fait des recherches bibliographiques sur les expériences menées par les scientifiques afin de découvrir quelles étaient les conditions optimales pour renforcer un comportement. Les grands dresseurs le savent d’instinct (mais pas toujours, et surtout ont du mal à l’expliquer), l’intérêt de ces expériences est de chiffrer précisément quel est l’impact de tel ou tel paramètre.  Dans cet article, je vais faire une analyse de ce que j’ai trouvé, et comment l’appliquer à une séance d’entraînement afin quelle soit la plus efficace possible..

Conclusion et impact sur notre dressage

Une fois n’est pas coutume, je mets directement la conclusion de mes recherches. Je vous ferai gré de toute l’analyse des articles qui m’ont amené à cette conclusion.

Je met en fin de ce billet les références bibliographiques et publications scientifiques que j’ai analysées.

Pour qu’un entraînement soit le plus efficace possible, il faut réunir les conditions suivantes :

  • Il faut assurer la contingence entre le comportement à renforcer et le comportement renforçateur (proximité temporelle, utilisation d’un marqueur sonore ou d’un clicker) afin que le chien fasse clairement le lien entre les deux comportements (celui à renforcer, et le renforçant).
  • Il faut que le chien ai une envie « naturelle » très importante de réaliser le comportement renforçateur (chien capable de jouer à la balle de façon intense et longtemps, chien gourmand ..). Sans cela, le rapport coût/ bénéfice ne sera pas suffisamment favorable. Cela se travaille en dehors de tout entraînement (jeux pour créer la passion de la balle)
  • On rajoute un phénomène qui va augmenter encore cette envie de réaliser le comportement renforçateur juste avant l’entraînement (frustration sur la balle avec une longe, aboiement sur la balle, on affame le chien …)
  • Durant l’entraînement, on donne accès à ce comportement récompensant avec parcimonie (on crée une restriction). En compensation, le chien va fortement augmenter le comportement à récompenser (c’est bien le but recherché).
  • On fait attention à ne pas trop réduire cet accès au comportement récompensant afin d’éviter l’apparition de comportements parasites (aboiements, chien qui tourne sur lui-même, chien qui broute l’herbe). Attention aussi à ce qu’il ne trouve pas de lui-même une autre activité récompensante pour compenser la réduction de la 1ère (aller voler la balle du copain ..)…
  • L’arrivée de la récompense doit apparaître au bout d’un temps aléatoire (créer de l’espoir, mais attention à la création de superstitions) afin d’augmenter la tenue dans le temps du renforcement (résistance à l’extinction).
  • On arrête l’entraînement avant que l’intérêt pour le comportement récompensant ne décroisse (phénomène de satiété)

Une séquence d’apprentissage peut se résumer en 4 phases :

  1. – Augmentation de la valeur de comportement récompensant (exemple : frustration sur la balle)
  2. – Signal vocal (assis, au pied ..)
  3. – Réaction du chien (comportement souhaité)
  4. – Accès bref à la récompense

Si on respecte ces conditions, l’apprentissage sera rapide, et durable dans le temps (résistance à l’extinction).

Références

The Behavioral Regulation Approach

Schedules and Theories of Reinforcement

The Role of the Establishing Operation in Performance Management: Changing the Value of Consequences

The Premack Principle, Response Deprivation, and Establishing Operations

Operant Conditioning Theories of Reinforcement

RESPONSE DEPRIVATION : AN EMPIRICAL APPROACH TO INSTRUMENTAL PERFORMANCE

From Pavlov to Skinner Box

CC BY-NC-ND 4.0 Optimisation du renforcement par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *