Optimisation du renforcement
Résumé
La carrière d’un chien de sport est courte, et le nombre de choses à lui apprendre est élevé. Il est donc indispensable d’aller au plus efficace. J’ai fait des recherches bibliographiques sur les expériences menées par les scientifiques afin de découvrir quelles étaient les conditions optimales pour renforcer un comportement. Les grands dresseurs le savent d’instinct (mais pas toujours, et surtout ont du mal à l’expliquer), l’intérêt de ces expériences est de chiffrer précisément quel est l’impact de tel ou tel paramètre. Dans cet article, je vais faire une analyse de ce que j’ai trouvé, et comment l’appliquer à une séance d’entraînement afin quelle soit la plus efficace possible..
Conclusion et impact sur notre dressage
Une fois n’est pas coutume, je mets directement la conclusion de mes recherches. Je vous ferai gré de toute l’analyse des articles qui m’ont amené à cette conclusion.
Je met en fin de ce billet les références bibliographiques et publications scientifiques que j’ai analysées.
Pour qu’un entraînement soit le plus efficace possible, il faut réunir les conditions suivantes :
- Il faut assurer la contingence entre le comportement à renforcer et le comportement renforçateur (proximité temporelle, utilisation d’un marqueur sonore ou d’un clicker) afin que le chien fasse clairement le lien entre les deux comportements (celui à renforcer, et le renforçant).
- Il faut que le chien ai une envie « naturelle » très importante de réaliser le comportement renforçateur (chien capable de jouer à la balle de façon intense et longtemps, chien gourmand ..). Sans cela, le rapport coût/ bénéfice ne sera pas suffisamment favorable. Cela se travaille en dehors de tout entraînement (jeux pour créer la passion de la balle)
- On rajoute un phénomène qui va augmenter encore cette envie de réaliser le comportement renforçateur juste avant l’entraînement (frustration sur la balle avec une longe, aboiement sur la balle, on affame le chien …)
- Durant l’entraînement, on donne accès à ce comportement récompensant avec parcimonie (on crée une restriction). En compensation, le chien va fortement augmenter le comportement à récompenser (c’est bien le but recherché).
- On fait attention à ne pas trop réduire cet accès au comportement récompensant afin d’éviter l’apparition de comportements parasites (aboiements, chien qui tourne sur lui-même, chien qui broute l’herbe). Attention aussi à ce qu’il ne trouve pas de lui-même une autre activité récompensante pour compenser la réduction de la 1ère (aller voler la balle du copain ..)…
- L’arrivée de la récompense doit apparaître au bout d’un temps aléatoire (créer de l’espoir, mais attention à la création de superstitions) afin d’augmenter la tenue dans le temps du renforcement (résistance à l’extinction).
- On arrête l’entraînement avant que l’intérêt pour le comportement récompensant ne décroisse (phénomène de satiété)
Une séquence d’apprentissage peut se résumer en 4 phases :
- – Augmentation de la valeur de comportement récompensant (exemple : frustration sur la balle)
- – Signal vocal (assis, au pied ..)
- – Réaction du chien (comportement souhaité)
- – Accès bref à la récompense
Si on respecte ces conditions, l’apprentissage sera rapide, et durable dans le temps (résistance à l’extinction).
Références
The Behavioral Regulation Approach
Schedules and Theories of Reinforcement
The Role of the Establishing Operation in Performance Management: Changing the Value of Consequences
The Premack Principle, Response Deprivation, and Establishing Operations
Operant Conditioning Theories of Reinforcement
RESPONSE DEPRIVATION : AN EMPIRICAL APPROACH TO INSTRUMENTAL PERFORMANCE
Optimisation du renforcement par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .