entraînement en soirée

Entraînement en soirée après le boulot, juste pour se détendre et préparer le brevet d’obéissance.

Click to Watch Video

 

Récompense ou renforçateur

Récompense ou renforçateur

Dans mes articles, j’utilise le mot renforçateur et non le mot récompense. Ce n’est pas pour me rendre intéressant ou montrer que j’ai du vocabulaire, mais tout simplement parce que ce n’est pas la même chose. Voyons cela plus en détails

La récompense

C’est quelque chose que l’on donne à son chien, qu’il trouve agréable. La récompenses est généralement donnée après un comportement qui nous convient. Elle fait plaisir au chien, mais surtout elle fait plaisir au maître. On ne s’intéresse pas à son impact sur le comportement

Le renforçateur

C’est quelque chose qui augmente la probabilité d’apparition d’un comportement, de façon mesurable. Cela peut être un objet, de la nourriture, un autre comportement, un environnement social, le milieu naturel .. Il n’y a pas de limite à la forme qu’il peut prendre, seule sa conséquence sur la probabilité d’apparition du comportement compte.

Conclusion

Pour une fois,Je vous laisse la faire vous même, ce ne devrait pas être compliqué.

 

Le renforcement par le milieu naturel

Maintenir un comportement en l’absence de jouet ou de nourriture

Dans les articles précédents, j’ai expliqué ce que mes recherches m’ont permis de comprendre de l’utilisation pratique du renforcement d’un comportement.
La conclusion est qu’il faut utiliser un renforçateur puissant (c’est-à-dire à forte valeur), pour obtenir un renforcement optimum.

Mais une fois que le comportement voulu est obtenu, il faut le maintenir dans le temps, en tout lieu, sans avoir à utiliser de renforçateur artificiel (balle, récompense alimentaire ..). Cela est d’autant plus important pour un compétiteur, que les récompenses artificielles sont interdites en concours.
J’ai aussi souvent la question en cours d’éducation, les maîtres ne souhaitant pas avoir en permanence une balle ou de la nourriture pour que leur chien continue à obéir, ce qui est tout à fait compréhensible.
J’ai donc poursuivi mon analyses des articles scientifiques afin de comprendre comment le maintient du renforcement fonctionnait en l’absence de jouet ou de nourriture. J’ai analysé des articles expliquant comment maintenir un comportement en utilisant «des renforçateurs naturels». J’ai aussi étudié une application puissante de ce type de renforçateur que les chercheurs appellent «le piège comportemental».

Le renforcement par l’environnement naturel

Comme son nom l’indique, on se sert de l’environnement naturel, et non d’artifices (jouet, nourriture) pour récompenser le comportement. L’exemple le plus couramment utilisé, est celui d’une salle de classe, avec les élèves qui réagissent spontanément au bon comportement d’un de leur copain ; celui-ci va continuer le bon comportement afin d’être apprécié par ses copains. On pourrait aussi citer le cas du sportif, ou de l’acteur, applaudi spontanément par les spectateurs.

Les chercheurs ont identifiés cinq spécificités du renforcement par l’environnement naturel :

La généralisation : le comportement va se produire dans diverses circonstances ou environnements. C’est ce que nous faisons en entraînant sur divers terrains. Le renforçateur faisant partie de l’environnement, il est donc potentiellement présent partout.

Le maintien dans le temps : le comportement va se maintenir, même en l’absence du renforçateur utilisé pendant la phase d’apprentissage, puisque le renforçateur est dans l’environnement, donc toujours disponible.

Le renforcement par les pairs : c’est lorsque ce sont «les collègues», qui par leur propre comportement, montrent leur satisfaction, ce qui encourage l’élève à reproduire le bon comportement. Il ne faut donc pas hésiter à montrer notre satisfaction discrètement (et dans le respect du règlement) lorsque notre chien réalise correctement un exercice en concours. Évidemment, il faut avoir mis en place ce code au préalable lors des entraînements.

L’analyse fonctionnelle du renforcement social : c’est lorsque tout un groupe de personnes réagit positivement à un comportement d’un individu. Lors de nos entraînements, tout le monde doit montrer sa satisfaction suite au bon comportement de notre élève canin, y compris le moniteur ! Et en concours, les supporters doivent aussi exprimer leur satisfaction ! A condition, là aussi, que cela soit compris par le chien, donc montré en entraînement.

Réplication systématique : c’est lorsque plusieurs facteurs de l’environnement interviennent, et qu’il est difficile de dire si c’est plus l’un que l’autre qui agit comme renforçateur. Pour nos chiens cela s’obtient en faisant des entraînements ou tout le monde est dans la joie, est fier du travail réalisé. C’est un état d’esprit collectif à avoir lors de nos entraînements. Ils doivent se faire dans la joie et la bonne humeur afin que tous les bons comportements soient valorisés par l’environnement du chien.

Le piège comportemental

Définition

On aborde là une utilisation puissante du renforçateur naturel.
On parle de piège comportemental lorsque l’action elle-même engendre le renforçateur, et donc s’auto-renforce.
Pourquoi un piège ? Parce que une fois que le chien (ou tout autre animal, y compris humain) rentre dans ce comportement, il se trouve « piégé », il va continuer indéfiniment à réaliser le comportement en question puisqu’il s’auto-renforce.
Pour donner un exemple concret couramment cité : lorsqu’on sourit à quelqu’un, il sourit en retour, et semble plus heureux, ce qui nous rends aussi plus heureux en retour. On aura donc tendance à sourire plus souvent.
Cela concerne aussi les substance addictives comme le chocolat, ou les drogues.
Ce piège peut donc être « vicieux » (on s’enfonce dans une addiction néfaste), ou vertueux (le bonheur appelle le bonheur …).

Cela ne vous rappelle-t-il pas les chiens que l’on rend « ball-addict » ?

De façon plus précise, on parlera de piège comportemental lorsque les conditions suivantes seront réunies (source : wikipedia, adapté à notre activité canine) :

– Le chien est attiré irrésistiblement vers le comportement par des renforçateurs qui le leurrent vers le piège

– Il suffit d’un comportement déjà connu, requérant peu d’effort de la part du chien, pour tomber dans le piège

– Un ensemble de renforçateur interdépendants dans le piège motive le chien à acquérir, étendre, ou maintenir le comportement

– Le renforcement reste efficace sur une très longue durée, car le chien n’arrive pas à satiété

Mise en place d’un piège

Il y a quelques conditions pour que ça fonctionne.

– Le comportement doit être au préalable appris et généralisé

– Il faut trouver un leurre suffisamment puissant pour attirer le chien dans le piège

– Il faut très peu d’efforts au chien pour tomber dans le piège, mettez-lui le piège sous le nez

– La compétence à renforcer doit être simple à renforcer par l’environnement naturel

– La compétence doit pouvoir être mise en œuvre très souvent

– Commencer progressivement, puis augmenter de plus en plus la généralisation.

Je prendrai comme exemple pratique dans le dressage canin, une compétence très utile, la pugnacité. Avoir un chien «ouvert d’esprit» comme je le préconise tout au long de ce blog ne sera pas suffisant. Il faut qu’il ait suffisamment de pugnacité pour se battre et passer les difficultés.

Cette compétence est très importante dans de nombreux exercices, comme par exemple en pistage, le chien ne devant pas se décourager face à la première difficulté rencontrée. Cette compétence est une excellente candidate au piège, car elle réuni tous les critères.

On va travailler cette compétence sur la recherche d’un objet qu’on aura touché (recherche et identification). Cela sera ensuite facile à étendre sur n’importe quel objet naturel (un fruit, une branche …).
Reprenons les choses dans l’ordre :

– On utilisera au début un jouet dont le chien est « frappadingue » (on y revient toujours …). C’est l’action de découvrir l’objet qui va devenir le renforçateur, et non une balle jetée par le maître suite à la découverte. La recherche va devenir sa drogue.

– Le chien devra déjà connaître l’ordre d’aller chercher son jouet (ou sa gamelle de nourriture), à vue. On le félicite vocalement dès qu’il le trouve, on lui montre qu’on est fier de lui

– On généralisera cette compétence dans des endroits variés de la maison, puis lors de promenades

– On complique progressivement la tâche en cachant l’objet de plus en plus. Le chien devra faire un effort de plus en plus grand, y passer de plus en plus de temps avant de le découvrir (mais il découvre toujours, au besoin on réduit la difficulté discrètement si on le voit en difficulté, on évite l’échec), et on est toujours aussi fier de lui, et on le lui fait savoir

– On pratiquera le plus souvent possible, par exemple à chaque  promenade, avec des objets «naturels» qu’on aura pris en main quelques secondes.

On va ainsi obtenir de son chien qu’il ne se décourage pas à la première difficulté venue. La recherche de l’objet va devenir sa drogue, la découverte sa fierté ….

Conclusion

Une fois un comportement acquis via un renforçateur artificiel, on mettra en place un renforcement par des renforçateurs naturels, accessibles en tout lieu, tout le temps. Le plus simple est de se servir du renforcement social, en étant fier de son chien, et en lui faisant savoir (ceux qui ont fait un stage avec Carmen Benett comprendrons …). Lors de nos entraînements, il faut que l’ambiance générale soit à la joie, à la fierté. C’est quelque chose que nous avons toujours avec nous, y compris en concours, et ce n’est interdit par aucun règlement !

L’utilisation de piège comportementaux est utile pour maintenir, et auto-renforcer certaines compétences. Cela ne s’applique pas à tout (l’action doit être récompensable par l’environnement, aussi varié soit-il).
Par l’utilisation de cette approche, le chien devient complètement addict, il est capable de mettre en œuvre cette compétence quasiment indéfiniment, jusqu’à épuisement. Mais il faut être prudent, car c’est un outil très puissant, difficile à maîtriser (on ne maîtrise pas l’environnement par définition), et pouvant se transformer en cercle vicieux.

Vous pouvez maintenant éteindre votre ordinateur, et aller jouer avec votre chien, parce qu’il le vaut bien !

https://en.wikipedia.org/wiki/Reinforcement
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2741872/pdf/behavan00062-0022.pdf
http://pattan.net-website.s3.amazonaws.com/images/2012/12/03/5.%20GOTCHA_BehaviorTraps.pdf
https://www.interventioncentral.org/student_motivation_trap