Archives de catégorie : billet

construire un chien de sport

CONSTRUIRE UN CHIEN DE SPORT

Pourquoi cet article

La route est longue entre l’arrivée à la maison du chiot  tout juste sevré et le chien en concours de niveau III. Si on démarre la fleur au fusil en avançant en tâtonnant, on a toute les chances de terminer dans une impasse. Il faut une stratégie, une ligne directrice, qui va nous guider tout au long des 3 années, voire plus, qui nous séparent de notre objectif.
Pour m’aider dans ce parcours, je conçois cela comme la construction d’un bâtiment. C’est ce que je vais détailler dans cet article

Étape n°1 : le choix du bâtiment

Entre la cabane au fond du jardin et un château fort, le choix est vaste.
Ce choix sera dicté par le règlement de la discipline choisie., mais aussi et surtout en fonction du caractère du chien. Difficile de construire un château fort avec un chien au caractère faible. Et réciproquement, construire un bâtiment très aérien avec un chien solidement bâti et au caractère très dur ne donnera pas le résultat espéré.
Une fois le type de bâtiment choisi en fonction des matériaux dont on dispose, il faut définir les étapes à suivre.
Un construira toujours dans l’ordre : les fondations, puis les murs, puis le toit. Si on essaie de faire autrement, le bâtiment sera bancal, voire s’effondrera au premier coup de vent. Et on terminera logiquement par les finitions qui donneront son cachet typique à l’édifice.

Étape n°2 Les fondations

Comme pour un bâtiment, la construction des fondations est quelque chose qui ne se voit pas lorsque le bâtiment est terminé, mais c’est sur elle que repose toute la solidité de la future construction.
Comme pour un bâtiment, les fondations vont dépendre :

  •  Du type de terrain (le caractère du chiot)
  • Du type de bâtiment à construire (la cabane ou le château fort)

Cette étape commence dès l’arrivée du chiot à la maison. On va lui apprendre à apprendre, on va lui montrer que ses actions ont des conséquences. On va lui donner plaisir à faire plaisir à son maître.
Pour cela on utilisera des exercices très simple (toucher la main, tourner derrière un piquet, aller dans une boite …). Ces exercices vont favoriser la prise d’initiatives, et la prise de conscience qu’il peut être très agréable de proposer quelque chose à son maître (c’est ce que j’appelle l’activation du chiot)
Au niveau des techniques utilisées, on utilisera un peu le leurre, mais on travaillera principalement en shaping avec récompense.
C’est aussi durant cette période qu’on travaillera la mémoire musculaire.
Cette période de la vie du chiot est déterminante pour la suite, et ne devra surtout pas être écourtée sous prétexte qu’il faut travailler les exercices « tels que demandés en concours ».

Étape n°3 : les murs

Dans un bâtiment, les murs ont deux fonctions :

  • Assurer la rigidité de l’ensemble
  • Donner la forme générale

C’est dans cette phase qu’on va construire ce qui sera visible en concours : les exercices du règlement.
Mais pour construire un mur, il faut des briques. Ce sera pour le chien de tout petits bouts d’exercices, ce que j’appelle dans mes articles « les compétences élémentaires ». C’est, par exemple, ramasser un objet ou bien rester sur le côté gauche quelle que soit la position du maître.
Tout comme on construit un mur en commençant par le bas, on commencera à assembler ces briques en commençant par la fin (le back-chaining des anglophones). Le chien sera ainsi récompensé à la fin. Chaque brique devient la récompense de la précédente, jusqu’à la récompense qui suit la dernière brique.

Cette étape n’est pas la plus compliquée, et c’est la plus valorisante car on voit les choses se construire. L’erreur à ne pas faire est de se précipiter dessus et de vouloir monter les murs sans avoir au préalable assuré les fondations et façonné ses briques. Le mur va se monter vite, mais s’écrouler tout aussi vite.

Étape n°4 : le toit

Le toit sert à se protéger des aléas climatiques. En ce qui concerne le chien de compétition, il s’agira de se protéger contre les aléas externes, autrement dit les distractions.
Durant les étapes précédentes, je travaille dans un milieu pauvre en distraction. Lorsque la construction des murs est suffisamment solide, j’introduis des distractions de plus en plus importantes. Si on commence trop tôt, les murs se fissurent. Il faut alors les réparer, mais ce n’est jamais aussi solide que si on a attendu qu’ils soient assez résistants dés le départ.
Pour prendre un exemple concret, à la fin de cette étape, le chien doit être capable de faire un rapport d’objet alors que l’apportable est entre les jambes de l’homme assistant (celui-ci étant considéré comme la distraction ultime pour un chien pratiquant le mordant). Si le chien ramène l’HA au lieu de l’apportable, c’est qu’on a loupé une étape …

Étape n°5 : les finitions

Dans un bâtiment, les finitions sont ce qui fait toute la différence pour un regard extérieur. C’est cette étape qui va lui donner tout son éclat, son aspect définitif. Le chien étant maintenant suffisamment mature et aguerri, on va pouvoir exiger une exécution parfaite et soigner les détails. C’est à cette étape qu’on utilisera la punition basse intensité, car la récompense seule ne permet pas un tel niveau d’exigence. Il faudra faire bien attention de ne pas casser ce qu’on a construit précédemment on voulant ajouter trop de fioriture à notre construction.
Cela dépendra évidement de la solidité de tout ce qui aura été réalisé au préalable, et donc en partie du caractère du chien.

Conclusion :

Construire un chien pour la compétition est un long chemin, qui demande de savoir ou l’on va dés le départ. Il ne viendrait à personne l’idée de construire un gros bâtiment sans avoir au préalable tracé des plans et choisi ses matériaux. Malgré cela, il faudra à chaque étape trouver des solutions pour pallier aux aléas du projet.
Il y a des étapes à respecter, et si on veut aller trop vite, tout fini par s’écrouler.
Comme me disait mon grand père : « on ne construit pas un cheval sur un âne »
Il est temps d’éteindre votre ordinateur et de commencer à tracer les plans de votre future construction.

Quelle récompense utiliser ?

Quelle récompense utiliser avec mon chien ?

Balles, nourriture, tugs ? Lesquels utiliser ? Dans quelles phases de progression ?
Je vais vous présenter dans cette article ma vision de la chose, issue de mon expérience.

Nourriture :

Le chiot

C’est la récompense évidente à utiliser avec un chiot. Il n’y a pas de question à se poser. Un chiot est un estomac sur pattes, la nourriture est sa seule raison de vivre ! Il faut donc utiliser à fond ce renforçateur hyper puissant.
On peut l’utiliser comme leurre, à condition que celui-ci soit actif, c’est-à-dire que le chiot pousse sur la main, et non pas qu’il la suive mollement.
On l’utilisera aussi comme renforçateur en marqueur training. Dans cette utilisation, la pot de récompense peut être sur soi, ou posé sur un meuble. Le chiot sait parfaitement où se trouve la source de nourriture, mais doit interagir avec son maître afin que celui-ci lui en donne l’accès .
Quel type de nourriture ? J’utilise tout simplement la ration habituelle du chiot. S’il veut manger, il doit interagir avec moi. Je distribue environ la moitié de la ration comme renforçateur (par poignées, pas une croquette après l’autre !), puis le reste en jackpot à la fin de la séance.
La nourriture étant difficile à lancer, on l’utilisera en mode self-service (le chien se déplace pour se servir), ou restaurant (on se déplace pour apporter la nourriture).

Le chien adulte

On l’utilisera de façon identique avec un adulte ou un chiot (leurre ou marqueur, avec toutefois deux différences afin d’éviter le phénomène de satiété qui réduit l’intensité.

– Le chien doit avoir faim en début de séance. Ça parait évident à dire, mais je vois souvent des maîtres en train d’essayer d’intéresser leurs chiens à la nourriture qu’ils ont dans la main. Mon opinion est claire sur ce sujet : le chien doit être fou de ce que vous avez dans la main. Dès que cet intérêt baisse, il faut arrêter la séance. Et il faut admettre que certains chien ne seront jamais suffisamment intéressés par la nourriture pour s’en servir comme renforçateur. Il faudra trouver autre chose.

– Type de nourriture : avec un adulte, je n’utilise plus sa ration, mais de la nourriture très appétante. On trouve dans le commerce des friandises toutes prêtes, qui font parfaitement l’affaire. La seule condition est que ce soit suffisamment petit pour être ingéré en 2 secondes. Si le chien doit mâcher 2 mn à chaque fois qu’on le récompense, ce n’est pas efficace, sauf pour le jackpot final. Personnellement j’utilise des bouts d’emmental coupés en dés de 5 mm de côté. C’est économique et facile à utiliser. À vous de trouver ce dont votre chien raffole.

Dernier conseil qui ne semble pas être évident pour tout le monde : on donne la gamelle au moins 30 mn après la fin de la séance, une fois le chien revenu au calme. On pourra alors utiliser la gamelle comme marqueur hiérarchique si besoin.

Petite illustration en vidéo

Click to Watch Video

Les tugs :

Le chiot

Il existe des tugs spécialement adaptés aux chiots. Ils sont munis d’une multitude de brins très amusants à attraper. On commence par intéresser le chiot au tug en dehors de toute séance de travail. On le rends accro à ce truc qui gigote dans l’herbe. L’idéal étant d’avoir un éleveur qui joue au tug avec ses chiots, on gagne ainsi plusieurs semaines dans l’utilisation du tug pour le démarrage des séances de travail.
Un fois le chiot pris de passion pour ces bouts de tissus, on commence à l’utiliser par exemple pour l’apprentissage du rappel. Les séquences de récompense avec le tug doivent être brèves et intenses.
Cette façon de faire n’est pas unique. Certains démarrent directement la découverte du tug dans les séances de travail. D’après moi, cela ne peux fonctionner qu’avec un chiot déjà bien éveillé par son éleveur. Les séances sont alors à la fois une découverte du tug, et la mise en place de fondations . Je préfère laisser ça aux personnes expérimentées qui démarrent plusieurs chiots par an. Pour l’éternel débutant que je suis, je préfère bien séparer les choses, quitte à progresser moins vite.

L’adulte

On continuera comme avec un chiot, mais on choisira des tugs plus gros et plus résistants. On passera avantageusement au boudin si le chien est gros mordeur.

Petite illustration en vidéo

Click to Watch Video

Les balles

La balle étant un intermédiaire pour jouer avec son chien, il va de soi que les balles sont forcément avec une ficelle. Cette ficelle sert à la fois à animer la balle (la proie vivante), et de cordon de liaison entre le chien et son maître. Si le chien apprend à jouer tout seul avec une balle, pourquoi viendrait il ensuite jouer avec vous, et se défoncer pour avoir accès à la balle ? Au mieux, il la dépose à vos pieds pour que vous la lui relanciez. Vous jouez alors avec ses règles, il vous à bien éduqué!

Le chiot

Je n’utilise pas de balles pour m’entraîner avec un chiot. Le jeu avec les balles est technique pour le chiot. Il doit d’abord maîtriser un certain nombre de règles avant de pouvoir apprécier pleinement cet accessoire. Tout d’abord, il apprend à attraper la balle, et pas la ficelle. Ensuite, lorsque le maître lâche la ficelle, le chien doit apprendre à venir poser la ficelle dans la main de son maître pour que le jeu reprenne. Le chien doit aussi apprendre à se saisir de la balle sur commande (marqueur training), mais aussi à la lâcher sur commande (switch, cessation participative). Les principaux intérêts des balles sont leur robustesse, et leur facilité à être lancées pour récompenser à distance (mode restaurant, la récompense est livrée au chien sans qu’il se déplace). Leur inconvénient, tout relatif, est leur difficulté à être cachées sur soi. On pourra retourner cet inconvénient en se servant de balles comme récompense à vue.
Ce n’est qu’une fois que le chien est devenu complètement accro au jeu de balles avec son maître que l’on peut introduire cet accessoire dans les séances d’entraînement. Lorsque les mâchoires du chien, ainsi que sa musculature deviennent si puissantes qu’ils détruisent les tugs, il est temps de passer aux balles …

Petite illustration en vidéo

Click to Watch Video

Le boudin

Je ne fais pas de différence entre l’utilisation de balle ou de boudin. Le boudin sera avec poignée, l’équivalent de la ficelle pour la balle. Rien n’empêche d’ajouter une ficelle au boudin ….
Le travail préparatoire est identique à celui des balles. La technique de prise par le chien étant plus simple qu’avec une balle, on pourra l’introduire plus tôt dans les séances d’entraînement.
Je l’utilise alternativement avec les balles afin de varier les plaisirs. Il est plus difficile à lancer, mais offre une meilleure prise pour le chien et le maître lorsque le chien vous arrive dessus à toute vitesse pour se récompenser, et qu’il ne ralenti pas lors de sa prise.
Avec une balle on n’a pas d’autre choix que de lâcher la ficelle, avec un boudin on peut faire un bel amorti et bagarrer ensuite pour renforcer l’envie du boudin (si le caractère du chien s’y prête).

Vous pouvez maintenant éteindre votre ordinateur et sortir vos balles ou tugs, pour la plus grande joie de votre compagnon.

motivation intrinsèque et extrinsèque

Motivation intrinsèque ou extrinsèque ?

Après avoir fait une série d’article sur la dopamine, la récompense, et la punition, je vais revenir sur un aspect important de la récompense. Je me base sur l’article cité en référence.

La récompense, ou motivation, peut être de deux origines :

  • Intrinsèque :qui vient de l’intérieur (envie spontanée de faire les choses)
  • Extrinsèque : qui est externe à l’animal (nourriture, balle, tugs)

Sur un terrain de concours, nous n’avons pas le droit d’utiliser les récompenses externes. On ne peut donc utiliser que l’espoir de cette récompense externe (la fameuse dopamine). On peut contourner cette contrainte si la motivation vient de l’intérieur du chien. Rien dans les mains, rien dans les poches, tout est dans le chien, c’est magique!
Regardons de plus près ce qu’est cette motivation intrinsèque.

Motivation intrinsèque

comment la mesurer

L’article sur lequel je m’appuie concerne les humains, et leur motivation à aller à l’école (je simplifie, mais c’est l’idée).
Les chercheurs se sont d’abord posés la question de la mesure de cette motivation intrinsèque.
Le concept généralement admis est celui du « libre choix ». L’élève est mis en condition pour réaliser une tache déterminée par l’expérimentateur, puis on lui propose de faire d’autres tâches considérées comme plus divertissantes. On mesure combien de temps il continue à faire la tâche imposée avant de se laisser distraire par les autres tâches.

Impact de l’environnement sur la motivation intrinsèque

L’environnement influe fortement sur cette motivation, bien qu’elle soit interne, et donc non liée directement à celui-ci.
L’environnement peut susciter, soutenir, améliorer, réduire, voire saper, cette motivation.
On explique généralement que l’environnement catalyse, plutôt que provoque, cette motivation. C’est en gros le souffle qui va réveiller l’étincelle initiale, mais ce n’est pas ce qui allume cette étincelle.
Une autre façon de présenter les choses est de dire que l’environnement contribue à un « sentiment de compétence », et par conséquent à la satisfaction de réaliser l’action, et donc à la motivation pour cette action. Il y a toutefois des conditions à respecter pour que ce sentiment de compétence se transforme en motivation intrinsèque. Il est par exemple nécessaire que l’élève perçoive un impact de son action sur le résultat, que le libre choix dont il était question un peu plus tôt soit effectif. De plus, chaque individu réagit différemment à ce sentiment de compétence, soit pour des raisons génétiques, soit lié à son passé.

Les partisans de cette théorie du sentiment de compétence ont étudié à la fois en laboratoire, mais aussi sur des cas concrets comment l’environnement influe sur la motivation intrinsèque.
Tout d’abord, ils ont démontrés qu’un retour positif sur l’amélioration des performances améliore la motivation intrinsèque (félicitations de l’enseignant par exemple). Et à l’opposé, qu’un retour négatif diminue cette motivation (dénigrement de la part de l’entourage). Il n’est donc absolument pas inutile , voire ridicule, de féliciter son chien lorsqu’il fait quelque chose de bien. Il faut être fier de lui, et surtout ne pas le dénigrer. Cela augmente sa confiance en lui, et sa motivation intrinsèque.
Une autre approche consiste à dire que ce sentiment de compétence augmente l’impression de contrôle sur l’environnement, une l’augmentation de l’autonomie. L’élève se rend compte que ses actions influencent l’environnement. Faites le lien avec mon article sur le maître manipulateur ou manipulé ….. Le chien est lui aussi fier de manipuler son environnement …

Motivation intrinsèque et récompense externe

Des recherches dans les années 70 ont étudié l’impact de la récompense externe sur la motivation intrinsèque. Cette récompense vient saper la motivation intrinsèque. Cela est expliqué par le fait que le lien de cause à effet est transféré de l’interne vers l’externe. Le sujet perçoit que l’impact de son action se situe plus à un niveau externe qu’interne.
La récompense externe peut être généralisée sur cet aspect à toute forme de conséquence tangible : récompenses alimentaires, délais, directives, mise en compétition. Toutes ces choses tangibles sont perçues comme des conséquences échappant aux choix de l’élève, et donc sape sa motivation intrinsèque.
En revanche, tout ce qui favorise l’autonomie, le libre arbitre, augmente cette motivation.
Bien que l’étude porte sur des élèves humains, je pense que cela s’applique aussi parfaitement à nos élèves canins. Un chien qui n’est travaillé que via l’évitement de la contrainte n’aura aucune motivation intrinsèque. Il va rentrer sur le terrain d’entraînement sans motivation particulière. Alors qu’un chien qu’on a rendu ouvert et actif, va vous précéder pour rentrer sur le terrain, à la limite de vous engueuler parce que ça ne commence pas assez vite, et cela sans savoir si vous avez sur vous une récompense tangible  (balle, nourriture).

Motivation extrinsèque

Une motivation extrinsèque est quelque chose de tangible qui est obtenu chaque fois qu’une action est terminée (jouet, nourriture). Elle s’oppose en cela à la motivation intrinsèque qui est la satisfaction obtenue par la réalisation de l’activité, plus que par la conséquence matérielle de cette action. Cette motivation extrinsèque peut être la peur d’une sanction, ou le résultat concret de cette action.

De l’extrinsèque vers l’intrinsèque

La question que se sont posé les chercheurs  est de comprendre comment motiver les élèves via des pressions extérieures, des règles, mais en faisant en sorte qu’ils s’approprient ces pressions et ces règles pour les transformer en motivation intrinsèque. Vaste programme !
Les chercheurs séparent le problème en deux phases :

  • Intériorisation : l’élève s’approprie la contrainte, et au lieu de la subir, la transforme en challenge
  • Intégration : l’élève s’approprie plus profondément la contrainte, jusqu’à penser qu’elle vient de lui et non de l’extérieur

Il existe toute une gradation de l’appropriation de ces contraintes ; qui va de l’intégration (motivation purement interne), à la motivation externe imposée (loi, règlements), voire à l’absence de motivation voir figure ci-dessous (de droite à gauche)

image001

Cela n’est évidemment qu’un modèle pour aider à comprendre comment se situe la motivation.
Celle-ci n’est pas figée à un point du graphe. En fonction des conséquences de nos actions, elle va se déplacer vers la gauche ou vers la droite..
Cette motivation reste tributaire des conséquences de nos actions. Si ces conséquences sont systématiquement désagréables, le plus motivé des élèves finira par se lasser, et sa motivation s’émousser (déplacement vers la gauche du graphe).
Et réciproquement, quelque chose qui est au début subi comme une contrainte, sera de plus en plus transformé en motivation intrinsèque si elle amène plus d’autonomie, plus d’auto détermination (déplacement vers la droite du graphe)

Dans notre domaine de l’éducation canine, je ne compte plus le nombre de chiots très motivés qui se retrouvent complètement amorphes quelques mois plus tard à cause d’un maître trop autoritaire ou trop directif (ce que les auteurs de l’article appellent un « controling mentor »).

Des expériences ont été menées dans les années 90 sur la motivation des élèves à faire leurs devoirs à la maison. Au plus ils étaient encadrés et dé-responsabilisés, au moins ils étaient motivés. Et c’était aussi ceux qui avaient le plus tendance à rejeter la faute de leurs échecs sur les autres.
Ces expériences ont aussi montré qu’il était plus facile de s’approprier les contraintes, de les intérioriser, voire de les intégrer, lorsqu’on fait partie d’un groupe solidaire, et qu’on est tourné vers les autres. Nous avons effectivement tous constaté qu’un chien proche des humains, qui se sent aimé, sera plus facile à motiver qu’un chien naturellement indépendant, ou qui se sent rejeté.

D’autres études ont démontré qu’il était plus facile de s’approprier une contrainte si elle est comprise, si on en voit l’intérêt, et si on est capable de réussir ce qu’on entreprend. Il n’y a rien de plus démotivant que les échecs répétés, le sentiment qu’on n’a pas les compétences pour y arriver.

Application directe sur nos entraînements : si le chien n’y arrive pas, au lieu de se dire « quel abruti ce clébard », on baisse la difficulté de façon à ce qu’il sorte gagnant de l’exercice.

Conclusion

Nous avons vu dans cet article que la motivation intrinsèque est liée au sentiment d’autonomie, d’auto-détermination, de compétence.
La motivation extrinsèque, qui est liée au résultat de nos actions, peut être plus ou moins lié à cette auto détermination suivant le contexte.
Ce contexte peut permettre de transformer une motivation extrinsèque en motivation intrinsèque via les processus d’intériorisation et d’intégration. Il faut pour cela que l’élève soit mis dans un contexte où il a conscience que ces choix ont un impact sur le résultat, qu’il a compris l’intérêt du résultat, et qu’il est en situation de mettre en valeur ses compétences, d’en acquérir de nouvelles, et que celles-ci soient reconnue par les autres (ça fait beaucoup de conditions tout ça !).

Application à notre activité de compétition canine

Je n’ai pas grand-chose à ajouter . Ce qui est étudié pour les élèves humains s’applique quasiment mot pour mot à nos élèves canins. Leur donner de l’autonomie, leur faire comprendre que ce sont leurs actions qui sont la cause des résultats obtenus, ne pas les mettre en échec, être fier de leurs compétences, bref, avoir un chien ouvert et actif …..
Lorsque ces conditions sont réunies, les artifices de motivations utilisés systématiquement en début d’apprentissage peuvent se faire plus discrets, plus aléatoires. Mais il ne faut pas précipiter les choses, et laisser le temps pour que l’intégration se fasse. Mais à contrario, il ne faut pas pousser la récompense extrinsèque trop loin, car dans ce cas, le chien ne s’approprie plus l’action, il ne s’approprie que le résultat. Il perd ce sentiment d’autonomie, de libre arbitre, et n’intègre pas l’action. En concours, cela donne des chiens dynamiques sur les premiers exercices, puis qui s’éteignent peu à peu en voyant que la récompense n’arrive pas.

Ce subtil équilibre entre motivation intrinsèque et extrinsèque est l’apanage des grands dresseurs, et soyons honnête, des grands chiens. Mais le fait de savoir que cela existe nous permet de le travailler, et de nous améliorer !

Il est temps maintenant d’éteindre votre ordinateur, et d’aller tester votre motivation intrinsèque à jouer avec votre chien.

Référence

https://mmrg.pbworks.com/f/Ryan,+Deci+00.pdf

Le Maître: manipulateur ou manipulé ?

Le Maître: manipulateur ou manipulé ?

Pourquoi cet article

Lorsque j’explique à mes élèves qu’on va apprendre au chien à manipuler son maitre pour lui faire faire faire ce qu’il veut, je sens de l’incrédulité dans leur regard. Je lis dans leur pensées comme dans un livre ouvert: « je suis venu pour apprendre à mon chien à faire quelque chose, pas le contraire ! ».

Je vais donc essayer de clarifier dans cet article ce qui se cache derrière cette notion du chien qui manipule son maître, et cette notion de « chien actif ».

Le conditionnement opérant

Si vous êtes un habitué de ce blog, vous savez que j’utilise à fond le conditionnement opérant avec Jessy et Heiko. Je vais dans ce chapitre détailler les subtilités de cette approche.

Application basique

Edward THORNDIKE, le père du béhaviorisme. avait popularisé dans les années 30 la notion de « cause à effet ». Cela consiste à dire que si une action à une conséquence  agréable, on aura tendance à la refaire, et si réciproquement, une action a une conséquence désagréable, on aura tendance à ne plus la refaire.

C’est la notion de confort/inconfort dont on entends parfois parler sur le bord des terrains d’entraînement.

Transposé à l’entraînement de nos chiens, c’est par exemple : le chien va vers un cône et il y découvre de la nourriture. Il va donc régulièrement retourner au cône pour voir si de la nourriture n’y serait pas apparue par magie.

Dans ce type de technique d’apprentissage, le chien apprend que ces actions ont des conséquences fournies par l’environnement. Le chien subi l’environnement, ce n’est pas un chien actif. Si vous vous contentez de cela, vous atteignez rapidement une limite dans votre dressage, un plafond de verre.

Application évoluée

Burrhus Frederic Skinner est le père du conditionnement opérant. Il a démontré que dans l’apprentissage, on pouvait avoir une action sur l’environnement. Pour atteindre la récompense, on peut être amené à modifier l’environnement, à influer sur lui. Par exemple, pour accéder à la récompense, on peut ouvrir une boite, soulever une pierre, prendre sa voiture et rouler 500 km de nuit pour retrouver sa fiancée ….

On ne subit plus l’environnement, on le modifie, on réfléchi, puis on influe sur lui. On est actif!

Et le maître dans tout ça ?

Le maître fait partie de l’environnement. On va donc faire comprendre au chien qu’il peut agir sur nous.

Imaginez la conversation suivante entre Heiko et Jessy:

 » Viens voir, j’ai découvert un truc génial ! Je m’assois, et le grand couillon là-bas me file à bouffer. Et ça marche à tous les coups ! J’en fais ce que j’en veux de ce grand dadais! ».

Mes chiens me manipulent… Ne riez pas trop car il est fort probable que ce soit pareil chez vous. N’avez-vous jamais craqué lorsque votre chien vous regarde en hochant la tête ? Ne lui avez-vous pas donné un petit bout de votre tartine de pain lorsqu’il se couche à vos pieds en soupirant d’un air malheureux ?

Le manipulateur manipulé

C’est là que mon coté machiavélique apparaît. J’ai conscience que mon chien me manipule. Je vais donc moi-même manipuler son esprit pour le renforcer dans cette idée. Je vais même faire en sorte que sa manipulation réussisse lorsqu’il réalise l’action que justement je veux qu’il fasse.

C’est la manipulation à double détente, base de tout ce que je fais avec Jessy. Elle doit en permanence réfléchir à ce qu’elle doit faire pour me manipuler, afin que moi, grand dadais que je suis, je lui donne accès à plus de confort (nourriture, jeux, câlins ..).

La réponse à la question contenue dans le titre de cet article est donc : les deux, mon capitaine.

Il est temps d’éteindre votre ordinateur et d’aller vous faire manipuler par votre chien.

Références

https://fr.wikipedia.org/wiki/Edward_Thorndike

https://fr.wikipedia.org/wiki/Burrhus_Frederic_Skinner

R-, ou P+, R+ ?

R-, ou P+, R+ ?

Pourquoi cet article

La notion de R- est souvent mal comprise, voire confondue avec celle de P+.
Commençons par rappeler de quoi il s’agit :

R – : renforcement par suppression de quelque chose. Renforcement, cela signifie qu’on veut favoriser l’apparition d’un comportement, on veut faire en sorte que le chien le reproduise. Cela doit donc résulter en l’amélioration de son confort, ou plus précisément dans le cas du R -, dans la réduction de son inconfort.

P+ : punition par ajout de quelque chose. Punition, c’est pour réduire, voire faire cesser un comportement. Pour cela on ajoute de l’inconfort.

Illustration par l’exemple

Vous montez dans un véhicule d’un modèle qui vous est inconnu, et vous vous asseyez sur le siège du conducteur. Un bip bip désagréable retentit. Ce son n’est pas suffisamment désagréable pour vous faire quitter le véhicule, mais suffisamment gênant pour que vous cherchiez à le faire cesser. Vous bouclez votre ceinture, et le bip-bip disparaît.
Vous êtes donc récompensé par suppression d’un inconfort, c’est du R -.
Imaginez maintenant qu’au lieu d’un bip-bip désagréable, ce soit une alarme antivol stridente qui vous fait mal aux oreilles. Vous quittez immédiatement le véhicule tellement c’est désagréable, et vous vous en éloignez. Cette sirène a fait cesser l’intrusion dans le véhicule en créant un bruit désagréable, voire douloureux pour vos tympans, c’est donc du P+.

Maintenant, imaginez que lorsque vous vous asseyez sur le siège, rien ne se passe. Et si par le plus grand des hasard l’envie vous prends de boucler votre ceinture, la boite à gants s’ouvre sur un paquet de vos gâteaux préférés. Le comportement est récompensé par ajout de quelque chose d’agréable, c’est du R+.

Discussion

Vous constatez que ce qui différencie le R- du P+, c’est l’intensité de l’inconfort, mais surtout, la conséquence.
Le R- fait appel à la réflexion, vous agissez pour trouver la solution. Alors qu’en P+, vous êtes dans la réaction à un stimuli fortement désagréable, vous ne réfléchissez quasiment pas, vous réagissez.
Utiliser le R- en dressage est délicat, car il faut bien doser le niveau d’inconfort. Soit il n’est pas assez intense, et il ne se passe rien. Soit il est trop intense, et cela se transforme en P+, et le comportement souhaité cesse au lieu de se renforcer. L’intensité doit être ajustée quasiment en temps réel en fonction de la réaction observée.

Autre point délicat, la difficulté à trouver la solution pour faire cesser l’inconfort. Si pour faire taire le bip-bip vous devez appuyer sur 8 boutons dans un ordre précis, selon votre tempérament, au bout d’un temps variable, vous allez :

  • Soit laisser tomber et passer à autre chose, voire sortir de la voiture, et le résultat sera du P+
  • Soit vous énerver, et commencer à tout casser dans l’habitacle pour défouler votre frustration et faire cesser ce bip-bip par un moyen expéditif, et pas franchement réfléchi

Notez qu’avec le R+, ce n’est pas mieux. Si vous ne trouvez pas la solution pour ouvrir la boite à gants que vous savez contenir vos gâteaux préférés, vous finirez par adopter un des deux comportement ci-dessus. Avec deux subtilités :

  • Si vous partez, ce sera du P-, car on aura enlevé les gâteaux.
  • Si vous arrivez à atteindre les gâteaux en cassant la boite à gants, vous ne ferez plus l’effort de chercher la combinaison lors des prochaines tentatives, vous irez au plus rapide : tout casser. Et si on tente de vous en empêcher, vous pourrez même mordre.

Renforcements : Points forts, points faibles

De nombreuses études ont été menées sur les points forts et points faibles du R+ et du R-.
Je vous en ai décortiqué quelques-unes sur ce blog, en voici un résumé:

Points forts Points faibles
R+ Donne de la vitesse, de la joie

En cas d’erreur (mauvais timing), c’est facile de rattraper la situation

 

Mauvaise résistance à l’extinction (le comportement disparaît rapidement lorsqu’il n’y a plus de friandise)

Sensible à la satiété, on ne peut pas faire de longue séances

R- Apporte de la précision, et parfois de la vitesse

Très bonne résistance à l’extinction

Apporte de la fiabilité (comportement ancré de façon fiable)

Délicat à mettre en œuvre, en cas d’erreur (timing, intensité), ça peut se transformer en P+, et c’est galère à récupérer

Ne donne pas de joie, de motivation

 

 

Vous noterez que le contenu de la case R- : points forts, est ce qu’on appelle souvent « le devoir ».

Conclusion

Ceux qui confondent encore R- et P+ se privent d’un outil d’apprentissage puissant. Et ils sont nombreux, je vois très peu de dresseurs l’utiliser. Leur ignorance du R- les rend souvent virulents contre cette approche, et ils répandent leur incompétences sur les réseaux sociaux ….. C’est vrai aussi que son utilisation requiert une bonne maîtrise de la technique, une bonne analyse en temps réel de la séance. Une erreur est difficile à rattraper. Cela demande aussi un très bon matériel afin de doser très précisément l’intensité et la durée de l’inconfort, et surtout de savoir s’en servir ….

Les curieux parmi vous sont en train de penser : et si on utilise les deux simultanément,  séquentiellement ou en alternance, est-ce que les avantages se cumulent ?
Patience, je suis en train d’accumuler les preuves scientifiques sur cette approche, mais ce n’est pas évident car les articles sur le sujet sont peu nombreux.
Et il va falloir, vous comme moi, encore clarifier quelques notions au préalable afin d’analyser tout ça le plus objectivement possible …

Et comme je l’ai déjà fait remarquer dans l’article renforcement-positif-et-negatif, la différence entre ajout et suppression dépend fortement du point de vue où on se place. Donner une friandise à son chien, est-ce améliorer son confort (R+), ou réduire l’inconfort lié à la faim (R-). Est-ce qu’on utiliserait donc la combinaison des deux sans le savoir ? Vaste débat.
N’oubliez jamais que tout ceci ne sont que des modélisations de phénomènes complexes, et que dans quelques années ils seront peut être complètement obsolètes. Mais en attendant, depuis Skinner, ces modèles n’ont cessé de s’améliorer, et chaque nouvelle étude les affine de plus en plus.

L’intérêt d’être cohérent

Être cohérent

Être cohérent dans son dressage, comme dans l’éducation de base, est une évidence lorsqu’on a un petit peu d’expérience. On ne va pas autoriser un jour l’accès au canapé, et le punir sévèrement le lendemain !

Même pour des choses aussi évidentes, les scientifiques veulent vérifier.
Je suis tombé sur une étude qui se penche sur ce qui se passe si des rats sont face à une situation incohérente (voir article en référence). C’était en 1960, mais toujours d’actualité.

Principe de l’expérience.

Des rats sont mis dans une cage, en présence de 2 leviers, A et B. La récompense est concrétisée par la distribution de liquide sucré, la punition par un léger choc électrique au niveau des pattes.
Le dispositif peut aussi produire 2 clicks sonore différents qui seront utilisés comme stimuli. Afin de garantir une parfaite répétabilité dans les timings, l’ensemble est commandé par un dispositif électrique à base de relais électromagnétique (en 1960, on ne parlait pas encore d’ordinateurs …).

Phase 1

Durant cette phase préliminaire, les rats sont récompensés si ils appuient sur le levier A après apparition du signal A, et jamais récompensé après apparition du stimuli B..
Le levier B n’était pas installé dans la cage durant cette phase.
Je vous passe les détails sur les variantes utilisées suivant les groupes de rats (type de stimuli sonore, fréquence de la récompense …).
Après 75-100 heures de cette phase, tous les rats avaient compris qu’il fallait appuyer sur le levier A dés apparition du stimuli A. Ils réagissait systématiquement et rapidement au stimuli.

Phase 2

Durant cette phase, 8 rats sur les 10 sont soumis à un protocole différent. Lorsqu’ils appuient sur le levier A, il reçoivent de façon aléatoire du liquide sucré, ou une décharge électrique.
Le levier B est introduit dans la cage. Si le rat appui sur le levier B, le stimuli sonore A se transforme en stimuli sonore B. Tant que le stimuli sonore B est actif, le levier A est inopérant (pas de liquide sucré, pas de choc électrique). Ces 8 rats sont répartis en plusieurs groupes pour lesquels les timing d’application des stimuli sont différents.
Un des 2 rats restant est soumis à des conditions légèrement différentes. Si il appuie sur le levier B, il n’y a pas apparition du stimuli sonore B, mais le levier A devient inopérant pendant un certain temps (idem groupe des 8 rats).
Le 10 eme et dernier rat continu à être soumis aux mêmes conditions que durant la phase 1,

Résultats

Sur les 8 rats soumis de façon aléatoire a une récompense ou une punition après appui sur le levier A suite au stimuli A, 4 ont choisi une « stratégie de fuite », avec parfois des « temps morts » (ils ne bougent plus).
Pour les 4 autres, la fréquence d’appui sur le levier A décroît fortement.

Afin de mieux comprendre ce qui provoque la stratégie de fuite et les temps morts, les chercheurs ont alors fait varier différents paramètres (suppression de la récompense ou de la punition).
Lorsque seule la punition ou la récompense est utilisée, les rats adoptent beaucoup moins la stratégie de « temps morts ». Ce phénomène est réversible, c’est-à-dire que si on réintroduit récompense et punition, les rats reprennent leur stratégie de fuite, ou font de longs temps morts. Lorsque seule la punition ou la récompense sont rétablie, les rats ne tentent plus de fuir, et n’ont plus de temps morts.En conclusion, ce qui est vraiment perturbant pour ces rats, c’est le mélange incohérent de récompense et de punition.
Les chercheurs ont ensuite multipliés les variations des autres paramètres (durée de la récompense ou des chocs, fréquence des stimuli, ..) afin de déterminer quel était le ratio optimal entre récompense et punition qui permettrait d’augmenter la fréquence d’appui sur le levier A. Les résultats ne furent pas concluant.

Phase 3

Durant cette phase, si le rat appuie sur le levier B à l’apparition du stimuli A, alors la punition est inhibée pendant un certain temps. Le rat apprends très vite à appuyer sur le le levier B. Il ne reçoit ainsi plus de récompense, mais évite surtout la punition.

Conclusion

La première conclusion, commune a beaucoup d’études de cette époque, c’est que le dressage par évitement de la punition, ça fonctionne, à condition d’être très cohérent. Ce n’est évidemment pas ce type de dressage qui est recommandé (surtout pas sur ce blog !), mais il faut arrêter de dire que ça ne fonctionne pas. Je préfère dire qu’il y a d’autres méthodes qui fonctionnent mieux.

L’autre conclusion est sans surprise : si nous sommes incohérent dans la distribution de punition ou de récompense, le chien n’apprends rien, et au pire risque d’adopter une stratégie de fuite ou d’immobilité.

Application au dressage canin

Je vois 2 applications pratiques aux conclusions de cette étude.

Application n°1 : Si on n’est pas un dresseur expérimenté et compétent, il ne faut pas utiliser la punition. Il est préférable de n’utiliser que la récompense. En cas d’erreur de timing, ou d’incohérence, on fera moins de dégâts. Au pire, si on récompense trop et n’importe comment, on aura un chien obèse, mais joyeux et content d’être nourri à tout moment !

Application n°2 : dans le cas d’un comportement auto-récompensant (courir après les chats par exemple) il est risqué d’utiliser la punition. En effet, on ne pourra jamais contrôler à 100% que le chien ne se récompensera pas de temps en temps, et sera puni le reste du temps. Face à cette situation confuse, Il va développer soit une réduction du nombre de comportement (mais il ne va pas complètement arrêter), soit une stratégie de d’évitement , ou d’immobilité. Mais dans tous les cas, le problème de fond ne sera pas réglé. Dans la pratique , l’utilisation de la punition pourra toutefois être une solution d’urgence qui pourra éviter la mise en danger du chien (cas du chien qui court après les voitures), ou lui éviter l’abandon voire l’euthanasie (propriétaire débordé ou excédé), mais ce ne sera toujours qu’une solution temporaire et ransitoire.

Référence :

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1404056/pdf/jeabehav00196-0068.pdf

Le devoir

Le devoir

Cette notion de devoir dans le dressage canin est souvent floue, ou mal comprise. Je vais expliquer ma façon d’aborder cette notion.

Ma définition

Le devoir, c’est lorsque le chien aurait un intérêt à faire autre chose que ce que son dresseur lui demande, mais fait quand même ce qui est demandé.

On peut voir ces notions d’intérêt et de devoir suivant 2 modèles :

– En confort/inconfort : ce que demande le conducteur amène moins de confort que l’autre choix, mais le chien choisi de faire quand même ce que demande le conducteur

– En coût : ce que demande le conducteur conduit à faire plus d’effort, à dépenser plus d’énergie, que l’autre choix, mais le chien choisi de faire quand même ce que demande le conducteur

Notez que j’insiste sur la notion de décision du chien.

Comment arriver à ce résultat ?

Je vais me baser sur une situation simple : le chien est à côté de son conducteur et doit  le regarder fixement et intensément. Une distraction apparaît qui aura tendance  à faire détourner le regard du chien, voire  le chien s’éloigne du conducteur en direction de la distraction.
Il y a deux approches possibles suivant votre compréhension de l’exercice

Le chien doit me regarder

On est là clairement dans une notion de renforcement puisqu’on cherche à ce qu’un comportement se reproduise le plus souvent possible. Je resterai sur le renforcement positif.
Le mode opératoire est le suivant :

  • Le chien détourne son regard du maître: on ne fait rien, on ne dis rien
  • Le chien se reconcentre sur son maître: on renforce fortement (balle, tug, bouffe, félicitations …)

La limite de la méthode est lorsque le chien est tellement attiré par la distraction qu’il s’éloigne du maître.

Le chien ne doit pas se laisser distraire

On veut faire cesser un comportement, il faut donc utiliser la punition.
Sur le principe, c’est simple : dès que le chien est attiré par la distraction, on sanctionne.
Je pars du principe qu’on sait ce qu’est une sanction, c’est-à-dire un inconfort juste suffisant pour que le chien cesse volontairement le comportement indésirable. Il n’est pas question de « forcer » le chien à faire quoi que ce soit. Se détourner de la distraction doit être sa décision pleine et entière.

La limite de la méthode, c’est qu’on n’a pas appris au chien à ignorer la distraction, mais pas à regarder son maître. C’est ballot …

Dans certains cas on peut avoir l’illusion qu’on a appris au chien à regarder son maître. Mais en analysant de plus prêt, c’est juste que le chien n’a pas compris la sanction, et il regarde son maître en se disant « qu’est ce qui te prends de me faire ça, pourquoi tu fais ce truc bizarre avec la laisse ?) 🙂

Mon approche

Personnellement, je mixe les 2 méthodes, en restant cohérent avec les bases du conditionnement opérant : c’est le chien qui fait son choix après réflexion.
Tout d’abord, j’utilise une laisse uniquement pour limiter les déplacements du chien et éviter qu’il s’éloigne en direction de la distraction, et je travaille face à un miroir afin d’observer le chien sans avoir à bouger la tête.

Ensuite, je gère entièrement l’environnement de façon à contrôler l’apparition des distractions et leur intensité. Cela permet de monter très progressivement le niveau de la distraction, en s’assurant à chaque palier que le chien à bien compris l’exercice, et qu’il a bien compris que ses choix déterminent les conséquences.
Je sanctionne lorsque le chien détourne le regard (léger inconfort via la laisse), et je renforce fortement lorsque le chien décide de me regarder (récompense alimentaire, social, en le félicitant chaleureusement, ..).

TRES IMPORTANT : Je dis bien décide de me regarder. C’est son choix, issu de sa réflexion.

Si vous analysez la séquence :

  • Le chien se distrait : P+ (inconfort par légères secousses sur la laisse)
  •  Le chien cesse de se laisser distraire : R- (arrêt de l’inconfort), R+ (récompense alimentaire, sociale ..)

2 R pour 1 P, on est 2 fois plus dans le renforcement que dans la punition …

Cela permet de tirer avantage des deux approches :

  • Engagement, intensité lié au renforcement
  • Fiabilité, résistance à l’extinction lié à la punition

Une fois que le chien à bien compris cette notion sur un exercice simple, on peut généraliser sur des choses plus compliquées, avec des distractions de plus en plus fortes (HA lors d’une garde au ferme ….).

Démonstration :

une petite vidéo issue du post http://chiens-actifs.eu/2015/08/la-methode-illustree/

A 1mn 47s les distractions apparaissent.

Click to Watch Video