Le rapport d’objet

On m’a demandé récemment comment je travaillais le rapport d’objet.

Autant vous faire profiter de ma réponse.

J’ai testé pas mal de choses, et voici comment je pratique maintenant.

Tout d’abord, qu’attend-on d’un rapport d’objet ? Tout simplement que le chien ramène un objet. C’est évident dit comme ça, mais j’en vois encore tellement qui apprennent à leur chien à courir après un objet qui bouge (prédation) au lieu de leur apprendre à rapporter un objet immobile, qu’il est bon de le rappeler.

Tout d’abord, comme tout exercice qu’on veut mettre en place, commençons par le découper en séquence élémentaires:

  • course rapide vers l’objet immobile
  • prise en gueule ferme de l’objet
  • course de retour rapide au maître
  • présentation de l’objet en position assise devant le maître
  • remise de l’objet sur ordre

Je travaille toutes ces phases séparément, en utilisant les techniques les plus adaptées pour chacune d’entre elles en fonction de ce qui est attendu (shaping pour la précision et la concentration, prédation pour la vitesse) :

  • Prise en gueule de l’objet au sol: shapping
  • présentation de l’objet: shaping et frustration (si il le lâche ou que j’arrive à lui prendre, pas de récompense)
  • course aller et retour: prédation sur une balle pour avoir la vitesse.
  • Remise de l’objet sur ordre: shaping et frustration.

Et ensuite j’assemble tout ça en backchaining, c’est à dire que je commence par la fin (remise de l’objet), toujours fortement récompensée, et je construis petit à petit la chaîne en remontant vers le début (course aller). Chaque phase est ainsi récompensée et renforcée par la précédente jusqu’à l’apothéose de la récompense finale.

Le chien est ainsi acteur de son exercice. Il est convaincu qu’il me manipule: si il va vite chercher cet objet et si il me le ramène, cela va provoquer chez moi la sortie de la récompense.

On est à fond dans le conditionnement opérant: le chien agit sur son environnement (tout au moins, c’est ce que je lui fait croire)

Pour vous convaincre de la puissance de cette façon de travailler, voici une anecdote.

Lors d’un entraînement récent avec Heiko, le cane corso, une personne qui m’aidait ce jour-là est allé poser l’apportable derrière un bosquet, sur le bord du terrain (pour le ranger plus tard). Pendant ce temps, je jouais tranquillement avec Heiko . Alors que le jeu baissait d’intensité à son goût, il est parti comme une flèche derrière le bosquet, et m’a ramené l’apportable dans un rapport d’objet parfait. Il avait compris que si il me le ramenait, j’allais sortir le méga jouet qui allait relancer le jeu.

Et moi j’ai compris que ma méthode pour travailler le rapport d’objet était bonne.

 

 

Jessy se concentre

Voici une vidéo de la première séance avec diversion mise en scène (contrairement aux séances ou les distractions sont liées à l’environnement imprévisible).

Je reprends un exercice simple que Jessy connaît bien (tourner derrière un piquet), et je rajoute un tug au sol. Au début, je surestime la difficulté, et Jessy ne comprend pas.

Mais en revenant à une difficulté moindre, l’exercice est compris; je peux alors augmenter la difficulté jusqu’à envoyer Jessy tourner face au tug.

Pour faire le lien avec l’article précédent sur le refus d’appât, je n’ai pas besoin de poser le pied sur le tug. 🙂

Click to Watch Video

 

 

Le refus d’appat d’aprés Karen Pryor

J’ai traduit un article très intéressant sur la vision du refus d’appât par Karen Pryor, qui débouche sur une réflexion plus globale sur la notion de punition telle que perçue par un chien.

Traduction de http://www.clickertraining.com/node/1612

Marcher sur l’alimentation

une note de Karen
Par Karen Pryor le 02/19/2008

Est-ce, ou n’est-ce pas une punition ?

Vous entraînez le commandement « laisse ». Vous déposez un peu de nourriture, le chien se précipite vers elle, et vous la recouvrez avec le pied. Est-ce que vous venez de gérer l’environnement, ou est-ce une punition négative, enlevant quelque chose de désiré?

L’implication est que si c’est une punition négative, alors un bon formateur clicker ne devrait pas avoir à l’utiliser. Et cela soulève une autre question: «Comment pouvez-vous apprendre ‘laisse’ sans faire cela? » Quel sujet de discussion intéressant!

J’ai écrit sur le sujet de la punition et des courbes d​’extinction dans mon nouveau livre (Atteindre l’esprit des animaux, à sortir à l’automne prochain), donc je suis heureuse de répondre à la question.

Toutes les punitions sont répulsives, mais pas tous les répulsifs  sont des punitions. Comme je l’ai mentionné précédemment, Kay Laurence a écrit de façon amusante sur les punitions dans la vie quotidienne de ses setters Gordon. Ils tombent hors du lit, courent dans les montants de porte, vont du mauvais côté d’un arbre et se laissent prendre par la laisse accidentellement, heurtent leurs orteils, et ainsi de suite. Qu’est-ce que les chiens apprennent de ces épisodes? Rien que vous ne pourriez remarquer. Ainsi, votre pied sur la nourriture peut juste être un des répulsifs de la vie de votre chien, comme si la nourriture était tombé à travers une fissure du plancher.
Oups. Tant pis.

Une question d’opinion

Toutefois, la punition, comme la beauté, est dans l’œil de celui qui regarde. Était-ce une punition ? Ça dépend.

Il existe deux tests.

Le test de comportementaliste: « Est-ce que le comportement par la suite deviennent moins fréquent ou disparaît? » Vous ne pouvez pas savoir la réponse sans de nombreuses répétitions et, comme pour beaucoup de punitions, vous ne pouvez pas obtenir le résultat que vous avez prédit. Après quelques essais, au lieu d’arrêter de se précipiter, le chien pourrait se précipiter encore plus vite, pour essayer de prendre de vitesse votre pied sur la nourriture.

Le test de l’éthologue: pour savoir si marcher sur la nourriture est une aversion ou une punition vu du chien, quel est le comportement du chien. « Est-ce que le chien devient dingue ou recule, ou est-ce que le chien hésite, est-ce que l’expression de son visage reflète de l’anxiété? » Si oui, alors vous savez que le chien a reconnu une punition.

Façonner avec un timing variable

Est-ce que faire l’expérience d’une punition fait partie inévitablement de l’expérience du shaping ? Je ne pense pas. En shaping, vous devez mettre l’organisme sur un programme de timing variable de sorte que vous pouvez renforcer de manière sélective, en choisissant un comportement plutôt qu’un autre. Vous devez construire a minima un peu de résistance à l’extinction, parce que vous ne voulez pas que l’animal  abandonne chaque fois que vous ne parvenez pas à renforcer un comportement une fois sur deux. (Voilà ce que l’on entendais par « deux pour le prix d’un » autrefois, une étape dans la création de la tolérance pour un timing de shaping. D’une certaine façon, il a été  éclaté dans un timing à rapport fixe, comme une sorte d’outil de maintenance  absolument nécessaire, ce que bien sûr, il n’est pas).

Dans la toute première expérience d’un organisme en shaping, même une très légère augmentation du ratio-une simple expérience de passer de 1: 1 à 1: 2-  peut mettre un apprenant naïf dans une courbe d’extinction. L’apprenant trouve cela aussi très « punissant ». Pensez à la vidéo de poisson où mon cichlidés s’évanouit la première fois qu’il échoue-quand il était sûr qu’il allait réussir. J’ai eu la même expérience avec un dauphin naïf (les deux expériences sont inclues dans le nouveau livre).

Au moment où nous commençons l’apprentissage du « laisse », le chien est probablement bien horrifié d’avoir à essayer quelque chose deux fois et de se faire payer une fois; la vie d’un chien est pleine des résultats variables et les chiens deviennent résilient assez rapidement. Ainsi, la plupart d’entre nous faisons notre shaping en jouant dans les limites d’un timing variable de faible ratio. Nous élevons les critères assez lentement, de sorte que l’apprenant a une bonne chance de succès la plupart du temps.

Dans le DVD le plus récent de Virginie Broitman  , il y a une séquence intéressante sur le shaping d’un papillon à se tenir debout sur ​​une boîte (le clip vidéo est également dans la leçon Web Karen Pryor Academy sur le shaping). Tant le formateur que chien sont doués pour le jeu. Le chien est sur un ratio de 4: 1. Il essaie quelque chose de nouveau, obtient un clic pour cela pendant quelques fois , puis Virginie élève les critères. Oops, le prochain essai ne fonctionne pas, de sorte que le chien intensifie ou varie le comportement. Yay! Succès encore pour les prochaines tentatives, et ainsi de suite. Ce n’est pas un ratio arbitraire, bien sûr. Virginie ne compte pas ses clics. Elle renforce tout ce qui répond à ses critères, élève les critères rapidement, et le chien gagne le plus souvent, mais le comportement ne cesse de changer dans le sens de l’objectif final.

Ce chien n’est pas sur une courbe d’extinction. Virginie ne laisse pas  les choses aller vers ce point. En effet, le comportement non renforcé retombe et le comportement renforcé augmente , mais avec la participation consciente du chien. Il n’y a pas de punition en cause; le chien a du plaisir.

Donc, à mon humble avis, il est possible de façonner, de changer les paramètres du comportement, dans le contexte de renforcement à ratio variable qui sont tolérables (les Baileys  appellent simplement cela un «calendrier de shaping »). Cela peut être fait sans tomber dans la privation et la punition ou  mettre l’animal dans une courbe d’extinction.

La tolérance est variable – long timing versus extinction et stress

Vous pouvez construire avec votre chien, ou autre apprenant, une tolérance pour les timing longs, où il faut plusieurs essais pour trouver comment obtenir un clic. Une fois de plus, il y a une histoire liée à cela dans mon nouveau livre. J’étais en Angleterre, je donnai un séminaire pour les associés de John Fisher, et j’ai demandé si quelqu’un veux démontrer le jeu de la boite  sur scène. Une femme est venue avec sa belle Border collie. Le public a choisi le comportement – aller sous une chaise. Après avoir été cliqué une fois pour avoir interagi avec la chaise, le chien a essayé une douzaine ou plus de comportements différents liés à la chaise, au point où le public criait « Arrête, pauvre chien, ça suffit. » Mais le chien semblait calme, et le propriétaire connaissait sa capacité; la décision était la sienne. Ensuite, le chien a poussé son nez sous la chaise, a obtenu un clic, scruté sous la chaise, clic, compris le comportement, ignoré la récompense, plongé sous la chaise, et est sorti avec la queue frétillante! Le timing a été difficile, mais pas trop dur pour ce chien expérimenté. Chaque petite chose qu’il a essayé et qui n’a pas été cliqué, il l’abandonne immédiatement. Ce que nous avons vu n’était PAS de l’extinction, mais une décision, un changement dans le modèle de recherche, si vous voulez. Le comportement actuel – chercher pour ce clic – est resté très fort.

Vous pouvez, bien sûr, faire le timing si exigeant que votre animal  montre effectivement du stress, même si cela créé des progrès. Je l’ai lu dans des commentaires par des non-formateurs disant qu’ils voient des gens qui façonnent avec le chien dans un état d’anxiété réelle, les lèvres retroussées, la langue sortie, des lignes de stress dans les joues, etc. L’explication simple serait que les critères ont été élevés beaucoup trop vite et l’animal est, en effet, sur une courbe d’extinction, mais je ne sais pas. Je n’en ai jamais été témoin moi-même. Quand je l’ai lu un article par un autre entraîneur en disant que son shaping est composée de « surf sur les vagues d’extinction,« Je suis choquée. Oui, vous pouvez façonner de cette façon, mais aille, vous aurez besoin de construire un chien bien costaud. Il me semblait triste que quelqu’un avait trouvé un moyen d’introduire des punitions dans l’expérience passionnante du shaping.

Un plan à suivre

Alors, fixer les limites? Revenons à «laisse». Si l’animal se précipite sur la nourriture tombée, alors vous avez élevé les critères trop vite. Commencez par faire tomber des objets ennuyeux, ceux qui seraient vérifié seulement pour voir ce qu’ils sont. Les jetons de poker et les feuilles mortes sont de bons exemples. Ici, vous pouvez facilement obtenir un « Oh, d’accord » d’indifférence à l’objet en quelques clics. (Vous façonner l’indifférence avant de commencer à dire «laisse» bien sûr. Cliquez ici pour regarder, mais pas pour se déplacer vers lui, par exemple.) Commencez par des objets peu intéressants, puis des jouets. Variez votre comportement, le lieu, l’heure de la journée, intérieur / extérieur, etc., de façon à construire un bon renforcement pour ce commandement , puis utilisez de  la nourriture peu intéressante  (laitue, carottes), terminez avec un rappel à travers des  morceaux de steak éparpillés, ou autre, quel que soit votre test ultime. À quel moment avez-vous introduit le commandement? Je ne sais pas. Peut-être quand la réponse est bien établie avec les premiers objets; c’est une décision de shaping.

Le clic constructif

Gagner un clic est toujours plus puissant que juste bâfrer de la nourriture. Je suis sûre que beaucoup d’entre vous ont fait la même démo que je ai  souvent fait à ClickerExpo avec des chiens de refuge énervés -cliquant lorsque ​​le chien  marche à côté de moi, ou  autre comportement, à un taux très élevé au premier abord, puis jeter de la nourriture au sol parfois. En cinq minutes, le chien peut être totalement concentré pour me faire cliquer, et sur les friandises qui viennent du clic, alors qu’il est en train de patauger dans des hot-dogs et des morceaux qu’il ignore, sans une pensée pour les chaparder.

Donc, si vous avez a gérer de la nourriture tombée en marchant dessus, c’est juste un outil de gestion temporaire. Si vous le faites à plusieurs reprises, pour empêcher le chien de faire le mauvais comportement, vous introduisez une correction dans votre processus. L’animal peut le considérer comme une mésaventure accidentelle (dans ce cas, le comportement peut persister), ou l’information: « Oh, laisse-le, je me souviens maintenant. » Ou il peut être considéré comme une punition; le comportement de l’animal vous aidera à décider. La punition à  a des retombées. Un type de retombée est que si vous avez la punition dans votre boîte à outils, vous êtes beaucoup plus susceptibles de l’utiliser à nouveau (ceci est une citation de Kay). La punition est pour arrêter un comportement, pas pour le construire. Soyez constructif à la place.

Clic heureux,

Karen Pryor

Jessy, 8 mois, et l’apportable

Voici le résultat de plusieurs semaines de travail. Vous noterez l’utilisation du clicker en tant que pont entre l’action à valider et l’arrivée de la récompense. Il s’écoule plusieurs secondes entre le clic et le renforçateur primaire (la pâtée).

Jessy a encore un peu de mal à serrer quelque chose qu’elle prend dans ma main (c’est une jeune fille délicate …).

Click to Watch Video