Le refus d’appat d’aprés Karen Pryor

J’ai traduit un article très intéressant sur la vision du refus d’appât par Karen Pryor, qui débouche sur une réflexion plus globale sur la notion de punition telle que perçue par un chien.

Traduction de http://www.clickertraining.com/node/1612

Marcher sur l’alimentation

une note de Karen
Par Karen Pryor le 02/19/2008

Est-ce, ou n’est-ce pas une punition ?

Vous entraînez le commandement « laisse ». Vous déposez un peu de nourriture, le chien se précipite vers elle, et vous la recouvrez avec le pied. Est-ce que vous venez de gérer l’environnement, ou est-ce une punition négative, enlevant quelque chose de désiré?

L’implication est que si c’est une punition négative, alors un bon formateur clicker ne devrait pas avoir à l’utiliser. Et cela soulève une autre question: «Comment pouvez-vous apprendre ‘laisse’ sans faire cela? » Quel sujet de discussion intéressant!

J’ai écrit sur le sujet de la punition et des courbes d​’extinction dans mon nouveau livre (Atteindre l’esprit des animaux, à sortir à l’automne prochain), donc je suis heureuse de répondre à la question.

Toutes les punitions sont répulsives, mais pas tous les répulsifs  sont des punitions. Comme je l’ai mentionné précédemment, Kay Laurence a écrit de façon amusante sur les punitions dans la vie quotidienne de ses setters Gordon. Ils tombent hors du lit, courent dans les montants de porte, vont du mauvais côté d’un arbre et se laissent prendre par la laisse accidentellement, heurtent leurs orteils, et ainsi de suite. Qu’est-ce que les chiens apprennent de ces épisodes? Rien que vous ne pourriez remarquer. Ainsi, votre pied sur la nourriture peut juste être un des répulsifs de la vie de votre chien, comme si la nourriture était tombé à travers une fissure du plancher.
Oups. Tant pis.

Une question d’opinion

Toutefois, la punition, comme la beauté, est dans l’œil de celui qui regarde. Était-ce une punition ? Ça dépend.

Il existe deux tests.

Le test de comportementaliste: « Est-ce que le comportement par la suite deviennent moins fréquent ou disparaît? » Vous ne pouvez pas savoir la réponse sans de nombreuses répétitions et, comme pour beaucoup de punitions, vous ne pouvez pas obtenir le résultat que vous avez prédit. Après quelques essais, au lieu d’arrêter de se précipiter, le chien pourrait se précipiter encore plus vite, pour essayer de prendre de vitesse votre pied sur la nourriture.

Le test de l’éthologue: pour savoir si marcher sur la nourriture est une aversion ou une punition vu du chien, quel est le comportement du chien. « Est-ce que le chien devient dingue ou recule, ou est-ce que le chien hésite, est-ce que l’expression de son visage reflète de l’anxiété? » Si oui, alors vous savez que le chien a reconnu une punition.

Façonner avec un timing variable

Est-ce que faire l’expérience d’une punition fait partie inévitablement de l’expérience du shaping ? Je ne pense pas. En shaping, vous devez mettre l’organisme sur un programme de timing variable de sorte que vous pouvez renforcer de manière sélective, en choisissant un comportement plutôt qu’un autre. Vous devez construire a minima un peu de résistance à l’extinction, parce que vous ne voulez pas que l’animal  abandonne chaque fois que vous ne parvenez pas à renforcer un comportement une fois sur deux. (Voilà ce que l’on entendais par « deux pour le prix d’un » autrefois, une étape dans la création de la tolérance pour un timing de shaping. D’une certaine façon, il a été  éclaté dans un timing à rapport fixe, comme une sorte d’outil de maintenance  absolument nécessaire, ce que bien sûr, il n’est pas).

Dans la toute première expérience d’un organisme en shaping, même une très légère augmentation du ratio-une simple expérience de passer de 1: 1 à 1: 2-  peut mettre un apprenant naïf dans une courbe d’extinction. L’apprenant trouve cela aussi très « punissant ». Pensez à la vidéo de poisson où mon cichlidés s’évanouit la première fois qu’il échoue-quand il était sûr qu’il allait réussir. J’ai eu la même expérience avec un dauphin naïf (les deux expériences sont inclues dans le nouveau livre).

Au moment où nous commençons l’apprentissage du « laisse », le chien est probablement bien horrifié d’avoir à essayer quelque chose deux fois et de se faire payer une fois; la vie d’un chien est pleine des résultats variables et les chiens deviennent résilient assez rapidement. Ainsi, la plupart d’entre nous faisons notre shaping en jouant dans les limites d’un timing variable de faible ratio. Nous élevons les critères assez lentement, de sorte que l’apprenant a une bonne chance de succès la plupart du temps.

Dans le DVD le plus récent de Virginie Broitman  , il y a une séquence intéressante sur le shaping d’un papillon à se tenir debout sur ​​une boîte (le clip vidéo est également dans la leçon Web Karen Pryor Academy sur le shaping). Tant le formateur que chien sont doués pour le jeu. Le chien est sur un ratio de 4: 1. Il essaie quelque chose de nouveau, obtient un clic pour cela pendant quelques fois , puis Virginie élève les critères. Oops, le prochain essai ne fonctionne pas, de sorte que le chien intensifie ou varie le comportement. Yay! Succès encore pour les prochaines tentatives, et ainsi de suite. Ce n’est pas un ratio arbitraire, bien sûr. Virginie ne compte pas ses clics. Elle renforce tout ce qui répond à ses critères, élève les critères rapidement, et le chien gagne le plus souvent, mais le comportement ne cesse de changer dans le sens de l’objectif final.

Ce chien n’est pas sur une courbe d’extinction. Virginie ne laisse pas  les choses aller vers ce point. En effet, le comportement non renforcé retombe et le comportement renforcé augmente , mais avec la participation consciente du chien. Il n’y a pas de punition en cause; le chien a du plaisir.

Donc, à mon humble avis, il est possible de façonner, de changer les paramètres du comportement, dans le contexte de renforcement à ratio variable qui sont tolérables (les Baileys  appellent simplement cela un «calendrier de shaping »). Cela peut être fait sans tomber dans la privation et la punition ou  mettre l’animal dans une courbe d’extinction.

La tolérance est variable – long timing versus extinction et stress

Vous pouvez construire avec votre chien, ou autre apprenant, une tolérance pour les timing longs, où il faut plusieurs essais pour trouver comment obtenir un clic. Une fois de plus, il y a une histoire liée à cela dans mon nouveau livre. J’étais en Angleterre, je donnai un séminaire pour les associés de John Fisher, et j’ai demandé si quelqu’un veux démontrer le jeu de la boite  sur scène. Une femme est venue avec sa belle Border collie. Le public a choisi le comportement – aller sous une chaise. Après avoir été cliqué une fois pour avoir interagi avec la chaise, le chien a essayé une douzaine ou plus de comportements différents liés à la chaise, au point où le public criait « Arrête, pauvre chien, ça suffit. » Mais le chien semblait calme, et le propriétaire connaissait sa capacité; la décision était la sienne. Ensuite, le chien a poussé son nez sous la chaise, a obtenu un clic, scruté sous la chaise, clic, compris le comportement, ignoré la récompense, plongé sous la chaise, et est sorti avec la queue frétillante! Le timing a été difficile, mais pas trop dur pour ce chien expérimenté. Chaque petite chose qu’il a essayé et qui n’a pas été cliqué, il l’abandonne immédiatement. Ce que nous avons vu n’était PAS de l’extinction, mais une décision, un changement dans le modèle de recherche, si vous voulez. Le comportement actuel – chercher pour ce clic – est resté très fort.

Vous pouvez, bien sûr, faire le timing si exigeant que votre animal  montre effectivement du stress, même si cela créé des progrès. Je l’ai lu dans des commentaires par des non-formateurs disant qu’ils voient des gens qui façonnent avec le chien dans un état d’anxiété réelle, les lèvres retroussées, la langue sortie, des lignes de stress dans les joues, etc. L’explication simple serait que les critères ont été élevés beaucoup trop vite et l’animal est, en effet, sur une courbe d’extinction, mais je ne sais pas. Je n’en ai jamais été témoin moi-même. Quand je l’ai lu un article par un autre entraîneur en disant que son shaping est composée de « surf sur les vagues d’extinction,« Je suis choquée. Oui, vous pouvez façonner de cette façon, mais aille, vous aurez besoin de construire un chien bien costaud. Il me semblait triste que quelqu’un avait trouvé un moyen d’introduire des punitions dans l’expérience passionnante du shaping.

Un plan à suivre

Alors, fixer les limites? Revenons à «laisse». Si l’animal se précipite sur la nourriture tombée, alors vous avez élevé les critères trop vite. Commencez par faire tomber des objets ennuyeux, ceux qui seraient vérifié seulement pour voir ce qu’ils sont. Les jetons de poker et les feuilles mortes sont de bons exemples. Ici, vous pouvez facilement obtenir un « Oh, d’accord » d’indifférence à l’objet en quelques clics. (Vous façonner l’indifférence avant de commencer à dire «laisse» bien sûr. Cliquez ici pour regarder, mais pas pour se déplacer vers lui, par exemple.) Commencez par des objets peu intéressants, puis des jouets. Variez votre comportement, le lieu, l’heure de la journée, intérieur / extérieur, etc., de façon à construire un bon renforcement pour ce commandement , puis utilisez de  la nourriture peu intéressante  (laitue, carottes), terminez avec un rappel à travers des  morceaux de steak éparpillés, ou autre, quel que soit votre test ultime. À quel moment avez-vous introduit le commandement? Je ne sais pas. Peut-être quand la réponse est bien établie avec les premiers objets; c’est une décision de shaping.

Le clic constructif

Gagner un clic est toujours plus puissant que juste bâfrer de la nourriture. Je suis sûre que beaucoup d’entre vous ont fait la même démo que je ai  souvent fait à ClickerExpo avec des chiens de refuge énervés -cliquant lorsque ​​le chien  marche à côté de moi, ou  autre comportement, à un taux très élevé au premier abord, puis jeter de la nourriture au sol parfois. En cinq minutes, le chien peut être totalement concentré pour me faire cliquer, et sur les friandises qui viennent du clic, alors qu’il est en train de patauger dans des hot-dogs et des morceaux qu’il ignore, sans une pensée pour les chaparder.

Donc, si vous avez a gérer de la nourriture tombée en marchant dessus, c’est juste un outil de gestion temporaire. Si vous le faites à plusieurs reprises, pour empêcher le chien de faire le mauvais comportement, vous introduisez une correction dans votre processus. L’animal peut le considérer comme une mésaventure accidentelle (dans ce cas, le comportement peut persister), ou l’information: « Oh, laisse-le, je me souviens maintenant. » Ou il peut être considéré comme une punition; le comportement de l’animal vous aidera à décider. La punition à  a des retombées. Un type de retombée est que si vous avez la punition dans votre boîte à outils, vous êtes beaucoup plus susceptibles de l’utiliser à nouveau (ceci est une citation de Kay). La punition est pour arrêter un comportement, pas pour le construire. Soyez constructif à la place.

Clic heureux,

Karen Pryor

CC BY-NC-ND 4.0 Le refus d’appat d’aprés Karen Pryor par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *