Archives de catégorie : Uncategorized

L’empoisonnement du commandement

Traduction de http://www.clickertraining.com/node/164

Pourquoi clic et correction ne se mélangent pas.

Les analystes comportementaux  se réfèrent à un stimulus appris qui déclenche un comportement opérant en tant que «stimulus discriminatif." Les comportementalistes ne font pas la différence , autant que je le sache, entre un stimulus discriminatif qui a été acquis par renforcement positif, et celui qui a été acquis par renforcement négatif.

En pratique, cependant, il existe une différence significative. Dans le  clicker training (conditionnement opérant avec signal  marqueur) le comportement est d'abord développé en tant que comportement librement proposé dans l'attente d'un renforcement positif. Le stimulus discriminatif est ensuite associé avec celui-ci pour fonctionner comme un indicateur d'une opportunité de renforcement. Chaque stimulus discriminatif signale la possibilité de gagner un renforcement  pour un comportement ou une suite de comportements particuliers.

Ce stimulus discriminatif utilisé toujours  positivement "ouvre la porte" à un renforcement positif. Si le comportement ne se produit pas, la seule conséquence est l'absence de renforcement. Lorsque le comportement se produit, le renforcement est garanti. (Nous appelons parfois ce genre de signal : un commandement ; pour le différencier du terme traditionnel : un ordre.)

Dès que l'animal comprend ce que signifie un commandement donné, celui ci, stimulus discriminatif positif, devient lui aussi un renforçateur positif conditionné , comme le clic. Grâce à cela, un commandement peut être utilisé comme un renforcateur pour un comportement qui se produit lorsque le commandement est donné. On peut par exemple utiliser le  commandement positif bien établi pour un comportement afin de façonner un autre comportement, ou de renforcer le comportement précédent dans une chaîne. Le signal peut également être utilisé comme signal de marquage, comme si c'était un simple clic, afin de marquer plus particulièrement les bons aspects d'un autre comportement. Il semble aussi probable que la réponse émotionnelle souhaitée, que nous savons être associée avec le clic, accompagne également la présentation de ces stimuli conditionnés positivement.

Un comportement qui a été entraîné par la correction peut également être associé à un stimulus discriminant qui indique quand le comportement spécifique va se produire. Cependant, ces discriminateurs, ou ces commandements, peuvent ou non conduire à un renforcement positif. Si l'animal ne parvient pas à effectuer le comportement, ou l'effectue de manière incorrecte, le stimulus peut conduire à l'inconfort (habituellement appelé «correction»). Le stimulus discriminatif négatif, habituellement appelé un commandement, est maintenant un renforçateur négatif conditionné, signalant la possibilité d'échapper à la punition .

Même si le comportement a été formé entièrement avec le renforcement positif, si l'on clique maintenant pour un comportement correct après un discriminateur (un repère, une commande ou un signal), mais qu'on donne aussi une correction aversive (coup sur la laisse, réprimande verbale, etc.) pour un comportement incorrect après le même stimulus, le stimulus perd immédiatement sa valeur de renforcement positif. Il est, au mieux, ambigu en termes de renforcement. Il n'est pas un clic. Il ne déclenche plus automatiquement les émotions positives associées aux renforcements positifs conditionnés. Il ne peut plus être utilisé à l'intérieur d'une chaîne afin de renforcer le comportement précédent.

Même si  les renforçateurs primaires, comme l'approbation, les jouets et les friandises, sont fournis en abondance pendant ou après l'entraînement ou la performance, les stimuli discriminants eux-mêmes, les commandements, sont maintenant des menaces autant que des promesses. Le comportement tend à se déliter, curieusement, à la fois avant et après ces stimuli ambigus:
- avant, parce que le comportement précédent peut commencer à s'éteindre en raison du manque de renforcement positif qui est maintenant un stimulus aversif,
- après , parce que le comportement qui pourrait être puni tend à être évité.
 Le changement devient visible dans l'attitude de l'apprenant, qui passe de l'empressement attentif à la réticence, souvent avec des manifestations visibles de stress. Même si la réponse positive à un stimulus discriminatoire donné est toujours suivie par la récompense, si l'échec est maintenant suivie par la punition, vous avez créé ce stimulus discriminant ambigu en terme de résultat prévisible. 
Il n'est plus «sûr». Vous avez empoisonné votre commandement.

Karen Pryor

Le conditionnement classique

Le conditionnement classique,

parfois appelé  pavlovien , ou de type 1, a été étudié par Ivan Pavlov au début du 20ème siècle.

Son expérience est très simple :

– on présente de la nourriture à un chien, il se met à saliver,

– on fait tinter une clochette, il ne salive pas.

Suite à cela, pendant plusieurs jours, on fait tinter la clochette juste avant de lui donner sa nourriture. Au bout de quelques temps, on fait tinter la clochette sans présenter de nourriture, et le chien salive. On a créé un acte réflexe. Un stimulus qui n’avait aucun sens pour le chien au début de l’expérience (la clochette), est devenu le stimulus qui va déclencher un comportement. Ce qu’il est important de noter, c’est que tout se fait « à l’insu » du chien. Il n’a aucune conscience du fait que la clochette va déclencher la salivation.

Un peu de vocabulaire :

– la clochette est appelée « stimulus neutre » en début d’expérience (elle n’a aucune signification particulière pour le chien), et devient le « stimulus conditionnel » à la fin de l’expérience (elle a acquis une signification),

– la nourriture est le « stimulus inconditionnel », elle déclenche la salivation « à tous les coups », sans condition,

– la salivation est la « réponse inconditionnelle » en début d’expérience (associée uniquement à la nourriture), et devient la « réponse conditionnelle » (associé à la clochette ).

Ce type de conditionnement fonctionne formidablement bien avec nos chiens. Nous le vivons tous les jours. Par exemple, on prend la laisse de son chien pour l’emmener en promenade. Au bout de quelques temps, le simple fait de prendre la laisse déclenche chez le chien la même joie que d’être en promenade.

Il y a une chose fondamentale à savoir pour mettre en place ce type de conditionnement : le « stimulus neutre » (la clochette) doit être donné environ une seconde avant le « stimulus inconditionnel » (la nourriture).

Pour l’éducation de nos chiens, on peut par exemple l’utiliser pour apprendre le « assis ». Au début, on pousse les fesses du chien vers le bas, et on lui lève la tête. Mécaniquement, il va s’asseoir, et on récompense. Au bout d’un certain temps, il suffit d’effleurer les fesses et le dessous de la tête pour que le chien s’assoit.

Vous me direz, ce n’est pas très utile en concours. Alors réfléchissez à ceci. Votre chien est en position de base, c’est-à-dire assis à votre gauche:

– lorsque vous démarrez et que vous voulez qu’il vous suive, vous donnez un ordre vocal, mais surtout, vous partez avec la jambe gauche en 1er,

– lorsque vous démarrez et que  vous voulez qu’il reste en place, vous donnez un ordre vocal, mais surtout, vous partez avec la jambe droite en 1er.

Au bout d’un moment, vous ne donnez plus aucun ordre vocal (vous le faites disparaître progressivement), et votre chien réagira en fonction de la 1ère jambe que vous bougez Vous avez conditionné votre chien sur votre jambe.Inutile de faire, comme je le vois souvent, de longues phrases ou des ordres à rallonge (pas bouger, reste, …).

Ce conditionnement est très puissant, il n’est pas à négliger dans notre boite à outils de compétiteurs. Il est utile, voire indispensable, pour des ordres simples qui doivent être exécutés rapidement (assis, couché, stop, ..) car ce conditionnement agit quasiment comme un acte réflexe, ne fait pas appel à la réflexion.

Un dernier exemple pour alimenter votre réflexion :

– vous mettez un collier « à pointes » à votre chien

– vous donnez une petite secousse sur la laisse (c’est désagréable mais pas douloureux !), et vous donnez une friandise très appétissante juste après.

– Après de nombreuses répétitions, vous verrez votre chien être très content d’être « secoué » avec un collier à pointes, car il aura associé cela à la récompense ….

Rentrée 2014

Fini les vacances, il faut reprendre le travail.

Mais pas n’importe quel travail. A 7 mois, il est temps que Jessy fasse un travail utile!

Fini les exercices d’obéissance pour s’amuser. Il faut travailler vraiment pour mériter sa gamelle.

Jeux à deux balles

Les vacances sont finies, mais ce n’est pas une raison pour reprendre l’école.

On a encore le droit de jouer un peu!

Même si ce n’est qu’un jeu à deux balles ….

Click to Watch Video

Cyska se focalise sur la gamelle

Une petite vidéo de Cyska se focalisant sur sa gamelle. Il y a encore du travail … C’est plus difficile que sur une balle.