Le conditionnement opérant

Le conditionnement opérant,

aussi appelé instrumental, skinnerien, ou de type II, a été étudié par Frederic Skinner dans les années cinquante.

Le 1er dispositif expérimental est le suivant :

– un rat est mis dans une cage, munie d’un levier,

– lorsque le rat actionne le levier, il reçoit de la nourriture.

Que ce passe-t-il lorsqu’un rat est mis dans la cage ? Il déambule, et lorsqu »il touche par hasard le levier, de la nourriture tombe.

Au bout de quelques répétitions de ce hasard, le rat se met à appuyer volontairement sur le levier pour recevoir de la nourriture.

Le 2ème dispositif expérimental est le suivant :

– un rat est mis dans une cage, dont une zone au sol est grillagée,

– ce grillage est reliée à une source électrique de faible tension.

Que ce passe-t-il lorsqu’un rat est mis dans la cage ? Il déambule, et lorsqu’il marche par hasard sur le grillage, il ressent une sensation désagréable.

Au bout de quelques répétitions de ce hasard, le rat va volontairement éviter le grillage.

De ces 2 expériences, de nombreux points fondamentaux de l’apprentissage ont été déduits. Je les détaillerai dans d’autres articles. Ce qu’il est fondamental de comprendre, c’est que l’animal est pleinement acteur de son apprentissage. Il constate que ses actions ont des conséquences (agréables ou désagréables), et il adapte consciemment son comportement en conséquence. Il est acteur de son comportement.

Il faut aussi retenir, que c’est l’environnement qui réagit aux actions de l’animal. L’animal comprends qu’il peut agir sur son environnement, et non pas seulement le subir.

Nos chiens, et nous-même, sommes impliqués quotidiennement dans des conditionnements de type II :

– notre chien se met sur le dos pour une raison quelconque, et nous lui grattons le ventre. Il va se mettre de plus en plus souvent sur le dos pour se faire gratter le ventre,

– nous montons en voiture, et un bip bip désagréable nous accueille. On constate que ce bruit désagréable disparaît lorsque nous bouclons notre ceinture de sécurité. Dorénavant, nous bouclons notre ceinture systématiquement, lorsque nous montons en voiture.

L’application de cette loi d’apprentissage dans notre dressage a permis de perfectionner d’anciennes techniques en les débarrassant du folklore qui les entourait parfois, et en les rendant ainsi plus efficaces. Cela a permis aussi de développer de nouvelles techniques (shaping par exemple).

Cette loi d’apprentissage impliquant la réflexion, on ne l’appliquera pas à des actions simples demandant de la rapidité de type réflexe (assis, couché), mais à des enchaînements plus ou moins complexes demandant de la concentration (marche au pied, rapport d’objet par exemple).

Un autre concept important qui apparaît avec l’application du conditionnement opérant, c’est que le maître fait partie intégrante de l’environnement, il devient le mécanisme qui distribue les récompenses. Le chien ne va pas travailler pour une récompense, mais pour que son maître lui donne une récompense, ce qui est fondamentalement différent. En concours par exemple, le chien ne sera plus distrait par un bruit ou un mouvement périphérique (qui peut être pour lui l’équivalent d’une récompense ou d’une menace potentielle), puisque son objectif est de faire en sorte de faire «déclencher» la sortie de récompense par son maître (comme le rat dans la boite de skinner). Il va rester concentré, il va s’appliquer pour faire des actions dans le but de faire « déclencher » le mécanisme.

Pour cela, il faut accepter, en tant que dresseur, de se faire manipuler par son chien (ou tout au moins lui laisser croire qu’il nous manipule) ! C’est une remise en cause profonde de l’attitude du dresseur sur un terrain d’entraînement.

Attention, il ne faut pas toutefois tomber dans l’excès inverse, et dire que la hiérarchie ne sert à rien, voire n’existe pas. Cela n’a rien à voir avec les lois d’apprentissage. Vous ne serez crédible en tant que « mécanisme distributeur de récompense » que si vous êtes vous-même une récompense (je vous laisse réfléchir la dessus, je décline toute responsabilité de l’application de cette phrase aux relations entre humains …). Et quelle meilleure récompense pour un chien, animal de meute, que d’avoir un leader qui s’occupe de tout, et en particulier de son confort quotidien ?

 

CC BY-NC-ND 4.0 Le conditionnement opérant par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *