Archives de catégorie : apprentissage

Le conditionnement opérant

Le conditionnement opérant,

aussi appelé instrumental, skinnerien, ou de type II, a été étudié par Frederic Skinner dans les années cinquante.

Le 1er dispositif expérimental est le suivant :

– un rat est mis dans une cage, munie d’un levier,

– lorsque le rat actionne le levier, il reçoit de la nourriture.

Que ce passe-t-il lorsqu’un rat est mis dans la cage ? Il déambule, et lorsqu »il touche par hasard le levier, de la nourriture tombe.

Au bout de quelques répétitions de ce hasard, le rat se met à appuyer volontairement sur le levier pour recevoir de la nourriture.

Le 2ème dispositif expérimental est le suivant :

– un rat est mis dans une cage, dont une zone au sol est grillagée,

– ce grillage est reliée à une source électrique de faible tension.

Que ce passe-t-il lorsqu’un rat est mis dans la cage ? Il déambule, et lorsqu’il marche par hasard sur le grillage, il ressent une sensation désagréable.

Au bout de quelques répétitions de ce hasard, le rat va volontairement éviter le grillage.

De ces 2 expériences, de nombreux points fondamentaux de l’apprentissage ont été déduits. Je les détaillerai dans d’autres articles. Ce qu’il est fondamental de comprendre, c’est que l’animal est pleinement acteur de son apprentissage. Il constate que ses actions ont des conséquences (agréables ou désagréables), et il adapte consciemment son comportement en conséquence. Il est acteur de son comportement.

Il faut aussi retenir, que c’est l’environnement qui réagit aux actions de l’animal. L’animal comprends qu’il peut agir sur son environnement, et non pas seulement le subir.

Nos chiens, et nous-même, sommes impliqués quotidiennement dans des conditionnements de type II :

– notre chien se met sur le dos pour une raison quelconque, et nous lui grattons le ventre. Il va se mettre de plus en plus souvent sur le dos pour se faire gratter le ventre,

– nous montons en voiture, et un bip bip désagréable nous accueille. On constate que ce bruit désagréable disparaît lorsque nous bouclons notre ceinture de sécurité. Dorénavant, nous bouclons notre ceinture systématiquement, lorsque nous montons en voiture.

L’application de cette loi d’apprentissage dans notre dressage a permis de perfectionner d’anciennes techniques en les débarrassant du folklore qui les entourait parfois, et en les rendant ainsi plus efficaces. Cela a permis aussi de développer de nouvelles techniques (shaping par exemple).

Cette loi d’apprentissage impliquant la réflexion, on ne l’appliquera pas à des actions simples demandant de la rapidité de type réflexe (assis, couché), mais à des enchaînements plus ou moins complexes demandant de la concentration (marche au pied, rapport d’objet par exemple).

Un autre concept important qui apparaît avec l’application du conditionnement opérant, c’est que le maître fait partie intégrante de l’environnement, il devient le mécanisme qui distribue les récompenses. Le chien ne va pas travailler pour une récompense, mais pour que son maître lui donne une récompense, ce qui est fondamentalement différent. En concours par exemple, le chien ne sera plus distrait par un bruit ou un mouvement périphérique (qui peut être pour lui l’équivalent d’une récompense ou d’une menace potentielle), puisque son objectif est de faire en sorte de faire «déclencher» la sortie de récompense par son maître (comme le rat dans la boite de skinner). Il va rester concentré, il va s’appliquer pour faire des actions dans le but de faire « déclencher » le mécanisme.

Pour cela, il faut accepter, en tant que dresseur, de se faire manipuler par son chien (ou tout au moins lui laisser croire qu’il nous manipule) ! C’est une remise en cause profonde de l’attitude du dresseur sur un terrain d’entraînement.

Attention, il ne faut pas toutefois tomber dans l’excès inverse, et dire que la hiérarchie ne sert à rien, voire n’existe pas. Cela n’a rien à voir avec les lois d’apprentissage. Vous ne serez crédible en tant que « mécanisme distributeur de récompense » que si vous êtes vous-même une récompense (je vous laisse réfléchir la dessus, je décline toute responsabilité de l’application de cette phrase aux relations entre humains …). Et quelle meilleure récompense pour un chien, animal de meute, que d’avoir un leader qui s’occupe de tout, et en particulier de son confort quotidien ?

 

Le conditionnement classique

Le conditionnement classique,

parfois appelé  pavlovien , ou de type 1, a été étudié par Ivan Pavlov au début du 20ème siècle.

Son expérience est très simple :

– on présente de la nourriture à un chien, il se met à saliver,

– on fait tinter une clochette, il ne salive pas.

Suite à cela, pendant plusieurs jours, on fait tinter la clochette juste avant de lui donner sa nourriture. Au bout de quelques temps, on fait tinter la clochette sans présenter de nourriture, et le chien salive. On a créé un acte réflexe. Un stimulus qui n’avait aucun sens pour le chien au début de l’expérience (la clochette), est devenu le stimulus qui va déclencher un comportement. Ce qu’il est important de noter, c’est que tout se fait « à l’insu » du chien. Il n’a aucune conscience du fait que la clochette va déclencher la salivation.

Un peu de vocabulaire :

– la clochette est appelée « stimulus neutre » en début d’expérience (elle n’a aucune signification particulière pour le chien), et devient le « stimulus conditionnel » à la fin de l’expérience (elle a acquis une signification),

– la nourriture est le « stimulus inconditionnel », elle déclenche la salivation « à tous les coups », sans condition,

– la salivation est la « réponse inconditionnelle » en début d’expérience (associée uniquement à la nourriture), et devient la « réponse conditionnelle » (associé à la clochette ).

Ce type de conditionnement fonctionne formidablement bien avec nos chiens. Nous le vivons tous les jours. Par exemple, on prend la laisse de son chien pour l’emmener en promenade. Au bout de quelques temps, le simple fait de prendre la laisse déclenche chez le chien la même joie que d’être en promenade.

Il y a une chose fondamentale à savoir pour mettre en place ce type de conditionnement : le « stimulus neutre » (la clochette) doit être donné environ une seconde avant le « stimulus inconditionnel » (la nourriture).

Pour l’éducation de nos chiens, on peut par exemple l’utiliser pour apprendre le « assis ». Au début, on pousse les fesses du chien vers le bas, et on lui lève la tête. Mécaniquement, il va s’asseoir, et on récompense. Au bout d’un certain temps, il suffit d’effleurer les fesses et le dessous de la tête pour que le chien s’assoit.

Vous me direz, ce n’est pas très utile en concours. Alors réfléchissez à ceci. Votre chien est en position de base, c’est-à-dire assis à votre gauche:

– lorsque vous démarrez et que vous voulez qu’il vous suive, vous donnez un ordre vocal, mais surtout, vous partez avec la jambe gauche en 1er,

– lorsque vous démarrez et que  vous voulez qu’il reste en place, vous donnez un ordre vocal, mais surtout, vous partez avec la jambe droite en 1er.

Au bout d’un moment, vous ne donnez plus aucun ordre vocal (vous le faites disparaître progressivement), et votre chien réagira en fonction de la 1ère jambe que vous bougez Vous avez conditionné votre chien sur votre jambe.Inutile de faire, comme je le vois souvent, de longues phrases ou des ordres à rallonge (pas bouger, reste, …).

Ce conditionnement est très puissant, il n’est pas à négliger dans notre boite à outils de compétiteurs. Il est utile, voire indispensable, pour des ordres simples qui doivent être exécutés rapidement (assis, couché, stop, ..) car ce conditionnement agit quasiment comme un acte réflexe, ne fait pas appel à la réflexion.

Un dernier exemple pour alimenter votre réflexion :

– vous mettez un collier « à pointes » à votre chien

– vous donnez une petite secousse sur la laisse (c’est désagréable mais pas douloureux !), et vous donnez une friandise très appétissante juste après.

– Après de nombreuses répétitions, vous verrez votre chien être très content d’être « secoué » avec un collier à pointes, car il aura associé cela à la récompense ….

De l’interet des lois d’apprentissage

Lorsque j’ai commencé l’éducation, puis la compétition, j’ai écouté les conseils des moniteurs, ou de compétiteurs expérimentés.
J’appliquai leur conseils et leurs astuces pour réaliser un exercice, ou résoudre un problème. Des fois ça marchait, souvent ça ne marchait pas, ou ça marchait mais avec des dommages collatéraux.
Je testai aussi des méthodes vues à droite ou à gauche, lors des entraînements précédents les concours par exemple.
Globalement ça marchait, mais le « rendement » était médiocre.
Certaines astuces semblaient évidentes et ne donnaient aucun résultat.
D’autres me paraissaient farfelues (mais je les testaient quand même, ayant toute confiance en la personne qui me la conseillait), et fonctionnaient à merveille.
Au fur et à mesure que mon bagage de « trucs et astuces » grossissait, je commençais à faire des liens entre elles pour comprendre la logique qui faisait que « ça marchait ».
Mais mes connaissances théoriques se limitaient l’expérience de Pavlov, et encore, juste les grandes lignes.
Un jour, je me suis mis plus sérieusement à chercher à comprendre. Et j’ai découvert que des scientifiques avaient fait des tas d’expériences, et en avait tiré des grand principes sur les lois de l’apprentissage. Et plus fort encore, certains grand dresseurs avaient étudié ces lois, et les avaient appliquées au dressage canin avec succès.
Je me suis alors mis a regarder ça de prés, et j’ai compris pourquoi les astuces des autres fonctionnaient, … ou pas !
C’est tout simplement que n’ayant pas compris sur quel principe d’apprentissage telle ou telle astuce était basée, je ne la mettait pas en œuvre correctement. C’est parfois un problème de timing, d’attitude, d’environnement, qui fait toute la différence entre « ça marche », et « ça marche pas ».

Depuis que j’ai pris conscience de tout ça, mon dressage est beaucoup plus efficace, mais aussi, je suis plus à même de conseiller les autres.

Lorsque j’ai voulu faire partager à d’autres personnes mes lectures passionnantes sur toutes ces lois d’apprentissage, je me suis heurté à une nouvelle difficulté : toutes ces publications et vidéos sur internet sont en langue anglaise. Et beaucoup de personnes ont un peu, voire beaucoup oublié leur cours d’anglais de l’école (pour ceux qui en ont eu).
Je vais donc essayer par quelques articles sur ce blog d’expliquer les grands principes à connaître, avec mes mots à moi, et avec des exemples pratiques qui parlent à tout le monde.
N’étant absolument pas un expert dans le domaine, je vais juste faire des traduction/adaptation/synthèse de pages en anglais qui me semblent intéressantes.
Bonnes lectures !