Le clicker, comment ça marche

Le clicker, ce tout petit instrument qui fait « click » quand on appuie dessus, est déconcertant de simplicité, et pourtant il permet de faire de grandes choses!

Sous son apparente simplicité, il met en oeuvre plusieurs principes d’apprentissage.

Charger le clicker:

Tout d’abord, il est écrit partout qu’il faut commencer par « charger » le clicker. Qu’est-ce qui se cache derrière ce terme ?

Tout simplement la mise en place d’un conditionnement de type I (pavlovien), voir mon article précédent sur le sujet.

Le clic est le stimulus neutre, la nourriture le stimulus inconditionnel.

Et la réponse inconditionnelle ? Et bien il n’y en a pas, du moins en apparence. La réponse inconditionnelle est une joie, un bien-être, créé par l’attente procurée par une friandise appétissante. Le clic devient la promesse d’une sensation agréable. On dit qu’il fait un pont entre le moment du clic et l’arrivée de la récompense.

Le clic devient la récompense. Conformément aux règles du conditionnement de type 1, il faudra éviter l’extinction (c’est à dire que le clic perde sa valeur de récompense), en redonnant de temps en temps de la nourriture après le clic.

On pourrait utiliser sa voix pour faire ça, mais le clic offre au moins 3 avantages:

– la neutralité : la voix fait passer une émotion, qu’on le veuille ou non,

– la précision: il est plus facile de cliquer au moment exact que d’utiliser sa voix. Ne me demandez pas d’expliquer pourquoi, je n’en sais rien. Mais j’ai constaté qu’avec la voix, on avait toujours une fraction de seconde de retard,

– il n’est pas attaché à une personne. Au besoin, vous confiez le clicker à une personne à coté de vous, cela aura strictement le même effet que si vous cliquez vous-même (sous certaines conditions).

Mais si on s’arrête là, le clicker ne sert pas à grand chose.

Utilisation du Clicker:

Il y a de multiples façons d’utiliser le clicker. On peut par exemple l’utiliser pour coder des actions: 1 clic veut dire « tourne à droite », 2 clics veulent dire « tourne à gauche ». Mais l’usage le plus intéressant est en conditionnement opérant.

On va s’en servir pour valider le bon comportement de l’animal (renforcement positif). Le clic agira comme un déclic d’appareil photo. A l’instant précis ou le comportement apparaît, on le valide par un clic. L’animal aura donc tendance à reproduire ce comportement.

On travaillera par approches successives, en validant chaque petit progrès vers l’action désirée. On ne parle pas, on ne guide pas, on laisse le chien réfléchir et chercher ce qui va nous faire cliquer.

On appelle cette technique le  » façonnage », mais en bon français, tout le monde parle de « shaping » …

 

Digression :

Maintenant, un peu de provocation.

Rien ne vous empêche d’utiliser le clicker différemment. Par exemple, au lieu de l’associer à quelque chose d’agréable, vous l’associez à quelque chose de désagréable (un jet d’eau sur la tête par exemple) et vous vous en servez comme punition positive  (je rappelle que positif veut dire « on ajoute quelque chose »)…..

Ce petit outil, d’apparence si simple, met en réalité en oeuvre simultanément les conditionnements de type 1 et 2.

Et surtout, il est ce que vous en faites une fois que vous avez compris comment ça marche!

CC BY-NC-ND 4.0 Le clicker, comment ça marche par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *