Récompense et punition: suivez le chemin!

Récompense et punition: suivez le chemin!

Pourquoi faire ?

Parce que j’en ai marre des extrémistes d’un camp ou de l’autre , soit que ne jurent que par l’absence de punition, soient ceux qui punissent n’importe comment et à tout va.

L’utilisation de la récompense et de la punition simultanément n’est pas tabou, et offre même des avantages, il faut être pragmatique, et surtout savoir de quoi on parle pour pouvoir le mettre en oeuvre.

Si vous lisez ce blog depuis quelques temps, vous savez que lorsque je parle de punition, c’est strictement dans le sens du conditionnement opérant, c’est à dire quelque chose qui fait appel à la réflexion, et en aucun cas quelque chose qui fait appel à la douleur. Il s’agit généralement d’un simple signal vocal que le chien connaît comme étant une indication qu’il est dans l’erreur, mais cela peut aussi être un collier électronique en mode vibreur ou très basse intensité si on veut plus de précision.

Mise en situation

Imaginez vous dans un endroit complètement obscur, dans lequel vous ne voyez absolument rien. Et vous devez trouver un interrupteur quelque part qui vous permettra d’avoir de la lumière.

Sans aucune indication, vous risquez de tourner en rond pendant longtemps!

Pour vous aider, quelqu’un a matérialisé un chemin pour vous guider vers l’interrupteur.

La récompense

Comme vous n’y voyez rien, le chemin est matérialisé par de petites billes noires, que vous devez trouver en tâtonnant. Imaginez votre bonheur lorsque vous trouvez une bille qui vous confirme que vous êtes dans la bonne direction! Vous allez explorer frénétiquement pour trouver la bille suivante.

Celui qui a disposé les billes doit y avoir mûrement réfléchi.

Si elles sont trop éloignées, vous allez vous décourager rapidement.

Si elles sont trop proche, vous n’explorez plus, vous suivez bêtement le chemin et ne mémorisez pas le trajet pour la prochaine fois.

La punition

Imaginez maintenant que pour matérialiser le chemin, on ai fait en sorte que ses accotements soient un sol très mou, dans lequel il est très difficile de marcher.

Vous allez avancer prudemment, en tâtant le terrain. Votre stratégie sera  de progresser lentement , pas à pas, et chaque fois que votre pied rencontre un sol instable, vous allez changer de direction.

Vous progressez certes lentement, mais sûrement, canalisé entre les 2 accotements.

Idem que pour la récompense, si les accotements sont trop rapprochés, vous ne mémorisez pas grand chose (vous êtes guidé sur des rails), et si ils sont trop éloignés, vous perdez du temps à aller d’un coté à l’autre, avec le risque de complètement vous perdre.

Récompense et punition

Vous l’aurez compris, vous avez à la fois les billes au centre du chemin, et les accotements instables de chaque coté.

Votre stratégie sera toujours d’essayer de rester au centre du chemin pour trouver les billes rapidement, mais vous perdez moins de temps car si vous faites fausse route, l’accotement instable vous ramène vers le centre.

Vous avancerez moins frénétiquement qu’avec les récompenses seules, mais vous perdrez globalement moins de temps à explorer des territoires inutiles, et au final arriverez rapidement au but.

Conclusion

Je vous laisse la deviner par vous même, mais elle me semble assez évidente!

 

 

 

CC BY-NC-ND 4.0 Récompense et punition: suivez le chemin! par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *