L’intérêt d’avoir un retour d’information

L’intérêt d’avoir un retour d’information

Pourquoi cet article ?

Le sujet qui fait débat sur les forums, est de savoir si il vaut mieux punir ou récompenser.
Je vais aborder ce sujet dans le cas où nous (ou notre chien) devons faire un choix simple entre 2 comportements. Ce cas se présente de très nombreuses fois par jour, pour nous, ou pour nos chiens.
Deux exemples typiques concernant nos chiens :

  • Mon maître me rappelle. Dois je continuer à renifler ce brin d’herbe, ou dois je rejoindre mon maître ?
  • Je marche au pied de mon maître en le regardant intensément. Dois-je me détourner pour aller voir ce qui vient de titiller ma vision périphérique, ou dois je rester le regard fixé sur mon maître ?

Je n’aborderai ce sujet que sur l’aspect « performance », c’est-à-dire nombre de fois ou le chien fait le « bon » choix (celui que nous voulons). Je n’aborderai pas les conséquences sur  l’aspect « chien actif » dont j’ai déjà parlé (pour rappel, la récompense encourage à proposer autre chose en cas d’erreur, la punition inhibe cette tendance).

Principe du retour d’information

En anglais, feedback.

C’est le fait de savoir si le choix que nous avons fait est le bon ou pas.
Je ne parle pas de l’aspect « confort/inconfort » qu’apporte la conséquence de notre décision, mais bien l’aspect purement intellectuel d’avoir fait le bon choix.
On sait bien intuitivement que si nous n’avons aucun retour d’information, on ne sait pas si notre choix est bon, et donc on ne vas pas progresser.
Prenons l’exemple des tables de multiplication que nous devions apprendre et réciter dans notre enfance. Si personne ne nous disait si la table que nous venions de réciter était correcte ou pas, on comprend bien qu’il nous aurait été difficile de progresser.
Mais est il préférable de récompenser la bonne restitution, de punir la mauvaise ? Ou les 2 ? Quelle forme doit prendre ce stimulus de retour ?
J’ai fait quelques recherches sur le sujet, et je suis tombé sur l’article cité en référence, que je vais essayer de résumer ici car il est particulièrement adaptable à notre activité.

Déroulement de l’expérience

Des étudiants devaient trier des cercles hachurés qui apparaissaient sur un écran. Il devaient les classer en 2 groupes, en cliquant sur 2 boutons (un dans chaque main, un fonction d’un critère qu’ils ne connaissait pas au départ (taille des hachures, orientation des hachures ..)
Le retour d’information était réalisé par un son de 2 tonalités différentes suivant le type de retour (correct / incorrect).
Ces sons ont été choisi pour n’être ni particulièrement agréables, ni particulièrement désagréables, afin d’éliminer toute notion de confort/inconfort.
Suivant les groupes, le retour d’information était donné différemment :

  • PFB (positive feedback) : les bonnes réponses étaient confirmées 80% des fois, les mauvaises réponses ignorées
  • NFB (négative feedback) : les mauvaises réponses étaient confirmées 80% des fois, les bonnes réponses ignorées
  • Partial : les bonnes et mauvaises réponses étaient confirmées de temps en temps
  • Full : toutes les réponses, bonnes ou mauvaises étaient confirmées

Résultats bruts :

On constate que la combinaison de retours positifs et négatif est bien plus efficace en terme d’apprentissage que l’utilisation d’un seul type de retour.

Lorsque qu’un utilise qu’un seul type de retour, le retour négatif est plus efficace en terme de rapidité d’apprentissage, et en terme de fiabilité.

Conclusion des auteurs :

L’apprentissage dans ce type de test est possible avec des retours soit uniquement positif, soit uniquement négatif, mais est plus efficace lorsque les deux sont utilisés simultanément.
La littérature montre que la nature et le timing du feed back sont des paramètres importants.
Ce type d’apprentissage est le plus efficace lorsqu’un retour d’information est donné systématiquement et immédiatement après la réponse.
Les auteurs insistent que leurs conclusions ne s’appliquent qu’a ce type d’apprentissage (type II learning), qui se caractérise par des choix simples, qui ne nécessitent pas d’attention ou d’effort particulier, qui sont presque automatiques. Ce ne serai pas le cas dans les situations de choix plus complexes (rules based) qui nécessitent plus d’attention et de concentration.

Conclusion personnelle

Ce type de situation où nos chiens doivent faire des choix simples sont très courantes dans nos disciplines canines. Cette étude est donc appropriée pour améliorer notre compréhension du dressage.
Vous remarquerez qu’il n’est pas ici question de punition ou de récompense, mais de retour d’information, sans impact confort/inconfort. Cela sert juste d’information pour que notre chien sache si il a bien fait, ou pas.
En pratique, cela consiste à mettre en place un code avec notre chien, pour lui dire si ce qu’il vient de faire est bien ce qui est attendu, ou pas. Le plus classique est le « good boy » pour CORRECT, et le « NOPE » pour INORECT.
J’avais déjà parlé d’un article de ED FRAWLEY qui aborde ce sujet (article sur le marqueur training).
http://leerburg.com/markers.htm

On voit au travers de cette étude qu’il est important de mettre en place les retours positifs et négatifs. Nos chiens en ont besoin. On entend souvent dire qu’il ne faut pas dire « NON » en phase d’apprentissage. C’est à la fois vrai, et faux.
Si le « NON » est dit d’un ton autoritaire, et est destiné à faire cesser une action, ce n’est pas de cela dont on parle ici. Mais si le « NON » est dit calmement, et dont le but est d’inciter le chien à proposer autre chose, alors c’est exactement de cela dont il s’agit. Et il ne faut surtout pas s’en priver !

Pour la compétition, on utilisera évitera les codes sonores trop évidents, et on préférera des codes visuels beaucoup plus discrets. Cela évitera au chien de douter, et de rajouter un stress supplémentaire à une situation de compétition déjà stressante.
Dans le cas d’un chien « fort », cela ne sert pas à grand-chose car il est sûr de lui en toute circonstance, mais dans le cas d’un chien assez faible, comme JESSY, cette aide est primordiale. Cela l’aide a prendre confiance en elle, c’est notre « YES, YOU CAN » à nous ….

Vous pouvez maintenant éteindre votre ordinateur, et donner à votre chien des retours d’informations …

Référence

https://labs.psych.ucsb.edu/ashby/gregory/Ashby_OBrien_P&P.pdf

CC BY-NC-ND 4.0 L’intérêt d’avoir un retour d’information par Didier ESCALLIER est sous Licence Creative Commons Internationale Attribution-Pas d'utilisation Commerciale-Pas de Modification 4.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *