Pourquoi le R+ et la P+ ne font pas nécessairement bon ménage

Publié le par fidelecanin

Pourquoi le R+ et la P+ ne font pas nécessairement bon ménage

La plupart des entraîneurs canins se réclament maintenant du renforcement positif (R+). Et c’est une excellente nouvelle! Cependant, il faut savoir utiliser les quadrants du conditionnement opérant de façon appropriée pour que le renforcement positif ait sa pleine valeur.

Rappelons tout d'abord ce qu’est le conditionnement opérant :

Edward Thorndike (1898) et Burrhus Frederic Skinner (1947), deux psychologues américains (précurseurs du behaviorisme), ont mis au point la théorie du conditionnement opérant. L'apprentissage skinnerien repose sur deux éléments, le renforcement et la punition, pouvant chacun être soit positif soit négatif. Ces termes doivent être pris dans le sens précis du conditionnement opérant :

  • Renforcement : conséquence d'un comportement qui rend plus probable que le comportement soit reproduit de nouveau.
  • Punition : conséquence d'un comportement qui rend moins probable que le comportement soit reproduit de nouveau.

Un renforcement ou une punition peut être soit :

  • Positif : par l'ajout d'un stimulus agissant sur l'organisme.
  • Négatif : par le retrait d'un stimulus agissant sur l'organisme.

Ainsi, il existe 4 types de conditionnement opérant (les 4 quadrants):

  • Renforcement positif : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter suite à l'ajout d'un stimulus appétitif contingent à la réponse Ex: mon chien marche bien au pied et je lui donne un morceau de nourriture
  • Renforcement négatif : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à augmenter suite au retrait d'un stimulus aversif contingent à la réponse. Ex: mon chien marche bien au pied alors je ne lui donne pas un coup d'étrangleur
  • Punition positive : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite à l'ajout d'un stimulus aversif ou conséquence aversive contingente au comportement cible. Ex: mon chien tire en laisse et je lui donne un coup d'étrangleur
  • Punition négative : Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite au retrait d'un stimulus appétitif. Ex: mon chien tire en laisse et je cesse de marcher

Résumons:

Renforcement +

Ajouter un élément appétitif pour faire augmenter un comportement

Punition +

Ajout d’un élément aversif pour faire diminuer un comportement

Renforcement –

Retrait d’un élément aversif pour faire augmenter un comportement

Punition –

Retrait d’un élément appétitif pour faire diminuer un comportement

Plusieurs intervenants canins présentent à leurs clients, un mélange des méthodes traditionnelles (modèle aversif, basé sur la hiérarchie des individus d'un groupe et la vision dominant-soumis) et des méthodes scientifiques (théorie de l'apprentissage). Je m'explique.

Certains entraîneurs vont utiliser le R+ et la P+ dans une même séquence d'entraînement. Par exemple, on demande à un chien de s'asseoir:

-s'il le fait, on lui donne une gourmandise

-s'il ne le fait pas, on lui donne un bon coup d'étrangleur

Quel est l'effet psychologique de cette combinaison?

Pour bien faire comprendre mon point, je vais utiliser un parallèle:

-vous êtres au Japon. Vous devez vous rendre dans le quartier Nippori. Vous ne savez pas lire les panneaux en langue japonaise indiquant le nom des quartiers.

-je vous demande de prendre la direction du quartier Nippori. En cas de réussite, je vous donne un sushi (car vous les adorez!) à chaque embranchement qui nous mènera à bon port (R+). En cas d'échec, je vous électrocute avec un bâton électrique (P+). Comment allez-vous vous sentir? Totalement angoissé ! Vous aurez peur de vous tromper. Vous allez faire plusieurs essais et la possibilité de vous tromper est extrêmement élevée. Et plus vous serez angoissé, plus difficile sera votre réflexion.

Un signal empoisonné

De plus, se servir de la P+ comme réponse à une demande qui n'est pas obtempérée, peut empoisonner le mot ou le signal utilisé pour cette demande. Si je dis ''assis'' à un chien et que dans le cas où il ne répond pas adéquatement, j'utilise une P+, le mot ''assis'' pourra annoncer quelque chose de négatif pour le chien. Le R+, parce qu'il donne quelque chose d'agréable au chien, ne pourra jamais occasionner de peur ou d'angoisse.

Alors que:

-si j'utilise le R+ (renforcement de tout mouvement dans la bonne direction) et la P- (ignorance de tout mouvement qui va dans la mauvaise direction), le chien pourra chercher la bonne réponse à son rythme et selon le type de renforçateur utilisé. Avec le R+, il sera aidé dans la prise de décision. Aucune peut ou angoisse. La prise de décision est libre de tout parasitage. Aucune possibilité d'empoisonnement d'un signal.

Le chien qui est en période d'apprentissage, comme il ne comprend pas le langage humain, il ne peut comprendre la demande. Il doit faire une association pour que cette compréhension se produise. S'il ne se conforme pas à la demande... c'est tout simplement QU'IL NE VOUS COMPREND PAS! Aidez-le à vous comprendre en le leurrant, modelant ou capturant le bon comportement (R+). En ajoutant la P- au lien de la P+, votre chien pourra chercher la bonne réponse, sans angoisse et sans que votre relation avec lui soit parasitée.

Publié dans entraînement