Startseite » Training & Partnerschaft » Was ist positive Verstärkung und warum ist sie nicht immer positiv?

Was ist positive Verstärkung und warum ist sie nicht immer positiv?

Hast du dir schon mal darüber Gedanken gemacht, wie dein Pferd eigentlich lernt 🧐? Nein? Dann ist dieser Artikel genau richtig für dich! Darin geht es um positive Verstärkung, aber auch allgemein um das Lernverhalten von Pferden.

Warum ist es so wichtig, dass du das Lernverhalten deines Pferdes kennst? Ganz einfach: damit du ihm das Lernen möglichst einfach machen kannst und Erfolge belohnt werden. So funktioniert nämlich erfolgreiches Training, bei dem ihr beide Spaß habt 🤩

Dabei ist es wichtig zu wissen: Lernen findet immer statt. Dein Pony lernt pausenlos (und du übrigens auch!), ganz egal ob du das willst oder nicht. Aber je mehr du darüber weißt, desto mehr kannst du dir das zu Nutzen machen und für deine Zwecke beeinflussen 😎

Operante Konditionierung

Operante Konditionierung bezeichnet das Lernen über die Konsequenz einer Handlung. Das heißt: dein Pferdchen macht etwas (es bewegt einen Fuß, wackelt mit dem Ohr, wiehert etc.) und dann passiert etwas. Und je nachdem ob (und wie) toll dein Pony dieses Ergebnis findet, wird es das dann häufiger oder seltener machen.

💡 Das, was das Pferd macht, ist das Verhalten. Das, was danach passiert, ist die Konsequenz. Hier ein paar Beispiele, um das zu verdeutlichen:

  1. Dein Pferd zieht am Halfter (Verhalten) und erwischt deshalb ein Büschel Gras (Konsequenz).
  2. Dein Pferd zieht am Halfter (Verhalten) und erhält einen Klaps auf die Nase (Konsequenz).
  3. Du ziehst am Halfter und dein Pferd zieht dagegen (Verhalten), woraufhin du stärker am Halfter ziehst (Konsequenz).
  4. Du ziehst am Halfter und dein Pferd folgt dem Zug (Verhalten), woraufhin du nicht mehr ziehst (Konsequenz).
  5. Dein Pferd kommt auf der Weide zu dir (Verhalten) und erhält einen Apfel (Konsequenz).
  6. Dein Pferd kommt auf der Weide zu dir (Verhalten) und du ziehst ihm das Halfter an (Konsequenz).
  7. Das Pferd schnappt nach dem Leckerli in deiner Hand (Verhalten), woraufhin du eine Faust machst und das Pferd nicht mehr an das Leckerli kommt (Konsequenz).

Erkennst du ein Muster in diesen Beispielen? Wenn man sie genau analysiert, dann sieht man:

  • manchmal ist die Konsequenz angenehm für das Pferd 🥕; die Wahrscheinlichkeit ist daher sehr hoch, dass dein Pferdchen das Verhalten öfter zeigen wird, um öfter die angenehme Konsequenz zu erfahren
  • manchmal ist die Konsequenz unangenehm für das Pferd ⚡; dein Pony wird das Verhalten daher höchstwahrscheinlich seltener zeigen, um die unangenehme Konsequenz zu vermeiden

Du siehst: ich rede hier von Wahrscheinlichkeiten. Das heißt, in dem Moment wo die Konsequenz passiert, weißt du noch nicht mit Sicherheit, ob das Verhalten ab jetzt öfter oder seltener gezeigt wird. Das weißt du erst in der Zukunft. Wenn dein Pferd das Verhalten in Zukunft tatsächlich öfter zeigt, dann hast du es in der Vergangenheit verstärkt 👍. Man redet also von „Verstärkung“; auf Englisch heißt es „Reinforcement“ und man verwendet daher den Buchstabe „R“ als Kürzel. Wenn dein Pferd das Verhalten hingegen zukünftig seltener zeigt, dann hast du es in der Vergangenheit bestraft 👎. Man spricht daher von „Bestrafung“; auf Englisch heißt es „Punishment“ und man verwendet daher den Buchstabe „P“ als Kürzel.

Abgesehen davon ob das Verhalten verstärkt oder bestraft wurde, erkennst du in den Beispielen vielleicht noch ein zweites Muster:

  • manchmal wird als Konsequenz etwas hinzugefügt ➕ (ein Apfel, ein Klaps, ein Grasbüschel, ein Halfterdruck etc.)
  • manchmal wird als Konsequenz etwas entfernt ➖ (ein Leckerli, ein Halfterdruck etc.)

Wenn etwas hinzugefügt wird, dann wird das mit dem mathematischen Vorzeichen für Plus (+) gekennzeichnet. Eine Konsequenz ist daher „positiv“ in dem Sinne, dass etwas dazu kommt (mehr wird).

Wenn hingegen etwas entfernt wird, dann wird das mit dem mathematischen Vorzeichen für Minus (-) gekennzeichnet. Eine Konsequenz ist daher „negativ“ in dem Sinne, dass etwas weg kommt (weniger wird).

👉 Es ist daher wichtig, dass du dir folgendes merkst:
„Positiv“ und „negativ“ bedeuten bei der operanten Konditionierung nicht „angenehm“ und „unangenehm“, sondern etwas wird „hinzugefügt“ (+) oder „weg genommen“ (-).

Wenn man nun diese beiden Punkte kombiniert, erhält man vier mögliche Varianten: R+, R-, P+, P-
Man nennt diese die Quadranten der operanten Konditionierung:

Im Folgenden möchte ich dir die einzelnen Quadranten ein bisschen näher vorstellen, damit die ganze Theorie etwas praxisnaher wird!

Negative Bestrafung (P-) ⚡➖

Negative Bestrafung heißt: dein Pferd zeigt ein Verhalten seltener, weil in der Vergangenheit als Konsequenz etwas entfernt wurde. Das ist meistens der Fall, wenn du Futter weg nimmst (z.B. das aufgelistete Beispiel 7), aber auch andere angenehme Sachen. Beispielsweise wenn du aufhörst dein Pferd zu kraulen, weil es dich zurück krault (und das für dich meistens schmerzhaft ist).

Positive Bestrafung (P+) ⚡➕

Positive Bestrafung heißt: dein Pferd zeigt ein Verhalten seltener, weil in der Vergangenheit als Konsequenz etwas hinzugefügt wurde. Das ist immer der Fall, wenn du physischen oder psychischen Druck einsetzt, um ein Verhalten zu unterbinden (z.B. Punkt 2 und 3 in der Beispiel-Liste).

Beispielsweise wenn dein Pferd dich beim Spazierengehen überholen möchte und du einen Ruck am Halfter machst (also einen Ruck „hinzufügst“). Wenn dein Pferd dich daraufhin seltener versucht zu überholen, dann hast du das Überholen positiv bestraft.

Negative Verstärkung (R-) 🥕➖

Negative Verstärkung heißt: dein Pferd zeigt ein Verhalten häufiger, weil in der Vergangenheit als Konsequenz etwas entfernt wurde. Das ist immer dann der Fall, wenn du beispielsweise ein Verhalten mit Druck erzeugst und dann als Konsequenz den Druck weg nimmst (z.B. Beispiel 4 in der oberen Liste).

Diese Art von Training ist die Grundlage im weit verbreiteten „Horsemanship“: du wedelst mit der Gerte/einem Stick, dein Pferd macht daraufhin einen Schritt in eine Richtung die dir gefällt (Verhalten) und du hörst auf zu wedeln (Konsequenz).

🛑 Achtung: im Horsemanship wird auch häufig positive oder negative Bestrafung eingesetzt, ohne dass es den Menschen bewusst ist! Nämlich immer dann, wenn du das Wedeln/Touchieren mit der Gerte/dem Stick/dem Strick etc. dazu einsetzt, um ein Verhalten zu reduzieren (z.B. „Grenzen setzen“, indem du mit dem Seil vor der Pferdenase rotierst).

Positive Verstärkung (R+) 🥕➕

Positive Verstärkung heißt: dein Pferd zeigt ein Verhalten häufiger, weil in der Vergangenheit als Konsequenz etwas hinzugefügt wurde. Das ist in den allermeisten Fällen Futter (z.B. Punkte 1 und 5 in der Beispiel-Liste), kann aber auch etwas anderes angenehmes sein, z.B. Kraulen, Spielen, Zugang zu den Kumpels etc.

Diese Art von Training ist die Grundlage für das „Clickertraining“: dein Pferd macht etwas, du clickst und gibst ihm ein Leckerli. Ein häufig verbreiteter Irrtum ist deshalb, dass Clicker-Training und Training mit positiver Verstärkung das gleiche sind. Sind sie nicht! Clicker-Training (und beispielsweise auch Intrinzen) basiert aber auf positiver Verstärkung. Warum brauche ich den Clicker dann überhaupt? Das erfährst du weiter unten 👇

Was ist mit Beispiel Nr. 6?

Wenn du dir die Beschreibungen zu P+, P-, R+ und R- durchgelesen hast, dann hast du bestimmt gemerkt, dass ich die eingangs genannten Beispiele zugeordnet habe. Alle Beispiele, bis auf Nr. 6: „Dein Pferd kommt auf der Weide zu dir (Verhalten) und du ziehst ihm das Halfter an (Konsequenz).

In welchen Quadranten der operanten Konditionierung fällt dieses Beispiel also 🤔? Es steht jedenfalls fest: als Konsequenz wird etwas hinzugefügt (nämlich das Halfter). Es muss also jedenfalls ein Plus (+) sein. Aber ist es eine Verstärkung oder eine Bestrafung des Verhaltens (des Herkommens)? Tja, hier wird das Training interessant: das kommt nämlich darauf an!

Du denkst dir jetzt vielleicht „Hä, ich dachte operante Konditionierung ist etwas fixes?!“, und daher möchte ich nochmal auf einen Punkt in der Herleitung eingehen. Nämlich dass du erst rückblickend beurteilen kannst, ob du ein Verhalten verstärkt oder bestraft hast. Denn: es kommt darauf an, wie es dein Pferd auffasst! Lass‘ mich das im folgenden Abschnitt nochmal näher erklären 🧐

Unabsichtliche Bestrafung oder Verstärkung

Wenn dein Pferdchen das Halfter mit Arbeit oder Langeweile assoziiert, wird es das Aufhalftern vermutlich als Strafe auffassen ⚡. Wenn es das Halfter aber mit Spaß und Futter assoziiert, wird es das Aufhalftern als Belohnung (und daher Verstärker) auffassen 🥕.

Du siehst also, warum es wichtig ist dass du dich mit operanter Konditionierung auskennst: viele Probleme im Alltag sind nämlich auf genau dieses Missverständnis zurück zu führen! Wenn sich dein Pferd also nicht so verhält wie du dir das vorstellst, dann hast du das „richtige“ Verhalten vermutlich in der Vergangenheit (unabsichtlich) bestraft und/oder das „falsche“ Verhalten (unabsichtlich) verstärkt.

Und das passiert schneller als man denkt! Beispielsweise, wenn du dein Pferd schimpfst, sich dein Pony aber über deine Aufmerksamkeit freut. Oder wenn du dein Pferd am Kopf streichelst, aber ein Pferdchen das gar nicht wirklich gerne hat.

Du solltest daher sehr genau darauf achten, was dein Pferd als angenehm und unangenehm empfindet und das dann bewusst einsetzen. Das kann auch von Situation zu Situation unterschiedlich sein, je nachdem in welchem Gemütszustand sich dein Pferd gerade befindet.

Auf Englisch nennt man unabsichtliche Verstärkung übrigens „Bootleg Reinforcement“ und Eileen Anderson hat hier einen tollen Artikel dazu geschrieben (darin geht es zwar um Hunde, aber es ist bei Pferden das gleiche Prinzip 😉).

Häufige Fragen rund um das Training mit positiver Verstärkung

So, nachdem du nun weißt wie positive Verstärkung funktioniert, möchte ich hier nun gleich noch mit ein paar häufigen Vorurteilen und Fragen aufräumen.

Wofür kann ich positive Verstärkung anwenden?

Viele Pferdemenschen denken, dass positive Verstärkung und Clicker-Training nur für Zirkuslektionen und Trick-Training eingesetzt werden kann. Und das ist leider ein großer Irrtum, der dazu führt dass die allermeisten Pferde noch immer mit negativer Verstärkung oder gar Bestrafung trainiert werden.

Denn Fakt ist: du kannst alles mit positiver Verstärkung trainieren 🤩
Genauer gesagt:

  • das gesamte Handling im Alltag (führen, ruhig Stehen am Putzplatz und bei der Hufbearbeitung, bei medizinischen Prozeduren wie Entwurmen und Spritzen, waschen, scheren, verladen, spazieren gehen, Schrecktraining etc.),
  • Bodenarbeit (sowohl gymnastizierende Handarbeit als auch longieren, Zirzensik, Freiarbeit und natürlich Intrinzen-inspiriertes Training)
  • Reiten (egal welche Disziplin)

Allerdings muss ich auch erwähnen, dass nicht alles gleichermaßen einfach ist mit positiver Verstärkung. Gerade Reiten benötigt eine sehr gute Vorbereitung (und einen beweglichen Reiter 😁), aber dafür ist das Ergebnis ungleich schöner.

Ist positive Verstärkung das gleiche wie Clicker-Training?

Nein! Positive Verstärkung heißt nur, dass ein Verhalten verstärkt wird, indem eine Belohnung hinzugefügt wird. Der Clicker ist ansich jedoch neutral und keine Belohnung. Man kann den Clicker jedoch positiv (angenehm) behaften, indem danach immer ein Leckerli folgt. Damit wird der Clicker zu einem sogenannten sekundären Verstärker.

Du fragst dich jetzt vielleicht, warum man den Clicker dann überhaupt einsetzt, wenn man doch genauso gut einfach gleich das Leckerli geben kann 🤔
Dafür gibt es mehrere Gründe, aber zwei der wichtigsten sind:

  • der Clicker funktioniert auf Distanz (z.B. wenn du dein Pferd longierst) und du daher erst ein paar Momente brauchst bevor du bei deinem Pferd bist und das Leckerli verabreichen kannst – der Clicker hat hier daher die Funktion eines „Brücken-Signals“ (er „überbrückt“ den Zeitraum zwischen dem gezeigten Verhalten und Leckerli)
  • der Clicker ist präzise, d.h. du kannst damit den Bruchteil einer Sekunde markieren, beispielsweise wenn du den Vorgriff des linken Hinterbeins belohnen möchtest – der Clicker hat hier die Funktion des „Marker-Signals“ (er „markiert“ den Moment des richtigen Verhaltens)

Du kannst den Clicker auch sehr gut situativ einsetzen oder stattdessen einen Zungenschnalzer o.ä. verwenden. Was davon die Vor- und Nachteile sind, erfährst du in meinem Blog-Artikel „Warum ich Clicker-Training liebe (und es trotzdem nicht immer einsetze)“.

Ist positive Verstärkung immer „positiv“?

Nein! Positive Verstärkung ist im mathematischen Sinne immer „positiv“, aber nicht im emotionalen Sinne immer „angenehm“ oder „druckfrei“. Das klingt jetzt wahrscheinlich überraschend, denn die meisten Menschen setzen positive Verstärkung ein, damit sie eben nicht mit Druck trainieren müssen, sondern stattdessen ein möglichst friedvolles Pferdetraining anstreben.

Training mit positiver Verstärkung sollte auch friedvoll sein! Es sollte harmonisch und frei von Zwängen sein. Aber das ist es leider nicht automatisch.
Im Gegenteil: es passiert manchmal unabsichtlich, dass z.B. auch im Clicker-Training Druck und Zwang aufgebaut wird. Und zwar typischerweise wenn das Thema „Futterlob“ nicht ausreichend bedacht wird. Wenn dein Pferd beispielsweise Hunger hat, dann wird es quasi alles tun um endlich an das Leckerli zu kommen. Manche Leute nutzen das leider sogar extra aus, um dem Pferd besonders spektakuläre Bewegungen zu entlocken 😳! Das ist natürlich ziemlich gemein und hat dann klarerweise rein gar nichts mehr mit friedvollem Pferdetraining zu tun, obwohl es mit positiver Verstärkung gemacht wird.

Rund um das Thema „Futterlob“ gibt es auch noch zig andere Fallstricke, die du aber ganz einfach vermeiden kannst. Wie du das genau schaffst, zeige ich dir in meinem Artikel zur Vermeidung von Futtermonstern.

Andere Problemstellen können auch falsches Timing oder schlechte Belohnungsrate sein. Beides kann zu unheimlichem Frust auf Seiten des Pferdes führen und das ist dann ebenfalls ziemlich weit von friedvollem Pferdetraining entfernt. Oder es werden damit unabsichtlicher negative Emotionen (Angst oder Aggression) mit verstärkt, so dass diese im Training schließlich noch häufiger auftreten.

Du siehst also, „positiv“ ist nicht gleich „angenehm“ – leider! Es lohnt sich daher, wenn du dich tiefergehend mit der Materie beschäftigst, damit dein Pferdetraining mit positiver Verstärkung auch wirklich fair und pferdefreundlich ist.

Kann ich positive Verstärkung mischen?

Jein! Das kommt darauf an 😉
Wenn du dich für Training mit positiver Verstärkung entscheidest, dann ist das natürlich keine „entweder-oder“-Entscheidung, sondern du solltest dich zunächst fragen: in welchen Bereichen kannst oder willst du positive Verstärkung einsetzen? Und dann trenne diese Bereiche möglichst gut von jenen Bereichen, in denen du keine positive Verstärkung einsetzt. Je klarer du diese Trennung machst, desto einfacher wird es für dein Pferd sein.

Du kannst das beispielsweise über unterschiedliche Ort oder Ausrüstung trennen. In diesem Sinne kannst du die einzelnen Trainingsarten gut kombinieren, z.B. beim Reiten verwendest du negative Verstärkung (R-), bei der Bodenarbeit aber positive Verstärkung (R+).

Was ich dir hingegen nicht empfehlen würde, ist das Mischen von positiver Verstärkung (R+) mit den anderen Quadranten (R-, P+, P-) in ein und demselben Bereich. Warum? Weil es einerseits leicht zu Verwirrung beim Pferd führt und damit nicht nur Unmut, sondern auch schlechte Lernerfolge erzeugt 🤨
Und andererseits, weil es dann meist keine positive Verstärkung mehr ist! Ein Beispiel: du schickst dein Pferd mit Druck rückwärts und sobald es rückwärts geht, nimmst du den Druck weg und gibst ihm ein Leckerli. Aus welchem Grund ist es nun rückwärts gegangen? Weil es das Leckerli haben möchte oder weil es dem Druck entgehen wollte? Die Antwort wird in den meisten Fällen sein: es möchte den Druck vermeiden. Das Leckerli danach ist dann zwar nett, trägt aber nur noch wenig zum eigentlichen Lernen bei 🤔

Und was mache ich im Notfall?

Es gibt natürlich Ausnahmen, bei denen sich das Mischen im gleichen Kontext nicht vermeiden lässt oder aus anderen Gründen sinnvoll ist. Dazu zählen beispielsweise uneingeschränkt alle Notfall-Situationen – wenn Gefahr in Verzug ist, solltest du alles tun was nötig ist um die Gefahr zu bannen ❗

Ich würde hier aber auch jene Situationen hinzuzählen, die gesundheitliche Risiken (egal ob kurz- oder langfristig) verursachen können, beispielsweise:

  • wenn sich dein zu dickes Pferdchen nicht von der fetten Klee-Wiese entfernen möchte (hier würde ich negative Verstärkung einsetzen indem ich nicht-eskalierenden Druck am Halfter ausübe)
  • wenn dein Pferd wie ein Krokodil auf das Leckerli in deiner Hand zufährt (hier würde ich negative Bestrafung einsetzen, indem ich die Hand mit dem Leckerli schließe)

Aber, das beziehe ich immer auf die akute Situation. Vorbeugen ist besser als nachsorgen! Daher solltest du dir dann im Nachhinein überlegen, wie es überhaupt so weit kommen konnte und wie du eine solche Situation zukünftig vermeiden kannst 🚧 z.B.:

  • Hatte dein Pferd vielleicht Hunger oder Schmerzen?
  • Kannst du in einer grasarmen Gegend spazieren gehen?
  • Sind deine Leckerlis zu nieder-/hochwertig?
  • Kannst du an eurer Beziehung und der allgemeinen Motivation arbeiten?

Aber wenn du bereits in einer bestimmten Situation bist, dann musst du vielleicht auf andere Methoden als positive Verstärkung zurück greifen. Das sollte aber tatsächlich die Ausnahme und nicht die Regel sein ☝

Fazit

Rund um das Thema „positive Verstärkung“ gäbe es noch so unendlich viel mehr zu beschreiben. Aber ich hoffe, ich konnte dir mit diesem Artikel zumindest ein besseres Bild davon geben, wie dein Pferd mittels operanter Konditionierung lernt und wie positive Verstärkung funktioniert. Und natürlich, wie du damit dein Training effizient gestalten kannst 💪

Du hast noch Fragen? Dann schreibe sie mir doch als Kommentar und ich werde sie beantworten – versprochen!

Falls du also bisher positive Verstärkung noch nicht ausprobiert hast, dann kann ich dir nur raten: der beste Zeitpunkt dazu ist jetzt! Schnapp‘ dir die richtigen Leckerlis, überlege dir einen Bereich wo du R+ gerne ausprobieren möchtest und lege los 🤩

One comment

  1. Kathrin says:

    Hallo Nathalie,

    Vielen Dank für den sehr interessanten Artikel über die operante Konditionierung!

    Viele Grüße Kathrin

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert