オペラント条件づけ
報酬を与えることでオペラント行動を強化させ、オペラント行動を定着させる一連の手続きのことをオペラント条件づけといいます。
また、罰を与えることでオペラント行動を弱くし、行動の頻度を低下させるオペラント条件づけもあります。
定義を聞いても、理解できない方が多いかと思いますので、なるべく分かりやすく解説いたします。
目次
オペラント条件づけの概略
オペラント条件づけ(Operand conditioning)は道具的条件づけ(Instrumental conditioning)とも呼ばれます。
オペラント条件づけは、普段の生活で無意識に使っています。
具体的には、下記がオペラント条件づけに該当します。
- 望ましい行動をしたので、おやつを与えて褒める。
- 望ましくない行動をしたので、叱った。
心理療法でもオペラント条件づけは使用されており、脳波フィードバックトレーニング(ニューロフィードバック)は、オペラント条件づけ(正の強化)を使っています。
さらに、オペラント条件づけは人間だけではなくペットや家畜などの動物にも使うことができます。
オペラント行動とは
生体が随意的に制御できる行動が、オペラント行動です。
自発的な行動といっても良いでしょう。
オペラント行動は、反射や条件反応による行動ではありません。
オペラント行動の例
ゲーム好きな人が歩いていて、ゲームセンターを見かけたから、ゲームセンターに入ってしまった。
ゲームセンターに入った行動が、オペラント行動です。
ケーキ好きな人が、ショーケースの中にある美味しそうなケーキを見て、つい買ってしまった。
ケーキをつい買ってしまった行動がオペラント行動です。
三項随伴性(Three-term contingency)
オペラント条件づけに必ず付随してくる三項随伴性についても確認していきましょう。
「弁別刺激→行動→結果」の3つが、連続して起こることを三項随伴性といいます。
また、3つの対応関係を把握することを、頭文字からABC分析といいます。
随伴性とは、前者に伴って後者が起こるという意味です。
心理療法では、クライアント様から「弁別刺激がつらい」と訴えられることも多いです。
例えば、不安に悩んでいる方なら「○○場面で不安になります。○○の場面を避けるために△△をしています」と訴えることが多いです。
不安になる「○○の場面」というのが、弁別刺激です。
「△△をしています」というのが、オペラント行動です。
「不安から逃れることができた」というのが結果です。
「○○の場面で△△をしたことで、不安から逃げることができた」ということが強化につながり、不安から逃げる頻度が高まっていき、さらに大変になってしまいます。
強化と罰(弱化)
オペラント条件づけには、強化と罰があります。
強化は行動の出現率を上昇させること、罰は行動の出現率を減少させることです。
罰は「弱化」と呼ばれることもあります。
正の強化 or 負の強化
行動の出現率を上昇させる強化には、正の強化と負の強化があります。
正の強化とは強化する刺激を与えて、行動の出現率をアップさせること、負の強化とは刺激を取り除くことで、行動の出現率をアップさせることです。
正の罰(正の弱化) or 負の罰(負の弱化)
行動の出現率を減少させる罰にも、正の罰と負の罰があります。
正の罰とは罰になる刺激を与えて、行動の出現率をダウンさせること、負の罰とは刺激を少なくすることで、行動の出現率をダウンさせることです。
正の強化・負の強化・正の罰・負の罰のまとめ
強化 | 行動の出現率を増大 | 正の強化 | 強化する刺激を与える |
負の強化 | 刺激を取り除く | ||
罰 | 行動の出現率を減少 | 正の罰 | 罰になる刺激を与える |
負の罰 | 報酬を引き下げる(例:減給) |
強化子の操作 | ||
提示 | 除去(減少) | |
好子(報酬刺激) | 正の強化 (行動の出現上昇) | 負の罰 (行動の出現減少) |
嫌子(嫌悪刺激) | 正の罰 (行動の出現減少) | 負の強化 (行動の出現上昇) |
罰を用いる問題点
しつけなどで罰を使用する場合は、慎重な配慮が必要です。
- 罰は倫理的に問題がある場合が多い。
- 罰は望ましくない行動をさせないようにするには有効ですが、望ましい行動をするようにするには有効ではない。
- 罰の効果は一時的なものになりやすい。
- 罰の効果は繰り返すと弱くなる。同じ効果を持たせるには罰の強度を上げていく必要がある。
- 罰の出現する場面で、親の存在など明確な弁別刺激が付帯している場合が多い。結果、親の存在がないと行動が減少しない。隠れて悪事をしてしまう。
- 学習者に嫌悪的な反応を引き起こすため、別の望ましくない行動を引き起こすことがある。
- 罰を回避するため、学習者が罰の仕掛けを破壊したり、訓練者を攻撃したりすることがある。
正の強化の例
A:先行条件 デートで食事に行く
B:行動 おいしいと言って食べる
C:結果 彼女が喜ぶ
変化:デートでおいしい食事に行く機会が増える
負の強化の例
A:先行条件 嫌いな騒がしいところに行く
B:行動 外に出る
C:結果 嫌いな場所にいるのを避けられた
変化:嫌いな騒がしいところに行く機会が減る
正の罰の例
A:先行条件 食事に行く
B:行動 自分の体に合わない食べ物を食べた
C:結果 お腹を下す
変化:自分の体に合わない食べ物を食べなくなる
負の罰の例
A:先行条件 食事に行く
B:行動 飲み過ぎて、お店から出禁になった
C:結果 お店に入れなくなる
変化:飲む量が減る。食事に行くことを自粛する
弁別と般化
弁別(べんべつ)とは、刺激に応じて異なる反応をするように学習することです。
般化(はんか)とは、類似した刺激にも同じ反応を示すことです。
弁別の例
2種類の笛を用意し、笛Aのときは「おすわり」、笛Bのときは「伏せ」を犬に学習させます。
般化の例
2種類の笛を用意し、笛Aで「おすわり」の学習をさせます(オペラント条件づけ)。
次に、笛Bを鳴らしてみます。
笛Aよりは遅くなりますが、「おすわり」をします。
行動形成
段階的に行動を形成していくのが行動形成です。
オペラント条件づけは学習に極めて有効ですが、弱点もあります。
オペラント条件づけの弱点は、「結果による反応は、学習者が自発するものなので、確実に反応を得られる保証がない」ことです。
反応が無ければ、強化することはできません。
そこで、段階的に行動を形成していきます。
即時強化
反応直後に強化を与える方法が即時強化です。
例えば、お手伝いをしたら、すぐに褒めることが重要です。
強化が遅れる(お手伝いをした後、しばらくしてから褒める)と、思わぬ行為を学習してしまうことがあります。
スモールステップ
目標達成のコーチングや予備校などで用いられている方法です。
現状と目標に差が大きいときに有効です。
強化スケジュール
連続強化(Continuous Reinforcement : CRF)
反応を毎回強化するスケジュールを連続強化といいます。
正の強化であれば、毎回報酬を与えます。
部分強化(Partial Reinforcement)
部分強化は間欠強化(Intermittent Reinforcement)とも呼ばれます。
連続強化よりも、消去されにくい(消去抵抗が高い)のが部分強化です。
消去とは、反応に強化が随伴しなくなることです。
消去抵抗とは、強化子が与えられなくなっても反応が強くことです。
例)依存症の消去抵抗は高い。
部分強化の方法は無限に考えられます。
代表的なものに、固定間隔強化(Fixed interval : FI)、変動間隔強化(Variable interval : VI)、固定比率強化(Fixed ratio : FR)、変動比率強化(Variable ratio : VR)があります。
強化スケジュール | 強化の与え方 | 実例 | 消去抵抗 | |
連続強化 | 反応ごと | 自販機 | 最も低い | |
部分強化 | 固定間隔強化 (FI) | 一定の時間間隔 | 月給 | 低い |
変動間隔強化 (VI) | 異なる時間間隔 | 魚釣り | 高い | |
固定比率強化 (FR) | 一定の反応数 | 出来高払い | 低い | |
変動比率強化 (VR) | 不定の反応数 | ギャンブル | 非常に高い |
オペラント条件づけがベースとなる心理療法
シェイピング法
スキナーが提唱した方法で、目指す行動(適応的行動)をスモールステップで段階的に形成(シェイピング)する方法です。
刺激を提示(プロンプティング)することで、適応的行動を定着させます。
定着したら、刺激を除去(フェーディング)し、刺激がなくても適応的行動が持続するような手続きがあります。
授業中に離席をしてしまう子供の着席行動を定着させる方法に用いられます。
トークンエコノミー法
プリントを10枚できたときにシールを与え、シールが30枚たまったら、子供が設定したご褒美(強化子)を与える方法です。
トークンを一定数集めると、クライエントが望む強化子(報酬)を得られるようにすることで、適応的な行動の形成を行う方法です。
トークンとは、報酬につながるもので、シールやハンコなどが用いられます。
自己主張訓練(アサーション・トレーニング)
対人関係で過緊張や不安を感じる場面などで用いられます。
心理的安全性を確保したうえで、クライエントに実際に人前で繰り返し自己主張してもらいます。
緊張や不安を感じても、自己主張可能であることをクライエントが学びます。
社会的技能訓練{ソーシャルスキルトレーニング(SST)}
リバーマンによって提唱されたもので、社会的スキルの獲得を目指す方法です。
ニューロフィードバック
脳波など脳の情報をトレーニング者(クライアント様)に、音や映像でフィードバックするニューロフィードバックもオペラント条件付けによる学習です。
動物にオペラント条件付けが使えるように、ニューロフィードバックも動物に対して行うことが可能です。
ちなみに、猫に対して脳波をフィードバックさせる研究から、ニューロフィードバックが誕生しました。
ニューロフィードバックは心理療法のひとつですが、パフォーマンスアップや夢や目標の実現にも使えます。
ニューロフィードバックとQEEG専門施設では、心理療法としてのニューロフィードバックだけではなく、自己実現に対しても実施しております。
ご興味のある方は、お気軽にご連絡くださいませ。
よくある質問
- Q.オペラント条件付けとは?A.報酬を与えることでオペラント行動を強化させ、オペラント行動を定着させる一連の手続きのことをオペラント条件づけといいます。
また、罰を与えることでオペラント行動を弱くし、行動の頻度を低下させるオペラント条件づけもあります。 - Q.勉強など望ましい行動をオペラント条件付けで増やすには?A.勉強することを増やすには、勉強したことに対して報酬を与えます。報酬には、食べ物などがあります。ただし、お腹一杯ですと、報酬にはなりません。何が報酬になるかは、ご本人が報酬を与える時点で欲しいものである必要があります。 なお、間違った方法で行ってしまい、勉強することが減ってしまうこともありますのでご注意ください。
- Q.上手く強化できません。どうしたらいいですか?A.オペラント条件付けの基本である三項随伴性と強化スケジュール、報酬が適切に与えているかどうか確認しましょう。報酬が罰になっている可能性、報酬が報酬になっていない可能性もあります。 なお、オペラント条件付けは、自発行動(簡単にいうと自分からした行動:偶然にした行動でも可)を強化することが大切です。