مقدمه

شرطی شدن فعال Operant Conditioning، که گاهی اوقات به آن شرطی سازی عملیاتی نیز گفته می‌شود، روشی برای یادگیری است که برای انجام برخی از رفتارها پاداش و مجازات تعیین می‌شود. از طریق شرطی سازی عملیاتی، بین یک رفتار و پیامدی (چه منفی و چه مثبت) برای آن رفتار ارتباطی ایجاد می‌شود. به عنوان مثال، موش‌های آزمایشگاهی هنگام روشن شدن چراغ سبز یک اهرم را فشار می‌دهند، در نتیجه این کار یک گلوله غذایی به عنوان پاداش دریافت می‌کنند. اما هنگام روشن شدن چراغ قرمز اهرم را فشار می‌دهند و دچار برق گرفتگی ملایمی ‌می‌شوند. در نتیجه، آنها یاد می‌گیرند که هنگام روشن شدن چراغ سبز، اهرم را فشار دهند و از فشردن اهرم زمان روش شدن چراغ قرمز خودداری کنند.

اما شرطی شدن فعال فقط چیزی نیست که هنگام آموزش حیوانات آزمایشگاهی در محیط‌های آزمایشی اتفاق بیفتد. این رویکرد در یادگیری روزمره نقش قدرتمندی دارد. تقویت و تنبیه در محیط‌های طبیعی همیشه وجود داشت.  همچنین در ساختارهای ساختارمندتر مانند کلاس‌ها یا جلسات درمانی نیز از آن استفاه می‌شود.

تاریخچه شرطی شدن فعال

شرطی سازی عملیاتی برای اولین بار توسط رفتارگرای بی اف اسکینر (BF Skinner) ارائه گردید. به همین دلیل ممکن است گاهی اوقات بشنوید که از آن به عنوان شرطی سازی Skinnerian یاد می‌شود. به عنوان یک رفتارگرا، اسکینر معتقد بود که برای توضیح رفتار، واقعاً لازم نیست که به افکار و انگیزه‌های داخلی نگاه کنیم. در عوض، وی پیشنهاد داد، ما فقط باید به علل بیرونی و قابل مشاهده رفتار انسان بنگریم.

از اوایل قرن 20، رفتارگرایی به یک نیروی اصلی در روانشناسی تبدیل شد. اندیشه‌های جان بی واتسون از همان ابتدا بر این مکتب فکری حاکم بود. واتسون روی اصول شرطی سازی کلاسیک متمرکز بود. یک داستان مشهور وجود دارد که می‌گوید، واتسون می‌تواند هر کسی را بدون توجه به سابقه‌اش بگیرد و آموزش دهد تا کاری که او می‌خواهد را انجام دهد.

رفتارگرایان اولیه منافع خود را معطوف به یادگیری انجمنی می‌کردند. اسکینر بیشتر به این موضوع علاقه داشت که عواقب عملکرد افراد بر رفتار آنها چه تأثیر می‌گذارد. اسکینر اصطلاح عملگر را برای اشاره به هر “رفتار فعالی که برای ایجاد عواقب بر محیط اعمال می‌شود” ایجاد نمود. نظریه اسکینر توضیح داد که چگونه طیف وسیعی از رفتارهای آموخته شده را که هر روز از خود نشان می‌دهیم، در طی زمان آموخته‌ایم.

کاشف شرطی شدن فعال
بی اف اسکینر

تاثیر قانون اثر

نظریه اسکینر به شدت تحت تأثیر کار روانشناس ادوارد ثورندایک قرار گرفت، وی شخصی بود که  قانون اثر را ارائه کرده است. مطابق این اصل، اقداماتی که نتایج مطلوبی را ایجاد می‌کنند، احتمالاً بیشتر تکرار می‌شوند. در حالی که مواردی که نتایج نامطلوب را ایجاد می‌کنند، احتمال تکرار آن کمتر است.

شرطی شدن فعال یک پیش فرض نسبتا ساده‌ای دارد که کل نظریه بر اساس آن ارائه گردید. این فرض می‌گوید اقداماتی که باعث تشویق می‌شوند احتمال وقوع مجدد آنها در آینده بیشتر است. اگر در کلاس درس یک داستان خنده‌دار بگویید و همه بخندند، احتمال اینکه در آینده دوباره آن داستان را بگویید زیاد است.

اگر دست خود را برای پرسیدن سوال بلند کنید و معلمتان از رفتار مودبانه شما تعریف کند، احتمال اینکه دفعه بعدی که سوال یا نظری داشتید، دست خود را بلند کنید بسیار زیاد است. هر زمان که رفتاری انجام دهید تشویق شوید یا نتیجه مطلوبی ایجاد گردد، عمل قبلی شما تقویت می‌شود.

برعکس، اعمالی که منجر به مجازات یا پیامدهای نامطلوب شوند، تضعیف می‌شوند و احتمال تکرار آنها در آینده کمتر است. اگر در کلاس دیگری دوباره همین داستان را بگویید اما هیچ کس این بار نخندد، در آینده احتمال تکرار دوباره داستان کم است. اگر در کلاس پاسخی فریاد بزنید و معلم شما را سرزنش کند، در این صورت احتمال این که کلاس را دوباره قطع کنید، کمتر می‌شود.

انواع رفتارها

اسکینر بین دو نوع رفتار مختلف تفاوت قائل است. این دو نوع رفتار به شرح زیر:

  • رفتارهای واکنشگر: رفتارهایی هستند که به صورت خودکار و انعکاسی مانند عقب کشیدن دست از اجاق گاز داغ یا تکان دادن پای هنگام ضربه پزشک بر روی زانوی شما اتفاق می‌افتند. به هیچ وجه لازم نیست این رفتارها را یاد بگیرید. آنها به طور خودکار و غیر ارادی رخ می‌دهند.
  • رفتارهای عملیاتی: از سوی دیگر، رفتارهای عملیاتی تحت کنترل آگاهانه ما هستند. برخی ممکن است خود به خود و برخی دیگر به صورت عمدی رخ دهد. اما نتایج این اقدامات است که بر روی تکرار یا عدم وقوع آنها در آینده تأثیر می‌گذارد. اقدامات ما در مورد محیط زیست و عواقب ناشی از آن، بخش مهمی ‌از فرایند یادگیری را تشکیل می‌دهد.

در حالی که شرطی سازی کلاسیک می‌تواند رفتارهای واکنشگر توضیح دهد. اما اسکینر متوجه شد که این نظریه نمی‌تواند یادگیری که در طول زمان ایجاد می‌شود را توضیح دهد. به همین علت اسكینر نظریه شرطی شدن فعال را  که از اهمیت بیشتری برخوردار است، ارائه کرد.

اسکینر در دوران کودکی دستگاه‌های مختلفی را اختراع کرد و وی در طول تحصیلاتش در مورد شرطی شدن فعال از این مهارت‌های خود استفاده کرد. وی دستگاهی را ایجاد کرد که به عنوان اتاق شرطی سازی عملیاتی شناخته می‌شود. و امروزه اغلب از آن به عنوان جعبه اسکینر یاد می‌گردد. در این محفظه امکان قرارگیری حیوانات کوچکی مانند موش یا کبوتر وجود داشت. این جعبه همچنین حاوی میله یا کلیدی بود که حیوان می‌توانست برای دریافت پاداش آن را فشار دهد.

به منظور ردیابی پاسخ‌ها، اسکینر همچنین دستگاهی را اختراع کرد که به عنوان ضبط کننده تجمعی شناخته می‌شود. این دستگاه پاسخ‌ها را به عنوان یک حرکت به سمت بالا از یک خط ثبت می‌کند تا بتوان با مشاهده شیب خط نرخ پاسخ را فهمید.

اتاق شرطی سازی عملیاتی
جعبه اسکینر

اجزای شرطی شدن فعال

چند مفهوم کلیدی در شرطی شدن وجود دارد. این مفاهیم به شرح زیر است:

تقویت در شرطی شدن فعال

تقویت Reinforcement رویدادی است که اعمال می‌شود و رفتار آینده را تقویت و یا افزایش می‌دهد. تقویت کننده‌ها دو نوع هستند. در هر دو مورد تقویت، رفتار افزایش می‌یابد.

تقویت کننده‌های مثبت رویدادها یا نتایج مطلوبی هستند که پس از رفتار ارائه می‌شوند. در موقعیت‌های تقویت مثبت، پاسخ یا رفتاری با افزودن ستایش یا پاداش مستقیم تقویت می‌شود. اگر در محل کار خود کار خوبی انجام دهید و مدیرتان به شما تشویقی دهد، این پاداش یک تقویت کننده مثبت است.

تقویت کننده‌های منفی شامل حذف حوادث یا نتایج نامطلوب پس از نمایش یک رفتار هستند. در این شرایط، با حذف چیزی که ناخوشایند تلقی می‌شود، پاسخ تقویت می‌شود. به عنوان مثال، اگر کودک شما وسط یک رستوران شروع به فریاد زدن می‌کند، اما هنگامی‌که دلیل گریه او را برطرف می‌کنید متوقف می‌شود. این عمل منجر به برطرف شدن وضعیت ناخوشایند می‌گردد و رفتار شما (نه کودک شما) را تقویت می‌کند.

مجازات در شرطی شدن فعال

مجازات ارائه یک رویداد یا نتیجه نامطلوب است که باعث کاهش رفتاری می‌شود که به دنبال آن می‌آید. مجازات دو نوع است. در هر دو مورد، رفتار کاهش می‌یابد.

مجازات مثبت، که از آن به عنوان مجازات با برنامه یاد می‌شود، یک رویداد یا نتیجه نامطلوب را ارائه می‌دهد تا بتواند پاسخی را که در پی دارد تضعیف کند. تهمت زدن برای رفتار نامناسب نمونه‌ای از مجازات با برنامه است.

مجازات منفی، که به آن مجازات با حذف نیز گفته می‌شود، هنگامی ‌اتفاق می‌افتد که یک اتفاق یا نتیجه مطلوب پس از وقوع یک رفتار حذف گردد. گرفتن بازی ویدیویی از کودک به دنبال رفتار نامناسب مثالی از مجازات منفی است.

برنامه‌های تقویت

تقویت لزوماً روندی سرراست نیست و تعدادی از عوامل هستند که می‌توانند در یادگیری سریع و جدید چیزهای نو تأثیر بگذارند. اسكینر متوجه شد که زمان و تعداد رفتارهای تقویتی در سرعت و قدرت یادگیری هر فرد نقش دارند. به عبارت دیگر، زمان و دفعات تقویت بر نحوه یادگیری رفتارهای جدید و اصلاح رفتارهای قدیمی‌ تأثیر می‌گذارد. اسکینر چندین برنامه مختلف از تقویت را شناسایی کرد که بر روند شرطی شدن فعال تأثیر می‌گذارند. این برنامه‌ها به شرح زیر است:

تقویت مداوم شامل تحویل تقویت کننده همزمان با پاسخ است. در این روش یادگیری نسبتاً سریع اتفاق می‌افتد، با این وجود نرخ پاسخ بسیار کم است. با توقف تقویت، حذف نیز خیلی سریع اتفاق می‌افتد.

برنامه‌های با نسبت ثابت نوعی تقویت جزئی است. پاسخ‌ها فقط پس از بروز تعداد مشخصی از پاسخ‌ها تقویت می‌شوند. این به طور معمول منجر به نرخ پاسخ نسبتاً ثابت می‌شود.

برنامه‌های با فاصله ثابت شکل دیگری از تقویت جزئی است. تقویت تنها پس از سپری شدن یک بازه زمانی مشخص انجام می‌شود. نرخ پاسخ نسبتاً ثابت باقی مانده و با نزدیک شدن به زمان تقویت افزایش می‌یابد، اما بلافاصله پس از تحویل تقویت، کند می‌شود.

برنامه‌های با نسبت متغیر نیز نوعی تقویت جزئی است که شامل رفتار تقویت کننده پس از پاسخ‌های متنوع است. این امر هم منجر به نرخ پاسخ بالا و هم سرعت انقراض کند می‌شود.

برنامه‌های با فاصله متغیر، شکل نهایی تقویت جزئی است که اسکینر ارائه کرده است. این برنامه شامل تحویل تقویت کننده پس از سپری شدن زمان متغیر است. این برنامه تقویت همچنین منجر به سرعت پاسخ سریع و سرعت انقراض کند می‌شود.

شرطی شدن فعال
اجازه گرفتن در کلاس و تشویق برای این کار نوعی تقویت

نمونه‌هایی از شرطی شدن فعال

همه ما می‌توانیم نمونه‌هایی از شرطی شدن فعال را در محیط اطراف خود پیدا کنیم. کارهای  که بچه‌ها برای کسب جایزه از والدین یا معلم خود انجام می‌دهند، یا کارمندانی که پروژه‌هایی را برای دریافت تقدیر و تشویق اجرا می‌کنند، نمونه‌های از شرطی سازی عملیاتی هستند. نمونه‌های بیشتر شرطی سازی عملیاتی در عمل به شرح زیر است:

پس از اجرا در یک نمایش تئاتر عمومی، تماشاگران عوامل را تشویق می‌کنند. این به عنوان یک تقویت کننده مثبت عمل می‌کند، و به شما الهام می‌دهد تا برای بازی در نقش‌های بیشتر تلاش کنید.

شما هر وقت رفتار خود را به درستی انجام دهید، یک سری تعریف و تمجید از اطرافیان خود دریافت می‌کنید. این نیز یکی دیگر از تقویت کننده‌های مثبت است.

یک استاد به دانشجویان می‌گوید اگر آنها در تمام ترم حضور کامل داشته باشند، نیازی نیست در امتحان میان ترم شرکت کنند. با حذف یک محرک ناخوشایند (امتحان میان ترم)، دانش آموزان برای حضور منظم در کلاس که کار منفی است ترغیب می‌کند.

اگر نتوانید به موقع پروژه‌ای را تحویل دهید، رئیستان عصبانی می‌شود و شما را در مقابل همکارانتان تحقیر می‌کند. این به عنوان یک مجازات کننده مثبت عمل می‌کند، و احتمال اینکه در آینده پروژه‌ها را به تأخیر بیاندازید کمتر می‌شود.

یک دختر نوجوان همانطور که از او خواسته شد اتاقش را تمیز نمی‌کند. بنابراین والدینش تلفن همراه وی را می‌گیرند. این نمونه‌ای از مجازات منفی است که در آن محرک مثبت از بین می‌رود.

در برخی از این نمونه‌ها، وعده یا احتمال پاداش باعث افزایش رفتار می‌شود. از شرطی سازی عمیلاتی نیز می‌توان برای کاهش یک رفتار از طریق حذف نتیجه مطلوب یا استفاده از یک نتیجه منفی استفاده کرد. به عنوان مثال، ممکن است به کودک گفته شود اگر در کلاس خارج از نوبت صحبت کند، امتیاز رفتن به اردو را از دست خواهد داد. این پتانسیل مجازات ممکن است منجر به کاهش رفتارهای مخل شود.

سخن پایانی

در حالی که رفتارگرایی ممکن است تسلط خود را در اوایل قرن 20 از دست داده باشد. اما شرطی سازی عملیاتی همچنان یک ابزار مهم و غالباً مورد استفاده در روند یادگیری و اصلاح رفتار است. گاهی عواقب طبیعی منجر به تغییر در رفتار ما می‌شود. در موارد دیگر، ممکن است آگاهانه پاداش‌ها و مجازات‌ها به منظور ایجاد تغییر انجام شود.

شرطی شدن فعال چیزی است که شما ممکن است هر روزه در زندگی خود خواه در رویکردتان برای آموزش رفتار خوب به فرزندان یا در تربیت سگ خانگی استفاده کنید. به یاد داشته باشید که هر نوع یادگیری به زمان نیاز دارد. نوع تقویت یا تنبیه را در نظر بگیرید که ممکن است برای شرایط منحصر به فرد شما بهترین نتیجه را داشته باشد و ارزیابی کنید که کدام نوع برنامه تقویت ممکن است به بهترین نتیجه منجر شود.