مقدمه
شرطی شدن فعال Operant Conditioning، که گاهی اوقات به آن شرطی سازی عملیاتی نیز گفته میشود، روشی برای یادگیری است که برای انجام برخی از رفتارها پاداش و مجازات تعیین میشود. از طریق شرطی سازی عملیاتی، بین یک رفتار و پیامدی (چه منفی و چه مثبت) برای آن رفتار ارتباطی ایجاد میشود. به عنوان مثال، موشهای آزمایشگاهی هنگام روشن شدن چراغ سبز یک اهرم را فشار میدهند، در نتیجه این کار یک گلوله غذایی به عنوان پاداش دریافت میکنند. اما هنگام روشن شدن چراغ قرمز اهرم را فشار میدهند و دچار برق گرفتگی ملایمی میشوند. در نتیجه، آنها یاد میگیرند که هنگام روشن شدن چراغ سبز، اهرم را فشار دهند و از فشردن اهرم زمان روش شدن چراغ قرمز خودداری کنند.
اما شرطی شدن فعال فقط چیزی نیست که هنگام آموزش حیوانات آزمایشگاهی در محیطهای آزمایشی اتفاق بیفتد. این رویکرد در یادگیری روزمره نقش قدرتمندی دارد. تقویت و تنبیه در محیطهای طبیعی همیشه وجود داشت. همچنین در ساختارهای ساختارمندتر مانند کلاسها یا جلسات درمانی نیز از آن استفاه میشود.
تاریخچه شرطی شدن فعال
شرطی سازی عملیاتی برای اولین بار توسط رفتارگرای بی اف اسکینر (BF Skinner) ارائه گردید. به همین دلیل ممکن است گاهی اوقات بشنوید که از آن به عنوان شرطی سازی Skinnerian یاد میشود. به عنوان یک رفتارگرا، اسکینر معتقد بود که برای توضیح رفتار، واقعاً لازم نیست که به افکار و انگیزههای داخلی نگاه کنیم. در عوض، وی پیشنهاد داد، ما فقط باید به علل بیرونی و قابل مشاهده رفتار انسان بنگریم.
از اوایل قرن 20، رفتارگرایی به یک نیروی اصلی در روانشناسی تبدیل شد. اندیشههای جان بی واتسون از همان ابتدا بر این مکتب فکری حاکم بود. واتسون روی اصول شرطی سازی کلاسیک متمرکز بود. یک داستان مشهور وجود دارد که میگوید، واتسون میتواند هر کسی را بدون توجه به سابقهاش بگیرد و آموزش دهد تا کاری که او میخواهد را انجام دهد.
رفتارگرایان اولیه منافع خود را معطوف به یادگیری انجمنی میکردند. اسکینر بیشتر به این موضوع علاقه داشت که عواقب عملکرد افراد بر رفتار آنها چه تأثیر میگذارد. اسکینر اصطلاح عملگر را برای اشاره به هر “رفتار فعالی که برای ایجاد عواقب بر محیط اعمال میشود” ایجاد نمود. نظریه اسکینر توضیح داد که چگونه طیف وسیعی از رفتارهای آموخته شده را که هر روز از خود نشان میدهیم، در طی زمان آموختهایم.

تاثیر قانون اثر
نظریه اسکینر به شدت تحت تأثیر کار روانشناس ادوارد ثورندایک قرار گرفت، وی شخصی بود که قانون اثر را ارائه کرده است. مطابق این اصل، اقداماتی که نتایج مطلوبی را ایجاد میکنند، احتمالاً بیشتر تکرار میشوند. در حالی که مواردی که نتایج نامطلوب را ایجاد میکنند، احتمال تکرار آن کمتر است.
شرطی شدن فعال یک پیش فرض نسبتا سادهای دارد که کل نظریه بر اساس آن ارائه گردید. این فرض میگوید اقداماتی که باعث تشویق میشوند احتمال وقوع مجدد آنها در آینده بیشتر است. اگر در کلاس درس یک داستان خندهدار بگویید و همه بخندند، احتمال اینکه در آینده دوباره آن داستان را بگویید زیاد است.
اگر دست خود را برای پرسیدن سوال بلند کنید و معلمتان از رفتار مودبانه شما تعریف کند، احتمال اینکه دفعه بعدی که سوال یا نظری داشتید، دست خود را بلند کنید بسیار زیاد است. هر زمان که رفتاری انجام دهید تشویق شوید یا نتیجه مطلوبی ایجاد گردد، عمل قبلی شما تقویت میشود.
برعکس، اعمالی که منجر به مجازات یا پیامدهای نامطلوب شوند، تضعیف میشوند و احتمال تکرار آنها در آینده کمتر است. اگر در کلاس دیگری دوباره همین داستان را بگویید اما هیچ کس این بار نخندد، در آینده احتمال تکرار دوباره داستان کم است. اگر در کلاس پاسخی فریاد بزنید و معلم شما را سرزنش کند، در این صورت احتمال این که کلاس را دوباره قطع کنید، کمتر میشود.
انواع رفتارها
اسکینر بین دو نوع رفتار مختلف تفاوت قائل است. این دو نوع رفتار به شرح زیر:
- رفتارهای واکنشگر: رفتارهایی هستند که به صورت خودکار و انعکاسی مانند عقب کشیدن دست از اجاق گاز داغ یا تکان دادن پای هنگام ضربه پزشک بر روی زانوی شما اتفاق میافتند. به هیچ وجه لازم نیست این رفتارها را یاد بگیرید. آنها به طور خودکار و غیر ارادی رخ میدهند.
- رفتارهای عملیاتی: از سوی دیگر، رفتارهای عملیاتی تحت کنترل آگاهانه ما هستند. برخی ممکن است خود به خود و برخی دیگر به صورت عمدی رخ دهد. اما نتایج این اقدامات است که بر روی تکرار یا عدم وقوع آنها در آینده تأثیر میگذارد. اقدامات ما در مورد محیط زیست و عواقب ناشی از آن، بخش مهمی از فرایند یادگیری را تشکیل میدهد.
در حالی که شرطی سازی کلاسیک میتواند رفتارهای واکنشگر توضیح دهد. اما اسکینر متوجه شد که این نظریه نمیتواند یادگیری که در طول زمان ایجاد میشود را توضیح دهد. به همین علت اسكینر نظریه شرطی شدن فعال را که از اهمیت بیشتری برخوردار است، ارائه کرد.
اسکینر در دوران کودکی دستگاههای مختلفی را اختراع کرد و وی در طول تحصیلاتش در مورد شرطی شدن فعال از این مهارتهای خود استفاده کرد. وی دستگاهی را ایجاد کرد که به عنوان اتاق شرطی سازی عملیاتی شناخته میشود. و امروزه اغلب از آن به عنوان جعبه اسکینر یاد میگردد. در این محفظه امکان قرارگیری حیوانات کوچکی مانند موش یا کبوتر وجود داشت. این جعبه همچنین حاوی میله یا کلیدی بود که حیوان میتوانست برای دریافت پاداش آن را فشار دهد.
به منظور ردیابی پاسخها، اسکینر همچنین دستگاهی را اختراع کرد که به عنوان ضبط کننده تجمعی شناخته میشود. این دستگاه پاسخها را به عنوان یک حرکت به سمت بالا از یک خط ثبت میکند تا بتوان با مشاهده شیب خط نرخ پاسخ را فهمید.

اجزای شرطی شدن فعال
چند مفهوم کلیدی در شرطی شدن وجود دارد. این مفاهیم به شرح زیر است:
تقویت در شرطی شدن فعال
تقویت Reinforcement رویدادی است که اعمال میشود و رفتار آینده را تقویت و یا افزایش میدهد. تقویت کنندهها دو نوع هستند. در هر دو مورد تقویت، رفتار افزایش مییابد.
تقویت کنندههای مثبت رویدادها یا نتایج مطلوبی هستند که پس از رفتار ارائه میشوند. در موقعیتهای تقویت مثبت، پاسخ یا رفتاری با افزودن ستایش یا پاداش مستقیم تقویت میشود. اگر در محل کار خود کار خوبی انجام دهید و مدیرتان به شما تشویقی دهد، این پاداش یک تقویت کننده مثبت است.
تقویت کنندههای منفی شامل حذف حوادث یا نتایج نامطلوب پس از نمایش یک رفتار هستند. در این شرایط، با حذف چیزی که ناخوشایند تلقی میشود، پاسخ تقویت میشود. به عنوان مثال، اگر کودک شما وسط یک رستوران شروع به فریاد زدن میکند، اما هنگامیکه دلیل گریه او را برطرف میکنید متوقف میشود. این عمل منجر به برطرف شدن وضعیت ناخوشایند میگردد و رفتار شما (نه کودک شما) را تقویت میکند.
مجازات در شرطی شدن فعال
مجازات ارائه یک رویداد یا نتیجه نامطلوب است که باعث کاهش رفتاری میشود که به دنبال آن میآید. مجازات دو نوع است. در هر دو مورد، رفتار کاهش مییابد.
مجازات مثبت، که از آن به عنوان مجازات با برنامه یاد میشود، یک رویداد یا نتیجه نامطلوب را ارائه میدهد تا بتواند پاسخی را که در پی دارد تضعیف کند. تهمت زدن برای رفتار نامناسب نمونهای از مجازات با برنامه است.
مجازات منفی، که به آن مجازات با حذف نیز گفته میشود، هنگامی اتفاق میافتد که یک اتفاق یا نتیجه مطلوب پس از وقوع یک رفتار حذف گردد. گرفتن بازی ویدیویی از کودک به دنبال رفتار نامناسب مثالی از مجازات منفی است.
برنامههای تقویت
تقویت لزوماً روندی سرراست نیست و تعدادی از عوامل هستند که میتوانند در یادگیری سریع و جدید چیزهای نو تأثیر بگذارند. اسكینر متوجه شد که زمان و تعداد رفتارهای تقویتی در سرعت و قدرت یادگیری هر فرد نقش دارند. به عبارت دیگر، زمان و دفعات تقویت بر نحوه یادگیری رفتارهای جدید و اصلاح رفتارهای قدیمی تأثیر میگذارد. اسکینر چندین برنامه مختلف از تقویت را شناسایی کرد که بر روند شرطی شدن فعال تأثیر میگذارند. این برنامهها به شرح زیر است:
تقویت مداوم شامل تحویل تقویت کننده همزمان با پاسخ است. در این روش یادگیری نسبتاً سریع اتفاق میافتد، با این وجود نرخ پاسخ بسیار کم است. با توقف تقویت، حذف نیز خیلی سریع اتفاق میافتد.
برنامههای با نسبت ثابت نوعی تقویت جزئی است. پاسخها فقط پس از بروز تعداد مشخصی از پاسخها تقویت میشوند. این به طور معمول منجر به نرخ پاسخ نسبتاً ثابت میشود.
برنامههای با فاصله ثابت شکل دیگری از تقویت جزئی است. تقویت تنها پس از سپری شدن یک بازه زمانی مشخص انجام میشود. نرخ پاسخ نسبتاً ثابت باقی مانده و با نزدیک شدن به زمان تقویت افزایش مییابد، اما بلافاصله پس از تحویل تقویت، کند میشود.
برنامههای با نسبت متغیر نیز نوعی تقویت جزئی است که شامل رفتار تقویت کننده پس از پاسخهای متنوع است. این امر هم منجر به نرخ پاسخ بالا و هم سرعت انقراض کند میشود.
برنامههای با فاصله متغیر، شکل نهایی تقویت جزئی است که اسکینر ارائه کرده است. این برنامه شامل تحویل تقویت کننده پس از سپری شدن زمان متغیر است. این برنامه تقویت همچنین منجر به سرعت پاسخ سریع و سرعت انقراض کند میشود.

نمونههایی از شرطی شدن فعال
همه ما میتوانیم نمونههایی از شرطی شدن فعال را در محیط اطراف خود پیدا کنیم. کارهای که بچهها برای کسب جایزه از والدین یا معلم خود انجام میدهند، یا کارمندانی که پروژههایی را برای دریافت تقدیر و تشویق اجرا میکنند، نمونههای از شرطی سازی عملیاتی هستند. نمونههای بیشتر شرطی سازی عملیاتی در عمل به شرح زیر است:
پس از اجرا در یک نمایش تئاتر عمومی، تماشاگران عوامل را تشویق میکنند. این به عنوان یک تقویت کننده مثبت عمل میکند، و به شما الهام میدهد تا برای بازی در نقشهای بیشتر تلاش کنید.
شما هر وقت رفتار خود را به درستی انجام دهید، یک سری تعریف و تمجید از اطرافیان خود دریافت میکنید. این نیز یکی دیگر از تقویت کنندههای مثبت است.
یک استاد به دانشجویان میگوید اگر آنها در تمام ترم حضور کامل داشته باشند، نیازی نیست در امتحان میان ترم شرکت کنند. با حذف یک محرک ناخوشایند (امتحان میان ترم)، دانش آموزان برای حضور منظم در کلاس که کار منفی است ترغیب میکند.
اگر نتوانید به موقع پروژهای را تحویل دهید، رئیستان عصبانی میشود و شما را در مقابل همکارانتان تحقیر میکند. این به عنوان یک مجازات کننده مثبت عمل میکند، و احتمال اینکه در آینده پروژهها را به تأخیر بیاندازید کمتر میشود.
یک دختر نوجوان همانطور که از او خواسته شد اتاقش را تمیز نمیکند. بنابراین والدینش تلفن همراه وی را میگیرند. این نمونهای از مجازات منفی است که در آن محرک مثبت از بین میرود.
در برخی از این نمونهها، وعده یا احتمال پاداش باعث افزایش رفتار میشود. از شرطی سازی عمیلاتی نیز میتوان برای کاهش یک رفتار از طریق حذف نتیجه مطلوب یا استفاده از یک نتیجه منفی استفاده کرد. به عنوان مثال، ممکن است به کودک گفته شود اگر در کلاس خارج از نوبت صحبت کند، امتیاز رفتن به اردو را از دست خواهد داد. این پتانسیل مجازات ممکن است منجر به کاهش رفتارهای مخل شود.
سخن پایانی
در حالی که رفتارگرایی ممکن است تسلط خود را در اوایل قرن 20 از دست داده باشد. اما شرطی سازی عملیاتی همچنان یک ابزار مهم و غالباً مورد استفاده در روند یادگیری و اصلاح رفتار است. گاهی عواقب طبیعی منجر به تغییر در رفتار ما میشود. در موارد دیگر، ممکن است آگاهانه پاداشها و مجازاتها به منظور ایجاد تغییر انجام شود.
شرطی شدن فعال چیزی است که شما ممکن است هر روزه در زندگی خود خواه در رویکردتان برای آموزش رفتار خوب به فرزندان یا در تربیت سگ خانگی استفاده کنید. به یاد داشته باشید که هر نوع یادگیری به زمان نیاز دارد. نوع تقویت یا تنبیه را در نظر بگیرید که ممکن است برای شرایط منحصر به فرد شما بهترین نتیجه را داشته باشد و ارزیابی کنید که کدام نوع برنامه تقویت ممکن است به بهترین نتیجه منجر شود.