ГЕНЕРАЛИЗАЦИЯ СТИМУЛА

Медицинская энциклопедия — значение слова Генерализа́ция Сти́мула

ГЕНЕРАЛИЗАЦИЯ СТИМУЛА

в физиологии — возникновение реакции на индифферентный раздражитель в процессе выработки условного рефлекса.

Смотреть значение Генерализа́ция Сти́мула в других словарях

Генерализация — генерализации, ж. (книжн.). Действие по глаг. генерализировать.
Толковый словарь Ушакова

Генерализация Ж. — 1. Действие по знач. несов. глаг.: генерализовать, генерализоваться.
Толковый словарь Ефремовой

Генерализация — -и; ж.1. к Генерализовать и Генерализоваться.2. Книжн. Логический переход от частного к общему, подчинение частных явлений общему принципу; обобщение.3. Мед. Распространение……..

Толковый словарь Кузнецова

Генерализация — переход местного процесса в общий, распространенный, с развитием бактериемии, токсинемии, септикопиемии, образованием вторичных очагов инфекции. Возникает в результате……..
Словарь микробиологии

Генерализация — (generalisatio; лат. generalis общий) в патологии распространение патологического процесса по организму (или органу) из ограниченного очага.
Большой медицинский словарь

Генерализация Per Continuitatem — Г., осуществляющаяся путем увеличения (роста) первичного очага поражения.
Большой медицинский словарь

Генерализация Гематогенная — (g. haematogena) Г. вследствие распространения агента, вызывающего патологический процесс, с током крови.
Большой медицинский словарь

Генерализация Интраканаликулярная — (g. intracanalicularis; лат. intra- внутри + canaliculus канадец) Г. вследствие распространения агента, вызывающего патологический процесс, по естественным каналам или щелям (преимущественно……..
Большой медицинский словарь

Генерализация Смешанная — (g. mixta) Г. вследствие распространения агента, вызывающего патологический процесс, различными путями — гематогенным, лимфогенным и др.
Большой медицинский словарь

Генерализация Стимула В Физиологии — возникновение реакции на индифферентныйраздражитель в процессе выработки условного рефлекса.
Большой медицинский словарь

Генерализация — (от лат. generalis — общий — главный), 1) обобщение,логический переход от частного к общему, подчинение частных явлений общемупринципу. 2) В медицине — распространение болезненного……..
Большой энциклопедический словарь

Стимула — (лат. пастушья палка — которой погоняют скот), в римской мифологиибогиня, побуждающая участников вакханалии к неистовству. Отождествлялась сгреческой Семелой.
Большой энциклопедический словарь

Генерализация Картографическая — генерализа́ция картографи́ческаяотбор, обобщение, выделение главных типических черт изображаемых объектов соответственно назначению, масштабу, содержанию карты,……..
Географическая энциклопедия

Генерализация — (лат. generalis — общий, главный). Распространение какого-либо патологического процесса в организме из первоначально ограниченного очага или же возможность распространенного……..
Психологическая энциклопедия

Генерализация (обобщение) — В психологии термин имеет несколько разных значений: 1. Генерализация может означать метод «широкого охвата», когда все члены конкретной группы считаются одинаковыми……..
Психологическая энциклопедия

Генерализация Раздражителя — (stimulus generalization) Как следует из самого названия, Г. р. относится к способности реакции, предварительно выработанной на специфический раздражитель, вызываться впоследствии……..
Психологическая энциклопедия

Генерализация Реакции — Тенденция реакций, сходных с оригинальной подкрепленной или условной реакцией, возникает в ситуации обусловливания.
Психологическая энциклопедия

Генерализация Рефлекса Условного — -> рефлекс условный: генерализация.
Психологическая энциклопедия

Генерализация Стимула — Аспект классического формирования условных рефлексов, когда организм реагирует не только на условный стимул, но также на другие сходные стимулы. Чем больше сходство,……..
Психологическая энциклопедия

Генерализация Стимулов — (stimulus generalization) — феномен, в котором реакцию, сформированную на одни стимулы, вызывают схожие стимулы.
Психологическая энциклопедия

Генерализация, Акустическая — Форма генерализации стимула в акустической модальности. Один из напрашивающихся примеров такой генерализации – реакция испуга, неизменно сопровождающая чье-то громкое……..
Психологическая энциклопедия

Генерализация, Вербальная — Просто генерализация на вербальном материале; например, см. акустическая генерализация, семантическая генерализация.
Психологическая энциклопедия

Генерализация, Опосредованная — Любая генерализация стимула, которая опосредуется некоторым другим процессом. Наиболее распространенная форма семантическая генерализация, при которой генерализация……..
Психологическая энциклопедия

Генерализация, Семантическая — Форма генерализации стимула, при которой процесс генерализации происходит через семантические свойства стимулов. Например, реакция, первоначально установленная……..
Психологическая энциклопедия

Действие Чистого Стимула — Термин, предложенный Кларком Халлом для обозначения любого поведения, которое явно не ведет организм к достижению цели. вызывает проприоцептивные стимулы, необходимые……..
Психологическая энциклопедия

Обобщение (генерализация) — — процесс, при котором одно, конкретное событие становится представителем целого класса событий.
Психологическая энциклопедия

Ожидания Последствий Стимула — (Stimulus-outcome expectancies). Множество комбинаций стимулов, ограничивающих возможные результаты исполнения любой схемы поведения.
Психологическая энциклопедия

Опосредованная Генерализация — См. генерализация, опосредованная и генерализация, семантическая.
Психологическая энциклопедия

Ответа, Генерализация — См генерализация ответа.
Психологическая энциклопедия

Оценка Величины Стимула — (magnitude estimation) Этот психофизический метод был изобретен С. С. Стивенсом для исслед. величины ощущения. В процедурном плане, метод оценки величины обязывает наблюдателя……..
Психологическая энциклопедия

Посмотреть в Wikipedia статью для Генерализа́ция Сти́мула

Источник: http://slovariki.org/medicinskaa-enciklopedia/6849

Генерализация и различение стимулов

ГЕНЕРАЛИЗАЦИЯ СТИМУЛА

Логическим расширением принципа подкрепления является то, что поведение, усиленное в одной ситуации, весьма вероятно повторится, когда организм столкнется с другими ситуациями, напоминающими ее.

Если бы это было не так, то поведенческий репертуар человека был бы так сильно ограничен и хаотичен, что мы бы, возможно, проснувшись утром, долго размышляли над тем, как реагировать должным образом на каждую новую ситуацию. В теории Скиннера тенденция подкрепленного поведения распространяться на множество подобных положений называется генерализацией стимула.

Этот феномен легко наблюдать в повседневной жизни. Например, ребенок, которого похвалили за утонченные хорошие манеры дома, будет обобщать это поведение в соответствующих ситуациях и вне дома, такого ребенка не нужно учить, как прилично вести себя в новой ситуации. Обобщение стимула также может быть результатом неприятного жизненного опыта.

Молодая женщина, изнасилованная незнакомцем, может генерализировать свой стыд и враждебность по отношению ко всем лицам противоположного пола, так как они напоминают ей о физической и эмоциональной травме, нанесенной незнакомцем.

Подобно этому, единственного случая испуга или аверсивного опыта, причиной которого явился человек, принадлежащий к определенной этнической группе (белый, черный, латиноамериканец, азиат), может быть достаточно для индивида, чтобы создать стереотип и таким образом избежать будущих социальных контактов со всеми представителями данной группы.

Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Деньги — особенно показательный пример. Очевидно, что деньги не могут удовлетворить какое-либо из наших первичных влечений.

Все же благодаря системе культурного обмена деньги являются мощным и сильным фактором для получения множества удовольствий. Например, деньги позволяют нам иметь модную одежду, яркие машины, медицинскую помощь и образование.

Иные виды генерализованных условных подкрепляющих стимулов — это лесть, похвала, привязанности и подчинение себе других.

Эти так называемые социальные подкрепляющие стимулы (включающие в себя поведение других людей) часто действуют очень сложно и едва уловимо, но они существенны для нашего поведения в разнообразных ситуациях. Например, внимание. Все знают, что ребенок может получить внимание, когда притворяется больным или плохо себя ведет.

Часто дети назойливы, задают нелепые вопросы, вмешиваются в разговор взрослых, рисуются, поддразнивают младших сестер или братьев и мочатся в постель — и все это для привлечения внимания. Внимание значимого другого — родителей, учителя, возлюбленного – особенно эффективный генерализованный условный стимул, который может содействовать ярко выраженному поведению привлечения внимания.

Социальное одобрение — это еще более сильный генерализованный условный стимул. Например, многие люди проводят массу времени, прихорашиваясь перед зеркалом, в надежде получить одобряющий взгляд супруга или любовника.

И женская, и мужская мода — это предмет одобрения, и она существует до тех пор, пока есть социальное одобрение.

Студенты высшей школы соревнуются за место в университетской легкоатлетической команде или участвуют в мероприятиях вне учебного плана (драма, диспут, школьный ежегодник) для того, чтобы получить одобрение родителей, сверстников и соседей.

Хорошие отметки в колледже — тоже позитивный подкрепляющий стимул, потому что ранее за это получали похвалу и одобрение родителей. Будучи мощным условным подкрепляющим стимулом, удовлетворительные оценки также способствуют поощрению учения и достижению более высокой академической успеваемости.

Скиннер полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека. Он также отмечал, что каждый человек проходит уникальную науку научения, и вряд ли всеми людьми управляют одни и те же подкрепляющие стимулы.

Например, для кого-то очень сильным подкрепляющим стимулом является успех в качестве менеджера или преподавателя; для других важно выражение нежности; а иные находят подкрепляющий стимул в спорте, академических или музыкальных занятиях. Возможные вариации в поведении, поддержанные условными подкрепляющими стимулами, бесконечны.

Следовательно, понять условные подкрепляющие стимулы у человека намного сложнее, чем понять, почему крыса, лишенная пищи, нажимает рычаг, получая в качестве подкрепления только звуковой сигнал.

Хотя способность обобщать реакции — важный аспект многих наших повседневных социальных интеракций, все же очевидно, что при адаптивном поведении нужно обладать способностью делать различия в разных ситуациях.

Небольшое изменение в стандартной процедуре оперантного научения демонстрирует, как нейтральный стимул может приобрести подкрепляющую силу для поведения. Когда крыса научилась нажимать на рычаг в «ящике Скиннера», сразу же ввели звуковой сигнал (сразу после осуществления реакции), за которым следовал шарик еды.

В этом случае звук действует как различительный стимул (то есть животное учится реагировать только при наличии звукового сигнала, так как он сообщает о пищевом вознаграждении). После того, как эта специфическая оперантная реакция устанавливается, начинается угасание: когда крыса нажимает на рычаг, не появляются ни пища, ни звуковой сигнал.

Через какое-то время крыса перестает нажимать на рычаг. Затем звуковой сигнал повторяется каждый раз, когда животное нажимает на рычаг, но шарик пищи не появляется. Несмотря на отсутствие первоначального подкрепляющего стимула, животное понимает, что нажатие на рычаг вызывает звуковой сигнал, поэтому оно продолжает настойчиво реагировать, тем самым ослабляя угасание.

Другими словами, установленная скорость нажатия на рычаг отражает тот факт, что звуковой сигнал теперь действует как условный подкрепляющий фактор. Точная скорость реагирования зависит от силы звукового сигнала как условного подкрепляющего стимула (то есть от числа случаев, когда звуковой сигнал ассоциировался с первичным подкрепляющим стимулом, пищей, в процессе научения).

Скиннер доказывал, что фактически любой нейтральный стимул может стать подкрепляющим, если он ассоциируется с другими стимулами, ранее имевшими подкрепляющие свойства. Таким образом, феномен условного подкрепления в значительной степени увеличивает сферу возможного оперантного научения, особенно если это касается социального поведения человека.

Иначе говоря, если бы все, чему мы научились, было пропорционально первичному подкреплению, то возможности для научения были бы очень ограничены, и деятельность человека не была бы столь разнообразна.

Различение стимула, составная часть обобщения, — это процесс научения реагировать адекватным образом в различных ситуациях окружения. Примеров множество. Автомобилист остается в живых в час пик благодаря тому, что различает красный и зеленый цвета светофора.

Ребенок учится различать домашнюю собачку и злобного пса. Подросток учится различать поведение, находящее одобрение у сверстников, и поведение, раздражающее и отчуждающее других. Диабетик сразу обучается различать пищу, содержащую много и мало сахара.

В самом деле, практически все разумное поведение человека зависит от способности делать различение.

Способность к различению приобретается через подкрепление реакций в присутствии одних стимулов и неподкрепление их в присутствии других стимулов. Различительные стимулы таким образом дают нам возможность предвидеть вероятные результаты, связанные с изъявлением особой оперантной реакции в различных социальных ситуациях.

Соответственно, индивидуальные вариации различительной способности зависят от уникального прошлого опыта различных подкреплений.

Скиннер предположил, что здоровое личностное развитие происходит в результате взаимодействия генерализирующей и различительной способностей, с помощью которых мы регулируем наше поведение так, чтобы максимизировать позитивное подкрепление и минимизировать наказание.

Режимы подкрепления

Особый интерес Скиннера был сосредоточен в основном на изучении особенностей (реакций и их связей с процентами подкреплений) и интервалами между ними, т.е. на изучениирежимов подкрепления.

Суть оперантного научения состоит в том, что подкрепленное поведение стремится повториться, а поведение неподкрепленное или наказуемое имеет тенденцию не повторяться или подавляться. Следовательно, концепция подкрепления играет ключевую роль в теории Скиннера.

Для исследования связей реакций и подкреплений используется простое экспериментальное устройство — ящик Скиннера. Конструкция ящика позволяет предъявлять несколько стимулов и наблюдать, как крысы давят на рычаг или как голуби стучат клювом по ключу.

По Скиннеру, именно в таких условиях лучше всего наблюдать проявления элементарных законов поведения.

Эти законы раскрываются через управление поведением, в данном случае через управление поведением крыс, давящих на рычаг, и голубей, бьющих клювом по ключу.

Поведение понятно, если его можно контролировать, внося определенные изменения в условия среды. Понять поведение — значит управлять им. Управление поведением, осуществляется через выбор типа реакции, которую необходимо подкрепить, и определения степени вероятности ее повторного появления.

Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления. Режим подкрепления — правило, устанавливающее вероятность, с которой подкрепление будет происходить. Режим подкрепления можно построить, задавая определенный временной интервал или определенный интервал реакций.

Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию.

Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию.

В большинстве ситуаций повседневной жизни, однако, это либо неосуществимо, либо неэкономично для сохранения желаемой реакции, так как подкрепление поведения бывает не всегда одинаковым и регулярным.

В большинстве случаев социальное поведение человека подкрепляется только иногда. Ребенок плачет неоднократно, прежде чем добьется внимания матери. Ученый много раз ошибается, прежде чем приходит к правильному решению трудной проблемы. В обоих этих примерах неподкрепленные реакции встречаются до тех пор, пока одна из них не будет подкреплена.

В случае если задается интервал реакций, т.е. определенное соотношение подкреплений и реакций, подкрепления появляются после того, как выполнено определенное число реакций (например, нажатий на рычаг или на ключ).

Таким образом, подкрепления не обязательно следуют после каждого ответа, а могут подаваться лишь время от времени.

Более того, подкрепления могут подаваться в регулярном, или фиксированном, режиме — всегда через определенный интервал времени или всегда после определенного количества реакций, либо их можно подавать в переменном режиме — то через одну минуту, то через две, то после пары реакций, то после серии реакций. Каждая схема, или режим подкрепления, как правило, стабилизирует поведение по-разному.

Скиннер тщательно изучал, как режим прерывистого, или частичного, подкрепления влияет на оперантное поведение.

Хотя возможны многие различные режимы подкрепления, их все можно классифицировать в соответствии с двумя основными параметрами: 1) подкрепление может иметь место только после того, как истек определенный или случайный временной интервал с момента предыдущего подкрепления (так называемый режим временного подкрепления), 2) подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций (режим пропорционального подкрепления). В соответствии с этими двумя параметрами выделяют четыре основных режима подкрепления.

1. Режим подкрепления с постоянным соотношением (ПС). В данном режиме организм подкрепляется по наличию заранее определенного или «постоянного» числа соответствующих реакций. Этот режим является всеобщим в повседневной жизни и ему принадлежит значительная роль в контроле над поведением.

Во многих сферах занятости сотрудникам платят отчасти или даже исключительно в соответствии с количеством единиц, которые они производят или продают. В промышленности эта система известна как плата за единицу продукции.

Режим ПС обычно устанавливает чрезвычайно высокий оперантный уровень, так как чем чаще организм реагирует, тем большее подкрепление он получает.

2. Режим подкрепления с постоянным интервалом (ПИ). В режиме подкрепления с постоянным интервалом организм подкрепляется после того, как твердо установленный или «постоянный» временной интервал проходит с момента предыдущего подкрепления.

На уровне человека режим ПИ действителен при выплате зарплаты за работу, выполненную за час, неделю или месяц. Подобно этому, еженедельная выдача денег ребенку на карманные расходы образует ПИ форму подкрепления. Университеты обычно работают в соответствии с временным режимом ПИ.

Экзамены устанавливаются на регулярной основе и отчеты об академической успеваемости издаются в установленные сроки. Любопытно, что режим ПИ дает низкую скорость реагирования сразу после того, как получено подкрепление – феномен, названный паузой после подкрепления.

Это показательно для студентов, испытывающих трудности при обучении в середине семестра (предполагается, что они сдали экзамен хорошо), так как следующий экзамен будет еще нескоро. Они буквально делают перерыв в обучении.

3. Режим подкрепления с вариативным соотношением (ВС). В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного числа реакций. Возможно, наиболее драматической иллюстрацией поведения человека, находящегося под контролем режима ВС, является захватывающая азартная игра.

Рассмотрим действия человека, играющего в игральный автомат, где нужно опускать монетку или специальной рукояткой вытягивать приз. Эти аппараты запрограммированы таким образом, что подкрепление (деньги) распределяется в соответствии с числом попыток, за которые человек платит, чтобы управлять рукояткой.

Однако выигрыш непредсказуем, непостоянен и редко позволяет получать свыше того, что вложил игрок. Это объясняет тот факт, почему владельцы казино получают значительно больше подкреплений, чем их постоянные клиенты.

Далее, угасание поведения, приобретенного в соответствии с режимом ВС, происходит очень медленно, так как организм точно не знает, когда будет следующее подкрепление.

Таким образом, игрок принуждается опускать монеты в прорезь автомата, несмотря на ничтожный выигрыш (или даже проигрыш), в полной уверенности, что в следующий раз он «сорвет куш». Такая настойчивость типична для поведения, вызванного режимом ВС.

4. Режим подкрепления с вариативным интервалом (ВИ). В этом режиме организм получает подкрепление после того, как проходит неопределенный временной интервал. Подобно режиму ПИ, подкрепление при этом условии зависит от времени.

Однако время между подкреплениями по режиму ВИ варьирует вокруг какой-то средней величины, а не является точно установленным.

Как правило, скорость реагирования при режиме ВИ является прямой функцией примененной длины интервала: короткие интервалы порождают высокую скорость, а длинные интервалы порождают низкую скорость.

Также при подкреплении в режиме ВИ организм стремится установить постоянную скорость реагирования, и при отсутствии подкрепления реакции угасают медленно. В конечном итоге, организм не может точно предвидеть, когда будет следующее подкрепление.

В повседневной жизни режим ВИ нечасто встречается, хотя несколько его вариантов можно наблюдать. Родитель, например, может хвалить поведение ребенка довольно произвольно, рассчитывая, что ребенок будет продолжать вести себя соответствующим образом и в неподкрепленные интервалы времени.

Подобно этому, профессора, которые дают «неожиданные» контрольные работы, частота которых варьирует от одной в три дня до одной в три недели, в среднем одна в две недели, используют режим ВИ.

При этих условиях от студентов можно ожидать сохранения относительно высокого уровня прилежания, так как они никогда не знают, в какой момент будет следующая контрольная работа.

Как правило, режим ВИ порождает более высокую скорость реагирования и большую сопротивляемость угасанию, чем режим ПИ.

По сути, теория оперантного научения представляет собой изощренную формулировку основных принципов дрессировки животных. Сложное поведение формируется через процесспоследовательных приближений, т.е. сложные действия вырабатываются благодаря подкреплению тех элементов поведения, которые соответствуют той конечной форме поведения, какую хотят получить.

Процесс формирования, или процесс постепенного приближения, наиболее четко просматривается в обучении животных. Сложные трюки, демонстрируемые цирковыми животными, не усваиваются как законченное целое.

Вместо этого дрессировщик постепенно выстраивает последовательность выученных реакций с помощью подкрепления определенных действий, которые затем связываются между собой или соединяются в цепочки.

То, что начинается с усвоения отдельных движений, в конце концов превращается в демонстрацию цирковой публике сложных последовательностей действий.

Животное непременно вознаграждается за свое поведение, но итоговая награда ставится в зависимость от исполнения всей серии первоначально усвоенных действий. Аналогичным образом с помощью последовательных приближений можно выработать сложное поведение у человека.

Однако вскоре стало очевидным, что стандартная методика оперантного научения плохо подходила для большого числа сложных оперантных реакций, которые могли спонтанно встречаться с вероятностью, равной почти нулю.

В сфере поведения человека, например, сомнительно, что с помощью общей стратегии оперантного научения можно было бы успешно научить пациентов психиатрического отделения приобретать соответствующие навыки межличностного общения.

Для того, чтобы облегчить эту задачу, Скиннер [§1аппег, 1953] придумал методику, при которой психологи могли эффективно и быстро уменьшить время, требуемое для обусловливания почти любого поведения в том наборе, которым располагал человек.

Эта методика, названная методом успешного приближения, или формированием поведения, состоит из подкрепления поведения, наиболее близкого к желаемому оперантному поведению. К этому приближаются шаг за шагом, и поэтому одна реакция подкрепляется, а затем подменяется другой, более близкой к желаемому результату.

Виды подкрепления

Как отмечалось ранее, под подкреплением понимается какое–либо действие, призванное усилить определенную реакцию.

Хотя оперантное обусловливание опирается в первую очередь на использование подкрепления с положительной валентностью, основанных на приближении организма к, такого, как пища, деньги или похвала, последователи Скиннера подчеркивают также важность подкреплений, основанных на бегстве организма от, или на избегании им отвращающих (неприятных) стимулов.

В таких случаях реакции подкрепляются устранением неприятных стимулов или возможностью их избежать, а не появлением приятных стимулов. Во всех этих случаях результатом должно быть сохранение или усиление реакции. В связи с этим различают два вида подкреплений:

Позитивное подкрепление– это приятный стимул, который следуя за желательной реакцией, усиливает ее или поддерживает на том же уровне, т.е. повышает вероятность ее повторения.

Негативное подкрепление– это неприятный стимул, устранение которого усиливает желательную реакцию.

Вместе с тем существует и множество самих способов подкрепления. К наиболее распространенным относятся поощрение (предъявление приятных стимулов) и наказание (предъявление неприятных стимулов).

Таблица 7-1



Источник: https://infopedia.su/2x25f3.html

Генерализация стимула, научение, оперантное поведение животных

ГЕНЕРАЛИЗАЦИЯ СТИМУЛА

Генерализация стимула

Когда у животного выработалась определенная реакция на данный стимул, она может возникать и на другие сходные стимулы.

Так, Павлов (1927) указал, что если тактильное раздражение ограниченного участка кожи сделать условным стимулом, то тактильное раздражение других участков кожи тоже будет вызывать некоторый условно-рефлекторный ответ, ослабевающий по мере удаления этих участков от того, с которым первоначально был связан условный рефлекс.

Явление такого типа называется генерализацией стимула. Павлов считал, что она объясняется распространением волны возбуждения, проходящей по коре больших полушарий от центра УС. Однако это объяснение не согласуется с современными взглядами на нейронное строение головного мозга (Thompson, 1965).

Современные объяснения генерализации обращают основное внимание на действующие при этом стимулы. Стимул, применяемый в опыте по выработке условных рефлексов, состоит из совокупности отдельных элементов. Тон, например, характеризуется определенной частотой, интенсивностью и длительностью. Эти параметры стимула могут приобрести значение условных во время выработки УР.

Рис. 17.6. Градиенты генерализации у отдельных голубей, реагирующих на тоны. Частота тренирующего тона 1000 Гц

Новый стимул, имеющий общие элементы с данным УС, до некоторой степени способен вызывать УР. Например, если человек легко различает тоны в 1000 и 300 Гц, то у голубей, наученных реагировать на первый из них, наблюдается генерализация и в отношении второго.

Однако у этих тонов имеются общие свойства в частности то, что в отличие от естественных звуков каждый из них характеризуется только одной частотой. Этим, возможно, объясняется, почему голуби реагируют на них как на одинаковые.

Если такой голубь получит подкрепление на тон в 300 Гц, то он будет менее склонен к генерализации на тоны с частотами, отличными от 1000 Гц. Диапазон генерализации сужается тренировкой дифференцировки (рис. 17.6). Такая тренировка уменьшает число элементов, прочно связанных с подкреплением.

Голубя стимулируют обращать внимание на частоту тона на том основании, что другие параметры звука не связаны прочно с подкреплением. Это называют генерализацией по общим элементам.

Генерализация имеет важное значение для многих сторон научения животных. Так, например, во время угашения УР отмена подкрепления меняет среду стимула, в которой был выработан УР.

Имеются некоторые данные о том, что снижение реактивности при угасании частично объясняется уменьшением генерализации. Подобным же образом привыкание к одному стимулу приведет к генерализации в отношении другого, сходного.

Животное реагирует на этот новый стимул до известной степени так, как если бы он предъявлялся ему ранее. Степень привыкания к новому стимулу зависит от того, насколько он похож на стимул, к которому ранее произошло привыкание.

Если стимул и нов, и необычен, произойдет дегабитуация. Таким образом, генерализация стремится противодействовать влиянию новых стимулов на реакции, к которым произошло привыкание.

Павлов считал, что дифференцировки можно добиться, подкрепляя одни свойства УС и не подкрепляя другие. Сначала все свойства УС вызывают УР, но если экспериментатор подкрепляет одни из них и не подкрепляет другие, то мы можем обозначить их соответственно УС+ и УС—.

Дифференцировка возможна между свойствами одной и той же физической размерности, например между слуховыми стимулами разной частоты или светом разной яркости. Она также возможна между сочетаниями качественно разных стимулов, которые Павлов (1927) назвал сложными раздражителями. Так, УС+ может служить сочетание тона и тактильного стимула, а УС— — один только тактильный раздражитель.

После того как животное научилось дифференцировать, тактильный раздражитель больше не будет вызывать УР. Как уже говорилось, во всяком опыте по выработке условных рефлексов присутствуют сложные стимулы в том смысле, что УС неизбежно предъявляется в определенной стимульной ситуации и может быть выделен среди фоновых стимулов только по мере того, как животное научится дифференцировке.

В интервалах между сочетаниями будут присутствовать некоторые стимулы, которые животное в начале тренировки связывает с подкреплением (дифференцировка между УС+ и УС— отсутствует).

Поэтому можно ожидать, что при выработке классических условных рефлексов собаки будут выделять слюну в интервалах между сочетаниями по крайней мере на ранних стадиях эксперимента, Шеффилд (Sheffield, 1965) сообщил, что у его собак действительно наблюдалось слюноотделение в промежутках между предъявлениями УС, которое с тренировкой постепенно уменьшалось.

Инструментальное научение

В то время как исследование классических условных рефлексов было начато в России, принципы инструментальных условных рефлексов были открыты и разработаны в США. Впрочем, первый шаг в этом направлении, по-видимому, был сделан в трудах Моргана (Morgan, 1852-1936).

Морган относился критически ко многим современным ему исследованиям по психологии животных из-за их слабой методологии и неубедительных толкований.

В книге «Introduction to Comparative Psychology» («Введение в сравнительную психологию») (1894) он провозгласил свое знаменитое правило: «Ни в коем случае нельзя считать какое-либо действие результатом упражнения более высокой психической способности, если его можно объяснить на основе способности, стоящей ниже по психологической шкале». Позднее (1900) он пояснил: «Можно добавить, — чтобы пределы применения этого принципа не были поняты неверно, — что такое правило никак не исключает взгляда на определенное действие как на результат высших мыслительных процессов, если мы уже располагаем независимым доказательством их присутствия в действующем агенте».

Морган оказал значительное влияние на развитие бихевиоризма, в особенности на Уотсона и Торндайка (Thorndike). В 1896 г. он проводил Лоуэлловские чтения в Гарвардском университете, чем побудил Торндайка начать изучение рассудочной деятельности животных.

Однажды Морган рассказал Торндайку, как его собака Тоби научилась открывать задвижку на садовой калитке, просовывая голову между рейками штакетника, и тот начал свои исследования вскоре после посещения Моргана, разработав способы повторения этого наблюдения в контролируемых лабораторных условиях.

Торндайк стал очень заметной фигурой в американской психологии, и полстолетия его теории господствовали как в психологии животных, так и в психологии воспитания.

Один видный его современник писал: «Психология научения животных, не говоря уже о научении ребенка, — была и все еще остается прежде всего вопросом согласия или несогласия с Торндайком или попытками слегка усовершенствовать его представления.

Все мы, американские гештальт-психологи, по-видимому, открыто или скрыто отталкиваемся от концепций Торндайка». (Tolman, 1938.)

Торндайк провел ряд опытов, в которых кошки должны были нажимать на задвижку или тянуть за пружину, чтобы, открыв дверцу, выйти из ящика и получить снаружи пищу. Ящики были сделаны с вертикальными щелями так, что пища была заметна (рис. 17.7).

Голодная кошка, впервые посаженная в ящик, производит множество действий, в том числе тянется к пище через щели и скребет предметы, находящиеся внутри ящика. Наконец она случайно ударяет по запирающему механизму и выскакивает наружу.

При последующих пробах действия кошки постепенно концентрируются вблизи этого механизма, и прочая активность со временем прекращается. Наконец кошка становится способной правильно вести себя, как только ее поместят в ящик.

Рис. 17.7. Кошка в одном из торндайковских проблемных ящиков.

Торндайк (1898) назвал научение такого типа «методом проб, ошибок и случайного успеха».

Теперь оно называется инструментальным научением, поскольку правильная реакция, ведущая к вознаграждению, требует использования «инструментов».

Цирковые дрессировщики знали о научении такого типа в течение столетий, но Торндайк первый исследовал его систематически и создал на основе своих наблюдений стройную теорию.

Для объяснения изменений, происходящих в поведении животного в этих опытах, Торндайк (1913) предложил свой «закон эффекта». Он гласит, что для реакции, за которой следует вознаграждение или состояние удовлетворения, вероятность повторения возрастает, а для реакции, вызывающей вредное или неприятное последствие, вероятность повторения снижается.

Таким образом, успех инструментального научения приписывается тому факту, что выработанное поведение может быть непосредственно изменено его последствиями. Торндайк (1911) считал, что подкрепление повышает вероятность реакции, с которой оно сочетается, потому что усиливает установленную связь между ней и присутствующей стимульной ситуацией.

Этот взгляд стал известен как «теория научения по принципу стимул-реакция», и варианты этой теории господствовали в течение многих лет. Признавая значение закона эффекта как эмпирического факта, современные психологи в то же время сомневаются в том, что поведение непосредственно модифицируется своими последствиями, как предполагали Торндайк и его школа.

Чтобы понять это, сначала надо рассмотреть природу подкрепления.

Подкрепление

Между способом проведения опыта по выработке классического условного рефлекса и постановкой эксперимента по инструментальному научению существует коренное различие. В первом случае связь устанавливается между УС (например, звонком) и БС (например, пищей). Подкрепление предъявляется независимо от поведения животного.

При инструментальном научении подкрепление (например, пища) связано с определенным поведением животного (например, с нажимом на рычаг). Таким образом, при классических условных рефлексах связь устанавливается между стимулом и результатом, а при инструментальном научении она возникает между реакцией и результатом.

Такие различия необязательно означают, что в этих двух типах опытов происходят разные виды научения, но они говорят о разных процессах подкрепления.

Как мы видели, согласно взгляду Павлова, наличие подкрепляющего стимула в определенных условиях приведет к тому, что реакции, вызываемые им, будут возникать еще до подкрепления. Ясно, однако, что не всегда подкрепление необходимо для проявления выработанных связей между стимулами.

Это яснее всего видно при рассмотрении феномена, называемого сенсорным предобусловливанием. При нем два условных стимула (УC1 и УС2) применяются вместе много раз до того, как в опыт вводится БС. За совместным предъявлением УC1 и УС2 следует сочетание УC1 с БС.

В заключительной части опыта измеряется сила УР в ответ на УС2.

Первая четкая демонстрация сенсорного предобусловливания принадлежит Брогдену (Brogden, 1939), который предъявлял собакам 200 одновременных сочетаний света и зуммера. Затем один из этих стимулов сочетался с электрическим ударом лапы для выработки ее условнорефлекторного сгибания.

Применения второго УС вызывали в среднем 9,4 УР по сравнению со всего лишь 0,5 УР в контрольных опытах без предварительного сочетания зуммера и света.

Более поздние опыты показывают, что лучшие результаты получаются при меньшем числе предварительных сочетаний и когда два УС предъявляются не одновременно, а с промежутком в несколько секунд (Mackintosh, 1974).

Результаты опытов с сенсорным пред обусловливанием ясно показывают, что сочетания двух нейтральных стимулов достаточно, чтобы установить некоторую связь между ними. По-видимому, при слишком частом применении этих стимулов наступает известное привыкание, и научение не улучшается.

Совершенно независимо от того, что эти результаты нельзя удовлетворительно объяснить теорией стимул-реакция, ясно, что для образования связи между двумя нейтральными стимулами нет необходимости в подкреплении.

Поэтому павловское подкрепление не является обязательным условием образования связей, но оно облегчает их образование и делает их устойчивыми к привыканию.

Как мы увидим дальше, животные вполне способны научиться тому, что некоторые стимулы несущественны для их текущих мотивационных потребностей, и поэтому неудивительно, что связи, образованные между двумя нейтральными стимулами, должны быть временными.

Обратимся теперь к вопросу об инсmpументальном подкреплении. Закон эффекта Торндайка лег в основу бихевиористского подхода к научению животных. Крайнюю позицию занял Гарвардский бихевиорист Скиннер (Skinner), который определил подкрепление, исходя из закона эффекта. По Скиннеру.

подкреплением является любое событие, которое, сочетаясь с каким-нибудь видом поведения, будет делать ею более частым. Скиннер (1938) считал также, что любое подкрепление может усилить любую реакцию в присутствии любого стимула при условии, что этот стимул ощущается животным, а реакция лежит в пределах его возможностей.

Таким образом, предполагалось, что реакция и подкрепление по существу произвольны. Это стало широко распространенной точкой зрения среди теоретиков научения до конца 50-х годов.

Подкрепление, побуждающее животное приближаться к стимулам, которые оно связывает с этим подкреплением, обычно называется «положительным». Если же подкрепление заставляет животное в дальнейшем избегать данной ситуации, оно считается «отрицательным».

Животные могут научиться бояться некоторых ситуаций, испытав в них боль или стресс. В дальнейшем они могут избегать таких ситуаций при столкновении с ними.

Сходным образом ситуации, в которых на животное действуют естественные вызывающие страх стимулы, могут по ассоциации вызывать страх, даже когда животное не испытывает боли.

Но многократное применение таких стимулов может привести к привыканию, и животное перестанет их избегать.

Как мы видели, неприятные стимулы применимы в опытах по классическим условным рефлексам. Одно из первых таких исследований принадлежит В.М.

Бехтереву (1913), который раздражал переднюю лапу собаки слабым электрическим током (БС) вслед за звуковым стимулом — тоном (УС).

Сначала собака сгибала лапу в ответ на ток (БР), а после ряда сочетаний УС и БС — в ответ на тон (УР) в отсутствие тока. Классическая оборонительная условная реакция многие годы оставалась парадигмой научения избеганию.

По Торндайку (Thorndike, 1913) наказание вызывает такую же силу реакции, что и вознаграждение. Согласно положительному закону эффекта, если за реакциями следует состояние удовлетворения, вероятность их возникновения возрастает.

Отрицательный закон предполагает, что вероятность возникновения реакций, приводящих к неприятным последствиям, снижается. Однако в конечном счете Торндайк (1932) на основании некоторых опытов пришел к заключению, что закон эффекта неприменим к наказанию.

В этом отношении с ним соглашались Скиннер (Scinner, 1938, 1953) и Эстес (Estes, 1944). Общее мнение, по-видимому, сводилось к тому, что наказание не ослабляет связи стимул-реакция, хотя иногда оно временно подавляет наказуемое поведение.

Более поздние данные говорят о том, что наказание может быть эффективным с точки зрения модификации поведения, когда его сочетают с определенной реакцией (Church, 1963, 1969).

Оперантное поведение

Скиннер (Scinner, 1937) ввел различие между оперантным и реактивным поведением.

Рис. 17.8. Голубь, клюющий ключ в скиннеровском ящике.

Оперантным он назвал спонтанное действие без какого-либо очевидного стимула. Реактивным является всякое поведение, совершаемое в ответ на определенный стимул. Скиннер полагал, что любое оперантное поведение модифицируется и эффективно контролируется сочетающимся с ним подкреплением.

Мысль о том, что поведением животного можно полностью управлять, создав соответствующий порядок подкреплений, явилась крайней бихевиористской точкой зрения (Skinner, 1938).

Бихевиористская философия Скиннера произвела революцию в экспериментальных методиках, влияние которой ощущается до сегодняшнего дня.

Вместо неоднократного применения сочетаний, характерного для классической выработки условных рефлексов, и опытов с использованием проблемных ящиков и лабиринтов Скиннер разработал методику свободного оперантного поведения, при которой животному позволяют совершать различные действия, а экспериментатор старается управлять последствиями. Чаще всего для опытов такого рода выбирались крысы и голуби, хотя использовались также и многие другие животные, а также человек. Оперантная выработка условного рефлекса состоит главным образом в том, что животное «тренируют» на выполнение задачи, за которой последует вознаграждение. Крысу можно заставлять нажимать на рычаг, голубя — клевать освещенный круг, называемый «ключевым стимулом». Такая методика тренировки обозначается термином «shaping» (формирование поведения).

Рассмотрим, как обучают голубя клевать ключевой стимул для получения корма. Голодного голубя помещают в маленький ящик с механизмом для подачи зерна и с «ключом» на уровне головы (рис. 17.8). Такого рода устройство называют «скиннеровским ящиком». О подаче корма обычно сигнализирует маленькая лампочка, освещающая зерно.

Голуби быстро научаются связывать включение света с появлением корма; они подходят к подающему механизму и съедают зерно всякий раз, как включается свет. Следующая стадия обучения состоит в согласовании подачи пищи с каким-нибудь типом поведения голубя.

Обычно от голубя требуется, чтобы он клевал ключ, но Скиннер считал, что можно формировать любую реакцию и что голубей за вознаграждение можно научить чистить перья или описывать круги по ящику. Клевания ключа можно добиться, выдавая вознаграждение только в ответ на движения, которые постепенно становятся все более похожими на удар клювом по ключу.

Так, сначала голубь научается за вознаграждением подходить к ключу; затем он получает вознаграждение, только если стоит прямо, держа около ключа голову. На этой стадии голубь обычно клюет ключ самостоятельно, но его можно и побудить к этому, на время приклеив к ключу пшеничное зерно.

Своим клеванием голубь замыкает чувствительный контакт в электрической цепи, которая производит автоматическую подачу корма. Начиная с этого момента, голубь награждается, только когда клюет ключ, и ручное управление вознаграждением больше не требуется. Теперь животное готово для использования в опыте.

Такая оперантная методика применяется во многих типах экспериментов. Например, выработку дифференцировки можно изучать, вознаграждая животных только за реакции на определенный цвет или рисунок или давая им выбирать между двумя сигнальными раздражителями, различающимися визуально.

Эта методика оказалась особенно полезной для изучения действия разного типа вознаграждений. Так, можно вознаграждать голубя не просто за каждый, а за каждый N-й удар клювом, устанавливая в итоге определенное отношение между числом ударов и числом вознаграждений.

Такой метод называется вознаграждением по постоянному соотношению. Другие обычно применяемые схемы опыта включают переменное соотношение, постоянный интервал и переменный интервал. При интервальной схеме вознаграждение дается через интервалы времени, выбранные экспериментатором.

Животное вознаграждается за первую реакцию после некоторого интервала. Оказалось, что разные схемы вознаграждения по-разному влияют на действия животного.

Так, например, применение переменных интервалов создает очень равномерную частоту реакций и служит хорошей опорной величиной, относительно которой можно испытывать влияние на поведение различных факторов, например величины вознаграждения.

Считается, что Скиннер рассматривал бихевиоризм как философию науки о поведении, а не как собственно науку. Его подход был операционалистским, а психология — антитеоретической.

Хотя Скиннер полагал, что всякое поведение создается подкреплением, он признавал (1975), что «естественным отбором объясняется тот факт, что люди реагируют на стимулы, воздействуют на среду и изменяют свое поведение под влиянием связи с подкреплением».

Точно так же «тот факт, что оперантные условные рефлексы, подобно всем физиологическим процессам, являются результатом естественного отбора, проливает свет на вопрос о том, какого рода последствия служат подкреплением и почему».

Подход Скиннера основан на том, что подкрепление способно изменять поведение. Его утверждение о возможности модификации любой деятельности иллюстрируется разными играми, которым можно обучать голубей.

Так, он описывает (1958), как «голубя тренировали пускать деревянный шар по миниатюрному желобу в направлении расставленных игрушечных кеглей, толкая его резким боковым движением клюва. Результат поразил нас…

Это зрелище произвело такое впечатление на Бреленда, что он отказался от многообещающей карьеры в области психологии и стал платным дрессировщиком».

По иронии судьбы именно К. и М. Бреленды первые усомнились в том, что любая деятельность может быть изменена подкреплением. Они обнаружили, что при попытках научить животных разным трюкам некоторые виды активности оказывались устойчивыми, т. е. подкрепление на них не влияло.

Так, например, они старались научить свинью вкладывать «монету» в особую «копилку».

Свинья поднимала соответствующий деревянный значок, но вместо того, чтобы опустить в контейнер, многократно роняла его на пол, «толкала пятачком, поднимала, снова роняла, подгоняла пятачком, подбирала, подкидывала в воздух, роняла, снова толкала пятачком и т. д.» (К. Breland, М. Breland, 1961).

Подобным же образом некоторые цыплята настойчиво скребли землю, когда от них требовалось простоять 10-12 с на платформе, чтобы получить вознаграждение. Впоследствии появилось много сообщений такого рода.

Так, Севенстер успешно обучал самцов трехиглых колюшек (Gasterosteus aculeatus) проплывать через узкое кольцо, чтобы приблизиться к самке. Но ему не удалось научить самцов за то же вознаграждение кусать стеклянный стерженек, потому что самец упорно направлял на него свое ухаживание. Обзор этих и других исследований дает С. Шеттлуорт.

Бреленды толкуют свои данные как свидетельство инстинктивного смещения, при котором «выученное поведение смещается в сторону инстинктивного» всегда, когда сильные врожденные инстинкты животного сходны с условной реакцией.

Эти авторы указывают, что их данные нарушают принцип наименьшего усилия, выдвинутый Скиннером (Skinner, 1938), согласно которому животные стремятся получить вознаграждение самым быстрым и самым удобным способом.

В их исследованиях вознаграждение значительно задерживается из-за «неправильного» поведения животных.



Источник: http://biofile.ru/bio/2678.html

Book for ucheba
Добавить комментарий