domingo, 2 de maio de 2010

Condicionamento operante . Aprendizagens 1

Condicionamento operante

Origem: Wikipédia, a enciclopédia livre.

O conceito de “Condicionamento Operante” foi criado pelo psicólogo Burrhus Frederic Skinner. Este refere-se ao procedimento através do qual é modelada uma resposta (ação) no organismo através de reforço diferencial e aproximações sucessivas. É onde a resposta gera uma consequência e esta consequência afeta a sua probabilidade de ocorrer novamente; se a consequência for reforçadora, aumenta a probabilidade, se for punitiva, além de diminuir a probabilidade de sua ocorrência futura, gera outros efeitos colaterais. Este tipo de comportamento que tem como consequência um estímulo que afete sua frequência é chamado “Comportamento Operante”.

O conceito de Comportamento Operante difere do conceito de comportamento respondente porque o primeiro ocorre em um determinado contexto, chamado estímulo discriminativo, e gera um estímulo que afeta a probabilidade dele ocorrer novamente; o segundo é diretamente eliciado por algum estímulo e é uma reação fisiológica do organismo. Uma resposta fisiológica a um estímulo, como fechar o olho diante de algo que se aproxima dele, retirar o braço diante de uma agulhada, etc.

O comportamento operante é modelado a partir de nosso repertório inato. As respostas que gerem mais reforço em média, tendem a aumentar de frequência e se estabelecer no repertório, ou seja, em um contexto semelhante tendem a ser novamente emitidas. O tipo de consequência que aumenta a probabilidade de ocorrência da mesma função de resposta em contextos semelhantes, chama-se reforço. O reforço pode ser positivo, quando há a adição de um estímulo no ambiente que resulte no aumento da frequência da resposta que o gerou; ou negativo, quando a resposta emitida remove algum estímulo aversivo, ou seja, que a pessoa tende a evitar, do ambiente.

Os contextos onde existe probabilidade de uma determinada resposta ser reforçada são chamados estímulos discriminativos, ou SD; os contextos onde não existe a probabilidade da resposta ser reforçada, são chamados estímulos delta, ou S∆.

Lei do Efeito de Thorndike

O condicionamento operante, também chamado de condicionamento instrumental ou aprendizagem instrumental foi primeiramente estudado por Edward L. Thorndike (1874-1949), que observou o comportamento de gatos tentando escapar de "caixas problemas".^[1] Na primeira vez que os gatos eram colocados nas caixas, eles demoravam bastante tempo para escapar delas. Mas, com o passar do tempo, as respostas ineficientes foram diminuindo de frequência, e as respostas mais efetivas aumantavam de frequência, e os gatos agora conseguiam escapar em menos tempo e com menos tentativas. Em sua Lei do Efeito, Thorndike teorizou que as respostas que produziam consequências mais satisfatórias, foram "escolhidas" pela experiência e portanto, aumentaram de frequência. Algumas consequências reforçavam o comportamento, outras enfraqueciam ele. Thorndike produziu a primeira curva de aprendizagem com este procedimento. B. F. Skinner (1904-1990)formulou uma análise mais detalhada do condicionamento operante utilizando de conceitos como reforçamento, punição e extinção. Seguindo as idéias de Ernst Mach, Skinner rejeitou as estruturas mediadores de Thorndike requeridas pela "satisfação" e construiu um novo conceito de comportamento sem a utilização de tais referências.

Princípios do Reforço

É importante ressaltar, que reforço, ao contrário do que pode pensar o senso comum, não é uma simples recompensa. Para B. F. Skinner, reforço, pode ser qualquer evento que aumenta a frequência de uma reação precedente.Um reforço pode ser uma recompensa tangível. Pode ser um elogio ou uma atenção. Ou pode ser uma atividade, como poder usar o carro depois que a louça estiver lavada, ou ter uma folga depois de uma hora de estudo.^[2]

Reforços Primários e Secundários

Os reforços primários - como receber alimento ou ser aliviado de um choque elétrico - são intrinsecamente satisfatórios. Os reforços secundários são aprendidos. Se um rato numa caixa de Skinner aprende que uma luz sinaliza de maneira confiável que a comida está chegando, ele vai se empenhar em acender a luz. Dinheiro, boas notas, são exemplos de reforços secundários, cada um das quais está ligado a recompensas mais básicas.^[2]

Reforços Imediatos e Retardados

Para ilustrar bem como funcionam esses dois tipos de reforços, pode-se usar como exemplo um experimento de moldagem em que se condiciona um rato a apertar uma barra. Antes de efetuar esse comportamento "desejado", o rato faminto se empenhará numa sequência de comportamentos "indesejados" - arranhar, farejar, andar de um lado para o outro. qualquer desses comportamentos que preceda imediatamente o reforço de comida tem mais probabilidade de ocorrer de novo. Se você retarda o reforço da pressão da barra por mais 30 segundos, permitindo que outros compotamentos interfiram e sejam recompensados, não ocorrerá praticamente qualquer aprendizagem de apertar a barra.^[2]

Humanos, ao contrário de ratos, reagem a reforços bem mais retardados: o pagamento do salário no fim do mês, a nota no fim do semestre, o troféu no campeonato.

Porém, reforços pequenos, mas imediatos, são às vezes mais atraentes do que reforços grandes, mas retardados. Fumantes, alcoolatras e outros usuários de drogas podem saber que seu prazer imediato é mais do que contrabalançado pelos futuros efeitos perniciosos, mas nem por isso abandonam seu vício.

Punição

O reforço negativo é algo diferente da punição. A punição, ao contrário do reforçamento negativo, leva à extinção do comportamento, ou seja, com o passar do tempo, a probabilidade de ele ocorrer novamente diminui. O reforçamento negativo, passa a idéia de uma obrigação: uma criança pode estudar (comportamento) com o intuito de evitar apanhar (reforço negativo). O reforçamente negativo, não é um evento punitivo: é a remoção de um evento punitivo. Ambos utilizam de estímulos aversivos.^[3]

As punições podem ser de dois tipos: por adição (punição positiva), quando experiências aversivas são adicionadas, ou por subtracção (punição negativa), quando facilitadores do comportamento são subtraídos. Ambas as técnicas levam a aquilo que chamamos de extinção.

A punição pode acarretar uma série de problemas: esse tipo de estimulação aversiva, acarreta respostas do sistema nervoso, entendidas como ansiedade, depressão, baixa auto-estima.^[4] Além do mais, o comportamento punido não é esquecido, ele é suprimido. Pode er que após a estimulação aversiva ter sido eliminada, o comportamento volte a ocorrer: a criança pode simplesmente aprender a não dizer palavrões em casa, mas continuar a usá-los em outros lugares.

Ela também suprime o comportamento indesejado, mas não guia a pessoa para um comportamento mais desejável. A punição diz o que não fazer, o reforço diz o que fazer. Uma punição combinada com um reforçamento positivo de comportamentos desejáveis é mais eficiente.

Em suma, a punição rápida e segura pode ser eficaz, e pode de vez em quando causar menos dor do que o comportamento autodestrutivo que suprime. Mas ele pode reaparecer, se for possível evitar a punição. Essa estimulação aversiva também pode provocar efeitos colaterais indesejáveis, como ansiedade e ensinar agressividade. Os psicólogos preferem dar mais ênfase ao reforço positivo do que à punição.

Programações de Reforço

Usando-se esquemas de reforço contínuo, a aprendizagem ocorre rapidamente, mas sem o reforço, a extinção ocorre rapidamente também. Na vida real, esquemas de reforço contínuo são raros.^[2]

Nevin, em 1988, estudou que as reações às vezes são reforçadas, às vezes não. É o que se chama de reforço parcial. A aprendizagem demora mais, no começo, mas ela é mais "resistente" à extinção. Imagine um pombo que aprendeu a bicar uma tecla para obter comida. quando o pesquisador vai suspendendo gradativamente a entrega de alimento, até que ela ocorra só de maneira rara e imprevisível, os pombos podem bicar 150.000 vezes sem recompensa. Com o reforço parcial, a esperança flui eterna (esse é o princípio do "pombo superticioso" de Skinner). è o que ocorre por exemplo, em jogadores compulsivos, que continuam a jogar, mesmo sem nunca ganharem.

Programações de Ritmo Fixo

Reforçam o comportamento depois de um determinado número de respostas. Empregados que trabalham em fábricas que recebem por produção, são reforçados de tal maneira.

Programações de Ritmo Variável

Reforçam a primeira resposta depois de uma quantidade imprevisível de respostas. É o que ocorre com os jogadores e pescadores. A dificuldade de se extinguir tais comportamentos é de que o reforço aumenta à medida que aumentam as respostas.

Programações de Intervalos Fixos

Reforça a primeira resposta depois de um período determinado. Como pessoas que verificam a caixa de correspondência quando a hora do carteiro passar se aproxima, os pombos bicam uma tecla com mais frequência à medida que fica mais próxima a hora esperada de recompensa, produzindo um padrão inconstante de "pára-começa".

Programações de Intervalo Variável

Reforça a primeira resposta depois de intervalos de tempo variáveis. Como o questionário imprevisível que reforça o estudo, as programações de intervalo variável tendem a eliciar respostas lentas e firmes. Caso os questionários tornem-se previsíveis, os estudantes começarão a seguir o padrão de pára-começa que caracteriza as programações de intervalo fixo (em outras palavras, estudarão apenas na véspera).

O Uso dos modelos Animais

Um behaviorista utiliza o comportamento dos animais não como forma de poder estudar as particularidades que os animais possuem quanto ao seus comportamentos, mas sim, para procurar leis universais que regem o comportamento dos organismos. Para Skinner (1956), os esquemas de reforço do condicionamento operante são universais. Importa pouco, disse ele, que reação, que reforço ou que espécie você usa. O efeito de determinada programação de reforço é quase o mesmo: "Pombo, rato, macaco, o que é o quê? Não importa… O comportamento apresenta características espantosamente similares."

Referências

↑ Thorndike, E. L. (1901). Animal intelligence: An experimental study of the associative processes in animals. Psychological Review Monograph Supplement, 2, 1-109.
↑ ^a ^b ^c ^d Myers, D (1999) em "Introdução a Psicologia Geral", Rio de Janeiro: LTC - Livros Técnicos e Científicos Editora S.A.
↑ Skinner, B. F. (1974) em "Sobre O Behaviorismo" São Paulo: Editora Cultrix
↑ Skinner, B. F. (1971) em "Para Além da Liberdade e da Dignidade" Lisboa: Edições 70

Este artigo sobre Behaviorismo é um esboço. Você pode ajudar a Wikipédia expandindo-o.

Obtida de "http://pt.wikipedia.org/wiki/Condicionamento_operante"

Categorias: Behaviorismo | Comportamento | Fundamentos da Educação

VÍDEOS

http://www.youtube.com/watch?v=--VoFnc7z-Y&feature=related

http://www.youtube.com/watch?v=vmRmBgKQq20&feature=related

Obrigado por sua visita, volte sempre.

Nenhum comentário:

Postar um comentário

Fundador Acarya da ISKCON e B.B.T.

A C Bhaktivedanta Swami Prabhupada nasceu em 1896, em Calcutá, na Índia e abandonou seu corpo em 1977, aos 81 anos de idade.
Seu mestre, de nome, Srila Bhaktisiddhanta Sarasvati Goswami Maharaj, convenceu-o a dedicar sua vida a ensinar os fundamentos e filosofia do hinduísmo, também chamado conhecimento védico.
Em 1944 Prabhupada escreveu sobre o Bhagavad-Gita e publicou uma revista chamada "Volta ao Supremo" com todo o conteúdo falando apenas sobre o seu mestre. A revista continua sendo publicada até hoje, já tendo sido traduzida para mais de trinta idiomas.
Em 1950, aos 54 anos de idade, Prabhupada adotou completamente a vida "monástica" com objetivo de dedicar mais tempo a seus estudos e escritos.
Traduziu os dezoito mil versos do Srimad-Bhagavatam (Bhagavata-Purana) e escreveu
"Fácil Viagem a Outros Planetas".
Em 65 mudou-se para os EUA onde fundou a Sociedade Internacional para a Consciência de Krsna.

Existem 4 Sampradayas vaishinavas , e Srila Prahupada, é auto refulgente, e não precisa de um carimbo de guru. Ele sintetiza a essência de toda sabedoria milenar Védica e de todas as Sampradayas para era de kaly. Ou Kali-Yuga. João Carlos Maria (Jagad Iswara Das Adhicary), desde 1992.

Professor Olavo de Carvalho

Professor e filosofo Olavo de Carvalho.

O maior: pedagogo, educador, professor e filósofo do mundo.
http://www.olavodecarvalho.org/index.html

Sites associados:
http://www.seminariodefilosofia.org
http://www.theinteramerican.org
http://www.institutoolavodecarvalho.com
http://luizgonzagadecarvalho.com
http://www.midiasemmascara.org

“O sentimento segue aquilo que amamos. Se amamos o que é verdadeiro, bom e belo, ele nos conduzirá para lá. O problema, portanto, não é sentir, mas amar as coisas certas. Do mesmo modo, o pensamento não é guia de si próprio, mas se deixa levar pelos amores que temos. Sentir ou conhecer, nenhum dos dois é um guia confiável. Antes de poder seguir qualquer um dos dois, é preciso aprender a escolher os objetos de amor – e o critério dessa escolha é:
Quais são as coisas que, se dependessem de mim, deveriam durar para sempre?
Há coisas que são boas por alguns instantes, outras por algum tempo. Só algumas são para sempre.”

Olavo de Carvalho

Blog do João Maria Andarilho Utópico,O Blog O Santo Nome & Blog Vídeo Imagem & Som.

domingo, 2 de maio de 2010