sexta-feira, 24 de fevereiro de 2012

O condicionamento operante: definição e aplicações


Por: Bruno Alvarenga Ribeiro.

Chamamos de condicionamento operante o processo pelo qual certa classe de comportamentos fica sob o controle de suas consequências. Esta classe de comportamentos recebe o nome de Operante. O termo faz referência ao fato de que esta classe de comportamentos opera no meio modificando-o, e por sua vez estas modificações também alteram o comportamento.

O comportamento operante foi descoberto por B. F. Skinner. Primeiro Skinner começou trabalhando com animais em laboratório. No seu clássico experimento um rato ou um pombo foram colocados em uma caixa experimental. Nesta caixa existia uma barra e/ou um disco (botão) e um recipiente que liberava água ou comida. O rato ou o pombo privados da água ou comida tiveram acesso tanto a água ou a comida toda vez que exibiram um certo comportamento. No caso do rato o comportamento seria pressionar a barra e no pombo seria o comportamento de bicar um disco (botão) iluminado na parede da caixa experimental.


No entanto, antes das sessões experimentais estes comportamentos não existiam no repertório de comportamentos dos animais. Os mesmos foram modelados. Cada resposta que se aproximava do comportamento almejado (pressionar barra / bicar disco) era imediatamente seguida da consequência ter acesso a comida e/ou a água. Percebeu-se que estas respostas foram se tornando mais fortes. Logo Skinner entendeu que foi estabelecida uma relação de dependência entre a resposta e a consequência por ela produzida (liberação de água ou comida). Ao final do experimento o rato conseguia pressionar a barra e o pombo bicar o disco para que houvesse liberação da comida ou água.

Este simples arranjo experimental foi um passo grandioso, pois ele levou à descoberta da classe de comportamentos que Skinner chamou de operantes. Diferente dos comportamentos respondentes, o comportamento operante não é causado por um estímulo que antecede a sua ocorrência. O comportamento operante é causado (determinado) pelas consequências que produz, pelas alterações que provoca no ambiente. A descoberta da classe de comportamentos operantes rompe com o paradigma de causalidade linear mecanicista.

Rompe porque demonstra que nem todo comportamento é provocado por estímulos que antecedem sua ocorrência, e porque demonstra também a necessidade de se entender a relação que o comportamento estabelece com o meio ao seu entorno para que este possa ser analisado. Sem que conheçamos o comportamento e as modificações por ele produzidas no ambiente, não somos capazes de entender os motivos por trás da sua ocorrência. Disto conclui-se que comportamento é relação e nos dois polos desta relação existem modificações que se processam, e o entendimento do comportamento passa pelo entendimento destas modificações. Um polo é a resposta exibida pelo organismo e o outro polo são as consequências produzidas por esta resposta.

Pode parecer um modelo aparentemente muito simples. No entanto, a coisa fica mais complexa quando descobrimos que a forma como as consequências seguem determinadas respostas são determinantes para a força desta. Mede-se a força de uma reposta pela sua frequência de emissão. Muitas variáveis se interpõem no intervalo entre uma resposta (um curso de ação) e a consequência por ela produzida. A consequência pode seguir imediatamente a resposta, pode segui-la depois de um tempo, ou segui-la depois de ser exibida uma quantidade de vezes etc. Tudo isso faz diferença na análise da resposta, sendo esta a menor fração de uma classe de comportamentos.

Uma classe de comportamentos é formada por várias respostas que têm a mesma função, ou seja, por respostas que produzem o mesmo resultado. Por exemplo, a classe de comportamentos abrir uma torneira pode ser formada por várias respostas que produzem o resultado torneira aberta. Posso abrir a torneira com a mão esquerda, com a mão direita, com as duas mãos, lentamente, vigorosamente etc. Todas estas respostas produzem o resultado torneira aberta. Logicamente que a circunstância em que a torneira é aberta também afeta o comportamento de abri-la. Se for uma torneira com mistura de água quente e fria, posso abrir mais lentamente para testar a mistura. Se abrir rapidamente a água quente posso me queimar, ou se abri-la lentamente a água pode demorar a atingir a temperatura que desejo. Estes exemplos envolvem outros estímulos presentes na circunstância em que o comportamento de abrir a torneira ocorre, mas por enquanto não vamos falar destes estímulos. Fiquemos apenas com a relação entre comportamento e suas consequências.

Vamos dar nomes aos bois, pois assim tudo fica muito mais fácil. Já aprendemos a definir operante. Sabemos que as consequências que um operante provoca são o princípio para entendermos esta classe de comportamentos. Mas estas consequências têm nomes. Vamos introduzir alguns destes nomes (conceitos). Chamamos de reforçadores, estímulos reforçadores ou simplesmente reforços as consequências produzidas por um operante. Estas só podem ser chamadas desta forma se for possível observar que a resposta que gera estas consequências torna-se mais forte. Se isso for observado podemos dizer que existe entre a resposta e a consequência produzida uma relação de contingência. Contingência é um termo técnico para designar relações de dependência entre eventos comportamentais e eventos ambientais.

A relação entre resposta e reforçadores é no condicionamento operante uma contingência. Assim como é uma contingência a relação entre estímulos incondicionado/condicionado e respostas incondicionada/condicionada no paradigma do condicionamento respondente. Dizer que existe uma contingência entre um evento comportamental e um evento ambiental, é o mesmo que dizer que a presença de um aumenta a possibilidade de ocorrência do outro, ou seja, é o mesmo que dizer que existe uma relação de dependência entre estes eventos. Neste sentido, podemos afirmar junto com Skinner que a Psicologia é uma Ciência Natural, pois seu objeto de estudos (comportamento) envolve relações de dependência entre eventos naturais. O vídeo abaixo faz um bom resumo da obra de Skinner e destas relações aqui teorizadas:

                                         

Há dois tipos de operações através do qual as consequências podem modificar o comportamento: operação de reforçamento positivo e operação de reforçamento negativo. Os termos positivo e negativo não têm nenhuma relação com energias positivas ou negativas ou com os efeitos emocionais provocados pela apresentação de reforços negativos e positivos. Energias positivas e negativas são entidades metafísicas que não têm lugar na psicologia skinneriana, são especulações a respeito do comportamento. Não são eventos naturais. Sendo assim, não podem possuir o status de agentes causais do agir humano, assim como a mente e assemelhados. Não podemos, por exemplo, com o conceito de mente (id, ego, superego, inconsciente, cognição etc) fazer qualquer previsão sobre o comportamento humano. Mas podemos com o conceito de reforço criar esta margem de previsibilidade, bastando que se identifique a resposta, o reforço que ela produz e o efeito deste reforço sobre a resposta. Feito isso, posso alterar o comportamento nesta ou naquela direção, bastando que eu modifique a relação entre resposta e reforço. Esta é a vantagem da prosposta de Skinner, pois ela nos permite transitar no mundo dos eventos naturais, o que consequentemente permite também a utilização do método experimental no estudo do comportamento, sendo a utilização deste método um avanço científico considerável, uma vez que o que se estuda no mundo simplificado do laboratório não é diferente do mundo externo, ou seja, não há uma ruptura entre a natureza do mundo dentro do laboratório e a natureza do mundo fora deste. São o mesmo mundo. Existe uma continuidade entre ambos. Sendo assim, as leis descobertas por meio de arranjos experimentais no laboratório podem perfeitamente serem aplicadas ao mundo cotidiano, desde que se resguardem as devidas proporções na complexidade das relações entre eventos ambientais e eventos comportamentais dentro e fora do laboratório.

Voltemos às operações de reforçamento positivo e negativo. Na operação de reforçamento positivo o comportamento é fortalecido por um estímulo que é acrescentado à situação. Diga-se de passagem, que este estímulo é produzido por este comportamento, já que há entre ambos uma relação de dependência. Veja a tirinha abaixo:

                                            Clique na imagem para ampliar.

O comportamento de “olhar de biscoito” de Snoopy é reforçado positivamente por Charlie Brown. Possivelmente Snoopy agiu assim porque outras vezes no passado quando lançou sobre Charlie Brown este mesmo olhar, acabou recebendo alguns biscoitos de chocolate. E há na tirinha informações que nos permite tal conjectura, pois Snoopy afirma ao final: “O velho olhar fixo de biscoito de chocolate”. Certamente este mesmo comportamento foi reforçado positivamente em outras circunstâncias semelhantes no passado, em função disso continua acontecendo. Um estímulo foi acrescido à situação: o comportamento de dar biscoitos por parte de Charlie Brown. Portanto, o termo positivo faz referência ao estímulo que é acrescentado.

Associado ao reforçamento positivo estão os sentimentos de bem-estar, motivação, alegria, exaltação etc. Mas um estímulo não é um reforçador positivo por causa de seus efeitos emocionais, e sim por causa de seus efeitos sobre o comportamento que o provoca. No caso do estímulo reforçador positivo, seu efeito é fortalecer o comportamento que o produz.

É visível como Snoopy ficou feliz. Então há uma relação entre o uso de reforçamento positivo e os sentimentos de alegria, realização, felicidade etc. Se quisermos construir um mundo em que as pessoas sejam mais felizes, temos que pensar no tipo de reforçamento que utilizamos em nossas relações. No entanto, isso não quer dizer que reforçamento positivo reforce apenas comportamentos adaptativos. Ele também pode ser responsável pela produção de comportamentos desadaptativos. Um bom exemplo é a dependência química. A droga enquanto estímulo reforçador positivo reforça todos os comportamentos que envolvem o seu uso, inclusive o tráfico, o roubo etc. E a longo prazo ela destrói relações e também a saúde de seus usuários. Então reforçamento positivo, embora, esteja associado a sentimentos positivos, também pode produzir comportamentos desajustados, por isso se deve tomar muito cuidado ao se analisar um comportamento e as relações que ele estabelece com o ambiente.

Na operação de reforçamento negativo um comportamento é fortalecido pela remoção de um estímulo. Neste caso a consequência do comportamento é a remoção do estímulo. Vejamos a tirinha abaixo:


                                          Clique na imagem para ampliar.

Na tirinha Linus faz o sanduíche para livrar-se da ameaça de agressão. O estímulo (comportamento) “ameaça” é removido pelo comportamento de fazer o sanduíche. Então o termo negativo faz menção ao fato de que um estímulo é subtraído. Este estímulo chamamos de estímulo reforçador negativo, ou simplesmente reforço negativo. No exemplo da tirinha o comportamento de Linus está sendo mantido através de reforçamento negativo. Se Linus agiu tão prontamente é porque provavelmente no passado ele recebeu outras ameaças, e talvez algumas delas chegaram a se concretizar. Associado ao reforçamento negativo está geralmente o sentimento de alívio quando o estímulo reforçador negativo é romovido. Mas quando este ainda está em operação é comum a ansiedade, angústia, medo, apreensão, mal-estar etc. Todos estes são exemplos de reações emocionais que comumente chamamos negativas, mas não é por causa disso que a operação é chamada de reforçamento negativo, mas sim por causa da função que tem o estímulo removido como consequência da ocorrência de um determinado comportamento, e esta função é o fortalecimento deste comportamento.

Vejam, portanto, que as operações de reforçamento, sejam elas de reforçamento positivo ou negativo produzem (fortalecem) comportamento. É bom que isso fique claro, pois comumente reforçamento negativo é confundido com punição. Embora exista uma estreita relação entre as operações de punição e reforçamento negativo, punição não produz (fortalece) comportamento. Punição suprime temporariamente o comportamento punido, mas somente enquanto ela estiver agindo. Cessada a punição o comportamento punido provavelmente volta a ocorrer.

A estreita relação entre punição e reforçamento negativo ocorre porque o agente punidor torna-se por causa do uso da punição um estímulo do qual fugimos ou tentamos evitar. Quando fugimos o comportamento de fuga é mantido por reforçamento negativo. Mas por que o agente punidor pode se tornar por si só um estímulo do qual temos a tendência a fugir e/ou evitar (esquivar)? Aqui aproveitamos para introduzir mais uma operação comportamental relacionada à ocorrência do comportamento operante. Esta operação é chamada de discriminação.

Já entendemos que o comportamento operante é afetado por suas consequências. Entendemos também que a relação entre comportamento e suas consequências é uma contingência. Mas existe outro tipo de contingência quando o que está em jogo é o comportamento operante. Este comportamento também mantém relações de dependência com estímulos presentes no contexto em que ocorre e é reforçado.

Todo comportamento ocorre em um contexto. Os estímulos do contexto podem se associar aos estímulos reforçadores. Quando isso acontece eles adquirem a função de sinalizarem a ocorrência de reforços, sejam eles positivos ou negativos. Estes estímulos são chamados de estímulos discriminativos, e a operação de estabelecimento dos mesmos é chamada de discriminação. Voltemos ao exemplo de Linus e a irmã. Provavelmente Linus foi punido pela irmã outras vezes no passado. Porque isso aconteceu certos comportamentos da irmã se tornaram estímulos sinalizadores de punição. O punho armado da irmã na figura age neste sentido, ou seja, ele sinaliza uma operação de punição em andamento. Para fugir da punição sinalizada pelo comportamento da irmã, Linus acaba fazendo o sanduíche. O comportamento agressivo da irmã é o estímulo discriminativo que tornou mais provável o comportamento de fazer sanduíche por parte de Linus.

Neste exemplo aprendemos algo importante. Estímulos discriminativos não agem como os estímulos incondicionado e condicionado no comportamento respondente. Eles não provocam o comportamento, eles tornam mais provável o comportar-se neste ou naquele sentido. Então os estímulos discriminativos aumentam a probabilidade de ocorrência de um determinado comportamento. A relação entre comportamento, suas consequências e os estímulos do contexto chamamos de contingências do reforço. A análise do comportamento passa pela análise das contingências do reforço.

Estímulos discriminativos também podem sinalizar a ocorrência de reforçamento positivo. Veja a tirinha abaixo:

                                          Clique na imagem para ampliar.

Vemos na cena Snoopy beijando Paty Pimentinha. O beijo de Snoopy sinaliza que ele está disposto a se envolver em outros comportamentos de manifestação de carinho. Quando, por exemplo, o amado quer surpreender a sua amada e torná-la predisposta a manifestar comportamentos de carinho, ele dá a ela um buquê de flores ou a chama para jantar. A surpresa do amado sinaliza que ele está disposto a reforçar comportamentos de carinho de sua amada e sinaliza que naquela noite ele quer um encontro especial. A surpresa sinaliza ainda para a amada que o amado naquela noite está predisposto a ser carinhoso. O buquê ou o convite para jantar são estímulos discriminativos sinalizadores de reforçamento positivo.

Estímulos parecidos, ou seja, que guardam alguma propriedade com algum estímulo discriminativo também têm a função de aumentar a probabilidade de certos comportamentos. Uma mulher com saudades do amado que está viajando pode achar que o viu na rua porque cruzou com algum homem que se parece com ele. O cheiro de um perfume doce pode nos lembrar alguém com quem nos relacionamos no passado e que também usava perfumes doces. Esse princípio chamamos generalização. A generalização ocorre tanto no condicionamento respondente quanto no condicionamento operante.

A mesma operação que produz estímulos discriminativos produz também um tipo de reforço que chamamos reforçadores condicionados. Existem os estímulos reforçadores incondicionados e os estímulos reforçadores condicionados. Estímulos reforçadores incondicionados e condicionados podem ter tanto a função de reforços positivos ou negativos, ou seja, podem reforçar comportamento pela sua adição ou subtração. Estímulos reforçadores incondicionados são aqueles de importância biológica: comida, bebida, sexo, abrigo contra calor ou frio etc. Estímulos reforçadores condicionados são aqueles estímulos que adquiriram a função de reforçar porque foram associados a algum estímulo reforçador incondicionado. O dinheiro é um bom exemplo de reforçador condicionado, pois com ele compramos comida, bebida, nos abrigamos contra o frio e nos protegemos do calor etc. Carinho, afeto, atenção são outros exemplos de reforçadores condicionados.

Desde muito cedo recebemos carinho, afeto e atenção de pessoas próximas de nós. Estes costumam ser acompanhados de comida e bebida. A mãe que amamenta e acaricia seu bebê é a cena perfeita para o estabelecimento destes reforçadores desde muito cedo. Desta forma novos reforçadores vão sendo construídos. Na medida em que novos estímulos ao longo da vida vão sendo pareados (associados) a reforçadores incondicionados ou a outros reforçadores condicionados, vão surgindo novos reforçadores condicionados.

Mas fica a pergunta: por que o reforço reforça? Da mesma forma que a evolução das espécies selecionou alguns comportamentos por causa de seu valor de sobrevivência, selecionou também a capacidade de certos comportamentos serem afetados pelas consequências que produzem. Estes comportamentos são os operantes. O operante corrige uma falha da evolução. A evolução só selecionou aqueles comportamentos adequados ao ambiente em que a espécie se desenvolveu. Num ambiente em constante mutação estes comportamentos selecionados pela evolução não permitiriam a espécie se adaptar eficazmente. Para corrigir esta falha o mesmo processo evolutivo selecionou a susceptibilidade de alguns comportamentos serem afetados por suas consequências, permitindo a espécie se adaptar a novos ambientes pela aquisição de novos comportamentos.

O mesmo princípio presente na seleção de comportamentos que têm valor de sobrevivência para a espécie, opera na determinação (causação) dos comportamentos operantes, ou seja, estes são selecionados pelas consequências que produzem por causa de seu valor adaptativo. Mas este processo também tem uma falha, pois ele pode produzir comportamentos desadaptativos como já tivemos oportunidade de assinalar. Para correção desta falha surgiu a “linguagem” (comportamento verbal). Veja que linguagem está entre aspas porque para o Behaviorismo Radical não existe linguagem enquanto entidade metafísica. Linguagem enquanto sinônimo de língua empregada por um povo é nada mais do que a codificação do conjunto de comportamentos verbais deste mesmo povo, mas deixemos esta querela para outros posts.

Através do comportamento verbal podemos descrever nossos comportamentos e as relações que ele estabelece com o meio, criando para nós mesmos e para a cultura que vivemos regras que evitam que incorramos em comportamentos que podem nos prejudicar e prejudicar aqueles com quem vivemos, ou regras que aumentam a probabilidade de comportamentos que promovam o bem-estar da cultura. Regras do tipo: “o uso de drogas destrói a saúde”. Logicamente que a regra não impede que sejam criadas ocasiões para o reforçamento de comportamentos pouco adaptativos, mas aumentam as chances de acertos e minimiza as chances de erros. O caso das drogas é um bom exemplo, pois a imediaticidade dos reforços positivos produzidos pelo seu uso é muito mais poderosa do que as adversidades produzidas a longo prazo. Mas tudo que a regra faz é sinalizar para estas consequências adversas a longo prazo. Neste caso existem duas contingências concorrendo uma com a outra: a contingência imediata e a contingência a longo prazo.

Portanto, o modelo de causalidade proposto pela psicologia skinneriana apresenta-nos três níveis de seleção: a filogenética, a ontogenética e a cultural. A filogenética diz respeito aos comportamentos selecionados ao longo da evolução da espécie. A ontogenética à susceptibilidade de certos comportamentos serem afetados por suas consequências e a cultural aos comportamentos que permitem-nos descrever as contingências que governam nossos comportamentos nos três níveis. Em outros posts exploraremos com mais detalhes os dois últimos níveis.

Outros artigos semelhantes a este? Abaixo você encontra outras indicações de leituras do Café com Ciência, não deixe de conferir.

4 comentários:

  1. Esse post me ajudou muito Bruno!
    Obrigada e parabéns pelo trabalho!

    ResponderExcluir
    Respostas
    1. Obrigado Cynthia pela contribuição! Sinta-se sempre a vontade para contribuir. Abraços!

      Excluir
  2. Olá Multiplicador Bruno, estamos felizes por você fazer parte deste projeto. Como prometido, seu blog já foi divulgado. Fizemos de coração, esperamos que goste!

    Aqui está o link da publicação:
    http://www.educadoresmultiplicadores.com.br/2013/02/multiplicador-cafe-com-ciencia.html

    Faça uma visitinha especial ao blog Educadores Multiplicadores, abra as páginas e veja como ficou sua divulgação.

    Multiplicador, (se quiser) escreva um pequeno post mostrando sua chegada ao Educadores Multiplicadores.

    E já sabe, seu blog poderá ficar em evidência todos os meses, conforme as regras da parceria (saiba tirar proveito dessa parceria dinâmica).

    Quando quiser acessar o link: Educadores Multiplicadores e o Marquecomx, fique a vontade! (o Marquecomx é parte da parceria):

    Parabéns pelos excelentes textos, fiquemos na Paz de Deus, abraço e até breve!

    Irivan

    ResponderExcluir
    Respostas
    1. Agradeço pela publicação. Esta parceria é uma honra!

      Abraços.

      Excluir

Obrigado por participar!