Aprendemos em Condicionamento Operante que podemos reforçar um determinado comportamento logo após o mesmo ser emitido, e quanto maior as repetições deste mesmo reforçamento maior será a probabilidade do comportamento se instalar. Se reforçamos, aumentamos as a força e a resposta do comportamento emitido.
Saiba Mais: Comportamento Responde e Operante - Behaviorismo
Há duas formas de se reforçar um comportamento dentro do condicionamento operante. Acredito que a mais conhecida é o Reforço Contínuo, onde reforçamos o comportamento logo após a sua manifestação, mas, não é somente o Reforço Contínuo a única forma de condicionamento e é justamente o que abordaremos nesse artigo. Hoje, falarei sobre o Esquema de Reforçamento Intermitente ou Reforço Parcial - como muitos chamam. No Esquema de Reforçamento Intermitente, somente algumas respostas serão reforçadas.
Reforçamento Intermitente - Reforço Parcial:
O Reforço Parcial, diferente do "contínuo", é quando a resposta (comportamento) é reforçada apenas em uma determinada parte do tempo, seguindo um padrão já pré-estipulado. No reforço parcial os comportamentos aprendidos demoram mais para serem aprendidos (reforçados), mas o mesmo se torna mais resistente à extinção.
Saiba Mais: Skinner e o Novo Conceito de Ciência Natural
Existem quatro esquemas de reforçamento intermitente, são eles:
- Esquema de Razão Fixa: É quando determinado comportamento somente é reforçado quando o mesmo se apresenta de terminadas quantidades, ou seja, somente é reforçado após um determinado número de respostas. Exemplo: Reforçamos (damos comida) o comportamento do rato de pressionar a barra após o mesmo pressionar a barra 3x. Aqui sempre é respeitado um intervalo, ele é fixo.
- Esquema de Razão Variável: Diferente da razão fixa, aqui o comportamento é reforçado após um número imprevisível de respostas (manifestação). Reforçamos (damos comida) o comportamento de pressionar a barra após o rato pressionar duas vezes, depois cincos e depois 1; assim o rato não "aprende" em que momento será liberada a comida.
- Esquema de Intervalo Fixo: Como o próprio nome diz "intervalo fixo" - nos remete a tempo -, é quando a resposta é recompensada somente após determinado período de tempo. Tal esquema produz poucas respostas no início do experimento - com o programa Sniffy - e altas taxas de respostas no final. Exemplo: Somente reforçamos o comportamento desejado no rato após 20 segundos corridos após ele emitir o comportamento.
- Esquema de Intervalo Variável: Ao contrário do "intervalo fixo", aqui uma resposta é recompensada depois de um tempo indeterminado. O reforçamento nesse caso é muito lento, mas eficaz. Um exemplo desse esquema seria reforçar o comportamento do rato após 30 segundos que emitiu o comportamento, depois 1 minuto, 40 segundos, sucessivamente.
Podemos notar como é fácil aprender esses conceitos. Todos envolvem o comportamento e diferem apenas quanto ao número de respostas necessárias para reforçar o comportamento e quanto ao tempo. Nos dois primeiros vemos uma razão quanto ao número de comportamentos necessários e, do contrário, nas duas últimas, temos apenas o tempo como variável a ser aplicada para o reforçamento de determinado comportamento.