Adiestramiento y Etología canina

15 de abril de 2013

Entrenamiento con Clicker: Una aplicación práctica de la Teoría del Condicionamiento Operante

por Juan Sangüesa Massiel, 2005

RESUMEN
Por medio de este documento intentaremos explicar la aplicación práctica de una de las teorías del aprendizaje más conocidas, el condicionamiento operante. Esta aplicación es utilizada principalmente para el adiestramiento canino y el condicionamiento de otros animales. El marco teórico en el cual nos hemos situado emerge de la tradición conductista, que es la que mejor ha estudiado el comportamiento y el aprendizaje en los animales. Es por esto que hemos omitido deliberadamente otros puntos de vista igualmente válidos acerca de los fenómenos cognitivos involucrados en el aprendizaje de los seres humanos.

Palabras clave:
Aprendizaje, condicionamiento, operante, reforzamiento, programas, clicker, estímulo, respuesta.

ABSTRACT
In this paper, we will try to explain a practical use of one the most famous learning theories, operant conditioning. This technique is mainly applied for dog training and the conditioning of other animals as well. The theoretical corpus in which we have focused, stems from the old behaviorism, for this is the school that has made the best efforts in understanding the true nature of the learning processes of animals. This is why we have purposefully left out some other valid theories about the cognitive phenomena involved in human learning.

Key words:
Learning, conditioning, operant, reinforcement, programs, clicker, stimulus, response.

¿Qué es aprendizaje?
Durante años nos hemos estado preguntando acerca del aprendizaje en todas sus formas y hemos tratado de explicarlo a través de diversas teorías.

Una definición bastante aceptada, aunque engañosa por su simplicidad, es que se trata de un cambio en la conducta debido a la experiencia (Chance, 1995). Aquí podemos apreciar que tratamos con dos temas interrelacionados, los eventos del organismo (respuestas) y los eventos del ambiente (estímulos). La relación entre ambos tipos de eventos ha sido largamente discutida y analizada, además de sometida a experimentos de toda índole, los que han permitido el desarrollo de todo tipo de conceptualizaciones y aplicaciones prácticas.

Condicionamiento clásico
El destacado fisiólogo ruso y ganador del premio Nóbel, Ivan Petrovich Pavlov (1849-1936), se encontraba realizando experimentos acerca del rol de la salivación en la digestión, cuando se percató de que los perros de su laboratorio salivaban frente a estímulos distintos a la comida. Esto fue un hallazgo, ya que la salivación es un acto reflejo que ocurre espontáneamente frente a la presentación de comida, sin embargo, los perros de Pavlov empezaron a salivar frente a la sola presencia del asistente que les traía la comida. Acertadamente, Pavlov, teorizó que los perros habían aprendido a anticipar la comida luego de la aparición de ciertas señales y, gradualmente llegaron a asociar esas señales con la comida. De este modo, el reflejo (respuesta incondicionada) que normalmente ocurría frente a la comida (estímulo incondicionado), podía ser condicionado para que ocurriera frente a una señal (la visión del asistente) que predecía con seguridad la llegada de la comida. Así, un estímulo en principio neutral, al aparearse en forma sucesiva con el estímulo incondicionado, llegaría a transformarse en un estímulo condicionado, capaz de elicitar por si solo el reflejo, que en este caso pasaría a llamarse respuesta condicionada.

Pavlov llevó a cabo una investigación sistemática sobre los reflejos condicionados. Encontró que las respuestas condicionadas ocurrirían también ante estímulos similares al estímulo condicionado usado originalmente, a este fenómeno le llamó generalización. También se puede establecer como requisito que el animal realice una respuesta condicionada frente a un tipo específico de estímulo y no ante otros, lo que conocemos como discriminación.

Los descubrimientos experimentales de Pavlov acerca de los reflejos condicionados sirvieron como base conceptual para explicar algunos aspectos del comportamiento canino. En alguna medida esto fue beneficioso y útil; pero, sin embargo, también condujo a una visión un tanto mecanizada del perro. (Campbell, 1992)

Conexionismo
Edward Lee Thorndike (1874-1949) realizó una importante contribución al campo de la investigación acerca del aprendizaje. Durante su especialización en Psicología en Harvard, desarrolló una serie de experimentos con animales. Los más famosos los realizó con gatos, a los cuales encerraba –hambrientos- en “cajas problema”, las que sólo podían ser abiertas mediante dispositivos especiales ubicados al interior de las mismas (una polea, por ejemplo). La comida esperaba afuera, a la vista, pero fuera del alcance del gato. Thorndike observó que los gatos, en un comienzo, emitían toda clase de respuestas ineficientes, como tratar de salir masticando los barrotes de la jaula o tratar de empujar contra las barreras, hasta que, finalmente, llegaban por accidente a manipular el dispositivo, con lo que lograban escapar y comer. La siguiente vez que eran puestos a prueba, seguían una secuencia similar de comportamiento hasta llegar a la respuesta correcta, pero a medida que se repetía el experimento, los gatos demoraban cada vez menos en accionar la polea o palanca.

Thorndike propuso dos leyes de la conducta tanto animal como humana (Leahey, 1998). La primera fue la ley del efecto: “de las muchas respuestas dadas a la misma situación, las que van acompañadas o inmediatamente seguidas de satisfacción para el animal, en igualdad de condiciones, se conectarán más firmemente con la situación; de manera que cuando ésta vuelva a presentarse, volverán a presentarse con gran probabilidad”. La segunda ley es la del ejercicio: “Toda respuesta a una situación en igualdad de condiciones, se conectará más fuertemente a la situación en proporción al número de veces que ha sido conectada a esa situación, y al vigor y duración medio de las conexiones”. (Thorndike, 1911. cit. por Leahey, 1998)

Condicionamiento operante
A partir del trabajo de Thorndike, B.F. Skinner realizó, en la década de los 30, una serie de estudios que lograron un gran avance en nuestra comprensión de los procesos de la conducta y el aprendizaje. En su libro "The behavior of organisms" (1938) (La conducta de los organismos) resumió la mayoría de sus conceptos centrales (Leahey, 1998). Skinner diseñó una caja de experimentos conocida hoy como "la caja de Skinner", elemento estándar en todo laboratorio conductual que se precie de tal. En esta caja, instaló una palanca que, al ser accionada por el sujeto (una rata o una paloma), permitía la aparición de un pellet (comida). Este procedimiento le permitió variar las condiciones en forma metódica y precisa para averiguar que sucedía en las distintas circunstancias. Al deprivar al animal de comida, llevándolo a un peso ligeramente inferior al normal, y poniéndolo en la caja, Skinner se dio cuenta que la tasa de presión de la palanca aumentaba significativamente. Si, por el contrario, al presionar la palanca el sujeto recibía un aversivo, la tasa disminuía rápidamente. Este procedimiento en el cual la conducta se fortalece o debilita fue llamado condicionamiento operante, pues se creía que la conducta opera sobre el ambiente. El comportamiento es típicamente instrumental al producir tales consecuencias, así que a esta clase de aprendizaje también se le llama condicionamiento instrumental (Chance, 1995).

“Una respuesta que ya se ha producido no puede, desde luego, predecirse o controlarse. Podemos predecir solamente que ciertas respuestas similares se producirán en el futuro. La unidad de una ciencia predictiva no es, por tanto, una respuesta sino una clase de respuesta. La palabra "operante" es la que utilizaremos para designar esta clase. El término pone de relieve el hecho de que la conducta opera sobre el medio ambiente para producir consecuencias. Las consecuencias definen las propiedades por las que las respuestas se llaman similares. El término se utilizará tanto como adjetivo (conducta operante), cuanto como sustantivo para designar la conducta definida por una consecuencia dada.” (Skinner, 1953)

Reforzamiento
Aún cuando Skinner se interesó principalmente en los reforzadores positivos, aquellos que al ser presentados en contingencia con una respuesta hacían más probable la repetición de la misma, reconoció también la existencia de los reforzadores negativos. Los reforzadores negativos son estímulos aversivos, que el organismo trataría normalmente de evitar. Entonces, el refuerzo resultaría de la ocurrencia de un reforzador positivo, pero también de la terminación de un reforzador negativo. Un ejemplo sencillo es el del frío, actuando como reforzador negativo para la operante de ponerse un abrigo; otro ejemplo es el de un shock eléctrico sostenido, cuya terminación es evidentemente reforzante. Entonces, podemos reforzar una respuesta ya sea presentando un refuerzo positivo o eliminando uno negativo.

Es importante destacar que los reforzadores, tanto positivos como negativos, pueden ser condicionados. Si un estímulo neutro es presentado en contingencia con el reforzador positivo, ese estímulo llegará a adquirir por sí solo la capacidad para reforzar la conducta. Lo mismo vale para los refuerzos negativos.

Los reforzadores son relativos, no absolutos. La lluvia es un refuerzo positivo para los patos, negativo para los gatos e indiferente para las vacas. La comida no es un refuerzo si estás repleto. Para que sea reforzante, el ítem elegido tiene que ser algo que el sujeto quiere. (Pryor, 1984)

Extinción
Cuando se retira el reforzamiento a una respuesta operante, la frecuencia de la conducta disminuye gradualmente según el proceso de “extinción operante”. “Si dejamos de darle comida, la paloma dejará finalmente de levantar la cabeza. En general, cuando practicamos una conducta que ya “no vale la pena”, nos sentimos menos inclinados a comportarnos de esa manera” (Skinner, 1953). Existen varios efectos secundarios interesantes de la extinción. Uno de ellos es la variabilidad de la conducta, una rata que ha aprendido a presionar una palanca para obtener comida puede, durante la extinción, presionarla con más fuerza o utilizar su nariz en lugar de la pata, o emplear las dos patas en vez de una. (Chance, 1995). Otro resultado es un incremento inicial de la respuesta que se pretende extinguir, lo que trae aparejado –al no encontrar el refuerzo acostumbrado- una reacción emocional de frustración o ira. “Una paloma que no ha conseguido reforzamiento se aparta de la llave, piando, batiendo las alas y practicando otras conductas emocionales” (Skinner, 1953).

Se habla de recuperación espontánea cuando el organismo vuelve a emitir una operante que ya había sido extinguida, lo que puede ocurrir producto de varios factores, como por ejemplo el encontrarse nuevamente en una situación o contexto en que la respuesta había sido reforzada en el pasado.

Castigo
Con frecuencia tiende a confundirse el castigo con los reforzadores negativos. La diferencia fundamental estriba en que si los reforzadores lo son en tanto aumentan la probabilidad de que una respuesta operante se repita, el castigo hace justamente todo lo contrario: disminuye la probabilidad de que una operante sea emitida nuevamente.

Hablamos de castigo positivo -o tipo 1- cuando a una respuesta le sigue la aparición de un estímulo aversivo. Al igual que en el reforzamiento la palabra positivo sólo tiene el significado de presentación de la consecuencia; la palabra castigo entonces sería sinónimo de debilitador. (Davidoff, 1989) Si apoyamos las manos sobre una estufa encendida, nos quemaremos las manos y probablemente en el futuro evitaremos repetir esa acción. Entonces decimos que esa conducta ha sido castigada.

En el castigo negativo –o tipo 2- la respuesta es debilitada por medio de la posposición o retiro de un reforzador que la hubiera sucedido y que el organismo esperaba. Un ejemplo sería el retiro de los permisos de conducir a los conductores que cometen infracciones del tránsito (se les priva del privilegio de conducir su automóvil) o el retirar el postre de un niño que se ha portado mal durante el almuerzo familiar. En vista de que la conducta “tiene un precio”, a menudo se le llama al castigo tipo 2, costo de respuesta. (Chance, 1995)

En general, Skinner consideró al castigo como un método pobre de modificación de conducta por varias razones, entre ellas tal vez la más importante sería que el castigo trae aparejadas respuestas emocionales negativas indeseables y que pueden ser asociadas con estímulos diferentes a los que el castigador pretende, incluidos los estímulos del propio castigador.

Programas de reforzamiento
Existen variados programas de reforzamiento en el entrenamiento de respuestas operantes. Se puede reforzar una conducta cada vez que es emitida (reforzamiento continuo) o cada cierto número de veces (refuerzo intermitente). Este último puede ser regular, administrando el refuerzo después de un número fijo de repeticiones de la operante; o bien, puede ser variable e impredecible. Cada programa afecta a la conducta de una manera diferente, lo que hace que cada programa se preste mejor para determinados procesos específicos durante el aprendizaje y entrenamiento de las respuestas.

El reforzamiento continuo parece ser el mejor método para condicionar la conducta en las fases iniciales del aprendizaje, ya que cada reforzamiento fortalece la conducta y esto produce un aumento rápido en la tasa de respuestas. Sin embargo, en la naturaleza, los refuerzos en general no aparecen en forma continua. Un lobo, por ejemplo, no todas las veces que se lanza a la captura de una presa logra su cometido, pero no por esto abandona su hábito de cazador.

Programas de razón
Los programas de razón especifican que el reforzador debe ser administrado después de un número determinado de respuestas. Cuando este número de respuestas es siempre e invariablemente el mismo, hablamos de un programa de razón fija. Los animales que trabajan bajo un programa de razón fija responden con tasas bastante altas, ya que mientras más trabajen, más refuerzos obtendrán. Sin embargo se produce una pausa después de la administración del reforzador, un descanso antes de reanudar el trabajo.

En cambio, en un programa de razón variable, el reforzador será administrado después de un número variable de respuestas. El ejemplo clásico es el de las máquinas tragamonedas, en el que los jugadores nunca saben cuándo ganarán. Los animales que están bajo este programa trabajan bastante rápido y sin descanso. La incertidumbre de desconocer cuando llegará el próximo reforzador hace que el organismo trabaje de manera constante. (Davidoff, 1989) Este tipo de programa de razón variable es el que más encontramos e la naturaleza y en muchas de las situaciones sociales humanas; además presenta una resistencia alta frente a la extinción.

Programas de intervalo
Estos programas dependen del paso del tiempo. Para entregar el reforzador se debe esperar a que se cumplan dos condiciones; primero tiene que haber pasado un tiempo determinado desde la administración del último refuerzo y, segundo, la operante debe ser emitida después de que ha transcurrido el intervalo.

En los programas de intervalo fijo, los períodos de tiempo entre refuerzos son constantes, como por ejemplo en los trabajos asalariados, en que el sueldo es recibido todos los meses en la misma fecha.

Se ha observado que en este programa, la tasa de respuesta es desigual; después de la administración del refuerzo, la frecuencia de respuestas baja. Después, aumenta en forma estable durante el intervalo y alcanza su máximo punto justo antes de la presentación del reforzamiento.

Control de estímulos
El control de estímulos se produce cuando se introduce un estímulo previo a la ocurrencia de la conducta operante y se refuerza sólo cuando este estímulo, llamado discriminativo, aparece. “Supongamos que entrenamos a una rata para presionar una palanca, reforzando sus presiones sólo cuando una luz se enciende por encima de la palanca. En poco tiempo, la rata llegará a presionar la palanca cuando la luz se encienda. Puede parecer que el estímulo luz provoca respuesta, pero según Skinner no es así. La luz señaliza la disponibilidad del reforzamiento, permite al organismo discriminar una situación de reforzamiento, de una situación de ausencia de reforzamiento, y, por tanto, este estímulo recibe el nombre de discriminativo.” (Leahey, 1998)

Conducta supersticiosa
La conducta supersticiosa se podría conceptualizar como una creencia falsa con respecto a causa y efecto. Esta situación puede surgir producto de la contingencia accidental entre una determinada respuesta operante y el reforzamiento.

Skinner realizó el siguiente experimento con palomas hambrientas; las puso en una caja de las que llevan su nombre, y proporcionó alimento cada 15 segundos sin importar lo que las palomas estuvieran haciendo. De este modo, se vieron condicionadas las más diversas respuestas. Algún ave que se encontraba dando vueltas aceleró esta actividad; otra incrementó mover la cabeza hacia delante; una mas, balancear el cuerpo. (Davidoff, 1989) Las palomas se comportaban como si creyeran que lo que estaban haciendo cuando se presentó la comida hubiera sido la causa de que esta se presentara.

Estas conductas supersticiosas resultaron ser bastante resistentes a la extinción. (Davidoff, 1989)

Algunas aplicaciones del condicionamiento operante
Nuevamente surge la figura de Skinner como uno de los pioneros en el intento de aplicar los principios del condicionamiento operante de una manera práctica y útil para la humanidad. En los años 50 intentó trasladar el conductismo hacia la conducta humana. Como escritor frustrado, Skinner estaba interesado en el lenguaje (Leahey, 1998), de manera que se abocó al estudio de la percepción del habla y el proceso del lenguaje. El resultado de sus investigaciones los expuso en varias conferencias en Harvard y, luego, en su libro Verbal Behavior (1957). También elaboró una utopía de sociedad perfecta, desarrollada a partir de los principios del reforzamiento, lo que decantó en la publicación de Walden II (1948). Durante la Segunda Guerra Mundial tuvo la oportunidad de aplicar sus conocimientos acerca del condicionamiento en las palomas. Participó en el “Proyecto ORCON”, nombre derivado de “organic control”, en el que entrenó a las palomas para ayudar a guiar a los misiles hacia sus blancos. Afortunadamente para las palomas, el proyecto no se concretó, a pesar de que experimentalmente se demostró que era virtualmente a prueba de fallas.

Una de las aplicaciones más conocidas ha sido la de entrenar animales para películas y spots publicitarios. Los psicólogos Keller y Marian Breland (1961) (alumnos de Skinner), fueron pioneros en el arte de entrenar los más diversos animales para realizar todo tipo de trucos para su exhibición en ferias y cosas por el estilo. Ellos desarrollaron su trabajo en Animal Behavior Enterprises en Hot Springs, Arkansas, donde llegaron a adiestrar más de 6.000 criaturas de 38 especies diferentes. (Davidoff, 1989)

Jim Simmons, PhD, un científico de la marina, desarrolló a fines de los años 70 y comienzos de los 80, un sistema de condicionamiento para palomas de búsqueda y rescate desde helicópteros. (http://www.apa.org/monitor/oct02/pigeons.html/)

Adiestramiento con Clicker
El adiestramiento con clicker está considerado hoy en día como una verdadera revolución en el campo del manejo conductual canino. Su difusión ha sido verdaderamente espectacular, generando una gran aceptación entre los profesionales del comportamiento canino a través de todo el mundo. Su aplicación es sencilla y no requiere de un gran caudal de conocimientos para lograr resultados.

Los orígenes del entrenamiento con clicker se encuentran en el trabajo de los expertos entrenadores de delfines en los parques acuáticos en EE.UU.

Una de las pioneras en este tipo de trabajo fue Karen Pryor. Con una formación como bióloga y un gran interés en el comportamiento animal, se abocó a la tarea de aprender y aplicar las técnicas del condicionamiento operante en seres que simplemente no se podían entrenar con métodos convencionales.

En su libro “Don’t shoot the dog!” (¡No mates al perro!) (1984), expone gran parte de sus técnicas de reforzamiento y conclusiones acerca de la modificación conductual, ampliadas al campo del comportamiento de otros animales e incluso de los seres humanos, con un lenguaje directo y claro.

¿Qué es el clicker?
El clicker es una pequeña caja de plástico con un resonador metálico que emite un chasquido al ser oprimido con los dedos.

Su principal función es la de actuar como un refuerzo condicionado para comunicarle al perro qué conducta es la que va a ser reforzada (normalmente el refuerzo primario es comida, pero también puede ser otras cosas)

El sonido del clicker es claro y distinto, sobresale por encima de otros estímulos del ambiente y es rápido y preciso para marcar conductas o fragmentos de ellas en el momento exacto en que están ocurriendo. La idea clave aquí es comunicación fluida e inmediata.

Metodología
Para usar el clicker como un poderoso elemento de comunicación inter-específica (hombre-perro), lo primero que hay que hacer es “cargar” el clicker. Esto se consigue por asociación del estímulo del clicker con la presentación de un reforzador primario (trozos pequeños de salchicha, por ej.). Esto se hace repetidas veces hasta lograr el aprendizaje del click (condicionamiento clásico) en una o más sesiones.

La idea es que el perro, al escuchar el click, anticipe la presentación del refuerzo, lo que también generará una respuesta emocional positiva.

Una vez que se ha creado la asociación, el clicker es usado para marcar todo tipo de comportamientos deseables cuando ocurren espontáneamente (o inducidos), lo que aumentará la probabilidad de que esas conductas sean repetidas en el futuro.

En el entrenamiento con clicker sólo se utilizan el refuerzo positivo y la extinción como métodos válidos de modificación conductual y aprendizaje.

A partir de los programas descritos con anterioridad, normalmente se utiliza el programa de reforzamiento continuo para el establecimiento de nuevas conductas y posteriormente se pasa a un programa de razón variable. En este punto, también el tipo y magnitud de los reforzadores debería ser variable e impredecible.

Por lo general el clicker es utilizado durante el período que el perro demora en aprender un nuevo ejercicio. Luego, una vez que se ha puesto la conducta bajo control de estímulos, es posible dejar de lado el clicker hasta que se desee enseñar un nuevo “truco”.

Las formas más comunes de entrenamiento de perros usando el clicker se resumen en las tres siguientes: shaping, luring y targeting.

Shaping (Modelado por aproximaciones sucesivas)
El modelado consiste en tomar una pequeña tendencia en la dirección correcta y llevarla a través del reforzamiento, paso a paso, hacia una meta final.

En el modelado, se busca enseñar un comportamiento complejo, compuesto de muchos comportamientos más simples realizados en forma encadenada. Lo más fácil es comenzar por reforzar la respuesta más sencilla y natural para el perro, la cual será el punto de partida para el modelado. Toda vez que el perro ofrezca conductas más cercanas al comportamiento final que buscamos, estas serán reforzadas en forma selectiva, es decir ya no se presentará refuerzo para las respuestas iniciales.

El modelado es posible porque el comportamiento de los organismos es variable. No importa cuál sea la conducta observada en un perro, él la realizará con más fuerza unas veces que otras y en diferentes direcciones o con otras variaciones de diversa magnitud. Entonces, si tomamos cualquier conducta que el perro esté ofreciendo espontáneamente, podremos reforzarla y gradualmente transformarla en otro tipo de comportamiento.

Luring (Atracción)
En esta técnica, se utiliza el reforzador primario como una guía para inducir al perro a adoptar distintas posturas físicas. Al mover un trozo de salchicha frente a la nariz del perro, éste se verá impulsado a seguir con su cabeza y el resto de su cuerpo. Esto facilita el guiarlo hasta las posiciones básicas del adiestramiento de obediencia (sentado, echado, parado, junto, etc.), clickeando en el preciso momento en que logra la posición y reforzando con cierta frecuencia para estabilizarlo en la posición.

El objetivo es que, luego de un número variable de repeticiones, el perro comience a ofrecer espontáneamente las operantes de las distintas posiciones. Una vez llegado este punto, se procede a poner ese comportamiento bajo control de estímulos.

Targeting (Establecer blancos)
El método del targeting está basado en lograr que el perro toque con la nariz o con las patas o con otra parte de su cuerpo un objetivo o blanco. Este entrenamiento forma parte de las habilidades básicas que se pueden enseñar con el clicker y tiene un sinnúmero de aplicaciones prácticas como el aprendizaje de trucos y ejercicios sorprendentes tales como cerrar puertas, jugar a la pelota, traer objetos, prender y apagar interruptores, etc.

Problemas de comportamiento y modificación conductual
Existe una amplia gama de problemas conductuales en los perros, desde el perro que hace sus necesidades al interior de la casa, hasta el perro con problemas de agresividad. Mucho se ha escrito y ensayado en la búsqueda de solución a estos y otros problemas en la relación hombre-perro. Los enfoques tradicionales casi siempre se han basado en castigos de la más diversa índole, desde los consabidos tirones con collares de ahorque o puntas, hasta el maltrato y los golpes.

Afortunadamente, el entrenamiento con clicker y los principios del reforzamiento, ofrecen soluciones mucho más positivas para la solución de los problemas de conducta.

Existen cinco maneras de aplicar estos principios en la modificación conductual.

Extinción
Si, por ejemplo, el comportamiento que deseamos reducir es del tipo búsqueda de atención, la respuesta es muy sencilla: simplemente no responder…De esta forma el perro, al no obtener refuerzo de ningún tipo, pronto declinará en su tasa de conductas. Esto es evidentemente mucho mejor que retarlo o castigarlo, ya que ambas cosas serían reforzadores potenciales (atención) para estas conductas.

Hay ciertos patrones conductuales que son auto-reforzantes (ladrar o masticar objetos, por ej.) y difícilmente se van a extinguir por si solos.

Entrenar una respuesta incompatible
Este método es muy eficaz en muchos casos. Se trata de enseñar un comportamiento físicamente incompatible con la conducta problemática. Un ejemplo sencillo es el caso del perro que se abalanza sobre las visitas, empujándolos y ensuciándoles la ropa. Lo más rápido y efectivo sería entrenar la posición de sentado y reforzarla cada vez que lleguen visitas (estímulo discriminativo). Si el perro aprende a sentarse cada vez que llega alguien, no podrá hacerlo y al mismo tiempo saltar sobre ese alguien.

Poner la conducta bajo control de estímulos
Uno de los axiomas de la teoría del condicionamiento operante es que cuando hemos puesto una conducta bajo control de estímulos –esto es, cuando el organismo aprende a ofrecer el comportamiento si y sólo si es presentado el estímulo discriminativo- esta conducta tenderá a extinguirse en la ausencia del estímulo.

Un ejemplo sería entrenar a un perro para ladrar bajo la señal “ladra” (estímulo discriminativo) y reforzarlo por hacerlo, luego al no dar la señal no hay refuerzo, de manera que esa conducta tendería a disminuir su tasa (extinción).

Modelar la ausencia de comportamiento
Este método sirve para eliminar un comportamiento problemático cuando no hay otra cosa que se pretende lograr que el perro haga en lugar de. La idea es reforzar cualquier cosa que no sea la conducta indeseable. Si tomamos nuevamente el ejemplo del perro que ladra en exceso, la idea sería salir de vez en cuando –cada vez que no este ladrando, desde luego- con intervalos variables y darle un reforzador positivo.

Este método es particularmente efectivo con perros agresivos o miedosos, cada vez que el perro actúa con normalidad, consigue un refuerzo.

Cambiar la motivación
A menudo esta es la forma más amable y efectiva de todas para lograr cambios en el comportamiento problemático. La dificultad estriba en inferir cuál es la posible causa de una conducta determinada, ya que es fácil apresurarse a sacar conclusiones. La idea es observar con atención el ambiente del perro y las condiciones en que se encuentra, además de la relación que existe entre él y los miembros de la familia. De esta manera, será posible encontrar posibles causas y tratar de eliminarlas del contexto. No descartar la posibilidad de hambre, enfermedad, dolencias, aburrimiento, soledad o miedo.

Desde luego que hay problemas de conducta que tienen su origen en aspectos hereditarios o factores orgánicos, tales como desórdenes neurológicos y otros. Aquí, la sola modificación conductual probablemente no será suficiente y, en algunos casos, habrá que recurrir también a la ayuda de medicamentos, prescritos por un especialista.

Conclusión
La teoría del condicionamiento operante es considerada, hoy en día, un tanto limitada por la mayoría de los Psicólogos a la hora de explicar las complejidades del aprendizaje y la conducta de los seres humanos. Sin embargo, como hemos visto, ella constituye un poderoso modelo para abordar el comportamiento animal. Como aplicación práctica de la teoría, el entrenamiento con Clicker es una metodología cuyas ventajas resultan evidentes. Al compararla con los métodos convencionales de adiestramiento canino (la mayoría basados en la fuerza y la coerción), destaca su énfasis en la comunicación inter-específica fluida y en el trabajo basado en motivación positiva. Los resultados son asombrosos. Perros que disfrutan del entrenamiento y dueños felices de poder comunicarse con sus mascotas de una forma que no habían imaginado posible.

Debido a estas características, el entrenamiento con Clicker ha logrado una difusión tan espectacular en todo el mundo.

Bibliografía
Campbell, W. (1992). Behavior Problems in Dogs. California: American Veterinary Publications
Chance, P. (1994). Learning and behavior. California: Wadsworth
Davidoff, L. (1989). Introducción a la Psicología.Méjico: McGraw-Hill/Interamericana
Leahey, T. H. (1998). Historia de la Psicología. Madrid: Prentice Hall Iberia
Pryor, K. (1984). Don’t shoot the dog! New York: Bantam Books
Skinner, B.F. (1953). Science and Human Behavior. New York: Free Press

AUTOR

Juan Sangüesa Massiel

E-Mail:

Web: