¿Qué es el condicionamiento operante o instrumental?

El condicionamiento operante es un método de aprendizaje que utiliza el refuerzo o el castigo para aumentar o disminuir la probabilidad de que una conducta vuelva a ocurrir en el futuro.
¿Qué es el condicionamiento operante o instrumental?
Gema Sánchez Cuevas

Revisado y aprobado por la psicóloga Gema Sánchez Cuevas.

Última actualización: 23 septiembre, 2022

El condicionamiento operante, también llamado condicionamiento instrumental, es un método de aprendizaje que se produce mediante la asociación de refuerzos (recompensas) y castigos con un determinado comportamiento o patrón de comportamiento. A través del condicionamiento operante se hace una asociación entre un comportamiento y una consecuencia de ese comportamiento.

El condicionamiento operante fue descrito por primera vez por el psicólogo conductista Burrhus Frederic Skinner como un método de aprendizaje para aumentar o disminuir la probabilidad de que una conducta vuelva a ocurrir en el futuro.

El condicionamiento operante se basa en una premisa simple: las acciones seguidas por el refuerzo tenderán a repetirse. A la inversa, las acciones que resulten en castigos o consecuencias indeseables se debilitarán y será menos probable que vuelvan a ocurrir en el futuro.

Por ejemplo, cuando una rata de laboratorio presiona un botón azul, recibe una bolita de comida como recompensa, pero cuando presiona el botón rojo recibe una leve descarga eléctrica. Como resultado, aprende a presionar el botón azul, pero evita el botón rojo.

Pero el condicionamiento operante no es solo algo que tiene lugar en entornos experimentales mientras se entrena a animales de laboratorio. El condicionamiento operante también juega un papel poderoso en el aprendizaje diario. El refuerzo y el castigo tienen lugar casi todos los días en entornos naturales, así como en entornos más estructurados.

Caja de Skinner

Skinner y el condicionamiento operante

Skinner utilizó el término ‘operante’ para referirse a cualquier “comportamiento activo que opera en el ambiente para generar consecuencias”. En otras palabras, la teoría de Skinner trata de explicar cómo adquirimos buena parte del rango de comportamientos que exhibimos todos los días.

Skinner creía que no era realmente necesario mirar los pensamientos y motivaciones internos para explicar el comportamiento. En su lugar, Skinner sugirió que deberíamos mirar solo las causas externas y observables del comportamiento humano.

La teoría del condicionamiento operante de Skinner está muy influenciada por el trabajo del psicólogo Edward Thorndike. Thorndike propuso lo que él llamó la ley del efecto. De acuerdo con este principio, es más probable que se repitan las acciones seguidas por resultados deseables, mientras que las seguidas por resultados indeseables tienen menos probabilidades de repetirse.

Tipos de comportamiento, según Skinner

Skinner distinguió entre dos tipos diferentes de comportamientos: las respuestas instintivas y los comportamientos operantes.

  • Las conductas instintivas son aquellas que ocurren de forma automática y reflexiva, como retirar la mano de una estufa caliente o sacudir la pierna cuando el médico le toca la rodilla. No hay que aprender estos comportamientos, simplemente ocurren de forma automática e involuntaria.
  • Los comportamientos operantes son aquellos que están bajo nuestro control consciente. Algunos pueden ocurrir de manera espontánea y otros a propósito, pero son las consecuencias de estas acciones las que influyen en que ocurran o no en el futuro. Nuestras acciones sobre el medio ambiente y las consecuencias de esas acciones constituyen una parte importante del proceso de aprendizaje.

Aunque el condicionamiento clásico podría explicar los comportamientos de los encuestados, Skinner se dio cuenta de que no podía explicar todo lo que aprendemos. Así, Skinner sugirió que el condicionamiento operante tenía una importancia a la hora de explicar nuestra manera de proceder: los seres humanos, como norma general, tendemos a repetir aquellas acciones que un coste asumible cosecharon éxito.

Skinner

Refuerzo y castigo

La promesa o posibilidad de recompensa provoca un aumento en la frecuencia o intensidad del comportamiento que “pensamos” (porque ya ocurrió en el pasado) que nos llevará a obtenerla. Sin embargo, el condicionamiento operante también se puede utilizar para disminuir un comportamiento. La eliminación de un resultado deseable o la aplicación de una consecuencia negativa se puede usar para disminuir o prevenir comportamientos indeseables.

En este sentido, Skinner identificó dos aspectos clave del proceso de condicionamiento operante: el refuerzo y el castigo. El refuerzo sirve para aumentar el comportamiento, mientras que el castigo sirve para disminuir el comportamiento. Además, encontramos que el refuerzo variable puede llegar a ser mucho mejor que el refuerzo constante, ya que el comportamiento adquirido se vuelve más resistente a la extinción.

Además, identificó dos tipos diferentes de refuerzo y dos tipos diferentes de castigo.

  • El refuerzo positivo implica presentar un resultado favorable, mientras que el refuerzo negativo implica la eliminación de un estímulo desagradable. En ambos casos, el refuerzo hace que aumente la frecuencia o la intensidad del comportamiento.
  • El castigo positivo significa aplicar un evento desagradable después de un comportamiento, mientras que el castigo negativo implica quitar algo agradable después de que ocurra un comportamiento. En ambos casos de castigo, el comportamiento disminuye (tiende a extinguirse).
Padre castigando a su hijo mientras llora

Programas de refuerzo

Los conductistas descubrieron que diferentes patrones (o programas) de refuerzo tenían diferentes efectos sobre la velocidad de aprendizaje y extinción. Ferster y Skinner (1957) idearon diferentes formas de entregar refuerzo y encontraron que esto tenía efectos sobre

  • La tasa de respuesta: es el número de veces a que una rata, por ejemplo, presionó una palanca.
  • La Tasa de Extinción: es el número de veces a la que la rata dejó de presionar la palanca (es decir, qué tan pronto se rindió la rata).

Refuerzo continuo

Un organismo se refuerza positivamente cada vez que ocurre un comportamiento específico, por ejemplo, cada vez que se presiona una palanca, se entrega una bolita y luego se interrumpe la entrega de alimentos.

  • La tasa de respuesta es lenta.
  • La tasa de extinción es rápida.

Refuerzo de relación fija

El comportamiento se refuerza solo después de que el comportamiento ocurre un número específico de veces. Por ejemplo, se da un refuerzo después de cada número determinado de aciertos. Otro ejemplo sería un niño recibe una estrella por cada cinco palabras escritas correctamente.

  • La tasa de respuesta es rápida.
  • La tasa de extinción es media.

Refuerzo de intervalo fijo

Se da un refuerzo después de un intervalo de tiempo fijo siempre que se haya realizado al menos una respuesta correcta. Un ejemplo es ser pagado por hora.

  • La tasa de respuesta es media.
  • La tasa de extinción es media.

Refuerzo de relación variable

El comportamiento se refuerza después de un número impredecible de veces. Por ejemplo, juegos de azar o pescar.

  • La tasa de respuesta es rápida.
  • La tasa de extinción es lenta (muy difícil de extinguir debido a la imprevisibilidad).

Refuerzo de intervalo variable

Siempre que se haya dado una respuesta correcta, el refuerzo se da después de que haya pasado una cantidad de tiempo impredecible, por ejemplo, en promedio cada 5 minutos.

  • La tasa de respuesta es rápida.
  • La tasa de extinción es lenta.

Técnicas operantes para desarrollar conductas

A continuación describiremos de manera breve las técnicas más relevantes para desarrollar conductas desde el condicionamiento operante.

  • Técnicas de instigación: son aquellas que dependen de la manipulación de estímulos discriminativos para aumentar la probabilidad de que se dé una conducta.
  • Moldeamiento: consiste en acercar gradualmente una conducta determinada a la conducta deseada, empezando por una respuesta relativamente parecida que el sujeto pueda realizar y modificándola poco a poco. Se lleva a cabo por pasos (aproximaciones sucesivas) a los que se aplica reforzamiento.
  • Desvanecimiento: se refiere a la retirada gradual de las ayudas que se habían utilizado para reforzar una conducta objetivo. Se pretende que el sujeto consolide una respuesta y posteriormente pueda llevarla a cabo sin necesidad de ayudas externas.
  • Encadenamiento: es una conducta compuesta por varias conductas simples, las cuales se separan en distintos pasos (eslabones). Luego, el sujeto debe aprender a ejecutar los eslabones uno a uno hasta lograr llevar a cabo la cadena completa.

Técnicas operantes para reducir o eliminar conductas

A continuación se presenta un listado de estas técnicas para reducir conductas indeseadas.

  • Extinción: se deja de recompensar una conducta que había sido reforzada con anterioridad. Esto disminuye la probabilidad de que la respuesta vuelva a darse.
  • Entrenamiento de omisión: a la conducta del sujeto le sigue la ausencia de la recompensa; o sea, si se da la respuesta no se obtendrá el reforzador. Un ejemplo del entrenamiento de omisión podría ser que unos padres impidan a su hijo jugar videojuegos por no haber hecho la tarea de la escuela.
  • Coste de respuesta: es una variante del castigo negativo en que la ejecución de la conducta problema provoca la pérdida de un reforzador.
  • Tiempo fuera: consiste en aislar al sujeto en un entorno no estimulante en caso de que se produzca la conducta problemática.
  • Saciación: el refuerzo que se obtiene por llevar a cabo la conducta es tan intenso o cuantioso que pierde el valor que tenía para un sujeto.
  • Sobrecorrección: consiste en aplicar un castigo positivo relacionado con la conducta problema.

El condicionamiento operante en la actualidad

Si bien el conductismo puede haber perdido gran parte del protagonismo que tenía durante la primera parte del siglo XX, el condicionamiento operante sigue siendo una herramienta importante y utilizada con frecuencia en los procesos de moldeamiento de la conducta. De hecho, muchos padres la utilizan, aunque no sean conscientes de la teoría que hay detrás.

Aplicaciones del condicionamiento operante

Las aplicaciones del condicionamiento operante son variadas, teniendo en cuenta el pontecial que tiene para el aprendizaje conductual. Es especialmente útil para 3 procesos:

  • Moldeamiento de la conducta: consiste en una modificación gradual de una conducta indeseada hacia otra que se desea alcanzar. El paciente va realizando aproximaciones con conductas similares a la que se busca hasta que se alcanza.
  • Tratamiento de fobias: aunque la técnica por excelencia para estos miedos irracionales es la exposición, algunos profesionales utilizan refuerzos y castigos para condicionar la respuesta del miedo.
  • Tratamiento de las adicciones: el condicionamiento operante juega un papel fundamental a la hora de superar la dependencia a sustancias. Gracias a él es mucho más fácil reconocer las conductas que llevan al consumo y se puede comenzar a trabajarlas.

Así, el condicionamiento operante es una forma de generar asociaciones con incidencia en el comportamiento, que podemos reconocer con facilidad en nuestra vida diaria, tanto en la educación que reciben u ofrecemos a nuestros hijos o en el entrenamiento que empleamos con nuestras mascotas, por ejemplo. La publicidad y las acciones de marketing también emplean el condicionamiento operante en sus estrategias para vender productos y servicios a los consumidores.

Te podría interesar...
3 técnicas conductuales para la educación de los pequeños: refuerzo, castigo y extinción
La Mente es Maravillosa
Leerlo en La Mente es Maravillosa
3 técnicas conductuales para la educación de los pequeños: refuerzo, castigo y extinción

Las técnicas conductuales nos van a suponer una ayuda extra en la educación de los niños... ¡Aprende a ponerlas en marcha!



  • Burgos, J. (2014). Historia de la psicología. Madrid: Palabra.
  • Caballo, V. (2015). Manual de técnicas de terapia y modificación de conducta. Madrid: Siglo XXI de España.
  • Commons, M., Staddon, J., & Grossberg, S. (1991). Neural network models of conditioning and action. Hillsdale: Lawrence Erlbaum Associates.
  • Cruz, D. R. L. (2021). Edward Lee Thorndike y John Broadus Watson: dos explicaciones del aprendizaje. Educere25(81), 647-656.
  • McLeod, S. A. (2018, January, 21). Skinner operant conditioning. Simply Psychology. www.simplypsychology.org/operant-conditioning.html
  • Pérez, A. (1990). Burruhus Frederic Skinner (1904-1990): in memorian. Revista latinoamericana de psicología22(3), 449-460.