Tipos de validez en investigación: validez de contenido

Escrito y verificado por el psicólogo Sergio De Dios González

Publicado: 11 febrero, 2019 03:16

Última actualización: 07 agosto, 2023 00:42

En términos estadísticos, la validez se define como la proporción de la varianza verdadera que es relevante para los fines del examen. Con el término ‘relevante’ nos referimos a lo que es atribuible a la variable, las características que mide la prueba (1). Pero, ¿sabemos que existen varios tipos de validez?

En este sentido, generalmente la validez de un test se define ya sea por medio de:

La relación entre sus puntuaciones con alguna medida de criterio externo, o bien,
La extensión con la que la prueba mide un rasgo subyacente específico hipotético o “constructo”.

La validez en términos psicométricos

En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso evolutivo. Al principio, Muñiz (1996) adoptó la validez con una posición en concreto. Esta sostenía que “un test es un válido para aquello con lo que correlaciona”.

Ahora, la validez se entiende como un juicio evaluativo global. En este juicio, la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones no solo de los ítems, sino también de la forma de responder de las personas así como del contexto de la evaluación.

Entonces, lo que se valida no es la prueba. Lo que se valida en concreto son las inferencias hechas a partir de la misma. Ello tiene dos consecuencias:

El responsable de la validez de una prueba ya no es solo su constructor, sino también el usuario.
La validez de una prueba no se establece de una vez por todas. Es el resultado del acopio de evidencias y supuestos teóricos que se dan en un proceso evolutivo y continuo. Este comprende todas las cuestiones experimentales, estadísticas y filosóficas por medio de las cuales se evalúan las hipótesis y teorías científicas (3).

En este contexto, el concepto validez se refiere a la adecuación, significado y utilidad de las inferencias especificas hechas con las puntuaciones de los test. La validación de un test es el proceso de acumular evidencia para apoyar tales inferencias. Así, la validez es un proceso unitario. Aunque la evidencia puede ser acumulada de muchas formas, la validez se refiere siempre al grado en que esa evidencia apoya las inferencias que se hacen a partir de las puntuaciones (4).

Tipos de evidencia

En 1954, un comité presidido por L. J. Cronbach estableció por encargo de la Asociación de Psicología Americana (APA) que la validez era de cuatro tipos. Estas son:

Validez de contenido.
Validez predictiva.
Validez concurrente.
Validez de constructo.

Actualmente se coincide, desde el punto de vista científico, que la única validez admisible es la validez de constructo (Messick, 1995).

La validez y sus aspectos

Dentro del estudio de la validez, las evidencias están relacionadas con cinco aspectos:

El contenido (la relevancia y representatividad del test).
El sustantivo (las razones teóricas de la consistencia observada de las respuestas).
Estructural (configuración interna del test y dimensionalidad).
Generalización (el grado en que las inferencias hechas a partir del test se pueden generalizar a otras poblaciones, situaciones o tareas).
Externo (relaciones del test con otros test y constructos).
Consecuencia (consecuencias éticas y sociales del test) (3).

Así, dentro de esta validez podemos entender otros tipos de validez o estrategias. Como hemos mencionado previamente, estas son la validez de contenido, la validez predictiva, la validez concurrente y la validez de constructo.

Tipos de validez: validez de contenido

En este tipo de validez se responde a la siguiente pregunta. ¿Los ítems que constituyen el test son realmente una muestra representativa del dominio de contenido o dominio conductual que nos interesa?

Para que nos entendamos, un dominio o campo conductual es una agrupación hipotética de todos los ítems posibles que cubren un área psicológica particular. Por ejemplo, un test de vocabulario debe ser una muestra adecuada del dominio de ítem posibles en esta área.

En este sentido, la validez de contenido es una “medida” de lo adecuado del muestreo. Se dice “medida” entre comillas, ya que este tipo de validez consiste en una serie de estimaciones u opiniones. Estas estimaciones no proporcionan un índice cuantitativo de validez. (1)

Este tipo de validez se asocia sobre todo a los test de rendimiento (test de matemáticas, historia…). Para su determinación, se comparan sistemáticamente las preguntas del test con el dominio conductual del contenido postulado.

Por ejemplo, tenemos una lista de 500 palabras que esperamos que los estudiantes de un curso sean capaces de escribir correctamente. Entonces, su rendimiento respecto a estas palabras será importante exclusivamente para probar la habilidad del estudiante para escribir correctamente las 500 palabras. Sin embargo, solo tendrá validez de contenido en la medida en que proporcione una muestra adecuada de las 500 palabras que represente. (1)

Si seleccionamos solamente palabras fáciles o difíciles, o palabras que representen únicamente ciertos tipos de faltas de ortografía, estaríamos propensos a obtener una validez de contenido muy baja.

hombre ante gráficos representando el pensamiento estratégico

Conclusión: ¿cuál es la utilidad de la validez de contenido?

En consecuencia, el aspecto clave en la validez de contenido es el muestreo de los ítems. En otras palabras, la validez de contenido es capaz de determinar si la muestra de sus ítems es representativa del universo o dominio conductual de ítem al que supuestamente representa (1).

Así pues, la validez de contenido es ese tipo de validez que va unida al propio test y a lo que pretende medir. Por ejemplo, nos permitirá saber si la muestra de los ítem del test es representativa del dominio en matemáticas que queremos evaluar. Se trata, por tanto, de un concepto importante tanto en estadística como en la utilización de pruebas psicológicas o de rendimiento.

A modo de conclusión, el estudio de la validez es un análisis sobre una prueba métrica, en nuestro caso, ya que estamos en psicología, psicométrica cuyas conclusiones se refieren al grado en el que dicha prueba mide lo que queremos que mida. Lógicamente, cuanto más validez tenga una prueba, a falta de otros análisis -como el de fiabilidad-, mejor será.