Читать книгу Prácticas de investigación aplicada a contextos educativos - Juan Carlos Rodríguez Macías - Страница 10
Standards for Educational
and Psychological Testing
ОглавлениеEn respuesta a los problemas relacionados con los instrumentos de medición y con base en los avances técnicos en materia de medición, en los nuevos y emergentes usos de los test, y en la creciente preocupación social sobre el papel que juegan los test en el cumplimiento de políticas públicas, en 1985 la American Educational Research Association (aera), la American Psychological Association (apa) y el National Council on Measurement in Education (ncme) coordinaron el trabajo de más de 125 especialistas, para actualizar y sustituir los estándares, directrices y principios que orientan el diseño, desarrollo, adaptación y validación de instrumentos. Como consecuencia de este trabajo se obtuvieron 180 estándares organizados en 16 capítulos o secciones, que tratan sobre los usos, aspectos técnicos y un amplio espectro de cuestiones legales y sociales asociadas a los test (tabla 1). El objetivo de la publicación de los estándares fue proporcionar los criterios mínimos para la evaluación de los test, orientar las prácticas de evaluación y regular el efecto del uso de los test. Sin embargo, no prescriben el uso de un método estadístico específico (American Education Research Association et al., 1985).
Tabla 1. Estructura de los estándarespara las pruebas psicológicas y educativas (1985) | ||
Sección | Capítulo | Número de estándares |
I. Estándares técnicos sobre la construcción y evaluación de los test | 1. Validez | 25 |
2. Confiabilidad y errores de medida | 12 | |
3. Desarrollo y revisión de un test | 25 | |
4. Escalamiento, normalización, comparabilidad de puntuaciones y equiparación | 9 | |
5. Publicación de test: manuales técnicos y guías de usuario | 11 | |
II. Estándares profesionales para el uso de los test | 6. Principios generales del uso de los test | 13 |
7. Pruebas clínicas | 6 | |
8. Pruebas psicológicas y educativas | 12 | |
9. Uso de los test en psicoterapia | 9 | |
10. Pruebas utilizadas en contextos laborales | 9 | |
11. Acreditación y certificación profesional y ocupacional | 5 | |
12. Evaluación de programas | 8 | |
III. Estándares para aplicaciones particulares | 13. Pruebas para minorías lingüísticas | 7 |
14. Pruebas para personas que tienen una condición de discapacidad | 8 | |
IV. Estándares para procedimientos administrativos | 15. Aplicación, calificación y reporte de un test | 11 |
16. Protección de los derechos de los examinados | 10 | |
Total | 180 |
Nota: elaboración propia basada en Standards for Educational and Psychological Testing (aera, apa y ncme, 1985).
Estos estándares sostienen que no se puede asumir que, al atender procedimientos de traducción, se genera una versión del test equivalente en contenido, nivel de dificultad, confiabilidad y validez. De igual modo, no se debe suponer que las propiedades psicométricas de dos versiones de un instrumento sean comparables entre idiomas o dialectos. En este sentido, la edición comprometió nueve estándares distribuidos en cuatro capítulos (tabla 2), que deben considerarse en los procesos de adaptación de test y evaluaciones interculturales (Geisinger, 1994).
Tabla 2. Estándares aplicables en los procesos de adaptación de test (1985) | ||
Sección | Capítulo | Número de estándares |
I. Estándares técnicos sobre la construcción y evaluación de los test | 2. Confiabilidad y errores de medida | 1 |
3. Desarrollo y revisión de un test | 2 | |
II. Estándares profesionales para el uso de los test | 6. Principios generales del uso de los test | 2 |
III. Estándares para aplicaciones particulares | 13. Pruebas para minorías lingüísticas | 4 |
Total | 9 |
Nota: elaboración propia basada en Standards for Educational and Psychological Testing (aera, apa y ncme, 1985).
En cuanto a la confiabilidad y el error típico de medida, se propuso que cuando existan razones teóricas o empíricas, para esperar que estos indicadores difieran sustancialmente en diferentes poblaciones, se deben presentar las estimaciones para cada población para las cuales el test es recomendado [estándar 2.9: 22]. Asimismo, para el desarrollo y revisión de los test se estableció que el tipo y contenido de los ítems debe realizarse con reconocimiento a los antecedentes culturales y a las experiencias previas de las poblaciones involucradas (grupos étnicos, edad, género, etc.) [estándar 3.5: 26]. De igual modo se debe prever la realización de aquellos estudios que sean necesarios cuando los resultados de las investigaciones señalen la necesidad de estudiar las diferencias en el funcionamiento del ítem, o del test, para miembros de distintos grupos (edad, étnicos, género, etc.). Tales estudios deben diseñarse para detectar y eliminar aspectos del diseño, contenido o formato del test que puedan sesgar las puntuaciones de un grupo en particular [estándar 3.10: 27].
Por otro lado, se establecieron principios generales para el uso de los test, mismos que recomiendan que cuando se realizan cambios sustanciales en el formato del test, modo de aplicación, instrucciones, idioma o contenido, se debe validar el uso del test para las condiciones modificadas, o bien tener un sustento racional de que una validación adicional no es necesaria [estándar 6.2: 41]. Además, cuando un test se va utilizar para un propósito para el que no ha sido previamente validado, o para el cual no existe evidencia de su validez, los responsables del test deben proporcionarla [estándar 6.3: 42].
Finalmente, el capítulo que establece el uso de test en sujetos que forman parte de una minoría lingüística, exige que cuando un test sea traducido de un idioma o dialecto a otro, se debe establecer la validez y confiabilidad del test para los usos esperados en el grupo lingüístico por examinar [estándar 13.4: 75]. Mientras que cuando se busca que las versiones del test en dos idiomas sean comparables, se deben reportar evidencias de la comparabilidad [estándar 13.6: 75]. A este respecto, tanto los responsables del test como los editores deben proporcionar la información necesaria para realizar un uso e interpretación apropiada de éste [estándar 13.3: 75], y describir en el manual del test todas las modificaciones lingüísticas recomendadas por los editores [estándar 13.2: 75].