Читать книгу Pruebas de aptitud física - Emilio José Martínez López - Страница 9
Оглавление2 | CRITERIOS DECALIDAD DE LASPRUEBAS DEAPTITUD FÍSICA |
2.1. CONSIDERACIONES PRELIMINARES
Los criterios de calidad informan del grado de eficiencia de una prueba; su componente cuantitativo se expresa a través de los tres principales indicadores:
Coeficiente de objetividad.
Coeficiente de fiabilidad.
Coeficiente de validez.
Un aspecto general de gran importancia es garantizar que entre las administraciones realizadas por un mismo ejecutante o por varios examinandos no haya ningún efecto de entrenamiento por parte de los mismos, ya que esto podría restar fiabilidad y objetividad a la aplicación de la prueba.
En 1976, Fetz y Kornexl ya apuntaban como el límite inferior de eficiencia de una prueba los señalados por Meyer y Blesh (1962):
• Coeficiente de objetividad y confiabilidad en análisis individual = 0,85.
• Coeficiente de objetividad y confiabilidad en análisis grupal = 0,75.
• Coeficiente de validez mínimo = 0,60.
Todo esto teniendo en cuenta que en los tests de campo, núcleo sobre el que gira todo nuestro trabajo, puede resultar difícil aislar cada componente individual. Para MacDougall (1993) este tipo de pruebas resulta útil para evaluar o valorar globalmente una aptitud; sin embargo, las aplicaciones realizadas en laboratorio admiten analizar variaciones individuales y permiten estudiar objetivamente los rendimientos de cada individuo en relación con cada variable analizada. Este autor afirma que, si bien los tests de campo no resultan tan fidedignos como los de laboratorio, sí presentan una mayor especificidad.
2.2. LA OBJETIVIDAD
Un test o prueba posee más objetividad cuanto mayor sea el grado de independencia sobre elementos externos que puedan intervenir. Por otra parte, la objetividad debe analizarse de forma aislada, ya que puede afectar de forma diferente a cada fase de una prueba; ya sea en la ejecución de la misma, en su evaluación o en su interpretación.
Una prueba objetiva ha de garantizar que su ejecución se realice con arreglo a un método, y que éste pueda reproducirse posteriormente de la misma manera. Es decir, la explicación y la demostración de la prueba no deben inducir a ambigüedades o interpretaciones diferentes que puedan modificar el resultado de la misma.
La objetividad de un test ha de medirse también atendiendo a criterios de valoración e interpretación. Podemos hablar de una prueba mayormente objetiva, cuanto más medible, en términos numéricos y de acuerdo a escalas estandarizadas, sea su resultado. De este modo, si la valoración final de la prueba está sujeta a interpretaciones con arreglo a baremos o decisiones arbitrales, tanto más subjetiva será.
El término objetividad se define como «1.- cualidad que lleva a emitir un juicio sin dejar que intervengan preferencias personales; ausencia de prejuicios; imparcialidad» (GEL, 1991).
El grado de objetividad de una prueba está directamente relacionado con la aplicación de las consignas utilizadas durante la misma. En este sentido, cualquier variabilidad en la información dada al ejecutante puede generar una respuesta diferente, ya sea por acción directa, al conocer el examinando información que pueda utilizar más correcta o incorrectamente, o por acción indirecta, al generar o restar una motivación influyente durante el período de respuesta.
Fetz y Kornexl (1976) aconsejan en el momento de la descripción del test lo siguiente1:
1. El examinador deberá atenerse exactamente a la prueba consignada.
2. Se realizará una lectura lenta y clara de la prueba.
3. Se demostrará una vez el desarrollo del movimiento.
4. Durante la demostración, se explicará la exacta realización de la prueba, evitando cualquier aclaración extra al efecto de no crear ningún tipo de interacción entre examinador y examinando.
5. La motivación creada por los diferentes examinadores debe ser homogénea en este sentido, conviene valerse de implicaciones objetivas para potenciar el esfuerzo personal del ejecutante.
2.3. LA FIABILIDAD
El término fiabilidad se define como «la probabilidad de que una pieza, dispositivo, circuito hidráulico, eléctrico o electrónico, o un equipo completo, pueda ser utilizado sin que falle durante un período de tiempo determinado, en unas condiciones operacionales dadas; magnitud que caracteriza a la seguridad de funcionamiento del aparato dispositivo, en condiciones previamente fijadas; medida de la probabilidad de un funcionamiento según unas determinadas normas». «-Sicol. Calidad de un test, prueba, etc., para proporcionar resultados fiables.», «Sicol. En psicometría2, la fiabilidad de un test se valora por la coherencia de los resultados obtenidos en dos aplicaciones de la misma prueba o mediante la aplicación de dos formas equivalentes de la prueba a los mismos individuos. En el primer caso, se comprueba la estabilidad de los resultados durante un período correspondiente al lapso de tiempo transcurrido entre ambas aplicaciones, mediante un método llamado a test-retest. En el segundo, se comprueba que las dos formas equivalentes midan lo mismo. Estas dos formas pueden estar constituidas por dos mitades del mismo test, oponiendo, por ejemplo, las preguntas pares a las impares. También pueden estar constituidas por formas paralelas, aplicadas una a continuación de la otra» (GEL, 1991). Aquí se amplía el concepto de fiabilidad, indicando que éste ha de contemplar tres aspectos importantes:
1°. Calidad del material utilizado. Será un factor limitante, en la medida en que pueda incurrir el fallo o desviación en su trabajo. Por ejemplo, si utilizamos un cronómetro con un medidor de tiempo en una prueba de velocidad en 30 m, podría ocurrir que el botón pulsador encargado de accionar y detener su funcionamiento actuara incorrectamente, de modo que según la inclinación de la presión sobre el mismo, provocara un mayor o menor tiempo en su accionamiento o parada.
De una forma general, el término fiabilidad es aplicado a elementos materiales para caracterizar la permanencia de los mismos.3 Para valorar la fiabilidad de un material, es necesario conocer el índice del fallo λ resultado de dividir el número de fallos constatados (n) por el producto del número de elementos comprobados (N) y el tiempo que dura la prueba expresada en horas (h).
A esta expresión estadística de la constancia de los resultados tras un test motor Harre la denomina (S/f) autenticidad, afirmando que: «...con la estabilidad de la constancia no se expresa la misma altura, longitud, tiempo, o calificación de un test, sino la constancia relativa de la persona con un nivel, dentro del grupo testado».
2°. Las técnicas y la metodología empleada. Representan una condición fundamental a la hora de potenciar la fiabilidad de una deter-minada prueba. Esto implica cualquier tipo de conducta externa o interna sobre el sujeto que va a ser medido, desde la posición inicial, durante un final de una prueba, hasta el modo de comunicación hacia él, previo o durante la ejecución. La fiabilidad tras una aplicación utilizando el método test-retest puede verse afectada simplemente porque se le ha permitido cambiar la posición inicial en pruebas diferentes.
Por otra parte, es necesario añadir que el hecho de insistir en la repetición de una prueba puede desembocar en un entrenamiento, facilitando un aprendizaje; en este caso, la fiabilidad de dicha prueba podría verse afectada. Por ejemplo, un circuito de agilidad como es el utilizado para las pruebas de selección de algunos INEFs, tras varios días de práctica, el resultado en su ejecución puede mejorar espectacularmente respecto al resultado de su marca originaria; y no precisamente por un igualmente espectacular aumento de la agilidad del sujeto, sino simplemente porque se ha producido un aprendizaje a nivel mental o de recorrido espacial del circuito.
3°. Tiempo de fiabilidad de la prueba. Como una magnitud que expresa hasta cuándo se puede repetir una prueba obteniendo los mismos resultados.
En este caso, es necesario tener en cuenta los períodos de reposo necesarios tras la ruptura de la homeostasis4 provocada por la ejecución del test. Dependiente de la cualidad a medir estará la relación de reposo del sujeto. Una prueba de esfuerzo de fuerza necesitará más reposo para la ejecución de su retest que una prueba de flexibilidad.
Lamb (1989) recoge como elemento primordial del test la reproducción de la medida. Para garantizar este concepto, calculó el coeficiente de variación de los resultados, concretándolos de la siguiente forma:
«El coeficiente de variación expresa la variación dentro de un grupo de números (los resultados de los test que se han repetido) como porcentaje del promedio (media) de esos números. Si la variación de las medidas es solamente del 2-3% del valor promedio, entonces el procedimiento de medidas tiene una reproducción notable (casi increíble). Una variación de 5-10% del valor promedio es más común, y la variación mayor de 15-20% sugiere que es necesario obtener una reproducción mejor».
2.4. LA VALIDEZ
De forma generalizada, se dice que la validez de una prueba indica el grado en que ésta mide lo que debe medir.
El término validez se define como «Sicol. dif. Cualidad de un test o prueba que mide realmente lo que se propone medir». «Encicl. Sicol. dif. Para comprobar si un test es válido se puede examinar el contenido de las preguntas que lo componen. Así, por ejemplo, en los tests de conocimientos, hay que asegurarse de que las preguntas planteadas correspondan al programa que quiere comprobarse. Puede también estudiarse la correlación del test con variables consideradas como constitutivas de otras medidas de lo que el test pretende medir, o bien recurriendo a las mismas cualidades y capacidades...» (GEL, 1991).
Se puede proponer establecer la correlación entre el test de salto vertical (prueba de detente) y el éxito de bloqueos en voleibol. Es posible y razonable definir una red de variables al efecto de concretar la variable hipotética de medir el test o prueba. En este caso, el análisis habría que realizarlo atendiendo a las posibles relaciones entre el test y las variables de la red.
Volviendo al ejemplo anterior, podemos estudiar la relación existente entre salto vertical y otras variables relacionadas con la variable principal, como podría ser la masa muscular del tren inferior, de coordinación en el salto, altura del sujeto, etc.
Para Bosco (1994), «el éxito y el valor de un test depende en gran manera de la estandarización, de tal modo que debe dar la posibilidad de ser utilizado por cualquier persona (lógicamente debe ser un experto), y en cualquier situación». Este autor afirma además que en el momento de decidirnos por una prueba contamos con el convencimiento de que ésta es la mejor ocasión y, por lo tanto, tiene la mayor validez para medir la cualidad funcional que queremos medir.5
Grosser y Starischka (1988) presentan esta validez de contenidos con la prueba de suspensión en flexión, válida para informar de la fuerza estática local de los flexores braquiales. Así, hablan de la validez referida a los criterios: «Se calcula como validez empírica interna, al correlacionar los valores de la prueba con los valores de otras pruebas reconocidas ya como válidas (prueba paralela, valores de criterio). Por ejemplo: diagnóstico de fuerza rápida: prueba de salto triple de longitud, brincos a la pata coja de longitud (cfr. Mening, 1975). La validez empírica externa se determina por la correlación con un criterio exterior (p.ej. resultado de una competición, valor en puntos, nota deportiva, valor de fortaleza fisiológica, etc.)».
Woodburn y Boschini (1992) hacen referencia a la aportación de Tomas y Nelson (1985), sobre la validez predictiva, la cual estaría relacionada con la correspondencia existente entre los resultados de una prueba y un criterio concreto previsto de antemano, es decir, serviría para saber si el resultado de una medición puede predecir un comportamiento o una situación en el futuro.6
2.5. OTROS CRITERIOS
Pero existen otros criterios de calidad a tener en cuenta en el momento de la selección de pruebas o tests de aptitud física. Para Grosser y Starischka (1988), las pruebas seleccionadas deben ser económicas, normalizadas, comparables y útiles.
Una prueba es económica si:
• Se puede ejecutar en un tiempo breve.
• Se realiza con poco material o aparatos sencillos.
• Su descripción y demostración es fácilmente realizable.
• Se puede aplicar a grupos de sujetos.
• Es fácilmente analizable y evaluable.
Una prueba es normalizada si:
• Se puede utilizar cada valor obtenido como referencia.
• Sus resultados son especificados según parámetros de edad, sexo, nivel de rendimiento, etc.
• Su evaluación se realiza sobre la base de análisis estadísticos de una masa de datos como promedio, desviación estándar o tabla de puntuaciones existentes.
El criterio de comparabilidad7 permite relacionar los valores resultantes de un determinado tests con otras soluciones obtenidas de pruebas análogas y validez semejante.
La utilidad de una prueba es el principal móvil detonante para su elección, ya que su resultado debe aportar información relevante de su análisis, y su evaluación permitirá tomar decisiones o establecer medidas correctoras, de aliciente o motivación.
MacDougall (1993) añade un componente más a la hora de realizar la selección de los tests. Este elemento es la pertinencia, afirmando que los parámetros evaluados con los tests deben ser apropiados a la especialidad deportiva de un sujeto. Fundamenta su afirmación en que es necesario medir las variables de fuerza potencia, máximo consumo de oxígeno, flexibilidad, masa muscular, etc., así como su efecto sobre el rendimiento. Por ejemplo, la evaluación de la capacidad aeróbica de un sujeto es pertinente sólo en aquellos deportes en los que el rendimiento depende del proceso aeróbico.
NOTAS
1 Estos autores ejemplifican una comunicación a un grupo de alumnos, en un intento homogéneo de lograr el máximo esfuerzo de los mismo. Examinador: «haremos algunos tests para determinar la medida de condiciones básicas importantes de la capacidad motriz (v. g. la fuerza). Las performances se reflejarán, entre otras cosas, en las calificaciones. Por eso pido que se esfuercen al máximo y traten de obtener el mejor resultado posible».
2 Parte de la psicología aplicada a la medida y elaboración matemática y estadística de los datos psicológicos se realiza por medio de tests de tipo cuantitativo como, por ejemplo, la medida de la inteligencia, las preferencias vocacionales, la memoria, la información cultural, etc.
3 Al referirse a un material, los facultativos llaman fiabilidad al Tiempo Medio de Buen Funcionamiento (TMBF).
4 Homeostasia. «Condición que expresa el equilibrio fisiológico entre los diferentes procesos químicos y físicos que tienen lugar en el organismo». Diccionario de medicina Marín, (1986).
5 Por ejemplo, Heyward (1996) a la hora de seleccionar una prueba afirmaba que «la validez de las pruebas consistentes en subir y bajar de un banco para valorar la preparación cardiorrespiratoria depende, en alto grado, de la medición precisa del ritmo del corazón, y su validez generalmente es algo menor que la validez de las carreras de resistencia».
6 Por ejemplo, estaría directamente relacionado con la afirmación de Heinrichs (1990), citado por Woodburn y Boschini (1992) según el cual la utilidad de una prueba depende de los beneficios reales que proporciona al usarse.
7 Liener, citado por Fetz y Kornexl (1976), incluía igualmente además de los criterios principales (objetividad, fiabilidad y validez) dos criterios secundarios de calidad de prueba, la utilidad, y la comparabilidad, este último como cualidad de confrontar pruebas de forma paralela para comparar tests de validez similar.