Curso de tests
Transcripción
Curso de tests
Diseño de pruebas tipo test enero de 2014 José Miguel Santos Espino ¿Qué son las pruebas tipo test? ¿Qué son las pruebas tipo test? • Desarrolladas en EUA a principios del siglo XX (Thorndike,Yerkes) ¿Qué son las pruebas tipo test? • Pruebas de evaluación educativa • Pretenden medir conocimientos de forma objetiva y masiva (a grandes grupos) • Consisten en una lista de ítems, normalmente de elección múltiple ¿Qué es la evaluación? ¿para qué evaluamos? Tipos de evaluación (objetivos) • Diagnóstica. Al principio, para conocer a los estudiantes. • Formativa. Durante, para seguir el progreso. • Sumativa. Al final, para certificar logros. Diseño de tests: preguntas claves • Objeto de la evaluación. ¿Qué pretendemos medir? • Validez de la prueba. ¿El test mide lo que pretende medir? • Fiabilidad de la prueba. ¿La puntuación obtenida es reproducible en casos similares? Etapas en el desarrollo de una prueba 1. 2. 3. 4. 5. 6. 7. 8. Plan general Definición del contenido Especificaciones de la prueba Desarrollo de los ítems Desarrollo de la prueba Administración de la prueba Puntuación de la prueba Interpretación de los resultados Contenido de la prueba ¿Cuánto es 3 x 5? a) 5. b) 10. c) 15. d) 35. ¿Cuánto es 3 x 5? a) 5. b) 10. c) 15. d) 35. Cada día que voy al colegio, me compro un bocadillo en la cantina, que cuesta 3 euros. ¿Cuántos euros me gasto cada semana, de lunes a viernes? a) 5. b) 10. c) 15. d) 35. Contenido de la prueba • Más allá de los “temas” o “materias” • Cada “tema” tiene varias dimensiones de aprendizaje: - sólo recordar nombres de cosas - recordar propiedades de las cosas - saber aplicar conceptos y procesos - saber relacionar conceptos de varios “temas” - etc. Taxonomía de Bloom (1956) • dimensiones del aprendizaje: - cognitiva - afectiva - psicomotriz • En la Universidad, suele dominar la dimensión cognitiva Taxonomía de Bloom (para la dimensión cognitiva) 1. Conocimiento - reconocer 2. Comprensión - entender 3. Aplicación - resolver problemas en nuevas situaciones 4. Análisis - identificar y separar las partes de un problema 5. Síntesis - crear un todo a partir de partes 6. Evaluación - realizar juicios a partir de datos o información Ejemplos de preguntas según clasificación de Bloom • Conocimiento: recuerdo/conocimiento de fechas, valores, nombres, lugares… • Comprensión: qué sucede cuando, qué parte no encaja, qué se espera, elija la mejor definición… • Aplicación: cuál es el método más apropiado, usar reglas para obtener resultados, cambiar un proceso para adaptarlo a otro… Ejemplos de preguntas según clasificación de Bloom • Análisis: discutir puntos de vista según autores, conclusiones desde varios enfoques, aplicabilidad de procesos a escenarios… • Síntesis: generalizar a partir de datos en bruto, interrelacionar conocimientos de varias áreas… • Evaluación: juzgar el valor de teorías, distinguir entre objetividad y subjetividad… ¿Qué se entiende por multitarea en un sistema operativo? a) La capacidad de ejecutar múltiples tipos de tareas. b) La posibilidad de ejecutar varias instrucciones a la vez. c) La capacidad para mantener simultáneamente varios procesos activos. Apple no incorporaba multitarea en las primeras versiones de iOS. ¿Cuál de estos motivos para tomar tal decisión resulta más plausible? a) La multitarea es demasiado complicada de implementar. b) Los procesadores de la época no eran suficientemente potentes para soportar multitarea. c) La multitarea tiende a consumir demasiada memoria y batería. Tabla de Especificación de Objetivos (TEO) • Herramienta para visualizar los contenidos que queremos para la prueba. • Dos dimensiones: contenidos + niveles cognitivos. Referencias • Standards for Educational and Psychological Testing • Evaluación de los aprendizajes en la universidad. Amparo Fernández March. UPV. http://www.sre.urv.es/web/aulafutura/ php/fitxers/496-7.pdf Estructura de una prueba tipo test Elementos de un test • ítem • enunciado (stem) • opciones (options) • alternativa correcta (key) • distractores (distractors) • escenario (scenario) Un ítem enunciado ¿Cuál de estos vegetales proviene de América? a) Aceituna. b) Canela. c) Caña de azúcar. distractores d) Judía. e) Naranja. opciones Los distractores • fundamentales para un buen diseño del ítem. • un buen distractor debe ser: • plausible. • atractivo para una persona que no conozca la respuesta correcta o que tenga un conocimiento superficial de la materia. • irrelevante para una persona con conocimiento. ¿Cuál de los dos ítems tiene mejores distractores? 5 x 15 = a) 3. b) 20. c) 55. d) 75. ! 5 x 15 = a) 73. b) 74. c) 75. d) 76. Formatos habituales • Elección múltiple tradicional • Elección alternativa • Verdadero-falso • Verdadero-falso múltiple • Emparejamiento • Elección múltiple complejo • Dependientes de contexto Elección múltiple tradicional ¿Cuál de los siguientes países pertenece a Oceanía? 1.Yibuti. 2. Kiribati. 3. Maldivas. 4. Bahrein. Escenarios Verdadero/falso • Enunciado en forma de afirmación tajante. ! ¿Verdadero o falso? El lenguaje máquina es el que es interpretado por la CPU. Elección alternativa • Dos únicas opciones de respuesta. ! La primera bomba atómica era de: A. Fisión. B. Fusión. V/F múltiple • Indique si cada una de las siguientes afirmaciones referidas al número π son verdaderas (V) o falsas (F): 1. es menor que 3. V F 2. es un número irracional. V F 3. es un número negativo. V F Emparejamiento • Conecte los siguientes países con sus capitales: 1. Tuvalu. 2.Vanuatu. 3.Burundi. 4. Malaui. a. Lilongwe. b. Port Vila. c. Funafuti. d. Tarawa. e. Bujumbura. Múltiple complejo ¿Cuáles de estos elementos químicos son metales? 1. Cromo. 2. Bromo. 3. Cerio. 4. Cesio. ! A. 1 y 2. B. 2 y 4. C. 1, 3 y 4. D. 2, 3 y 4. Cómo hacer un buen diseño del test Directrices para confeccionar un buen test • Propuesta clásica de directrices: Haladyna-Downing, 1989-2002 31 directrices • Moren, Martínez y Muñiz, 2004: simplifican modelo inicial a 12 directrices Las 12 directrices 1. El contenido debe ser una muestra representativa de la tabla de especificaciones. 2. La representatividad debe marcar el diseño del ítem: sencillo/complejo, concreto/ abstracto, memorístico/productivo, cómo se expresa, etc. 3. Idea central en el enunciado. Concordancia gramatical opciones-enunciado. 4. Sintaxis+gramática correcta. Evitar ítems escuetos, profusos, confusos, dobles negaciones. 5. Semántica ajustada al contenido y las personas. 6. Sólo una opción correcta. Distractores plausibles. 7. El lugar de la opción correcta no debe ser previsible. 8. Preferible TRES opciones. 9. Recomendable presentar opciones en VERTICAL. 10.Conjunto de opciones debe aparecer estructurado. 11.Opciones independientes entre sí. No referencias cruzadas. No “todas las anteriores” ni “ninguna de las anteriores”. 12.Ninguna opción debe destacar del resto, ni en contenido ni en apariencia. Las 12 directrices: contenido y expresión 1. El contenido debe ser una muestra representativa de la tabla de especificaciones. 2. La representatividad debe marcar el diseño del ítem: sencillo/complejo, concreto/abstracto, memorístico/ productivo, cómo se expresa, etc. 3. Idea central en el enunciado. Concordancia gramatical opciones-enunciado. 4. Sintaxis+gramática correcta. Evitar ítems escuetos, profusos, confusos, dobles negaciones. 5. Semántica ajustada al contenido y las personas. Las 12 directrices: construcción de las opciones 6. Sólo una opción correcta. Distractores plausibles. 7. El lugar de la opción correcta no debe ser previsible. 8. Preferible TRES opciones. 9. Recomendable presentar opciones en VERTICAL. 10. El conjunto de opciones debe aparecer estructurado. 11. Opciones independientes entre sí. No referencias cruzadas. No “todas las anteriores” ni “ninguna de las anteriores”. 12. Ninguna opción debe destacar del resto, ni en contenido ni en apariencia. Directriz 3 • evitar problemas a las personas que tienen dificultades de lectura (salvo que eso sea objeto de evaluación) • ¿Qué sinfonía de Beethoven también se conoce como «La heroica»? a) La sinfonía número 1. b) La sinfonía número 3. c) La sinfonía número 5. Directriz 3 • evitar problemas a las personas que tienen dificultades de lectura (salvo que eso sea objeto de evaluación) • La sinfonía de Beethoven conocida como «la Heroica» es la número: a) 1. b) 3. c) 5. Directriz 11 • La esperanza de vida al nacer en España es superior a: a) 75 años. b) 80 años. c) 82 años. d) 85 años. ¡ojo con despistes en los enunciados que pueden dar lugar a varias respuestas correctas! Directriz 11 • ¿Qué cifra se aproxima más a la esperanza de vida al nacer en España? a) 75 años. b) 80 años. c) 82 años. d) 85 años. Directriz 11 • una persona sin conocimiento experto puede contestar correctamente a esta pregunta. • ¿Cuáles de las siguientes opciones muestran componentes del ojo humano? a) Glándula lagrimal superior. b) Conjuntiva. c) Glándulas de Meibomio. d) Todas las anteriores son correctas. Directriz 11 • ¿Cuál es la capital de Moldavia? a) Moscú. b) Oslo. c) Varsovia. d) Ninguna de las anteriores. Directriz 11 pregunta innecesariamente complicada. El diseñador quería que la correcta fuera la (a). Pero admite como respuesta la (d), porque en C no hay valores booleanos. • Si a vale 1 y b vale 2, ¿cuál de estas expresiones en lenguaje C devuelve un valor booleano cierto? a) a>b | b>a b) a>b & b>a c) a>b && b>a d) Todas las anteriores son falsas. Directriz 11 • ¿Cuáles de estos números son potencias de 2? a) 1. b) 2. c) 3. d) a) y b) son ciertas. Directriz 12 al diseñador le ha traicionado la concordancia entre el artículo y el sustantivo. Da una pista para descartar la (b). • El hueso más largo de la extremidad superior que se articula en la cavidad glenoidea del omóplato es el: a) Fémur. b) Clavícula. c) Húmero. Directriz 12 una opción mucho más larga que las demás • Una muestra aleatoria es aquella en que: a)Los sujetos se seleccionan por niveles. b)Se selecciona cada n sujetos. c)Cada sujeto tiene la misma probabilidad de formar parte de la muestra. d)Los grupos son unidades de muestreo. Administración de la prueba Administración de la prueba • Aspectos formales: maquetación, soporte para responder, instrucciones… • Generar confianza, comodidad y comprensión. • Atención a la diversidad funcional. Administración de la prueba • Prevención del fraude (suplantación, copia) • aleatorizar ordenación o selección de ítems • controlar la visibilidad/accesibilidad del entorno • verificar la identidad de los evaluados • detección: minería de los resultados Aspectos formales • Instrucciones claras • Número de ítems • Cuidado con la tipografía y formato: tamaño de papel, interlineado, justificación, colores... Análisis del test Análisis del test • sobre ítems: índice de dificultad; índice de discriminación • sobre opciones: índice de discriminación • sobre la prueba: índice de dificultad de un ítem • índice de dificultad = aciertos / respuestas no vacías • índice de dificultad corregido (eliminando efecto del azar) = índices de discriminación • capacidad del ítem para separar personas de alto y bajo rendimiento • varias fórmulas, más o menos sofisticadas: • Kelley, 1939 (grupos extremos 27%) • correlación entre ítem y resultado global índices de discriminación • comparación de extremos: • restar proporciones de aciertos en los dos grupos extremos: Palto - Pbajo • rango entre -1 … +1 índices de discriminación • hallar la correlación entre el ítem y la puntuación global. • usar un indicador de correlación apropiado para la magnitudes. • rango entre 0 y 1. Análisis de los distractores • Frecuencia de elección • índice de discriminación del distractor (normalmente, un buen distractor debe ser muy seleccionado por personas con pobre rendimiento, y poco seleccionado por el grupo de mejor rendimiento) Análisis de las omisiones • frecuencia de omisiones para un ítem • opciones no seleccionadas Alerta si... • Ítems con un índice de discriminación negativo. • Distractores con un índice de discriminación mayor que la opción correcta. • Omisiones con índice de discriminación negativo. Fiabilidad del test • Coeficiente alfa de Cronbach Sistema de puntuación • Sistema básico: suma de aciertos • Penalización del azar • Premiar omisiones • Puntuar conocimiento parcial • Puntos de corte • Puntuaciones relativas