View
13
Download
0
Category
Preview:
Citation preview
ALGUNAS CLASIFICACIONES PREVIAS
Contenido
Ej. MáximaEj. Típica
BaremoRef.
CriterioRef. Norma
SesgosAciertos AzarDeseabilidad
SocialHalo
Puntuaciones
CentilesTipificadas
Notas
Tipo de ÍtemsCorrecta y distractoresEscala tipo
Likert
4.-PROCEDIMIENTO DE CONSTRUCCIÓN DE UNA PRUEBA O TEST
Pasos Croker y Algina, 1986):1. Delimitación del objetivo para el que van a
utilizarse las puntuaciones.2. Definición del constructo que se pretende
medir con el test.3. Descripción general de los componentes del
constructo.4. Diseño del test.5. Redacción de los ítems.6. (Consulta a expertos y estudio de campo)7. Análisis de la calidad de los ítems.8. Estudio de la fiabilidad del test.9. Estudio de la validez del test.10. Elaboración de las normas de aplicación,
interpretación y baremación de las puntuaciones.
Procedimientos para obtener la información(croker y algina, 1989; martínez-arias, 1995): 1.-Revisión bibliográfica. tener presentes las conductas o indicadores que hayan utilizado otros investigadores para medir el mismo constructo y de los que podemos tener conocimiento por sus publicaciones. 2.-Análisis de contenido. este procedimiento consiste en hacer preguntas abiertas relativas al constructo que nos interesa a personas conocedoras del constructo o que son elementos de la población objetivo y cuyas respuestas pueden indicar categorías conductuales representativas del constructo.3.-Juicio de expertos. se trata de pedir a personas “expertas” a través de entrevistas o cuestionarios que nos indiquen qué tener en cuenta y, por lo tanto, medir en los sujetos por lo que respecta al constructo .4.-Identificación de incidentes críticos. la particularidad de este procedimiento está en que pedimos a personas cercanas a sujetos típicos de nuestra población objetivo, que nos identifiquen comportamientos tipo de los distintos niveles del constructo.5.-Observación directa. el autor del test recoge la información mediante observación directa de personas que manifiestan el constructo. los comportamientos de estos sujetos que el autor considere relevantes serán propuestos como posibles indicadores del constructo.
4.3.- Definición del constructo
4.4.- Descripción general de los componentes del cons tructo
Ilustración 1.- Diagrama ilustrativo del proceso de derivación de los objetivos específicos a partir de los objetivos generales
Tabla 1- cuadro de expecificaciones de un examen de Psicometría
OBJETIVOS GENERALES/CONSTRUCTOS
OBJETIVOS ESPECÍFICOS/INDICADORES
NIVEL DE PROCESAM IENTOCONTENIDOS%CN1 CM AP 32 TOTALES
TOTALES
OBJETIVOSDOCENTES
I- Saber el concepto y objetode estudio dela Psicom etríaII- Conocer,com prender yaplicar la Teoría Clásica delos Tests.
15
35
50
Concepto y ObjetoTeoría Clásica de los TestsFiabilidadValidezConstrucción de escalas
Construcción de escalas
Construcción de escalasValidez
Validez
Fiabilidad
FiabilidadTeoría Clásica de los Tests
Teoría Clásica de los TestsConcepto y Objeto
Concepto y Objeto
10 2 0 0 3 0 15 15 15 5 0 5 5 5 20
100 100
25 0 100
75
--- ---
100
10 45
0 40
15
0 75
0
45
0
70 45
50
25 25
40 25
0 0 ---
0
45 10
100 100
----
15
100
50
0
75 75
20
100
100 100 100
100
100
100 100
--- --- --- ----
--- --- --- ----
--- --- --- ----
34.8 24.540.7
III- Conocer ycom prenderlas Aplicaciones Psicométricas.
4.5.- Diseño del test 4.5.1. Número de ítems 4.5.2.- Tipo de ítems y número de alternativas de respuesta
4.5.2.- Tipo de ítems y número de alternativas de respuesta4.5.2.1.-Verdadero y Falso4.5.2.2- Elección múltiple
En tests de Ejecución Máxima 4.5.2.3.- Relacionar4.5.2.4.- Completar, sustituir o corregir 4.5.2.5.- Respuesta corta4.5.2.6.- Ensayo4.5.2.7.- El verdadero ítem
• errores más frecuentes para prevenir su repetición (Muñiz,1994, p. 208-209):- Que las alternativas de respuesta no resultan igualmente plausibles...- - Siempre que se pueda, conviene evitar los enunciados en forma negativa- - La longitud de las alternativas conviene que sea aproximadamente la misma- -Evitar las reiteraciones de texto innecesarias. p.e.:- Cuando se utilizan cifras en las alternativas es conveniente presentarlas
ordenadas- Conviene evitar el uso como última alternativa de "todas las anteriores"
Componentes del superítem
Lea el texto, vea el diagram a y responda al item 51.Instrucción
V
X 2
X 1 X 4
X 3
e1 e4e3e2
1 4 3
2
Diagram a
Para validar el modelo de medida del constructo se ha utilizado el programa LISREL, obteniendoselos siguientes resultados: 1 2 3 1
e1 e2 e3 e4Texto
¿Qué teoría de test abala el cálculo de la fiabilidadcon estos datos?
Enunciadoo tronco
1. Clásica2. Generalizabilidad3. Congenérica R. Correcta
Distractores
En tests de
Ejecución
Típica
SI/NO, SI/NO/A VECES
Escalas tipo Likert
Alternativas de acuerdo
Las alternativas
de evaluación
bueno-malo
adecuado-inadecuado
correcto-incorrecto
Alternativas de frecuencia
4.5.3.- Cómo cuantificar las alternativas de respuesta.
RESTANDO ERRORES
AAATPD PaRAAA *k
Pa 1
PeRaE *PeERa
KKPe 1
11
KKE
kK
ERa
11*1
K
EKKE
KAA
NMNK
EATPDNota
KEATPD
11
SIN RESTAR ERRORES
11*1)1(11
KPatKPsPsKPsKPsKPat
KPsPsPat
NKNAtK
PD 11
NM
NKOmisiones
KNAtK
Nota *)*)1(11
(
4.6.- Redacción de los ítems.4.7.- Análisis de la calidad de los ítems.4.7.1. El Juicio de expertos.
Tabla 2. Hoja resumen de las señales de emparejamiento de los jueces entre objetivos e ítems (adaptada de Osterlind, 1989, p. 268)
M arcas de emparejamiento entre ítems y objetivos Juez: Fecha: ÁREA de contenido: Primero lea detenidamente toda la lista de especificaciones de dominio y de ítems del test. Su marca es para señalar qué ítem del test es y cuál no es una medida de una de las especificaciones de dominio. Esto es, si Ud. cree reconocer dentro de un banco de ítems la representación en un ítem del test de la m edida de una especificación de dominio, puede emparejarlo con una linea al objetivo correspondiente. Esto es, después de cada objetivo, escribir el/los ítems del test que crea miden dicho objetivo. En el caso de aquellos ítems que Vd. crea que no miden ninguna de las especificaciones de dominio disponibles, m arcar sus números en el espacio disponible al final. Objetivo Emparejamiento de ítems del test 1 2 3 4 Ítems no emparejados: From R.K. Hambleton "Validating the test scores" (p.225) in R.A. Berk (ed), A Guide to Criterion-Referenced Test Construction, 1984, Baltimore: The Johns Hopkins University Press.
Tabla 2. Grado de congruencia ítem-objetivo (adaptada de Osterlind, 1989, p. 267) Nombre Instrucciones: Primero lea el objetivo número 1. Después, lea el primer ítem en el cuadernillo del test. Considere cuidadosamente el grado de congruencia de este ítem con el dominio de habilidad. Evalúe la congruencia según las siguientes categorías: A = Alto grado de congruencia M = Grado medio de congruencia B = Bajo grado de congruencia Si Vd. quiere hacer algún comentario sobre la congruencia de ese ítem regístrelo en el lugar reservado para ello. Después de que haya terminado con el primer ítem, proceda con el segundo ítem, e igualmente con todos los ítems siguientes, evaluándolos de igual forma. Objetivo Nº 1 Uso de las técnicas matemáticas para solventar problemas de la vida real. Evaluación Com entario Ítem Nº 1 Ítem Nº 2 Ítem Nº 3 Ítem Nº 4 Ítem Nº 6 Ítem Nº 9 Objetivo Nº 2 Uso de las propiedades de figuras de dos o tres dimensiones para realizar cálculos geométricos. Evaluación Com entario Ítem Nº 3 Ítem Nº 5 Ítem Nº 8 Ítem Nº 10 Ítem Nº 11
4.7.2.1. Índices descriptivos de la distribución de respuestas y/o de puntuaciones del ítem y del test. 4.7.2.1.1. Índice de dificultad
4.7.2.- Análisis estadístico de ítems
- Índices que describen la distribución de respuestas a un ítem (p.e. varianza del ítem). - Índices que describen el grado de relación entre la respuesta al ítem y algún criterio interno o externo que interese. - Índices que reúnen los dos aspectos anteriores.
NAID
NK
EAID 1
11
KNAK
ID
Según Yela (1980)
CATEGORÍAS CENTIL DEL CONSTRUCTO % APROX. ÍNDICES DE DIFICULTAD________________________________________________________________(PS)______________MUY FÁCILES 0 - 10 10% 0.75 A 0.95FÁCILES 10 – 30 20% 0.55 A 0.74NORMALES 30 - 70 40% 0.45 A 0.54DIFÍCILES 70 - 90 20% 0.25 A 0.44MUY DIFÍCILES 90 - 100 10% 0.05 A 0.24
Según Garret (1968)
CATEGORÍAS CENTÍL DEL CONSTRUC TO % APROX. ÍNDICES DE DIFICULTAD______________________________________________________________________________FÁCILES 0 - 25 25% 0.75 A 0.95MEDIOS 25 - 75 50% 0.26 A 0.74DIFÍCILES 75 - 100 25% 0.05 A 0.25
Distribución recomendada de niveles de dificultad de los ítems en un test referido a la norma
Análisis de Alternativas incorrectas
Tabla 5. Análisis de las alternativas incorrectas A L T E R N A T I V A S
A B C D E
Grupo Superior 5 15 17 10 0 100
Inferior 15 65 20 0 0 100
20 80 90 10 0
4.7.2.2. Índice de discriminación: Índices que relacionan el ítem con un criterio externo al ítem.
4.7.2.2.1.- Índice de discriminación (D) propiamente dicho: D = Ps - Pi
4.7.2.2.2.- Aplicaciones o estimaciones del Coeficiente de Correlación de Pearson:
*Correlación Biserial Puntual (rbp) * Correlación Biserial (rb)
CONUNALIDADES
Inicial
Extracción
P1
1,000
,205
P2
1,000
,077
P3
1,000
,135
P4
1,000
,150
P5
1,000
,003
P6
1,000
,045
P7
1,000
,000
P8
1,000
,001
P10
1,000
,006
P11
1,000
,040
P12
1,000
,012
P13
1,000
,079
P14
1,000
,014
P15
1,000
,000
P16
1,000
,002
P18
1,000
,277
P19
1,000
,082
P20
1,000
,125
P21
1,000
,103
P22
1,000
,002
P23
1,000
,057
P24
1,000
,200
P25
1,000
,439
P26
1,000
,460
P27
1,000
,198
P28
1,000
,000
Com ponente Autovalores iniciales Sum as de las saturaciones al cuadrado de la extracción
Sum a de las saturaciones al cuadrado de la rotación
Total % de la varianza
% acum ulado
Total % de la varianza
% acum ulado
Total % de la varianza
% acum ulado
1 2,374 26,379 26,379 2,374 26,379 26,379 1,889 20,994 20,994
2 1,176 13,066 39,445 1,176 13,066 39,445 1,661 18,451 39,445
3 ,979 10,878 50,323
4 ,941 10,451 60,774
5 ,855 9,498 70,272
6 ,745 8,279 78,552
7 ,705 7,836 86,388
8 ,667 7,416 93,803
9 ,558 6,197 100,000
Criterios de validez paso a paso con Modelos Estructurales
a) Parámetros “πxv” y, en general cualquier parámetro “πjk”, han de ser significativamente distintos de cero (t>2). En el listado del programa AMOS este dato viene en la columna de CR de la tabla de parámetros estimados significación de parámetros individuales).
b) Ressiduales estandarizados no significativos y por lo tanto con valores “t<2. (Ajustes correlacionales)
c) Indices globales de de ajuste (de la matriz de correlaciones o covarianzas) que se adapten a los siguientes valores críticos: - χ²/GL< 2 - Probabilidad asociada a H0 > 0.05 - Otros índices de ajuste global del modelo: - GFI o índice de bondad de ajuste: es un índice insensible al tamaño muestral, cuyos valores oscilan entre 0 y 1 -excepcionalmente, puede tener valores superiores a 1-, aunque sólo valores superiores a 0.9 suelen ser aceptables.
- AGFI: es el índice GFI ajustado en base a los grados de libertad del modelo, y por lo tanto prima el principio de parsimonia. Como en el caso anterior, sus valores oscilan entre 0 y 1 y valores superiores a 0.8 indican un buen ajuste del modelo a los datos.
- RMR estandarizado : es un promedio de residuales estandarizados entre S y Σ(θ). Valores menores que 0.10 indican un buen ajuste.
- RMSEA Es una medida derivada de la anterior pero está en función de los grados de libertad del modelo y por lo tanto prima el principio de parsimonia. Un valor de RMSEA igual o menor a 0.05 indica un buen ajuste, valores superiores a 0.08 representan un error de aproximación a los valores poblacionales.
Recommended