Jörg M. Müller Universität Tübingen

Entsprechend setzt sich die beobachtete oder ‘Observed Rasch Variance’ (ORV) aus der

Varianz der wahren oder ‘True Rasch Variance’ (TRV) sowie einer Error Rasch Variance

(ERV) zusammen. Geschätzt werden die ORV sowie das Verhältnis TRV/ORV

(=Reliabilität). Die TRV ist damit unabhängig vom Messfehler bestimmbar (vgl.

Abbildung 3), da TRV=ORV*Rel. Die Wahl des Reliabilitätsschätzer ist allerdings von

Bedeutung (vgl. Abbbildung 4), da Cronbach‘s Alpha und die aus den IRT-

Softwareprogrammen angegebene Reliabilität durchaus voneinander abweichen können.

3. EINFLUSS DER SCHÄTZALGORITHMEN. Eine Vielzahl von Simulationstudien (z.

B. Hoijtink & Boomsma, 1993, 1995, 1996; Kim & Nicewander, 1993; Warm, 1989)

konnten systematische Verzerrungen der Schätzmethoden auf die ORS nachweisen. Eigene

Auswertungen zeigen nur einen relativ schwachen Einfluss.

4. EINFLUSS DER LINK-FUNKTION. Je nach verwendeter Software muss eine

Adjustierung von der Normal-Ogive auf die logistische Funktion durchgeführt werden. Für

die eigene Studie wurde für bestimmte BilogMG Programme eine entsprechende Korrektur

vorgenommen.

5. EINFLUSS VON BODEN-UND-DECKENEFFEKTEN. Über die standardisierten

Indikatoren Schiefe und Kurtosis sollten Verzerrungen entsprechend den Abbildungen

5a,b,c ermittelt und korrigiert werden. Diese Korrekturmethode wurde entwickelt, jedoch

aufgrund des unreliablen Kurtosisindikators bei den Analysen nicht angewendet.

ERGEBNISDie TRV der vier Skalen für die vier Sprachvarianten des EPQ-R finden sich in Abbildung 6a,b.

DiskussionDie TRV in Abbildung 6a sprechen nicht gegen eine gelungene Übersetzung des EPQ-R mit Ausnahme der polnischen Version. Die TRV in Abbildung 6b geben zum Teil Hinweise über Verbesserungen der Skalen zur Angleichung der inhaltlichen Validität.

AusblickZukünftig soll der Einfluss der Schwierigkeits- und Trennschärfeparameter auf die TRS genauer untersucht werden. Vorbereitung hierzu sind bereits erfolgt.

LiteraturAluja, A., García, Ó. ,& García, L.F. (2003). Dimensionality of the EPQ-RS: Structure equation modeling analysis. Personality and Individual Differences, 35 (2), 449-460.Eysenck, H. J. & Eysenck, S. B. G. (1991) Manual for the EPQ-R. Sevenoaks: Hodder and Stoughton.Müller, J. M. (2002a). Unterschiedliche Variationen in psychologischen Eigenschaften - eine Interpretation der Erstreckung einer Raschskalierung. Zeitschrift für Differentielle und Diagnostische Psychologie, 23, 261-271.Müller, J. M. (2002b). The contribution to interpret rasch variance to personality psychology. The 11th European Conference on Personality of the European Association of Personality Psychology Jena vom 21.- 25. Juli 2002.Müller, J. M. (2003). Nutzen für die psychologische Diagnostik aus der Interpretation geschätzer raschskalierter Personenparametervarianzen. Positionsreferat auf der 7. Arbeitstagung der Fachgruppe Differentielle Psychologie, Persönlichkeitspsychologie und Psychologischen Diagnostik in Halle.Ruch, W. (1999). Die revidierte Fassung des Eysenck Personality Questionnaire und die Konstruktion des deutschen EPQ-R bzw. EPQ-RK. Zeitschrift für Differentielle und Diagnostische Psychologie, 20(1), 1-24.Zawadzki, B. (1995). [The universal validity of psychoticism, extraversion, and neuroticism as the 3 superfactors of personality: The psychometric characteristics of the Polish adaptation of the Eysenck Personality Questionnaire--Revised (EPQ--R)]. Studia Psychologiczne, Vol 33(1-2), 147-188.

Interpretation und Vergleich der raschskalierten Personenparametervarianzen der englischen, Interpretation und Vergleich der raschskalierten Personenparametervarianzen der englischen, deutschen und polnischen EPQ-R Versionen deutschen und polnischen EPQ-R Versionen

zur Überprüfung der Inhaltsvaliditätzur Überprüfung der Inhaltsvalidität

Jörg M. Müller Universität Tübingen

http://www.joergmmueller.de/default.htm oder http://www.psychological-tests.deTheoretischer Ansatz

Die Variabilität von Personen bildet sich nach einer Arbeit von Müller (2002) in den geschätzten Varianzen der Personenparameter des Raschmodells (Gleichung 1) ab. Entsprechend weisen verschiedene psychologische Eigenschaften i.d.R. verschiedene Variabilität auf, was schematisch in Abbildung 1 dargestellt ist.

Abbildung 1 Verschiedene Variabilität in verschiedenen Dimensionen.

Diese besondere Eigenschaft der raschskalierten Personenparameter lässt sich verschiedentlich nutzen (Müller, 2003), u.a. für eine Überprüfung der Inhaltsvalidität.

InhaltsvaliditätInhaltsvalidität (Fitzpatrick, 1983; Klauer, 1984) stellt ein zentrales Konzept innerhalb der Gültigkeitseinschätzung eines Persönlichkeitsfragebogens dar. Sie fassen Inhaltsvalidität als Repräsentativität der Itemstichprobe aus dem Universum einer (validen; Ergänzung des Autors) und theoretisch unendlichen Itemmenge auf.

Hypothese Entsprechend dieser Auffassung und unter der Annahme, dass sich die vier Europäischen Nationen nur zufällig in ihrer Variabilität unterscheiden, sollten die vier durch den EPQ-R abgebildeten Skalen vergleichbare Rasch Varianzen aufweisen.

DatenZur Überprüfung dieser Hypothesen werden die Normierungsdaten von vier Operationalisierungen des EPR-R in den Sprachen Englisch (Eysenck & Eysenck, 1991)*, Deutsch (Ruch, 1999), Polnisch (Zawadzki, 1995) und Spanisch (EPQ-RS; Aluja, García, & García, 2003 ) mit vier Software-Programmen (Winmira, BilogMG, Bigsteps, Parscale) reanalysiert .

Methode/Störeinflüsse auf die ‚Observed Rasch Variance‘ (ORS)Die geschätzte Varianz der Personenparameter ist allerdings von einer Reihe von Einflussgrößer mit bestimmt, u. a. von:

1. SOFTWARE 2. MESSFEHLER 3. SCHÄTZALGORITHMEN 4. LINK-FUNKTION5. BODEN-UND-DECKEN-EFFEKTE

Ziel der methodischen Überlegungen über die Einflussgrößen ist die Suche nach einem möglichst unverzerrten Schätzer der Personenparametervarianzen, welcher Vergleiche über die testspezifischen Besonderheiten hinaus erlaubt, sodass teststarke Prüfverfahren, wie der Homogenitätstests von Bartlett (1954; eine genauere Diskussion über Test zur Überprüfung gleicher Varianzen siehe Olejnik & Algina, 1988), herangezogen werden können.

1. EINFLUSS DER SOFTWARE. Auf der Basis einer Simulationsstudie wurde Parscale für die Schätzung von Rasch Varianzen als ungeeignet eingestuft (vgl. Abbildung 2).

Abbildung 2

2. EINFLUSS DES MESSFEHLERS. Bereits Lord (1983) hat den geschätzten

Personenparameter als Summe eines wahren Wertes und eines Fehlerterms im Sinne der

Klassischen Testtheorie aufgefasst. Gleichung 2:

6. Tagung der Fachgruppe Methoden und Evaluation, Wien 2003

* Mein Dank an P. Barrett, W. Ruch, A. Aluja und P. Brzozowski und R. Horn von Swets für die Daten.

iii ˆ

geschätze TRS_est

Einfluss der verwendeten Software: SimulationsstudieTRS 0.25 bis 4.00 (.25); N=1000; Items=20

ca. 1. Std-abw.Relevanter Bereich für reale Testverfahren

Wahre TRS

Abbildung 6. EPQ-R(S) Variationsunterschiede (Winmira)

Personparameter

Gleichung1

iAAiAi

BODEN-UND-DECKEN Effekte auf die

STANDARDABWEICHUNG

KURTOSIS

SCHIEFE

a) Alle Items

Ne PsLü

Spanisch (N=1006, 48 Items)

Ne PsLüNe PsLü

Ne PsLü

Englisch (N=1434, 100 Items)

b) Skalen um Q-INDEX auffällige Items reduziert

Ne PsLü

0 1 2 3

Deutsch(N=2554, 64 Items)

Ex Ne PsLü

Englisch(N=1434, 82 Items)

0 1 2 3

Ex Ne PsLü

Polnisch(N=1414, 60 Items)

0 1 2 3

Ex Ne PsLü

Spanisch(N=1006, 38 Items)

0 1 2 3

Abbildung 3: Die Reliabilität beeinflusst die ORV, aber nicht die TRV Beispiel des SPM (N=1500)

0.5 1.0 1.5 2.0

Rasch Varianzen Personen

10 20 30 40 50 60

Anzahl an Items

Zufällig Itemreduktion

Erwartet

Cronbach

0 1 2 0 1 2

Deutsch (N=2554, 102 Items)

Polnisch (N=1414, 90 Items)

Erwartet

Winmira

Parscale

BilogMG

Bigsteps

TRV TRV

TRVTRV

Spearman Korrelation

r = 0.75 s.(N=466)

Cronbachs Alpha

Reliabilitäten der IRT-Software

0.0 0.25 .5 0.75 1.0

Erwartet

Abbildung 4: Die Wahl des Reliabilitätsschätzers ist nicht unerheblich

Zusammenhang zweier empirischer Reliabilitätsschätzungen

Jörg M. Müller Universität Tübingen

Documents

Getränkekarte Tübingen

April 2013 1 Jörg Trentmann, Uwe Pfeifroth, Jennifer Lenhardt, Richard Müller Deutscher Wetterdienst (DWD) Satellite-based Data Sets for EURO4M

1 20.03.2009, Tübingen Umweltprüfung Universität Tübingen Umweltprüfung an der Universität Tübingen Auftakt-Workshop Joachim Müller Ingo Holzkamm Tübingen,

Exploiting Network Printers - Black Hat · Exploiting Network Printers Jens Müller, Vladislav Mladenov, Juraj Somorovsky, Jörg Schwenk

Müller-Wille, Heredity Race and Disease - lists.cam.ac.uk ... · Governance in an Age of Genomics (Princeton: Princeton University Press, 2005); ... 6 Staffan Müller-Wille and Hans-Jörg

Klassische Archäologie Lehrveranstaltungen im WiSe20/21 22.09€¦ · W. Müller-Wiener, Die Häfen von Byzantion, Konstantinupolis, Istanbul (Tübingen 1994) P. Gilles, The Antiquities

PATIENT-REPORTED OUTCOMES IN PATIENTS WITH …€¦ · Kirste, Tilman; Hamm, Nicole; Eckert, Ralf; Fichter, Chris-tiane; Müller, Lothar; Sahlmann, Jörg; Potthoff, Karin: No conflicts

Personalrat Universitätsklinik Tübingen · Personalrat Universitätsklinik Tübingen 2/14 Herausgeber: Personalrat Universitätsklinikum Tübingen, Otfried-Müller-Str.49, 72076

für die Technische Gebäudeausrüstung - UKT...TGA-Standard Technisches Betriebsamt, Otfried-Müller-Straße 4, 72076 Tübingen Verantwortlicher: BB-4 T:\Abteilungen-Werkstaetten\BB\BB-4\Projekte

April 2013 1 Jörg Trentmann, Uwe Pfeifroth, Jennifer Lenhardt, Richard Müller Deutscher Wetterdienst (DWD) Evaluation of EURO4M Reanalysis data using Satellite

Windenergiesysteme - Fraunhofer IEE · Eckard Quitmann, Stephan Wachtel, Alfred Beekmann Aktiver Beitrag zur Systemsicherheit durch Windenergie ..... 105 Jörg Müller …

Remote Sens. OPEN ACCESS remote sensing · Richard Müller *, Uwe Pfeifroth , Christine Träger-Chatterjee, Jörg Trentmann and Roswitha Cremer Deutscher Wetterdienst, Frankfurter

Nutzen für die psychologische Diagnostik aus der Interpretation geschätzter raschskalierter Personenparametervarianzen J. M. Müller Universität Tübingen

Perspektiven für das Sportmarketing in Deutschland · 1 Perspektiven für das Sportmarketing in Deutschland-Hyperwettbewerb, Medienkrise und Professionalisierung Dr. Jörg Müller-Lietzkow

FREUNDE DER ERDE - cms.bund-hessen.decms.bund-hessen.de/hessen/dokument/jahresbericht2002.pdf · FREUNDE DER ERDE. Inhalt 2 Impressum Text: Regine Müller unter Mitarbeit von Jörg

PRÜF MIT > AUSGABE 1 > DEZEMBER 2018...Thomas Bulang, Jörg Kunkel, Christian Müller, Andrea Pilch GESTALTUNG PMinteractive GmbH FOTOS/ILLUSTRATIONEN Ralf Hansen, elenabs@istockphoto.com,

1/17...Personalrat Unilini Tbingen Personalrat Unilini Tbingen 1 1 Personalrat Universitätsklinik Tübingen 1/17 Herausgeber: Personalrat Universitätsklinikum Tübingen, Otfried-Müller-Str.49,

BAROMÈTRE NATIONAL DES PRATIQUES …...Baromètre national des pratiques sportives 2018 CREDOC - Pôle évaluation et société Patricia Croutte, Jörg Müller, sous la direction

Benutzbarkeit von Testkennwerte Jörg M. Müller – Universität Tübingen

Jörg Knoll (Hrsg.) · Vielleicht ist dies ein erster Focus, welcher die „Ausblendung des Lernerstandpunktes“ charakterisiert, die Kurt Müller als ursächlich für die Kritik