TentamenTests bij Psychometrics: An Introduction van Furr en Bacharach - 2e druk

Wat omvat de psychometrie allemaal? - Tentamen 1
Wat is belangrijk bij het toekennen van cijfers aan psychologische eigenschappen? - Tentamen 2
Wat betekenen variabiliteit en co-variabiliteit? - Tentamen 3
Wat zijn dimensies en factoranalyse? - Tentamen 4
Wat houdt het basisbegrip betrouwbaarheid in? - Tentamen 5
Hoe kunnen empirische schattingen gedaan worden? - Tentamen 6
Wat is het belang van betrouwbaarheid? - Tentamen 7
Hoe ziet de conceptuele basis van validiteit er uit? - Tentamen 8
Wat is er allemaal van belang bij validiteit? - Tentamen 9
Welke soorten reactiebias zijn er? - Tentamen 10
Welke soorten testbias zijn er? - Tentamen 11
Hoe ziet een confirmatieve factoranalyse er uit? - Tentamen 12
Wat stelt de Generalizability Theory? - Tentamen 13
Wat stelt de Item Reactie Theorie en hoe ziet het Rasch model er uit? - Tentamen 14

Wat omvat de psychometrie allemaal? - Tentamen 1

Oefenvragen

1. Geef voor de verschillen aan welke van de twee onderstaande verschillen (a of b) je meet: 1. intra-individuele verschillen 2. inter-individuele verschillen

Gedrag van individu op verschillende tijdstippen
Gedrag van twee of meer mensen

2. Aan welke voorwaarden hoeft een psychologische test volgens Cronbach niet te voldoen?

Samples op een systematische manier verzameld.
Doel is om het gedrag te meten.
Test moet beschikken over gedragssamples.
Test moet op verschillende momenten afgenomen zijn.

3. Waar zijn malingering en demand characteristics voorbeelden van?

Participant reactivity.
Scoresensitiviteit.
Bias.
Composite scores.

4. Een multiple choice tentamen waarbij je alleen geslaagd of gezakt bent is een voorbeeld van:

Een open-ended en norm referenced test.
Een closed-ended en norm referenced test.
Een open-ended en criterion referenced test.
Een closed-ended en criterion referenced test.

5. Welke zaken zijn van belang bij het meten van een niet direct observeerbaar psychologisch attribuut?

Assumptie van verband , taak aan theorie gelinkt en operationaliseerbare definities.
Betrouwbaarheid, taak aan theorie gelinkt en operationaliseerbare definities.
Assumptie van verband, operationaliseerbare definities en betrouwbaarheid.
Alleen validiteit en betrouwbaarheid.

6. Alle groep 8 leerlingen worden met verschillende opdrachten getest op hun leesvaardigheid. Hiervoor krijgen ze onder andere een lange lijst met allemaal woorden waarvan ze er in 5 minuten zoveel mogelijk moeten lezen. Wat voor een soort test is dit?

Speeded test
Power test
Open-ended test

7. Als er in de situatie zoals bij vraag 6 sprake was geweest van moeilijke woorden waarbij de hoeveelheid correct voorgelezen woorden van belang was geweest wat was het dan voor test geweest?

Open-ended test
Power test
Closed-ended test
Speeded test

8. Psychometrie heeft betrekking op het volgende:

De procedures gebruikt om testattributen te schatten en evalueren.
Het evalueren van verschillen tussen specifieke psychologische testen.

Antwoorden op de oefenvragen

a = 1, b = 2
d
a
d. Dit tentamen is closed-ended omdat iemand kan kiezen uit een beperkt aantal keuzes. Het is criterion referenced omdat er een grens is bepaald (bijv. 13 fout is voldoende) waar iemand aan moet voldoen om het tentamen te halen.
a. Een assumptie van verband tussen het observeerbare gedrag en de attribuut, dit zou betekenen dat de test (in ieder geval gedeeltelijk) valide is. Een theoretische link tussen de taak en de te meten attribuut is van belang om de validiteit mogelijk te maken. Validiteit is van belang omdat er in dit geval bepaald moet worden waarmee je het attribuut kan meten. Operationele definities maken het mogelijk om onduidelijke begrippen te kunnen meten en begrijpen (zoals intelligentie, leren en dromen).
a. Speeded tests zijn tests waarbij niet verwacht wordt dat je de hele test afrond en waarbij de test is hoever je komt met beantwoorden. Er wordt hierbij uitgegaan van een hoge kans dat beantwoorde vragen correct beantwoord zijn.
b. Power tests zijn tests waarbij de antwoorden juist wel van belang zijn, hierbij wordt gekeken naar het gegeven antwoord en aan de hand hiervan een score voor het aantal juiste antwoorden bepaald.
a. Bij psychometrie ligt de nadruk op de attributen van tests en dit kunnen evalueren. Zie pagina 9 van het boek.

Wat is belangrijk bij het toekennen van cijfers aan psychologische eigenschappen? - Tentamen 2

Oefenvragen

1. Aan welke eigenschap moet een categorie voldoen?

Categorieën moeten wederkerig uitsluitend zijn.
Proefpersonen binnen de categorie moeten op de gekozen eigenschap identiek zijn.
Iedereen moet in een categorie passen.
Alle bovenstaande.

2. Combineer de begrippen aan de juiste voorbeelden:

1. Nominaal

2. Ordinaal

3. Ratio

4. Interval

a. Leeftijd

b. Intelligentie

c. Geslacht

d. Reactietijd

3. Bepaal of de uitspraken waar of niet waar zijn.

Een meeteenheid is arbitrair omdat de oorspronkelijke eenheid arbitrair bepaald is.
Een meeteenheid is arbitrair omdat deze meerdere soorten objecten kan meten.
Een meeteenheid is arbitrair omdat deze meerdere soorten metingen kan verrichten.

4. Bij een interval schaal kan men de volgende berekeningen toepassen:

Bij een interval schaal kan je niet iets berekenen alleen onderscheid maken in categorieën.
Je kan hierbij optellen en aftrekken.
Je kan hierbij vermenigvuldigen en delen maar ook optellen en aftrekken.
Je mag hierbij alleen vermenigvuldigen en delen.

5. Welke van deze vier voorbeelden hoort thuis in een interval schaal?

Graden Celsius
Reactietijd
Geld
Afstand

6. Wat is het verschil tussen een ordinale schaal en een nominale schaal?

Bij een nominale schaal is er geen nulpunt en bij een ordinale schaal wel.
Bij een nominale schaal is er geen volgorde en bij een ordinale schaal wel.
Bij een ordinale schaal is er geen nulpunt en bij een nominale schaal wel.
Bij een ordinale schaal is er geen volgorde en bij een nominale schaal wel.

7. Meten met een meeteenheid gaat uit van een belangrijke assumptie, welke is dit?

De maat van de meeteenheid moet altijd dezelfde maat hebben.
De meeteenheid kan altijd op meerdere manieren gebruikt worden.

8. Bij een rijexamen is er sprake van een ….. variabele waarbij men kan slagen of zakken. Het bloedtype van een proefpersoon is op basis van een …. variabele.

Dichotome, Categorische
Dichotome, Continu
Categorische, Dichotome
Categorische, Continu

Antwoorden op de oefenvragen

d. De drie genoemde eisen zijn de standaard eisen waar een categorie aan moet voldoen.
1 = c want geslacht heeft categorieën maar geen volgorde,
2 = a want leeftijd heeft een volgorde,
3 = d want reactietijd heeft een absoluut nulpunt,
4 = b want intelligentie heeft een arbitrair nulpunt.
Alle drie de uitspraken zijn waar, pagina 25 en 26 in het boek stukje: Units of Measurement licht kenmerken van meeteenheden toe.
b. bij een interval schaal heb je een arbitrair nulpunt, je kan daarom niet vermenigvuldigen en delen.
a. Bij graden celsius is er een arbitrair nulpunt, daarom is een interval schaal hier geschikt voor.
b. Nominaal geeft alleen verschil aan en interval geeft, naast een verschil, ook een volgorde aan.
a. als de maat van de meeteenheid niet altijd hetzelfde is kun je er niet mee meten omdat je totaal dan geen/ weinig informatie geeft.
a. dichotoom heeft 2 opties: (0 of 1 / zakken of slagen etc.) en een categorische variabele heeft meerdere categorieën( niet per se gelimiteerd tot 2 opties).

Wat betekenen variabiliteit en co-variabiliteit? - Tentamen 3

Oefenvragen

1. Wat is het verschil tussen variabiliteit en covariabiliteit?

Het onderwerp wat vergeleken wordt met een ander (bij beide hetzelfde) onderwerp.
De onderwerpen die met elkaar vergeleken worden.
Beide bovenstaande antwoorden zijn correct.
Geen van bovenstaande antwoorden is correct.

2. Er wordt een test (Test A) uitgevoerd waarbij er sprake is van meerdere meetmomenten. Iedere participanten doet op ieder meetmoment opnieuw dezelfde test (Test A). De meetresultaten van de verschillende participanten op alle momenten worden met elkaar vergeleken. Naar welke verschillen kan er gekeken worden?

Alleen intra-individuele verschillen.
Alleen Interindividuele verschillen.
Zowel intra-individuele als interindividuele verschillen.
Geen van beide verschillen.

3. Bereken het gemiddelde van beide rijen afzonderlijk:

100, 120, 110, 105, 115.
11, 13, 17, 33, 16, 6.

4. Bereken de variantie vanuit de volgende standaard deviaties:

s = 100
s = 1
s = 25,2

5. Bereken de standaard deviaties vanuit de volgende varianties:

S2 = 2500
S2 = 900
S2 = 144

6. Combineer de meest waarschijnlijke correlaties aan de goede onderwerpen:

1. 0,65	a. De correlatie tussen alcoholpromillage en de vaardigheid om recht over een lijn te lopen.
2. -0,65	b. De correlatie tussen opleidingsniveau en inkomen
3. 0,0	c. De correlatie tussen haarkleur en geslacht.

7. Bij een Sum of Squares van 2000 met N=5 wat is de standaard deviatie?

20
400
22,36
√500

8. Vul de tabel (a t/m e) verder in:

	Deviatie X	Deviatie Y	Cross-product
a.	0	20
b.	10	10
c.	0	30
d.	20	5
e.	5	10

9. Welke correlatie lijst(en) kunnen kloppen?

a.	b.	c.	d.
0,5	0,5	0,9	-0,9
-0,5	0,7	0,4	-0,7
0,7	0,2	1,4	-0,6
0,2	0,8	0,8	-1,6

Antwoorden bij de oefenvragen

b. Covariabiliteit is de mate waarmee de variabiliteit tussen verschillende score sets met elkaar overeenkomen. Variabiliteit is het verschil binnen een set scores. Daarom zijn de onderwerpen verschillend en is er geen sprake van 1 hetzelfde onderwerp bij covariabiliteit en variabiliteit.

c. Er kan zowel naar intra-individuele verschillen (de resultaten van een participant over alle meetmomenten) gekeken worden als naar interindividuele verschillen (tussen de participanten).

a. 100+120+110+105+115= 550. 550/N = gemiddelde. 550/5 = 110
a. 11+13+17+33+16+6 = 96 --> 92/6 = 16

S2 is de variantie. Dus om van s naar s2 te gaan, hoeft dit alleen maar gekwadrateerd te worden. a is daarom 1002= 10.000, b is 12= 1, en c is 25,22= 635,04.

S2 is de variantie, om vanuit deze variantie naar standaard deviaties om te rekenen hoeft er alleen maar √s berekend te worden.

1=b, 2= a, 3= c
Hoe hoger je alcoholpromillage, hoe minder goed de vaardigheid om recht over een lijn te lopen zal zijn, dit is dan ook een negatief verband. De hoogte van je opleidingsniveau zal waarschijnlijk een positief verband hebben met je inkomen.

a. Vanaf een sum of squares kan je gemakkelijk een standaard deviatie berekenen door eerst de variantie te berekenen: delen door de N. Dit is 2000/5 = 400. Daarna kan je vanaf de variantie bij de standaard deviatie terecht komen door de wortel van 400 te bepalen. Dit is 20.

Om een kruisproduct te berekenen kun de deviaties met elkaar vermenigvuldigen.
a = 0 x 20 = 0
b = 10 x 10 = 100
c = 0 x 30 = 0
d = 20 x 5 = 100
e = 5 x 10 = 50
Lijst a en b zijn goed, correlaties kunnen tussen de -1 en 1 zijn.

Wat zijn dimensies en factoranalyse? - Tentamen 4

Oefenvragen

1. Welke vragen worden gesteld in verband met de dimensionaliteit van een test?

I. Hoeveel dimensies de test heeft.

II. Hoe deze dimensies gemeten worden

III. Wanneer deze dimensies gemeten worden

IV. Of de dimensies gecorreleerd zijn.

Alleen I. en II. zijn waar
Alleen III. en IV. zijn waar
Alleen I. en IV. zijn waar
Alleen II. en III. zijn waar

2. De WISC intelligentietest is een voorbeeld van een:

Unidimensionale test.
Multidimensionale test met gecorreleerde dimensies.
Multidimensionale test zonder gecorreleerde dimensies.

3. Combineer de begrippen:

1. Unidimensionale test

2. Multidimensionale test met gecorreleerde dimensies

3. Multidimensionale test zonder gecorreleerde dimensies

a. Test with higher order factors

b. Conceptuele homogeniteit

c. Test without higher order factors

4. Welke bewering(en) is/zijn waar?

I. Een test waarbij vragen alleen rekenvaardigheid reflecteren is een unidimensionale test.

II. Een test waarbij rekenvaardigheid en leesvaardigheid gereflecteerd worden is eenmultidimensionale test.

III. De WISC is een unidimensionale test.

Alleen I. en II. zijn waar
Alleen I. is waar
Alleen II. is waar
Alleen II. en III. zijn waar
Geen van de beweringen is waar

5. Welke bewering(en) is/zijn niet waar?

EFA wordt het vaakst gebruikt van de factoranalyses.
De eerste stap van het uitvoeren van een EFA is het identificeren van het aantal dimensies.
Er is geen simpele regel voor het identificeren van het aantal dimensies.
Bij Eigenvalues zoek je naar een punt met groot verschil tussen de opeenvolgende eigenvalues.

6. Wanneer we naar de Eigenvalues greater than 1.0 regel kijken, hoeveel dimensies zijn er dan?

Factor	Total
1	1,500
2	1,200
3	0,900
4	0,750
5	0,450
6	0,350

1
2
3
4 of meer

7. Welke van deze beweringen zijn waar?

I. CFA gebruik je als je al een beter beeld hebt bij de test.

II. Met een CFA controleer je je eigen idee over bijvoorbeeld dimensies.

Alleen I. is waar
Alleen II. is waar
Beide beweringen zijn waar
Beide beweringen zijn niet waar

Antwoorden op de oefenvragen

Antwoord c is juist, er worden 3 vragen behandeld in het boek. ( zie de tabel op blz. 72)
b: Een intelligentietest bestaat uit een algemene factor gemeten door verschillende subfactoren. De verschillende soorten intelligentie zijn de subfactoren in dit voorbeeld.
1 b
2 a
3 c
a: Een test waarbij vragen alleen rekenvaardigheid reflecteren is een unidimensionale test omdat er maar 1 dimensie gemeten wordt. Bij rekenvaardigheid en leesvaardigheid zijn dit er twee, daarom is dit inderdaad een multidimensionale test. Een WISC is zoals toegelicht bij vraag 2 is een multidimensionale test en geen unidimensionale test dus III. was niet correct.
b: het identificeren van het aantal dimensies ofwel factoren is de tweede stap bij het uitvoeren van een EFA niet de eerste, de eerste stap is het kiezen van een statistische techniek.
b, bij de eigenvalue greater than 1,0 regel kijk je naar de aantal waardes groter dan 1. Iedere van deze waardes hoger dan 1 telt als dimensie.
c. Beide uitspraken zijn waar. CFA is een test om jouw bestaande idee over de test te controleren.

Wat houdt het basisbegrip betrouwbaarheid in? - Tentamen 5

Oefenvragen

1. Uit welke van de onderstaande factoren is betrouwbaarheid niet afgeleid volgens de Klassieke Testtheorie?

Ware scores
Geobserveerde scores
Totale scores
Meetfouten

2. Wat is een belangrijke assumptie over de error?

De error heeft een random effect en is onafhankelijk van de variabelen.
Het effect van error is 0.
De error heeft geen random effect en is niet onafhankelijk van de variabelen.

3. Wat zijn de gevolgen van de assumptie van vraag 2? Je mag meerdere antwoorden selecteren.

Het gemiddelde effect van de error is nul.
Error scores zijn niet gecorreleerd met ware scores.
Error scores zijn niet gecorreleerd met geobserveerde scores.
Error scores zijn wel gecorreleerd met ware scores.
R2oe= 0.4, S2e= 20

4. Wat is de betrouwbaarheid?

0,6
0,4
5
1,6
S2e = 200, S2o = 600

5. Wat is de betrouwbaarheid?

0,33
0,50
0,67
0,75

6. Welke van de volgende beweringen zijn niet waar?

Als r2oe nul is, is de betrouwbaarheid 1.
Als r2oe nul is, is de betrouwbaarheid ook nul.
Als coe 1 is, is s2e dat ook.
Als coe 1 is, is s2e 1.

7. Wat is waar?

I. Sem kan nooit groter zijn dan So

II. Sem is 0 als Rxx 1 is.

Alleen I. is waar
Alleen II. is waar
Beide antwoorden zijn waar.
Geen van de antwoorden is waar.

8. Soms kunnen twee testen parallel genoemd worden. Geef van iedere van de onderstaande aannames aan of deze test hieraan moet voldoen:

Beide tests hebben dezelfde errorvariantie.
Beide tests hebben hetzelfde gemiddelde.
De ware scores van de tests zijn gelijk over alle testen.
Rxx= 0,7, S2o=200

9. Wat is Se?

3,439
11,832
28
140

Antwoorden op de oefenvragen

c. Totale scores horen er niet bij. Betrouwbaarheid is opgebouwd uit ware scores, geobserveerde scores en meetfouten.
a.
a en b.
a. Rxx= 1-r2oe. Dus 1-0,4 = 0,6
c. S2e = 200
S2o = 600, S2t= 600-200 = 400.
Rxx= 400/600 = 0,67
b en d zijn niet waar: Rxx= 1-r2oe. En coe is gelijk aan s2e.
c. een error kan niet hoger zijn dan de totaal geobserveerde score. Als er geen meetfout zou zijn was er een perfecte betrouwbaarheid.
a. wel
b. niet
c. wel , lees de voorwaarden eventueel nog een keer door op pagina 121 van het boek of de laatste pagina van het hoofdstuk in de samenvatting.
Rxx= 0,7, S2o=200.
Se bereken je met S2e als tussenstap.
x/200=0,7. 0,7x200=140.
S2e=140.
√( S2e) = Se.
√140= 11,83. Dit is antwoord b.

Hoe kunnen empirische schattingen gedaan worden? - Tentamen 6

Oefenvragen

1. Wanneer is er sprake van een paralleltest?

I. De twee testen zijn parallel als beide testen dezelfde set ware scores meten.

II. De twee testen zijn parallel als ze allebei evenveel errorvariantie hebben.

III. De twee testen zijn parallel als dezelfde test twee keer wordt gemeten.

alleen bij I.
alleen bij I. en II.
alleen bij II.
bij II. en III.

2. Als proefpersonen een afwijkende score hebben door een eerdere test, kan er dan een goede betrouwbaarheid gemeten worden vanuit een paralleltest?

Nee, er is dan geen sprake meer van een paralleltest
Ja, de betrouwbaarheid kan nog gemeten worden
Dit is onbekend

3. Welke van de redenen, waarom de stabiliteitsassumptie van de test-hertest betrouwbaarheid problematisch kan zijn, zijn echte redenen? (Er kunnen meerdere antwoorden goed zijn.

Sommige attributen zijn niet zo stabiel als andere attributen.
De intervallengtes brengen soms problemen met zich mee.
Sommige periodes in het leven van een participant zijn niet zo stabiel.

4. Wat is het gevolg van het niet kloppen van de stabiliteitsassumptie?

De betrouwbaarheid kan niet goed gemeten worden.
De meetfout en de verandering v.d. ware scores kunnen niet gemakkelijk opgesplitst worden.
Zowel a als b zijn waar.
a en b zijn beide niet waar.

5. Interne consistentie is een praktisch alternatief voor ‘alternate form’ en test-hertest betrouwbaarheid. Waarom is dit het geval?

Er is niet meer dan 1 test nodig.
Er is niet meer dan 1 test moment nodig.
Zowel a als b zijn waar.
a en b zijn niet waar.

6. Wanneer we kijken naar Split half estimates, en de rhh = 0,4. Wat is dan de Rxx?

0,38
0,40
0,57
0,80

7. Wat is de betrouwbaarheid wanneer je over deze gegevens beschikt?

ii = 0,6. K=5.

0,33
0,66
0,88
0,95

8. Welke berekening is gebruikt bij de vorige vraag?

Raw coefficient alpha.
Split half estimates
Standardized coefficient alpha
Raw alpha voor binaire items

Antwoorden op oefenvragen

b. 1 en 2 zijn de standaardregels m.b.t. de paralleltest, regel nummer 3 heeft te maken met test-hertest betrouwbaarheid.
a. dit zou volgens de klassieke testtheorie betekenen dat de errorscores wel correleren waardoor er geen sprake meer is van een echte paralleltest.
Alle drie de antwoorden kloppen .
c. Als de stabiliteitsassumptie niet klopt heb je een score met daarin de verandering van de ware score en de meetfout, dus kan je geen van beide los bepalen. Je betrouwbaarheid kan door deze meetfouten niet goed berekend worden.
c. Bij een interne consistentie betrouwbaarheid heb je maar 1 test nodig en ook maar 1 testmoment om te bepalen wat de betrouwbaarheid is.
c = 0,57. Rxx= 2rhh / 1+rhh.
Rxx= (2x0,4)/ 1,4 = 0,8/1,4 = 0,57.
c = 0,88. Rxx= kii / 1+(k-1) ii.
Rxx= (5x0,6) /(1+4x0,6) = 3/3,4 = 0,88
Standardized coefficient alpha.

Wat is het belang van betrouwbaarheid? - Tentamen 7

Oefenvragen

1. Hoe ziet de formule voor de geschatte ware score eruit?

Xest = +Rxx(Xo-)
Xest = X + Rxx(Xo-X)
Xest = + Rxx(Xo-Xe)
Xest = X+Rxx(Xo-Xe)
Rxx = 0,5, So = 5

2. Wat is de Sem?

2,35
2,50
3,54
5,71

3. Wat is het 95% betrouwbaarheidsinterval voor de volgende gegevens?

Sem = 5, Xt = 15, Xe = 5.

4. Welke van de beweringen kloppen?

Covariantie van X en Y heeft deze formule: Covx0y0=Cxtyt+cxtye+cxeye+Cxeyteo.
Covariantie van X en Y heeft deze formule: Cx0y0=cxtyt+cxtye+cxeyt+cxeye.
Covariantie van X en Y heeft een verkorte formule: cxy=cxtyt
Covariantie van X en Y heeft een verkorte formule: cxy=cxtyt/SoSy0

5. Welke van deze gevolgen van meetfouten is niet waar?

Geobserveerde score correlaties zullen altijd zwakker zijn dan die van ware scores.
Het is niet mogelijk een inschatting te geven van de ware correlatie, als deze niet beïnvloed was door verzwakking, tussen twee constructen.
De error beperkt de maximaal te vinden correlatie.
De mate van verzakking (attenuation) hangt samen met de mate van betrouwbaarheid van de individuele testen.

6. Wat betekent het om een hoge item-totaal correlatie te hebben?

Dat een persoon op een bepaald item lijkt op het geheel van de participanten.
Dat een persoon op een bepaald item niet lijkt op het geheel van de participanten.
Dat een test-item consistent is met de test.
Dat 1 participant op een bepaald item afwijkt ten opzichte van zijn geheel aan antwoorden.

7. Wat wordt vergeleken bij de item discriminatie index (D)?

De proportie (p) van mensen die hoog scoorden op de test met de proportie (p) van mensen die laag scoorden op de test. Zowel goed als fout beantwoorde vragen.
De proportie (p) van mensen die hoog scoorden op de test met de proportie (p) van mensen die laag scoorden op de test. Alleen wanneer goed beantwoorde vragen.
Het effect van een item op een test met andere items op dezelfde test.
Het proportie items waar goed op geantwoord is.

8. Wat zegt een itemgemiddelde van 0,85 bij een binaire test?

Dat 85% van de participanten een item goed heeft beantwoord.
Dat een participant 85% kans heeft op een goed antwoord.
Dat een item 85% betrouwbaar is.
Geen van de bovenstaande antwoorden.

Antwoorden op oefenvragen

A.
C. Sem = So√(1-Rxx). Sem= 5 x √(0,5).
5 x √(0.5)=5 x 0,707 = 3.535 ≈ 3.54.
Voor het betrouwbaarheidsinterval is er deze formule:
De z score bij 2 standaarddeviaties(95%) is 1,96. Die houden we aan in de formule.
Xo±(1,96)(Sem).
Sem is 5 dus Xo is de enige onbekende in de formule. We weten dan Xt+Xe=Xo.
Dus Xo is in dit geval 15+5 = 20.
20±(1,96)(5). --> 20±9,8. Betrouwbaarheidsinterval v. 95%: 10,2 tot 29,8.
b en c zijn goed, D is de correlatie die berekend kan worden uit deze covariantie. a heeft wat notatiefoutjes. (zie hoofdstuk 7 in de samenvatting)
b is fout want consequentie 4 geeft aan dat het mogelijk is de ware correlatie te schatten tussen een tweetal constructen. Er is een formule (de correctie van verzwakking) waarbij de ware correlatie mee geschat kan worden als er geen sprake zou zijn van verzwakking.
c.
b. alleen goed beantwoorde vragen worden meegenomen in deze vergelijking.
a. 0,85 geeft de mate aan waarin participanten een item goed hebben beantwoord en dit staat gelijk aan 85%

Hoe ziet de conceptuele basis van validiteit er uit? - Tentamen 8

Oefenvragen

Face validiteit is:
1. De mate waarin een meting gerelateerd lijkt aan een specifiek construct.
2. De mate waarin een meting gerelateerd is aan een specifiek construct.
3. De zichtbare betrouwbaarheid van de test.
4. De mate waarin de constructen goed gemeten worden.
Een tets waarvan onder andere participanten denken dat dit gerelateerd is aan een construct, heeft een hoge:
1. Content validiteit
2. Face validiteit
3. Betrouwbaarheid
4. Effect size
Als iemand wil weten of een test een goede meetmethode is voor een construct:
1. Geeft content validiteit goede informatie
2. Geeft face validiteit goede informatie
3. Geeft betrouwbaarheid goede informatie
Factor analyse zorgt ervoor:
1. Dat de interne structuur van een test gemeten kan worden.
2. Dat aparte factoren toegevoegd kunnen worden.
3. Dat factoren verwijdert worden.
4. Dat een factor van een test geanalyseerd kan worden.
Welke functie heeft Factor analyse niet?
1. Gelinkte items aan bijbehorende factoren koppelen.
2. Verbanden tussen factoren in een multidimensionale test vinden.
3. Uitvinden van aantal factoren in set van items
4. Onderscheiden van items binnen een factor.
Motivatie is in onze resultaten gecorreleerd aan betere resultaten, dit zou theoretisch ook zo moeten zijn. Er is sprake van:
1. Discriminant bewijs
2. Convergent bewijs
3. Geen van beide
4. Zowel a als b
In de theorie zijn IQ en geluk niet gecorreleerd, er komt geen verband terug in het onderzoek. Er is sprake van:
1. Discriminant bewijs
2. Convergent bewijs
3. Geen van beide
4. Zowel a als b
Het theorie rijexamen is een voorbeeld van:
1. Concurrent validity
2. Predictive validity
3. Discriminant bewijs
Is het waar dat criterium validiteit wordt gebruikt om groepen te onderscheiden?
1. Ja
2. Nee
3. Hier kan geen uitspraak over gedaan worden.

Antwoorden op de oefenvragen

a. Bij face validiteit draait het er alleen om dat het zo gerelateerd lijkt, niet of het wel of niet zo is.
b. Participanten en dergelijke verstaan wij in het algemeen onder de non-experts en als wij kijken naar de opinie over de validiteit van deze groep hebben we het over Face validiteit: of het in de eerste instantie zo lijkt te zijn.
a. In dit geval is de inhoud wel van belang, en hoe het eruit zien en hoe betrouwbaar het is zijn hierbij van minder belang.
a.
d.
b.
a. Discriminant bewijs beschrijft de mate waarin testscores ongecorreleerd zijn met tests van ongecorreleerd construct.
b. Want de meting is de mate waarin de huidige testscore (kennis over verkeersregels) gecorreleerd is met een relavante variabele die in de toekomst pas gemeten kan worden (het kunnen autorijden en de verkeersregels toepassen).
a. Ja criterium validiteit kan groepen verdelen (wel voldaan en niet voldaan aan een specifiek criterium)

Wat is er allemaal van belang bij validiteit? - Tentamen 9

Oefenvragen

Validiteit generalisatie onderzoek heeft als doel:
1. Het evalueren van het voorspellend vermogen van een testscore over verschillende settings en situaties
2. Het evalueren van voorspellend vermogen van testscores binnen een setting of situatie
3. Het vergelijken van alle soorten validiteit
4. Geen van de bovengenoemde opties
Waar staat MTMMM voor?
Wat is geen belangrijk kenmerk van een MTMMM?
1. Er worden meerdere metingen voor traits uitgevoerd.
2. Er worden meerdere soorten metingen uitgevoerd.
3. Er wordt onder andere gedeelde methode variantie ontweken
4. Er wordt bij heterotrait-heteromethod de sterkte correlatie verwacht.

Verbind de soorten correlaties aan de voorbeelden:

Correlatie

Voorbeeld

1. Heterotrait-heteromethod

2. Heterotrait-monomethod

3. Monotrait-heteromethod

4. Monotrait-monomethod

a. Sociale vaardigheidsmeting via observatie en geluksgevoel via vragenlijst.

b. Sociale vaardigheid via observatie en vragenlijst.

c. Geluksgevoel en sociale vaardigheid via vragenlijst.

d. Geluksgevoel via vragenlijst

Welke beweringen zijn waar?
1. QCV is bedoeld om een precieze en objectieve schatting te geven.
2. QCV is in deze nadruk op precisie anders dan eerder besproken aanpakken.
3. rcontrastCV is een van de effect sizes.
4. Een waarde van ralertingCV van -0,5 is mogelijk.
Bereken de correlatie tussen motivatie en algemene interesse.
Ware correlatie is 0,6, Motivatietest is 0,81 betrouwbaar, Algemene interesse is 0,49.
1. 0,238
2. 0,378
3. 0,622
4. 0,762
De formule voor de correlatie tussen een continue en een dichotome variabele (rCD) is:
1. rCD = cCD / SD
2. rCD = cCD / sCsD
3. rCD = p1p2 (C2gem – C1gem)
Als er uitgegaan wordt van de richtlijn van Cohen en er is een betrouwbaarheid van 0,58.
1. Dan is dit een kleine correlatie
2. Dan is dit een medium correlatie
3. Dan is dit een grote correlatie
4. Hier zijn onvoldoende gegevens voor bekend
Als er uitgegaan wordt van de richtlijn van Hemphill en er is een betrouwbaarheid van 0,29.
1. Dan is er geen sprake van een kleine correlatie
2. Dan is dit een kleine correlatie
3. Dan is dit een medium correlatie
4. Dan is dit een grote correlatie

Antwoorden op de oefenvragen

a.
MultiTrait-MultiMethod Matrices. (wat hier hoofdletters heeft vormt samen MTMMM)
d. bij een heterotrait-heteromethod wordt juist de laagste correlatie verwacht omdat correlaties door het gebruiken van dezelfde methode en dergelijke eruit gefilterd zijn.
1a, 2c, 3b, 4d. zie bladzijde 232 van het boek voor meer overzichtjes hierover.
Alle vier de beweringen zijn waar.
b. Rxoyo = rxtyt √(RxxRyy).
Rxoyo = 0,6 x(0,9x0,7)=0,6x0,63=0,378
a.
c.
b.

Welke soorten reactiebias zijn er? - Tentamen 10

Oefenvragen

Op een multiple choice toets is er kans op welke types van response bias?
1. Acquiensence bias
2. Extreme and moderate responding
3. Sociale wenselijkheid
4. Overdrijven van problemen
5. Random antwoorden
6. Gokken
Bij welke bias is een participant het te snel eens of oneens met een statement, zonder de betekenis hiervan volledig te snappen?
1. Acquiensence bias
2. Extreme and moderate responding
3. Sociale wenselijkheid
4. Overdrijven van problemen
5. Random antwoorden
6. Gokken
Als we spreken over een puntschaal waarbij een participant bijna altijd ongeveel in het midden scoort, met welke bias hebben we dan mogelijk te maken?
1. Acquiensence bias
2. Extreme and moderate responding
3. Sociale wenselijkheid
4. Overdrijven van problemen
5. Random antwoorden
6. Gokken
Wanneer een test niet anoniem is, is er meer kans op:
1. Acquiensence bias
2. Extreme and moderate responding
3. Sociale wenselijkheid
4. Overdrijven van problemen
5. Random antwoorden
6. Gokken
Wat voor bias is waarschijnlijk bij iemand die de test lang vind duren en saai vind.
1. Acquiensence bias
2. Extreme and moderate responding
3. Sociale wenselijkheid
4. Overdrijven van problemen
5. Random antwoorden
6. Gokken
Als iemand profijt heeft bij bijvoorbeeld een diagnose van een aandoening, welke bias zou dan kunnen voorkomen?
1. Acquiensence bias
2. Extreme and moderate responding
3. Sociale wenselijkheid
4. Overdrijven van problemen
5. Random antwoorden
6. Gokken
Welke stellingen zijn correct?
1. Een goede manier om antwoordbias tegen te gaan is door de test zo te maken dat de kans hierop kleiner wordt.
2. Het anoniem maken van tests vermindert sociaal wenselijke antwoorden.
3. Aan anonimiteit zitten weer risico’s voor andere vormen van bias.
4. Een betere concentratie van de participant zou kunnen helpen bias te voorkomen.
Welke van de genoemde stellingen zijn waar?
1. Te lange tests hebben een negatief effect op de validiteit.
2. Als een participant denkt dan onoprechte antwoorden herkent kunnen worden neemt de validiteit toe.
3. Beide zijn waar.
4. Geen van de antwoorden is waar.

Bij welke van de vier opties hoort het voorbeeld:
Een man gaat naar de dokter voor een test van een aandoening. Een week later krijgt hij te horen dat uit de test blijkt dat hij inderdaad de aandoening heeft. De test is incorrect.
1. True positive
2. False positive
3. False negative
4. True negative
Wanneer we de sensitiviteit berekenen, delen wij de 1. … door 2….
1. 1 is true positive en 2 is allen met stoornis.
2. 1 is false negative en 2 is allen met stoornis.
3. 1 is true negative en 2 is allen zonder stoornis.
4. 1. Is false positive en 2 is allen zonder stoornis.

Antwoorden op de oefenvragen

f. er is kans dat mensen zullen gaan gokken bij een meerkeuze toets.
a. Acquiensence bias houdt in dat mensen snel ja of nee of in een richting antwoorden op een stelling zonder goed na te denken over wat de betekenis hiervan is.
b. In dit geval is er sprake van moderate responding, dit houdt in dat mensen de extreme waarden in een schaal vermijden en hierdoor de wat meer naar het midden liggende antwoorden geven.
c. Als mensen meedoen aan een test waarbij hun naam opgegeven moet worden is de kans groter dat ze sociaal wenselijke antwoorden zullen geven.
e. Als iemand de test saai vind of te lang vind duren bestaat er een kans dat diegene niet meer serieus de vragen zal lezen en beantwoorden. Diegene zal dan random of beurtlings antwoord gaan geven op vragen wat niets meer met zijn of haar eigen mening/ervaringen te maken heeft.
d. Overdrijven van problemen (Malingering) is een verschijnsel waarbij iemand doet alsof zijn of haar hersenletsel/ aandoening / dergelijke erger is dan daadwerkelijk het geval is, omdat diegene hier persoonlijk gewin uit kan krijgen. Toeslagen, uitkering, andere zorg of schadevergoedingen kunnen als voorbeelden worden gezien voor een dergelijk persoonlijk gewin.
Alle stellingen zijn waar.
Beide zijn waar.
b. een false positive: het resultaat blijkt positief te zijn maar dit resultaat is niet terecht.
a. we kijken naar de true positive: mensen met de diagnose die ook echt de aandoening blijken te hebben t.o.v. alle mensen met de aandoening.

Welke soorten testbias zijn er? - Tentamen 11

Oefenvragen

Wat is niet mogelijk met construct bias?
1. Scores van mensen uit verschillende groepen met elkaar vergelijken.
2. Scores van individuen uit 1 groep met elkaar vergelijken.
3. Een test er goed uit laten zien voor non-experts.
Voorspellende bias is er wanneer:
1. De relatie tussen ware en geobserveerde score verschilt tussen twee groepen.
2. Er geen relatie is tussen ware en geobserveerde score.
3. De relatie tussen ware en geobserveerde score juist op elkaar lijkt bij twee groepen.
4. Geen van de bovenstaande opties.
Welke stelling is waar?
I. Item discriminatie index kan gebruikt worden om construct bias te ontdekken.
II. Differentiële item functie analyse kan ook gebruikt worden om construct bias te ontdekken.
III. Factor analyse kan gebruikt worden om de interne structuur van een test te evalueren, apart voor twee groepen.
1. Alle stellingen zijn waar
2. Alleen stelling I. en II. zijn waar
3. Alleen stelling I. en III. zijn waar
4. Alleen stelling II. en III. zijn waar
5. Geen van de stellingen is waar
Zijn deze uitspraken waar of niet waar:
1. De predictieve en de construct bias zijn onafhankelijk van elkaar.
2. De predicitieve bias draait meer om de betekenis van de test.
3. De construct bias draait meer om de bruikbaarheid van de test.
Is een verschil in testscores tussen groepen genoeg reden om aan te nemen dat er dan een bias is? (mogelijk meerdere antwoorden)
1. Ja, dit is een duidelijke indicatie en is daarom reden genoeg.
2. Nee, er kan ook sprake zijn van een daadwerkelijk verschil tussen groepen.
3. Ja, maar alleen als de verschillende reacties niet gerelateerd zijn aan de groepsverschillen.
Welke stelling is waar?
I. Twee aparte groepen in een test vertonen niet dezelfde interne structuur voor hun testscores. We kunnen daarom concluderen dat de test lijdt aan construct bias.
II. Twee aparte groepen in een test vertonen dezelfde interne structuur voor hun testscores. We kunnen daarom concluderen dat de test niet lijdt aan construct bias.
1. Alleen stelling I. is waar
2. Alleen stelling II. is waar
3. Beide stellingen zijn waar
4. Geen van beide stellingen is waar
Wat is geen methode om construct bias te ontdekken?
1. item discriminatie index
2. factor analyse
3. differentiële item functie analyse
4. item order
Zijn deze stellingen waar of niet waar?
1. Wanneer de gemeenschappelijke regressielijn overeenkomt met de gescheiden lijnen per groep is er een sprake van bias.
2. De gemeenschappelijke regressielijn is gebaseerd op een regressieformule aan de hand van alle data uit 1 groep.
Zijn deze stellingen waar of niet waar?
1. Bij een interceptbias zijn de regressielijnen parallel aan elkaar.
2. Bij een slopebias zijn de regressielijnen parallel aan elkaar.
Bij welke bias is er sprake van verschilconsistentie?
1. Interceptbias
2. Slopebias
3. Intercept en slopebias
4. Bij geen enkele van de bovenstaande biases is er sprake van verschilconsistentie.

Antwoorden op de oefenvragen

a. Want construct bias houdt in dat scores op een test verschillende betekenissen kunnen hebben voor verschillende groepen. Met deze reden kunnen ze niet goed vergeleken worden.
a.
a. alle uitspraken zijn correct.
Alleen uitspraak a. is waar, de soorten bias bij b en c zijn namelijk omgedraaid.
b. en c. zijn goed, a. niet, dit is een te snelle en eenduidige conclusie.
a.
d. Rank order is wel een methode om construct bias te ontdekken maar item order niet.
a is waar, b. niet: de regressieformule voor de gemeenschappelijke regressielijn is gebaseerd op de data uit alle groepen, niet uit slechts 1 groep.
Ja, alleen het intercept verschilt tussen de groepen, de richtingscoëfficiënt is gelijk.
a. Bij interceptbias blijft het verschil constant terwijl de x stijgt of daalt. Bij de rest is dit niet het geval.

Hoe ziet een confirmatieve factoranalyse er uit? - Tentamen 12

Oefenvragen

CFA kan gebruikt worden om hypotheses over de interne structuur van een meetmodel te evalueren. Maar wat zijn de stappen die je moet nemen voor je hieraan kan beginnen?
I. Negatief gecodeerde items omgekeerd scoren.
II. Duidelijk maken welk construct je gaat meten + alvast aantal items ontwikkelen
III. Participanten vinden
IV. Zelf de test alvast maken
1. Alleen I. en II. zijn waar
2. Alleen I. en III. zijn waar
3. Alleen II. en III. zijn waar
4. Alleen I., II. en III. zijn waar
5. Alleen II., III. en IV. zijn waar
6. Alle stellingen zijn waar
7. Geen van de stellingen is waar
Als er een CFA uitgevoerd wordt, wat moet er dan als eerst worden vastgesteld?
Een factorlading is:
1. Hoeveelheid invloed van een factor op de test.
2. De mate waarin een item verbonden is met een factor.
3. De betrouwbaarheid van een factor
4. De mate waarin een factor verbonden is met een andere factor.
In de vierde stap wordt van het uitvoeren van de CFA met software wordt informatie gegeven over:
1. Varianties en covarianties
2. Fit ofwel geschiktheid van model
3. Geschatte parameters
4. Geïmpliceerde varianties en covarianties
Wat zegt een significante chi-kwadraat over het veronderstelde model?
1. Dit geeft aan dat er een slechte fit is, dit betekend dat het aantal dimensies volgens de test niet overeenkomt met de werkelijke uitkomst.
2. Dit geeft aan dat er goede fit is, dit betekend dat het aantal dimensies volgens de test wel overeenkomt met de werkelijke uitkomst.
3. Dit geeft aan dat het model per definitie een te grote steekproef had.
4. Dit kan betekenen dat er een goede fit is, en dat de steekproef goed was, wat de test nog betrouwbaarder maakt.
Welke van de factorladingen heeft de minste kans om in de test te blijven?
1. Factor-item a = 0,82
2. Ffactor-item b = 0,78
3. Factor item c = 0,35
4. Factor item d = 0,46
5. Factor-item e = 0, 65
Hoeveel lower-order factoren heeft het model?
1. 2
2. 4
3. 5
4. 6
Welke van de “lower-order” factor heeft/ hebben de slechte lading op de “higher-order” factor?
1. -0,62
2. 0,62
3. -0,75
4. 0,75.
Zijn de stellingen waar of niet waar?
1. Het is mogelijk om CFA te gebruiken om convergente en discriminante validiteit te evalueren.
2. Convergente validiteit kan geëvalueerd worden door CFA toe te passen op multitrait-multimethod matrixen.
3. Discriminante validiteit kan niet geëvalueerd worden door CFA toe te passen op multitrait-multimethod matrixen.
4. MTMMM is niet de enige methode om met CFA de convergente validiteit te evalueren.

Antwoorden op de oefenvragen

d. zelf de test maken hoeft niet, de rest is wel van belang om af te hebben voor je de CFA uit gaat voeren.
Als eerste (na het invoeren van de gegevens) moet het aantal dimensies vastgesteld worden.
b. Dit is de mate waarin een item verbonden is met een factor. Deze factorlading is de eerste parameter, de tweede parameter is de verbinding tussen verschillende factoren.
b. de goede volgorde staat beschreven onder stap 2 van de samenvatting van dit hoofdstuk
a., het kan inderdaad ook betekenen dat de steekproef groot was, (optie c en d) maar dat hoeft het niet per se te betekenen. Bovendien betekend een significante chi kwadraat een slechte fit, en dus een slechte overeenkomst met de werkelijke resultaten. (b en d kunnen dus niet)
Item c: hoe lager de factorlading hoe slechter de reflectie van de onderliggende factor, dit houdt in dat deze de meeste kans maakt om uit de test te verdwijnen.
b: de een na laatste kolom is hier de kolom met “lower-order” factoren. Dit is de kolom na de hoogste factoren voor de items.
a en b, dit zijn de laagste waardes (- of + maakt niet uit)
a en b zijn waar. c is niet waar, deze methode kan namelijk bij zowel discriminante als convergente validiteit. d is waar; We kunnen convergente validiteit evalueren door een test en één of meer criteriumvariabelen te bekijken met behulp van CFA. (dit stond in de laatste zin van de samenvatting en een uitgebreide toelichting hiervan staat op pagina 352 in het boek.

Wat stelt de Generalizability Theory? - Tentamen 13

Oefenvragen

1. Welke van de beweringen zijn waar?

De generalizability theorie is minder handig bij complexe meetstrategieën met meerdere facetten dan de klassieke test theorie.
De generalizabilty theorie kan de effecten van verschillende facetten van elkaar onderscheiden.
De CCT kan de effecten van verschillende facetten van elkaar onderscheiden
Door middel van het onderscheiden van de effecten van de verschillende facetten kan de meetstrategie aangepast worden.

2. Als er vijf items bij een test zijn en 1 observator, hoeveel facetten zijn er dan?

3. Er zijn vijf items bij een test en de test wordt op twee momenten gemeten door twee observatoren. Hoeveel facetten zijn er in dit onderzoek?

4. Zijn de uitspraken waar of niet waar?

Een D study is onderdeel van een G theorie analyse.
Variantie componenten worden geschat in de D studie.

5. Welke van de beweringen zijn waar?

Bij een een-facet design zijn er drie factoren die de variabiliteit kunnen beïnvloeden.
De mate waarin de targets kunnen verschillen is een van de factoren die variabiliteit zou kunnen beïnvloeden.
Een ANOVA kan gebruikt worden in de D studie.
Meetfouten kunnen de variabiliteit niet beïnvloeden.

6. Wat is de targetvariantie als er 4 items zijn, MSt= 5, MSres=1 en MSi= 2.

0,75
0,80
1,00
1,25

7. Er is een gerelizability coëfficient van 0,790. Wat is de noise als het signal 50 is?

8. Zijn de volgende beweringen waar?

Er is sprake van een fixed facet wanneer men niet wil generaliseren buiten de in de analyse gebruikte condities.
Bij een random facet zijn de items een random gekozen steekproef uit het totaal aantal gerelateerde items.

9. Combineer de soort beslissing aan het bijbehorende voorbeeld en aan het bijbehorende soort test:

1. Relatieve beslissing	a. Theorie examen bij autorijden	I. Norm-referenced test
2. Absolute beslissing	b. Audities	II. Criterion-referenced test

Antwoorden op de oefenvragen

b en d zijn waar.
a. er is 1 facet namelijk de items. Van de rest van de meetmogelijkheden is er maar 1.
c. Er zijn 5 items (1 facet) op 2 momenten (2e facet) door 2 observatoren (3e facet)
a is waar, b niet, dit gebeurt in de eerste stap van de G theorie analyse ( de G study).
d is niet waar, de rest wel. Meetfouten kunnen de variabiliteit wel beïnvloeden.
c. Targetvariantie als er 4 items zijn, MSt= 5, MSres=1 en MSi= 2:
(MSt-MSres) /Ni. Ni = 4, (5-1) / 4 = 4/4 =1,00.
Er is een gerelizability coëfficient van 0,790. Wat is de noise als de signal 50 is?
De generizability coëfficient is signal/(signal+noise). De formule kan omgedraaid worden om signal te ontdekken.
50/(50+x) = 0,790. → keer (50+x) → 50=0,790*(50+x). → gedeeld door 0,79 → 63,29 = 50+x. → - 50 → X = 13,29. Noise is 13,29.
Zowel a als b zijn waar.
1-II-a. 2-I-b. Relatieve beslissingen gaan over relatief beoordeelde scores en zijn norm-referenced (bijv. beste 20%). Absolute beslissingen gaan over een cut-off score die je moet hebben om iets gehaald te hebben, dit is criteria-referenced.

Wat stelt de Item Reactie Theorie en hoe ziet het Rasch model er uit? - Tentamen 14

Oefenvragen

1. Welke van deze beweringen zijn niet waar?

IRT is een alternatief voor CTT.
IRT is minder complex dan CTT.
De IRT legt de nadruk op het feit dat de reactie van een individu beïnvloed wordt door het indivu (traits) en het item (moeilijkheidsgraad).
Moeilijkheidsgraad kan bij IRT ook gezien worden als hoe makkelijk iemand eens kan zijn met een statement.

2. Voor welke vraag is waarschijnlijk een hoger traitlevel nodig wanneer het trait vaardigheid in spelling is?

Het spellen van het woord: lepel.
Het spellen van het woord: consciëntieus.
Geen van beide: de moeilijkheidsgraad heeft niets met het traitlevel te maken.

3. Zijn de beweringen waar of niet waar?

Als iemand een item met de moeilijkheidsgraad 1 heeft. zal iemand met trait level 1 50% kans hebben om het item goed te volbrengen
Als een item moeilijkheidsgraad -1 heeft, heeft iemand met trait level 0 weinig kans om het item goed te volbrengen
Bij een item met moeilijkheidsgraad 0, zal iemand met trait level 1 meer dan 50% kans hebben om het item goed te beantwoorden

4. Er is een negatieve discriminatiewaarde van het item. Wat betekent dit voor de kans om een item goed te beantwoorden wanneer er sprake is van een hoog trait level?

Die kans is hoog omdat er een hoog trait level is.
Die kans is laag omdat het vast een item met nog hogere moeilijkheidsgraad is.
Die kans is hoog omdat dit item dan wel makkelijk moet zijn omdat het trait level hoog is.
Die kans is laag want een negatieve discriminatiewaarde betekent dat hoge trait scores zorgen voor een kleinere kans om het item goed te beantwoorden.

5. Bij welke discriminatiewaarde is er sprake van de meeste validiteit?

Bij discriminatiewaarde 0,8
Bij discriminatiewaarde 0
Bij discriminatiewaarde -0,8
Bij discriminatiewaarde 0,5

6. Bij het Rasch model wordt gekeken naar:

(mogelijk meerdere goede antwoorden)

De kans op een correct antwoord
De moeilijkheidsgraad van een item
Het traitlevel van het proefpersoon
Het gemiddelde traitlevel

7. Het verschil tussen het Rasch model en het twee parameter logistische model is:

1. Het wel of niet rekening houden met het discriminatie parameter van het item
2. Het wel of niet rekening houden met het betrouwbaarheidsinterval
3. Het wel of niet rekening houden met de moeilijkheid van het item
4. Geen van de bovenstaande antwoorden is juist

8. Vul de formule van het Rasch model in: Traitlevel = 2, Item moeilijkheid = 1,5. Wat is de kans op een correct antwoord?

0,334
0,378
0,447
0,622

9. Wat is het geschatte trait level als het proportie correct beantwoorde items van de respondent 0,7 is?

-0,847
0,153
0,847
6,712

10. Welke van de volgende voorbeelden is GEEN benoemde toepassing van IRT?

Evalueren van psychometrische eigenschappen items en testen.
Het vergelijken van meerdere facetten van een meetstrategie.
Analyseren van Person Fit.
Computerized adaptive testing.

Antwoorden op de oefenvragen

b is niet waar; IRT is juist complexer dan CCT.
b; ervan uitgaande dat dit een hogere moeilijkheidsgraad heeft dan de opdracht bij antwoord a.
a is waar, b is niet waar; juist meer kans dan 50%, c is waar.
d is waar.
a want dat is de hoogste positieve score (alleen positieve scores bevestigen validiteit) negatieve geven juist inconsistentie tussen traitniveau en kans om goed te beantwoorden aan, dit duidt meer op slechte validiteit.
a: dit is de uitkomst van het model en b + c : die worden meegenomen in de berekening.
a, De discriminatie parameter van het item is het verschil tussen de twee formules, beide houden ze verder rekening met trait level en moeilijkheid van het item.
d. Trait level is Өs, Өs = 2. Itemmoeilijkheid is βi, βi = 1,5.
P(Xis=1| Өs, βi) = (e ^(Өs – βi) / (1 + e^(Өs – βi) )
P(Xis=1 | Өs, βi) = e^(2-1,5)/1+e^(2-1,5)
P(Xis=1 | Өs, βi) = e^(0,5)/ 1+e^(0,5)
P(Xis=1 | Өs, βi) = 1,6487 / 2,6487 = 0,622
c. Proportie correct beantwoorde item van de respondent = PS. PS= 0,7.
Өs = LN(PS /1-PS)
Өs = LN (0,7/0,3) = LN(2,333) = 0,847.
b. dit is een functie van de G theorie niet van IRT.

Access:

Public

Check more: click and go to more related summaries or chapters

Studiegids voor samenvattingen bij Psychometrics: An introduction van Furr

Samenvatting van Psychometrics: An Introduction van Furr - 4e druk - Exclusive

Samenvatting van Psychometrics: An Introduction van Furr - 3e druk - Exclusive

BulletPointsamenvatting van Psychometrics: An Introduction van Furr - 3e druk

TentamenTests bij Psychometrics: An Introduction van Furr - 3e druk

Samenvatting van Psychometrics: An Introduction van Furr en Bacharach - 2e druk

TentamenTests bij Psychometrics: An Introduction van Furr en Bacharach - 2e druk

Study Guide for summaries with Psychometrics: An introduction by Furr

Assortimentwijzer voor samenvattingen bij Psychologie Bachelor 2 Blok 1 - UL Leiden

Assortment Pointer for summaries with Psychology Bachelor 2 Block 1 - LU Leiden

Statistics: summaries and study assistance - Theme

Join WorldSupporter!

Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Check: concept of JoHo WorldSupporter

Concept of JoHo WorldSupporter

JoHo WorldSupporter mission and vision:

JoHo wants to enable people and organizations to develop and work better together, and thereby contribute to a tolerant tolerant and sustainable world. Through physical and online platforms, it support personal development and promote international cooperation is encouraged.

JoHo concept:

As a JoHo donor, member or insured, you provide support to the JoHo objectives. JoHo then supports you with tools, coaching and benefits in the areas of personal development and international activities.
JoHo's core services include: study support, competence development, coaching and insurance mediation when departure abroad.