Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
a = 1, b = 2
d
a
d. Dit tentamen is closed-ended omdat iemand kan kiezen uit een beperkt aantal keuzes. Het is criterion referenced omdat er een grens is bepaald (bijv. 13 fout is voldoende) waar iemand aan moet voldoen om het tentamen te halen.
a. Een assumptie van verband tussen het observeerbare gedrag en de attribuut, dit zou betekenen dat de test (in ieder geval gedeeltelijk) valide is. Een theoretische link tussen de taak en de te meten attribuut is van belang om de validiteit mogelijk te maken. Validiteit is van belang omdat er in dit geval bepaald moet worden waarmee je het attribuut kan meten. Operationele definities maken het mogelijk om onduidelijke begrippen te kunnen meten en begrijpen (zoals intelligentie, leren en dromen).
a. Speeded tests zijn tests waarbij niet verwacht wordt dat je de hele test afrond en waarbij de test is hoever je komt met beantwoorden. Er wordt hierbij uitgegaan van een hoge kans dat beantwoorde vragen correct beantwoord zijn.
b. Power tests zijn tests waarbij de antwoorden juist wel van belang zijn, hierbij wordt gekeken naar het gegeven antwoord en aan de hand hiervan een score voor het aantal juiste antwoorden bepaald.
a. Bij psychometrie ligt de nadruk op de attributen van tests en dit kunnen evalueren. Zie pagina 9 van het boek.
1. Nominaal 2. Ordinaal 3. Ratio 4. Interval | a. Leeftijd b. Intelligentie c. Geslacht d. Reactietijd |
d. De drie genoemde eisen zijn de standaard eisen waar een categorie aan moet voldoen.
1 = c want geslacht heeft categorieën maar geen volgorde,
2 = a want leeftijd heeft een volgorde,
3 = d want reactietijd heeft een absoluut nulpunt,
4 = b want intelligentie heeft een arbitrair nulpunt.
Alle drie de uitspraken zijn waar, pagina 25 en 26 in het boek stukje: Units of Measurement licht kenmerken van meeteenheden toe.
b. bij een interval schaal heb je een arbitrair nulpunt, je kan daarom niet vermenigvuldigen en delen.
a. Bij graden celsius is er een arbitrair nulpunt, daarom is een interval schaal hier geschikt voor.
b. Nominaal geeft alleen verschil aan en interval geeft, naast een verschil, ook een volgorde aan.
a. als de maat van de meeteenheid niet altijd hetzelfde is kun je er niet mee meten omdat je totaal dan geen/ weinig informatie geeft.
a. dichotoom heeft 2 opties: (0 of 1 / zakken of slagen etc.) en een categorische variabele heeft meerdere categorieën( niet per se gelimiteerd tot 2 opties).
Het onderwerp wat vergeleken wordt met een ander (bij beide hetzelfde) onderwerp.
De onderwerpen die met elkaar vergeleken worden.
Beide bovenstaande antwoorden zijn correct.
Geen van bovenstaande antwoorden is correct.
Alleen intra-individuele verschillen.
Alleen Interindividuele verschillen.
Zowel intra-individuele als interindividuele verschillen.
Geen van beide verschillen.
100, 120, 110, 105, 115.
11, 13, 17, 33, 16, 6.
s = 100
s = 1
s = 25,2
S2 = 2500
S2 = 900
S2 = 144
1. 0,65 | a. De correlatie tussen alcoholpromillage en de vaardigheid om recht over een lijn te lopen. |
2. -0,65 | b. De correlatie tussen opleidingsniveau en inkomen |
3. 0,0 | c. De correlatie tussen haarkleur en geslacht. |
20
400
22,36
√500
Deviatie X | Deviatie Y | Cross-product | |
a. | 0 | 20 | |
b. | 10 | 10 | |
c. | 0 | 30 | |
d. | 20 | 5 | |
e. | 5 | 10 |
a. | b. | c. | d. |
0,5 | 0,5 | 0,9 | -0,9 |
-0,5 | 0,7 | 0,4 | -0,7 |
0,7 | 0,2 | 1,4 | -0,6 |
0,2 | 0,8 | 0,8 | -1,6 |
b. Covariabiliteit is de mate waarmee de variabiliteit tussen verschillende score sets met elkaar overeenkomen. Variabiliteit is het verschil binnen een set scores. Daarom zijn de onderwerpen verschillend en is er geen sprake van 1 hetzelfde onderwerp bij covariabiliteit en variabiliteit.
c. Er kan zowel naar intra-individuele verschillen (de resultaten van een participant over alle meetmomenten) gekeken worden als naar interindividuele verschillen (tussen de participanten).
a. 100+120+110+105+115= 550. 550/N = gemiddelde. 550/5 = 110
a. 11+13+17+33+16+6 = 96 --> 92/6 = 16
S2 is de variantie. Dus om van s naar s2 te gaan, hoeft dit alleen maar gekwadrateerd te worden. a is daarom 1002= 10.000, b is 12= 1, en c is 25,22= 635,04.
S2 is de variantie, om vanuit deze variantie naar standaard deviaties om te rekenen hoeft er alleen maar √s berekend te worden.
1=b, 2= a, 3= c
Hoe hoger je alcoholpromillage, hoe minder goed de vaardigheid om recht over een lijn te lopen zal zijn, dit is dan ook een negatief verband. De hoogte van je opleidingsniveau zal waarschijnlijk een positief verband hebben met je inkomen.
a. Vanaf een sum of squares kan je gemakkelijk een standaard deviatie berekenen door eerst de variantie te berekenen: delen door de N. Dit is 2000/5 = 400. Daarna kan je vanaf de variantie bij de standaard deviatie terecht komen door de wortel van 400 te bepalen. Dit is 20.
Om een kruisproduct te berekenen kun de deviaties met elkaar vermenigvuldigen.
a = 0 x 20 = 0
b = 10 x 10 = 100
c = 0 x 30 = 0
d = 20 x 5 = 100
e = 5 x 10 = 50
Lijst a en b zijn goed, correlaties kunnen tussen de -1 en 1 zijn.
I. Hoeveel dimensies de test heeft.
II. Hoe deze dimensies gemeten worden
III. Wanneer deze dimensies gemeten worden
IV. Of de dimensies gecorreleerd zijn.
Alleen I. en II. zijn waar
Alleen III. en IV. zijn waar
Alleen I. en IV. zijn waar
Alleen II. en III. zijn waar
Unidimensionale test.
Multidimensionale test met gecorreleerde dimensies.
Multidimensionale test zonder gecorreleerde dimensies.
1. Unidimensionale test 2. Multidimensionale test met gecorreleerde dimensies 3. Multidimensionale test zonder gecorreleerde dimensies | a. Test with higher order factors b. Conceptuele homogeniteit c. Test without higher order factors |
I. Een test waarbij vragen alleen rekenvaardigheid reflecteren is een unidimensionale test.
II. Een test waarbij rekenvaardigheid en leesvaardigheid gereflecteerd worden is eenmultidimensionale test.
III. De WISC is een unidimensionale test.
Alleen I. en II. zijn waar
Alleen I. is waar
Alleen II. is waar
Alleen II. en III. zijn waar
Geen van de beweringen is waar
EFA wordt het vaakst gebruikt van de factoranalyses.
De eerste stap van het uitvoeren van een EFA is het identificeren van het aantal dimensies.
Er is geen simpele regel voor het identificeren van het aantal dimensies.
Bij Eigenvalues zoek je naar een punt met groot verschil tussen de opeenvolgende eigenvalues.
Factor | Total |
1 | 1,500 |
2 | 1,200 |
3 | 0,900 |
4 | 0,750 |
5 | 0,450 |
6 | 0,350 |
1
2
3
4 of meer
I. CFA gebruik je als je al een beter beeld hebt bij de test.
II. Met een CFA controleer je je eigen idee over bijvoorbeeld dimensies.
Alleen I. is waar
Alleen II. is waar
Beide beweringen zijn waar
Beide beweringen zijn niet waar
Antwoord c is juist, er worden 3 vragen behandeld in het boek. ( zie de tabel op blz. 72)
b: Een intelligentietest bestaat uit een algemene factor gemeten door verschillende subfactoren. De verschillende soorten intelligentie zijn de subfactoren in dit voorbeeld.
1 b
2 a
3 c
a: Een test waarbij vragen alleen rekenvaardigheid reflecteren is een unidimensionale test omdat er maar 1 dimensie gemeten wordt. Bij rekenvaardigheid en leesvaardigheid zijn dit er twee, daarom is dit inderdaad een multidimensionale test. Een WISC is zoals toegelicht bij vraag 2 is een multidimensionale test en geen unidimensionale test dus III. was niet correct.
b: het identificeren van het aantal dimensies ofwel factoren is de tweede stap bij het uitvoeren van een EFA niet de eerste, de eerste stap is het kiezen van een statistische techniek.
b, bij de eigenvalue greater than 1,0 regel kijk je naar de aantal waardes groter dan 1. Iedere van deze waardes hoger dan 1 telt als dimensie.
c. Beide uitspraken zijn waar. CFA is een test om jouw bestaande idee over de test te controleren.
Ware scores
Geobserveerde scores
Totale scores
Meetfouten
De error heeft een random effect en is onafhankelijk van de variabelen.
Het effect van error is 0.
De error heeft geen random effect en is niet onafhankelijk van de variabelen.
Het gemiddelde effect van de error is nul.
Error scores zijn niet gecorreleerd met ware scores.
Error scores zijn niet gecorreleerd met geobserveerde scores.
Error scores zijn wel gecorreleerd met ware scores.
R2oe= 0.4, S2e= 20
0,6
0,4
5
1,6
S2e = 200, S2o = 600
0,33
0,50
0,67
0,75
Als r2oe nul is, is de betrouwbaarheid 1.
Als r2oe nul is, is de betrouwbaarheid ook nul.
Als coe 1 is, is s2e dat ook.
Als coe 1 is, is s2e 1.
I. Sem kan nooit groter zijn dan So
II. Sem is 0 als Rxx 1 is.
Alleen I. is waar
Alleen II. is waar
Beide antwoorden zijn waar.
Geen van de antwoorden is waar.
Beide tests hebben dezelfde errorvariantie.
Beide tests hebben hetzelfde gemiddelde.
De ware scores van de tests zijn gelijk over alle testen.
Rxx= 0,7, S2o=200
3,439
11,832
28
140
c. Totale scores horen er niet bij. Betrouwbaarheid is opgebouwd uit ware scores, geobserveerde scores en meetfouten.
a.
a en b.
a. Rxx= 1-r2oe. Dus 1-0,4 = 0,6
c. S2e = 200
S2o = 600, S2t= 600-200 = 400.
Rxx= 400/600 = 0,67
b en d zijn niet waar: Rxx= 1-r2oe. En coe is gelijk aan s2e.
c. een error kan niet hoger zijn dan de totaal geobserveerde score. Als er geen meetfout zou zijn was er een perfecte betrouwbaarheid.
a. wel
b. niet
c. wel , lees de voorwaarden eventueel nog een keer door op pagina 121 van het boek of de laatste pagina van het hoofdstuk in de samenvatting.
Rxx= 0,7, S2o=200.
Se bereken je met S2e als tussenstap.
x/200=0,7. 0,7x200=140.
S2e=140.
√( S2e) = Se.
√140= 11,83. Dit is antwoord b.
I. De twee testen zijn parallel als beide testen dezelfde set ware scores meten.
II. De twee testen zijn parallel als ze allebei evenveel errorvariantie hebben.
III. De twee testen zijn parallel als dezelfde test twee keer wordt gemeten.
alleen bij I.
alleen bij I. en II.
alleen bij II.
bij II. en III.
Nee, er is dan geen sprake meer van een paralleltest
Ja, de betrouwbaarheid kan nog gemeten worden
Dit is onbekend
Sommige attributen zijn niet zo stabiel als andere attributen.
De intervallengtes brengen soms problemen met zich mee.
Sommige periodes in het leven van een participant zijn niet zo stabiel.
De betrouwbaarheid kan niet goed gemeten worden.
De meetfout en de verandering v.d. ware scores kunnen niet gemakkelijk opgesplitst worden.
Zowel a als b zijn waar.
a en b zijn beide niet waar.
Er is niet meer dan 1 test nodig.
Er is niet meer dan 1 test moment nodig.
Zowel a als b zijn waar.
a en b zijn niet waar.
0,38
0,40
0,57
0,80
ii = 0,6. K=5.
0,33
0,66
0,88
0,95
Raw coefficient alpha.
Split half estimates
Standardized coefficient alpha
Raw alpha voor binaire items
b. 1 en 2 zijn de standaardregels m.b.t. de paralleltest, regel nummer 3 heeft te maken met test-hertest betrouwbaarheid.
a. dit zou volgens de klassieke testtheorie betekenen dat de errorscores wel correleren waardoor er geen sprake meer is van een echte paralleltest.
Alle drie de antwoorden kloppen .
c. Als de stabiliteitsassumptie niet klopt heb je een score met daarin de verandering van de ware score en de meetfout, dus kan je geen van beide los bepalen. Je betrouwbaarheid kan door deze meetfouten niet goed berekend worden.
c. Bij een interne consistentie betrouwbaarheid heb je maar 1 test nodig en ook maar 1 testmoment om te bepalen wat de betrouwbaarheid is.
c = 0,57. Rxx= 2rhh / 1+rhh.
Rxx= (2x0,4)/ 1,4 = 0,8/1,4 = 0,57.
c = 0,88. Rxx= kii / 1+(k-1) ii.
Rxx= (5x0,6) /(1+4x0,6) = 3/3,4 = 0,88
Standardized coefficient alpha.
Xest = +Rxx(Xo-)
Xest = X + Rxx(Xo-X)
Xest = + Rxx(Xo-Xe)
Xest = X+Rxx(Xo-Xe)
Rxx = 0,5, So = 5
2,35
2,50
3,54
5,71
Sem = 5, Xt = 15, Xe = 5.
Covariantie van X en Y heeft deze formule: Covx0y0=Cxtyt+cxtye+cxeye+Cxeyteo.
Covariantie van X en Y heeft deze formule: Cx0y0=cxtyt+cxtye+cxeyt+cxeye.
Covariantie van X en Y heeft een verkorte formule: cxy=cxtyt
Covariantie van X en Y heeft een verkorte formule: cxy=cxtyt/SoSy0
Geobserveerde score correlaties zullen altijd zwakker zijn dan die van ware scores.
Het is niet mogelijk een inschatting te geven van de ware correlatie, als deze niet beïnvloed was door verzwakking, tussen twee constructen.
De error beperkt de maximaal te vinden correlatie.
De mate van verzakking (attenuation) hangt samen met de mate van betrouwbaarheid van de individuele testen.
Dat een persoon op een bepaald item lijkt op het geheel van de participanten.
Dat een persoon op een bepaald item niet lijkt op het geheel van de participanten.
Dat een test-item consistent is met de test.
Dat 1 participant op een bepaald item afwijkt ten opzichte van zijn geheel aan antwoorden.
De proportie (p) van mensen die hoog scoorden op de test met de proportie (p) van mensen die laag scoorden op de test. Zowel goed als fout beantwoorde vragen.
De proportie (p) van mensen die hoog scoorden op de test met de proportie (p) van mensen die laag scoorden op de test. Alleen wanneer goed beantwoorde vragen.
Het effect van een item op een test met andere items op dezelfde test.
Het proportie items waar goed op geantwoord is.
Dat 85% van de participanten een item goed heeft beantwoord.
Dat een participant 85% kans heeft op een goed antwoord.
Dat een item 85% betrouwbaar is.
Geen van de bovenstaande antwoorden.
A.
C. Sem = So√(1-Rxx). Sem= 5 x √(0,5).
5 x √(0.5)=5 x 0,707 = 3.535 ≈ 3.54.
Voor het betrouwbaarheidsinterval is er deze formule:
De z score bij 2 standaarddeviaties(95%) is 1,96. Die houden we aan in de formule.
Xo±(1,96)(Sem).
Sem is 5 dus Xo is de enige onbekende in de formule. We weten dan Xt+Xe=Xo.
Dus Xo is in dit geval 15+5 = 20.
20±(1,96)(5). --> 20±9,8. Betrouwbaarheidsinterval v. 95%: 10,2 tot 29,8.
b en c zijn goed, D is de correlatie die berekend kan worden uit deze covariantie. a heeft wat notatiefoutjes. (zie hoofdstuk 7 in de samenvatting)
b is fout want consequentie 4 geeft aan dat het mogelijk is de ware correlatie te schatten tussen een tweetal constructen. Er is een formule (de correctie van verzwakking) waarbij de ware correlatie mee geschat kan worden als er geen sprake zou zijn van verzwakking.
c.
b. alleen goed beantwoorde vragen worden meegenomen in deze vergelijking.
a. 0,85 geeft de mate aan waarin participanten een item goed hebben beantwoord en dit staat gelijk aan 85%
De mate waarin een meting gerelateerd lijkt aan een specifiek construct.
De mate waarin een meting gerelateerd is aan een specifiek construct.
De zichtbare betrouwbaarheid van de test.
De mate waarin de constructen goed gemeten worden.
Content validiteit
Face validiteit
Betrouwbaarheid
Effect size
Geeft content validiteit goede informatie
Geeft face validiteit goede informatie
Geeft betrouwbaarheid goede informatie
Dat de interne structuur van een test gemeten kan worden.
Dat aparte factoren toegevoegd kunnen worden.
Dat factoren verwijdert worden.
Dat een factor van een test geanalyseerd kan worden.
Gelinkte items aan bijbehorende factoren koppelen.
Verbanden tussen factoren in een multidimensionale test vinden.
Uitvinden van aantal factoren in set van items
Onderscheiden van items binnen een factor.
Discriminant bewijs
Convergent bewijs
Geen van beide
Zowel a als b
Discriminant bewijs
Convergent bewijs
Geen van beide
Zowel a als b
Concurrent validity
Predictive validity
Discriminant bewijs
Ja
Nee
Hier kan geen uitspraak over gedaan worden.
a. Bij face validiteit draait het er alleen om dat het zo gerelateerd lijkt, niet of het wel of niet zo is.
b. Participanten en dergelijke verstaan wij in het algemeen onder de non-experts en als wij kijken naar de opinie over de validiteit van deze groep hebben we het over Face validiteit: of het in de eerste instantie zo lijkt te zijn.
a. In dit geval is de inhoud wel van belang, en hoe het eruit zien en hoe betrouwbaar het is zijn hierbij van minder belang.
a.
d.
b.
a. Discriminant bewijs beschrijft de mate waarin testscores ongecorreleerd zijn met tests van ongecorreleerd construct.
b. Want de meting is de mate waarin de huidige testscore (kennis over verkeersregels) gecorreleerd is met een relavante variabele die in de toekomst pas gemeten kan worden (het kunnen autorijden en de verkeersregels toepassen).
a. Ja criterium validiteit kan groepen verdelen (wel voldaan en niet voldaan aan een specifiek criterium)
Het evalueren van het voorspellend vermogen van een testscore over verschillende settings en situaties
Het evalueren van voorspellend vermogen van testscores binnen een setting of situatie
Het vergelijken van alle soorten validiteit
Geen van de bovengenoemde opties
Er worden meerdere metingen voor traits uitgevoerd.
Er worden meerdere soorten metingen uitgevoerd.
Er wordt onder andere gedeelde methode variantie ontweken
Er wordt bij heterotrait-heteromethod de sterkte correlatie verwacht.
Correlatie | Voorbeeld |
1. Heterotrait-heteromethod 2. Heterotrait-monomethod 3. Monotrait-heteromethod 4. Monotrait-monomethod | a. Sociale vaardigheidsmeting via observatie en geluksgevoel via vragenlijst. b. Sociale vaardigheid via observatie en vragenlijst. c. Geluksgevoel en sociale vaardigheid via vragenlijst. d. Geluksgevoel via vragenlijst |
QCV is bedoeld om een precieze en objectieve schatting te geven.
QCV is in deze nadruk op precisie anders dan eerder besproken aanpakken.
rcontrastCV is een van de effect sizes.
Een waarde van ralertingCV van -0,5 is mogelijk.
Ware correlatie is 0,6, Motivatietest is 0,81 betrouwbaar, Algemene interesse is 0,49.
0,238
0,378
0,622
0,762
rCD = cCD / SD
rCD = cCD / sCsD
rCD = p1p2 (C2gem – C1gem)
Dan is dit een kleine correlatie
Dan is dit een medium correlatie
Dan is dit een grote correlatie
Hier zijn onvoldoende gegevens voor bekend
Dan is er geen sprake van een kleine correlatie
Dan is dit een kleine correlatie
Dan is dit een medium correlatie
Dan is dit een grote correlatie
a.
MultiTrait-MultiMethod Matrices. (wat hier hoofdletters heeft vormt samen MTMMM)
d. bij een heterotrait-heteromethod wordt juist de laagste correlatie verwacht omdat correlaties door het gebruiken van dezelfde methode en dergelijke eruit gefilterd zijn.
1a, 2c, 3b, 4d. zie bladzijde 232 van het boek voor meer overzichtjes hierover.
Alle vier de beweringen zijn waar.
b. Rxoyo = rxtyt √(RxxRyy).
Rxoyo = 0,6 x(0,9x0,7)=0,6x0,63=0,378
a.
c.
b.
Acquiensence bias
Extreme and moderate responding
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken
Acquiensence bias
Extreme and moderate responding
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken
Acquiensence bias
Extreme and moderate responding
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken
Acquiensence bias
Extreme and moderate responding
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken
Acquiensence bias
Extreme and moderate responding
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken
Acquiensence bias
Extreme and moderate responding
Sociale wenselijkheid
Overdrijven van problemen
Random antwoorden
Gokken
Een goede manier om antwoordbias tegen te gaan is door de test zo te maken dat de kans hierop kleiner wordt.
Het anoniem maken van tests vermindert sociaal wenselijke antwoorden.
Aan anonimiteit zitten weer risico’s voor andere vormen van bias.
Een betere concentratie van de participant zou kunnen helpen bias te voorkomen.
Te lange tests hebben een negatief effect op de validiteit.
Als een participant denkt dan onoprechte antwoorden herkent kunnen worden neemt de validiteit toe.
Beide zijn waar.
Geen van de antwoorden is waar.
Een man gaat naar de dokter voor een test van een aandoening. Een week later krijgt hij te horen dat uit de test blijkt dat hij inderdaad de aandoening heeft. De test is incorrect.
True positive
False positive
False negative
True negative
1 is true positive en 2 is allen met stoornis.
1 is false negative en 2 is allen met stoornis.
1 is true negative en 2 is allen zonder stoornis.
1. Is false positive en 2 is allen zonder stoornis.
f. er is kans dat mensen zullen gaan gokken bij een meerkeuze toets.
a. Acquiensence bias houdt in dat mensen snel ja of nee of in een richting antwoorden op een stelling zonder goed na te denken over wat de betekenis hiervan is.
b. In dit geval is er sprake van moderate responding, dit houdt in dat mensen de extreme waarden in een schaal vermijden en hierdoor de wat meer naar het midden liggende antwoorden geven.
c. Als mensen meedoen aan een test waarbij hun naam opgegeven moet worden is de kans groter dat ze sociaal wenselijke antwoorden zullen geven.
e. Als iemand de test saai vind of te lang vind duren bestaat er een kans dat diegene niet meer serieus de vragen zal lezen en beantwoorden. Diegene zal dan random of beurtlings antwoord gaan geven op vragen wat niets meer met zijn of haar eigen mening/ervaringen te maken heeft.
d. Overdrijven van problemen (Malingering) is een verschijnsel waarbij iemand doet alsof zijn of haar hersenletsel/ aandoening / dergelijke erger is dan daadwerkelijk het geval is, omdat diegene hier persoonlijk gewin uit kan krijgen. Toeslagen, uitkering, andere zorg of schadevergoedingen kunnen als voorbeelden worden gezien voor een dergelijk persoonlijk gewin.
Alle stellingen zijn waar.
Beide zijn waar.
b. een false positive: het resultaat blijkt positief te zijn maar dit resultaat is niet terecht.
a. we kijken naar de true positive: mensen met de diagnose die ook echt de aandoening blijken te hebben t.o.v. alle mensen met de aandoening.
Scores van mensen uit verschillende groepen met elkaar vergelijken.
Scores van individuen uit 1 groep met elkaar vergelijken.
Een test er goed uit laten zien voor non-experts.
De relatie tussen ware en geobserveerde score verschilt tussen twee groepen.
Er geen relatie is tussen ware en geobserveerde score.
De relatie tussen ware en geobserveerde score juist op elkaar lijkt bij twee groepen.
Geen van de bovenstaande opties.
I. Item discriminatie index kan gebruikt worden om construct bias te ontdekken.
II. Differentiële item functie analyse kan ook gebruikt worden om construct bias te ontdekken.
III. Factor analyse kan gebruikt worden om de interne structuur van een test te evalueren, apart voor twee groepen.
Alle stellingen zijn waar
Alleen stelling I. en II. zijn waar
Alleen stelling I. en III. zijn waar
Alleen stelling II. en III. zijn waar
Geen van de stellingen is waar
De predictieve en de construct bias zijn onafhankelijk van elkaar.
De predicitieve bias draait meer om de betekenis van de test.
De construct bias draait meer om de bruikbaarheid van de test.
Ja, dit is een duidelijke indicatie en is daarom reden genoeg.
Nee, er kan ook sprake zijn van een daadwerkelijk verschil tussen groepen.
Ja, maar alleen als de verschillende reacties niet gerelateerd zijn aan de groepsverschillen.
I. Twee aparte groepen in een test vertonen niet dezelfde interne structuur voor hun testscores. We kunnen daarom concluderen dat de test lijdt aan construct bias.
II. Twee aparte groepen in een test vertonen dezelfde interne structuur voor hun testscores. We kunnen daarom concluderen dat de test niet lijdt aan construct bias.
Alleen stelling I. is waar
Alleen stelling II. is waar
Beide stellingen zijn waar
Geen van beide stellingen is waar
item discriminatie index
factor analyse
differentiële item functie analyse
item order
Wanneer de gemeenschappelijke regressielijn overeenkomt met de gescheiden lijnen per groep is er een sprake van bias.
De gemeenschappelijke regressielijn is gebaseerd op een regressieformule aan de hand van alle data uit 1 groep.
Bij een interceptbias zijn de regressielijnen parallel aan elkaar.
Bij een slopebias zijn de regressielijnen parallel aan elkaar.
Interceptbias
Slopebias
Intercept en slopebias
Bij geen enkele van de bovenstaande biases is er sprake van verschilconsistentie.
a. Want construct bias houdt in dat scores op een test verschillende betekenissen kunnen hebben voor verschillende groepen. Met deze reden kunnen ze niet goed vergeleken worden.
a.
a. alle uitspraken zijn correct.
Alleen uitspraak a. is waar, de soorten bias bij b en c zijn namelijk omgedraaid.
b. en c. zijn goed, a. niet, dit is een te snelle en eenduidige conclusie.
a.
d. Rank order is wel een methode om construct bias te ontdekken maar item order niet.
a is waar, b. niet: de regressieformule voor de gemeenschappelijke regressielijn is gebaseerd op de data uit alle groepen, niet uit slechts 1 groep.
Ja, alleen het intercept verschilt tussen de groepen, de richtingscoëfficiënt is gelijk.
a. Bij interceptbias blijft het verschil constant terwijl de x stijgt of daalt. Bij de rest is dit niet het geval.
I. Negatief gecodeerde items omgekeerd scoren.
II. Duidelijk maken welk construct je gaat meten + alvast aantal items ontwikkelen
III. Participanten vinden
IV. Zelf de test alvast maken
Alleen I. en II. zijn waar
Alleen I. en III. zijn waar
Alleen II. en III. zijn waar
Alleen I., II. en III. zijn waar
Alleen II., III. en IV. zijn waar
Alle stellingen zijn waar
Geen van de stellingen is waar
Hoeveelheid invloed van een factor op de test.
De mate waarin een item verbonden is met een factor.
De betrouwbaarheid van een factor
De mate waarin een factor verbonden is met een andere factor.
Varianties en covarianties
Fit ofwel geschiktheid van model
Geschatte parameters
Geïmpliceerde varianties en covarianties
Dit geeft aan dat er een slechte fit is, dit betekend dat het aantal dimensies volgens de test niet overeenkomt met de werkelijke uitkomst.
Dit geeft aan dat er goede fit is, dit betekend dat het aantal dimensies volgens de test wel overeenkomt met de werkelijke uitkomst.
Dit geeft aan dat het model per definitie een te grote steekproef had.
Dit kan betekenen dat er een goede fit is, en dat de steekproef goed was, wat de test nog betrouwbaarder maakt.
Factor-item a = 0,82
Ffactor-item b = 0,78
Factor item c = 0,35
Factor item d = 0,46
Factor-item e = 0, 65
2
4
5
6
-0,62
0,62
-0,75
0,75.
Het is mogelijk om CFA te gebruiken om convergente en discriminante validiteit te evalueren.
Convergente validiteit kan geëvalueerd worden door CFA toe te passen op multitrait-multimethod matrixen.
Discriminante validiteit kan niet geëvalueerd worden door CFA toe te passen op multitrait-multimethod matrixen.
MTMMM is niet de enige methode om met CFA de convergente validiteit te evalueren.
d. zelf de test maken hoeft niet, de rest is wel van belang om af te hebben voor je de CFA uit gaat voeren.
Als eerste (na het invoeren van de gegevens) moet het aantal dimensies vastgesteld worden.
b. Dit is de mate waarin een item verbonden is met een factor. Deze factorlading is de eerste parameter, de tweede parameter is de verbinding tussen verschillende factoren.
b. de goede volgorde staat beschreven onder stap 2 van de samenvatting van dit hoofdstuk
a., het kan inderdaad ook betekenen dat de steekproef groot was, (optie c en d) maar dat hoeft het niet per se te betekenen. Bovendien betekend een significante chi kwadraat een slechte fit, en dus een slechte overeenkomst met de werkelijke resultaten. (b en d kunnen dus niet)
Item c: hoe lager de factorlading hoe slechter de reflectie van de onderliggende factor, dit houdt in dat deze de meeste kans maakt om uit de test te verdwijnen.
b: de een na laatste kolom is hier de kolom met “lower-order” factoren. Dit is de kolom na de hoogste factoren voor de items.
a en b, dit zijn de laagste waardes (- of + maakt niet uit)
a en b zijn waar. c is niet waar, deze methode kan namelijk bij zowel discriminante als convergente validiteit. d is waar; We kunnen convergente validiteit evalueren door een test en één of meer criteriumvariabelen te bekijken met behulp van CFA. (dit stond in de laatste zin van de samenvatting en een uitgebreide toelichting hiervan staat op pagina 352 in het boek.
1. Relatieve beslissing | a. Theorie examen bij autorijden | I. Norm-referenced test |
2. Absolute beslissing | b. Audities | II. Criterion-referenced test |
b en d zijn waar.
a. er is 1 facet namelijk de items. Van de rest van de meetmogelijkheden is er maar 1.
c. Er zijn 5 items (1 facet) op 2 momenten (2e facet) door 2 observatoren (3e facet)
a is waar, b niet, dit gebeurt in de eerste stap van de G theorie analyse ( de G study).
d is niet waar, de rest wel. Meetfouten kunnen de variabiliteit wel beïnvloeden.
c. Targetvariantie als er 4 items zijn, MSt= 5, MSres=1 en MSi= 2:
(MSt-MSres) /Ni. Ni = 4, (5-1) / 4 = 4/4 =1,00.
Er is een gerelizability coëfficient van 0,790. Wat is de noise als de signal 50 is?
De generizability coëfficient is signal/(signal+noise). De formule kan omgedraaid worden om signal te ontdekken.
50/(50+x) = 0,790. → keer (50+x) → 50=0,790*(50+x). → gedeeld door 0,79 → 63,29 = 50+x. → - 50 → X = 13,29. Noise is 13,29.
Zowel a als b zijn waar.
1-II-a. 2-I-b. Relatieve beslissingen gaan over relatief beoordeelde scores en zijn norm-referenced (bijv. beste 20%). Absolute beslissingen gaan over een cut-off score die je moet hebben om iets gehaald te hebben, dit is criteria-referenced.
(mogelijk meerdere goede antwoorden)
Het wel of niet rekening houden met het discriminatie parameter van het item
Het wel of niet rekening houden met het betrouwbaarheidsinterval
Het wel of niet rekening houden met de moeilijkheid van het item
Geen van de bovenstaande antwoorden is juist
b is niet waar; IRT is juist complexer dan CCT.
b; ervan uitgaande dat dit een hogere moeilijkheidsgraad heeft dan de opdracht bij antwoord a.
a is waar, b is niet waar; juist meer kans dan 50%, c is waar.
d is waar.
a want dat is de hoogste positieve score (alleen positieve scores bevestigen validiteit) negatieve geven juist inconsistentie tussen traitniveau en kans om goed te beantwoorden aan, dit duidt meer op slechte validiteit.
a: dit is de uitkomst van het model en b + c : die worden meegenomen in de berekening.
a, De discriminatie parameter van het item is het verschil tussen de twee formules, beide houden ze verder rekening met trait level en moeilijkheid van het item.
d. Trait level is Өs, Өs = 2. Itemmoeilijkheid is βi, βi = 1,5.
P(Xis=1| Өs, βi) = (e ^(Өs – βi) / (1 + e^(Өs – βi) )
P(Xis=1 | Өs, βi) = e^(2-1,5)/1+e^(2-1,5)
P(Xis=1 | Өs, βi) = e^(0,5)/ 1+e^(0,5)
P(Xis=1 | Өs, βi) = 1,6487 / 2,6487 = 0,622
c. Proportie correct beantwoorde item van de respondent = PS. PS= 0,7.
Өs = LN(PS /1-PS)
Өs = LN (0,7/0,3) = LN(2,333) = 0,847.
b. dit is een functie van de G theorie niet van IRT.
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Field of study
Add new contribution