2200 B.C.
2200 B.C.
Chinezen beginnen met onderzoeken voor civiele dienst.
1800-1899
1838
Jean Esquirol maakt onderscheid tussen mentale ziekte en mentale retardatie.
1862
Wilhelm Wundt gebruikt een gekalibreerde slinger om de “snelheid van denken” te meten.
1866
O. Eduard Seguin schrijft het eerste belangrijke boek over de beoordeling en behandeling van mentale retardatie.
1869
Wundt richt het eerste experimentele laboratorium voor de psychologie op in Leipzig, Duitsland.
1884
Francis Galton voert de eerste “test battery” uit op duizenden burgers bij de International Health Exhibit.
1890
James McKeen Cattell gebruikt de term “mental test” tijdens de aankondiging van de agenda voor zijn Galtonian test battery.
1896
Emil Kraepelin zorgt voor de eerste uitgebreide classificatie van psychische aandoeningen.
1900-1909
1901
Clark Wissler ontdekt dat de Cattelliaanse “brass instruments” testen geen correlatie hebben met universiteitscijfers.
1904
Charles Spearman stelt voor dat intelligentie uit een enkele algemene factor g en talrijke specifieke factoren s1, s2, s3 etc. bestaan.
1904
Karl Pearson formuleert de theorie van correlatie.
1905
Alfred Binet en Theodore Simone stellen de eerste moderne intelligentie test samen.
1908
Henry H. Goddard zorgt voor een Engelse vertaling van de Binet-Simon schalen.
1910-1919
1912
Stern introduceert de Intelligentie Quotient: IQ = de mentale leeftijd/werkelijke leeftijd.
1916
Lewis Terman corrigeert de Binet-Simon schalen naar de Stanford-Binet: volgende herziene versies verschenen in 1937, 1960, 1986 en 2003.
1917
Robert Yerkes leidt de ontwikkeling van de Army Alpha en Beta onderzoeken die gebruikt werden voor het testen van WOI rekruten.
1917
Robert Woordworth ontwikkelt de eerste persoonlijkheidstest: de Personal Data Sheet.
Jaren 20
1920
Publicatie van de Rorschach inkblot test.
1921
Cattell, Thorndike en Woodworth richten de Psychologische Corporatie, de eerste grote testuitgever, op.
1926
Florence Goodenough publiceert de Draw-A-Man Test.
1926
De College Entrance Examination Board (CEEB) publiceert de eerste Scholastic Aptitude Test (SAT).
1927
Publicatie van de eerste editie van de Strong Vocational Interest Blank.
Jaren 30
1935
Morgan en Murray brengen de Thematische Apperceptie Test (TAT) uit aan Harvard University.
1936
Publicatie van de voorloper van de Iowa Tests of Basic Skills door Lindquist en anderen.
1936
Edgar Doll publiceert de Vineland Social Maturity Scale voor de beoordeling van adaptief gedrag bij mensen met mentale retardatie.
1938
L.L. Thurstone stelt voor dat intelligentie uit zeven groepfactors bestaat: de primaire mentale vaardigheden.
1938
Raven publiceert de Raven’s Progressive Matrices: een non-verbale test van redeneren om de Spearman’s g factor te meten.
1938
Lauretta Bender publiceert de Bender Visual Motor Gestalt Test: een “design-copying test” van visueel-motorische integratie.
1938
Publicatie van het eerste Mental Measurements Yearbook door Oscar Buros.
1938
Arnold Gesell introduceert zijn schaal voor de ontwikkeling van baby’s.
1939
Publicatie van de Wechsler-Bellevue Intelligentie Schaal; herziene versies zijn gepubliceert in 1955 (WAIS), 1981 (WAIS-R), 1997 (WAIS-III) en 2008 (WAIS-IV).
1939
Publicatie van de Taylor-Russell tabellen om door middel van een test te bepalen wat de verwachte proportie van succesvolle sollicitanten zal zijn.
1939
Publicatie van de Kuder Preference Record: een interesse inventaris op basis van een gedwongen keuzetechniek.
Jaren 40
1942
Publicatie van de Minnesota Multiphasic Personality Inventory (MMPI).
1948
Office of Strategic Services (OSS) gebruikt situationele technieken voor de selectie van officieren.
1949
Publicatie van de Wechsler Intelligence Scale for Children: herziene versies zijn gepubliceerd in 1974 (WISR-R), 1991 (WISC-III) en 2003 (WISC-IV).
Jaren 50
1950
Publicatie van de Rotter Incomplete Sentences Blank.
1951
Lee Cronbach introduceert de coefficient alpha als een index voor betrouwbaarheid (interne consistentie) voor tests en schalen.
1952
American Psychiatric Association (APA) publiceert de Diagnostic and Statistical Manual (DSM-I).
1953
Stephenson ontwikkelt de Q-techniek voor het onderzoeken van het zelfconcept en andere variabelen.
1954
Publicatie van Clinical vs. Statistical Prediction door Paul Meehl.
1956
Verschijning van de Halstead-Reitan Test Battery als de eerste test battery in neuropsychologie.
1957
C.E. Osgood beschrijft het semantisch differentieel.
1958
Lawrence Kohlberg publiceert de eerste versie van zijn Moral Judgment Scale; onderzoek hiernaar rijkt uit tot in het midden van de jaren 80.
1959
Campbell en Fiske publiceren de multitrait-multimethod matrix: een test validatie benadering.
Jaren 60
1963
Raymond Cattell stelt de theorie van vloeiende en gekristalliseerde intelligentie voor.
1967
In Hobson v. Hansen: de rechtbank oordeelt tegen het gebruik van group ability tests op grond van het feit dat zulke testen discrimineren jegens kinderen van minderheden.
1968
APA publiceert de DSM-II.
1969
Nancy Bayley publiceert de Bayley Scales of Infant Development (BSID): de herziene versie (BSID-II) is gepubliceerd in 1993.
1969
Arthur Jensen stelt de genetische hypothese van IQ-verschillen tussen Afro-Amerikanen en blanke Amerikanen voor in de Harvard Educational Review.
Jaren 70
1971
In Griggs v. Duke Power: de Supreme Court oordeelt dat de resultaten van wergelegenheidstesten een bewijsbare link moeten hebben met werkprestatie.
1971
George Vaillant populariseerd een hierarchy van 18 ego adaptieve mechanismen en beschrijft de methodologie voor hun beoordeling.
1971
Een rechterlijke beslissing vereist dat testen gebruikt voor werknemersselectie relevant moeten zijn ten opzichte van de baan (Griggs v. Duke Power).
1972
Publicatie van de Model Penal Code regel voor juridische waanzin; algemeen aangenomen in de Verenigde Staten.
1974
Rudolf Moos begint met de publicatie van Social Climate Scales om verscheidene omgevingen te schatten.
1974
Friedman en Rosenman populariseren de Type-A coronair gevoelige gedragspatroon; de beoordeling is interview-based.
1975
De U.S Congress passeert Public Law 94-142, the Education for All Handicapped Children Act.
1978
Jane Mercer publiceert System of Multicultural Pluralistic Assessment (SOMPA), een test battery ontworpen om culturele discriminatie te reduceren.
1978
In de Uniform Guidelines on Employee Selection is nadelige impact gedefinieerd door de viervijfde regel; ook zijn er richtlijnen voor werknemer-selectie onderzoeken gepubliceerd.
1979
In Larry P. v. Riles: de rechtbank oordeelt dat gestandaardiseerde IQ-testen een culturele bias hebben ten opzichte van laag-functionerende donkere kinderen.
Jaren 80
1980
In Parents in Action on Special Education v. Hannon: de rechtbank oordeelt dat gestandaardiseerde IQ-testen niet beschikken over een bias jegens ras of cultuur.
1985
APA en andere groepen publiceren gemeenschappelijk de invloedrijke Standards for Educational and Psychological Testing.
1985
Publicatie van de Vineland Adaptive Behavior Scales door Sparrow en anderen: dit is een herziene versie van de baanbrekende 1936 Vineland Social Maturity Scale.
1987
APA publiceert DSM-III-R.
1989
Het Lake Wobegon Effect is genoteerd: vrijwel alle Staten van de Verenigde Staten claimen dat hun prestatieniveaus boven het gemiddelde liggen.
1989
Publicatie van de Minnesota Multiphasic Personallity Inventory-2 (MMPI-2).
Jaren 90
1992
APA publiceert een herziene versie van de Ethical Principles of Psychologists and Code of Conduct.
1994
APA publiceert DSM-IV.
1994
Herrnstein en Murray doen het debat over ras en IQ erfelijkheid herleven middels The Bell Curve.
2000-2009
Nieuwe herziene versie van APA Ethical Principles of Psychologists and Code of Conduct wordt in werking gesteld.
Oefenvragen
1) Wie beschouwde individuele verschillen als een bron van fouten in onderzoek?
a) Darwin
b) Wundt
c) Galton
d) Witmer.
2) De geschiedenis van de diagnostiek gaat vooral over
a) tests voor plaatsing en selectie
b) hulpverlening aan cliënten die een gedragsstoornis vertonen
c) theorievorming over de genetische basis van verschillen in intelligentie en persoonlijkheid
d) het foutloos meten van cognities, emoties, en gedrag.
3) Een geteste heeft recht op “informed consent”. Dat betekent dat de geteste het recht heeft
a) bepaalde informatie niet te delen met de diagnosticus
b) op de hoogte gebracht te worden van de testgegevens
c) te weten waarom hij of zij wordt geëvalueerd en hoe de gegevens zullen worden gebruikt
d) elk van bovenstaande.
4) Het hypothese-toetsend model voor het diagnostisch proces heeft als bedoeling en functie
a) voor te schrijven hoe diagnostiek systematisch dient te verlopen
b) de diagnostiek te verwetenschappelijken
c) een verklaring te vinden voor het onderzochte probleemgedrag
d) elk van bovenstaande.
5) De Bruijn e.a. hanteren de begrippen therapeutische cyclus, klinische cyclus en diagnostische cyclus. Welke van onderstaande uitspraken is juist?
a) De diagnostische en therapeutische cyclus zijn beide onderdeel van de klinische cyclus.
b) De klinische cyclus en de diagnostische cyclus zijn beide onderdeel van de therapeutische cyclus.
c) De klinische cyclus is hetzelfde als de diagnostische cyclus, maar dan inclusief een evaluatiemoment.
d) De klinische cyclus is hetzelfde als de therapeutische cyclus, maar dan met een evaluatiemoment.
6) Beoordeel de volgende twee uitspraken over de schatting van de betrouwbaarheid:
I Bij de test-hertest methode kan de betrouwbaarheidscoëfficiënt te hoog uitvallen omdat mensen zich nog items van de test herinneren.
II Bij de paralleltestmethode kan de betrouwbaarheidscoëfficiënt te hoog uitvallen omdat de testen niet parallel zijn.
a) I is juist, II is juist
b) I is juist, II is niet juist
c) I is niet juist, II is juist
d) I is niet juist, II is niet juist.
7) De bepaling van de validiteit van een test heeft als doel iets te kunnen zeggen over:
a) de mate waarin items hetzelfde meten
b) de gemaakte systematische meetfout
c) de gemaakte toevallige meetfout
d) de reproduceerbaarheid van de resultaten.
8) Voor een onderzoek naar de meningen van Nederlandse studenten over internationale verhoudingen is een factoranalyse uitgevoerd. De ladingen van de acht items in een 1-factoroplossing zijn hieronder weergegeven. De items X1 tot en met X4 gaan over Rusland en de items X5 t/m X8 gaan over de Verenigde Staten (VS). Voor alle items betekent een lage score op dat item een negatieve mening en een hoge score op dat item een positieve mening.
F1
X1 .8
X2 .4
X3 .5
X4 .8
X5 -.7
X6 -.4
X7 -.5
X8 -.9
Uit de factorladingen blijkt dat personen met een hoge factorscore:
a) negatief staan tegenover de VS en tegelijk positief tegenover Rusland.
b) positief staan tegenover de VS en tegelijk negatief tegenover Rusland.
c) positief staan tegenover VS; over de houding tegenover Rusland zegt deze factor niets.
d) negatief staan tegenover VS; over de houding tegenover Rusland zegt deze factor niets.
9) Bij een maximum performance test voor het meten van hebberigheid kunnen de items met het oog op een zo hoog mogelijke betrouwbaarheid het beste worden geselecteerd aan de hand van:
a) de moeilijkheid van de items
b) de item-covarianties
c) de item-varianties
d) de item-restcorrelaties
10) De dichotome items g en h zijn voorgelegd aan een steekproef uit de doelpopulatie. In de tabel staat de frequentieverdeling van de antwoorden.
| Item g 1 | Item g 0 |
Item h 1 | 5 | 45 |
Item h 0 | 15 | 35 |
Hoe groot is de proportie in de steekproef met een foutenpatroon?
a) .05
b) .15
c) .35
d) .45
11) Twee dichotome items voor het beoordelen van oog-handcoördinatie van volwassenen worden beoordeeld op het Mokken model met dubbele monotonie. De twee items voldoen niet aan de aannames van dit model.
Wat is dan voor de twee items het geval?
a) De itemkarakteristieke curven snijden elkaar
b) De moeilijkheidsparameters van de itemkarakteristieke curven verschillen
c) De foutenpatronen van de items verschillen
d) De gokkansen voor de items verschillen
12) In de onderstaande figuur zijn de item-karakteristieke curves van item g en h gegeven.
Beoordeel de volgende twee uitspraken.
I. De succeskans voor item h is voor iemand met een vaardigheid 1 kleiner dan de succeskans voor item g.
II. De discriminatieparameter van item h is even groot als de discriminatieparameter
van item g.
a) I is juist, II is juist.
b) I is juist, II is niet juist.
c) I is niet juist, II is juist.
d) I is niet juist, II is niet juist
13) Problematische sociale weerbaarheid komt bij 2% van de basisschoolleerlingen voor. Van een test voor het meten van sociale weerbaarheid is het volgende bekend:
sensitiviteit = 0.95
specificiteit = 0.80
selectieratio = 0.22
predictieve accuratesse = 0.09
Bij een willekeurig kind uit de populatie wordt een test afgenomen voor het meten van sociale weerbaarheid. De testuitslag wijst op problematische sociale weerbaarheid.
Hoe waarschijnlijk is het dat van het geteste kind de sociale weerbaarheid daadwerkelijk problematisch is?
a) .02
b) .95
c) .22
d) .09
14) Welke persoon ontwikkelde een serie intelligentietests waarvan wordt gezegd dat die de periode “van de wieg tot het graf” beslaat?
a) Thurstone
b) Wechsler
c) Sternberg
d) Kevorkian.
15) Theorieën over intelligentie zijn in te delen naar soort theorie, zoals bijvoorbeeld de interactionistische theorieën en de informatieverwerkingstheorieën. Volgens theorieën behorende tot het interactionistische perspectief
a) is intelligentie een latent, unidimensioneel construct
b) kan de meeste variantie die nu wordt toegeschreven aan “intelligentie” eigenlijk beter worden toegeschreven aan sociale interactie
c) is er een aangeboren intellectueel potentieel en is de omgeving er voor verantwoordelijk of dit potentieel ook wordt gerealiseerd
d) is er een aangeboren intellectueel potentieel en hangt het deels van omgevingsinvloeden af in hoeverre dit potentieel ook wordt gerealiseerd.
16) Een diagnosticus maakt gebruik van een persoonlijkheidstest waarin de geteste persoon voor elke uitspraak aangeeft of deze op hem of haar van toepassing is. De diagnosticus heeft deze test voorgelegd aan een kind van 11 (waarvoor de test ook geschikt was). Toch twijfelt hij of de antwoorden op de testvragen de persoonlijkheid van het kind wel goed representeren. Wat kan de diagnosticus het beste doen?
a) De antwoorden voorleggen aan een onderzoeker die onderzoek doet naar de test.
b) De antwoorden nog een keer nalopen om eventuele fouten er uit te halen.
c) De ouders en een leerkracht van het kind een test laten invullen voor het vaststellen van de persoonlijkheid van het kind.
d) De diagnosticus moet niets doen. Hij kan er vanuit gaan dat het resultaat klopt en dat zijn twijfel voorkomt uit een vooroordeel.
17) Sommige projectieve tests maken gebruik van beeldmateriaal. De Rorschach test bestaat uit inktvlekken. Andere tests (zoals o.a. de TAT), bestaan uit afbeeldingen van situaties, geschikt om te stellen bij een afbeelding van mensen of omgevingen. Welke vraag gaat niet over situaties, mensen of omgevingen?
a) “Kunt u een verhaal vertellen bij dit plaatje?”
b) “Kunt u vertellen hoe dit verhaal afloop?”
c) “Kunt u iets vertellen over wat hier gebeurt?”
d) “Kunt u vertellen wat u hier ziet?
18) Een aptitudetest verschilt van een intelligentietest doordat de eerste ten opzichte van de tweede
a) verworven kennis vaststelt
b) beter schoolprestaties in het algemeen voorspelt
c) bedoeld is om geschiktheid voor het verwerven van kennis te voorspellen
d) elk van bovenstaande.
19) Welke van onderstaande alternatieven is niet juist?
a) De mate waarin burn-out voorkomt is niet gelijk verdeeld over de verschillende beroepsgroepen.
b) Een werknemer met een lage mate van toewijding aan de organisatie waar hij/zij werkt is vaker afwezig van het werk.
c) De mate van toewijding die de werknemer heeft aan de organisatie waar hij/zij werkt wordt niet bepaald door het aantal jaren dat de werknemer bij deze organisatie werkzaam is.
d) Het meten van persoonlijkheid heeft in een selectiesituatie zin omdat sommige persoonlijkheidskenmerken tevens een indicatie zijn voor intelligentie.
20) De controverse tussen klinische versus statistische predictie (clinical versus mechanical prediction) heeft vooral betrekking op
a) de verschillen tussen wat theoretici op de universiteiten als werkwijze hanteren en wat in de praktijk werkzame psychologen doen.
b) twee verschillende manieren van informatie verzamelen en combineren van gegevens van een (groep) cliënt(en) .
c) de verschillen tussen predictie door klinisch psychologen op basis van projectieve methoden en interviews versus de predictie door statistici op basis van gestandaardiseerde tests.
d) elk van bovenstaande.
21) Wat is het verschil tussen een test en een assessment?
a) Een test maakt gebruik van instrumenten, een assessment is het meetinstrument zelf.
b) Een test beschrijft het meten van een psychologische variabele, een assessment is het verzamelen van gegevens voor een psychologische evaluatie.
c) Alleen geregistreerde psychologen mogen een test uitvoeren, voor een assessment is dit geen eis.
d) Een test wordt alleen bij volwassenen afgenomen, een assessment wordt ook gebruikt bij kinderen.
22) Bij een collaboratieve psychologische assessment
- wordt zelfinzicht aangemoedigd door de onderzoeker
- wordt gebruik gemaakt van een interactieve benadering
- werken de onderzoeker en de deelnemer samen
- werken twee onderzoekers samen tijdens het onderzoek
23) Welke begrippen hebben een aandeel bij de psychometrische juistheid van een test?
- Betrouwbaarheid en validiteit
- Correlatie en betrouwbaarheid
- Correlatie en validiteit
- Bruikbaarheid en betrouwbaarheid
24) Wat is een cut-off score?
- Het verschil tussen een hoge score en een lage score
- Het verschil tussen een voldoende en onvoldoende
- Een referentiepunt voor de classificatie van data
- Een referentiepunt om te kijken of een test wel of niet betrouwbaar is
25) Welke vorm van informatie verzamelen wordt vooral gebruikt voor personeelselectie?
- Rollenspel
- Panel interview
- WAISS
- Case study
26) Welke uitspraak is juist?
1. CAT is een vorm van CAPA, hierbij worden items aangepast aan degene die de test maakt
2. Computers kunnen met CAT interpretatie geven aan scores
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- Beide zijn juist
- Beide zijn onjuist
27) Bij een consultatief verslag
- wordt interpretatie gegeven bij de testscores
- integreert de computer data van verschillende bronnen
- wordt een statistisch analyse gepresenteerd
- wordt een mening gegeven over de data-analyse
28) Waar zijn de ‘Standards’ voor bedoeld?
- Regels voor hoe een test in elkaar moet zitten
- Richtlijnen over ethische kwesties.
- Hier staat in beschreven wat de gewenste waarden van betrouwbaarheid en validiteit zijn voor een test.
- De rechten van een deelnemer tijdens de test
29) Volgens McCaffrey moeten derde partijen tijdens een onderzoek worden uitgesloten. Waarom?
- Vanwege sociale facilitatie
- Vanwege afleidende factoren
- Doordat ruis het onderzoek kan verstoren
- Doordat op die manier de betrouwbaarheid kan worden aangetast
30) Welke uitspraak is juist?
1. Psychologische autopsie betekent dat men tijdens een autopsie gaat kijken naar hersenafwijkingen
2. Psychologische autopsie betekent dat men een psychologisch profiel schetst van iemand die overleden is
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- Beide zijn juist
- Beide zijn onjuist
31) Assessments kunnen in verschillende situaties worden uitgevoerd. Noem vijf van die situaties.
32) Wat is accommodatie?
a) Het aanpassen van de normering bij iemand die gehandicapt is
b) Het aanpassen van bijvoorbeeld de testsituatie voor iemand die gehandicapt is; bijvoorbeeld als de test in plaats van in een lab bij iemand thuis afgenomen wordt.
c) Zorgen dat een gehandicapt iemand zich op zijn gemak voelt tijdens het testen
d) Een regel die stelt dat gehandicapten niet gediscrimineerd mogen worden in een testsituatie.
33) Wie was de eerste die de psychologie in de 18e eeuw als wetenschap vestigde?
- Wolff
- Wundt
- Galton
- Spearman
34) Wat was de eerste mentale test?
- Wechsler intelligentieschaal
- Projectieve test
- Personal Data Sheet
- Intelligentie test van Binet en Simon
35) Wat is het voordeel van zelfrapportage?
- Mensen zijn er altijd toe bereid om correcte informatie over zichzelf met anderen te delen
- Je hebt geen last van bias
- Mensen kennen zichzelf het best dus weten meer over zichzelf dan anderen
- Mensen kunnen zo uitgebreid antwoord geven als ze zelf willen
36) Goddard had een controversiële carrière. Hij werd een aanhanger van eugenetica. Deze stroming is
- Gericht op de studie naar ziekten en genetische aanleg
- Gericht op de studie naar de invloed van genen op psychologisch onderzoek
- Gericht op manieren waarop kinderen zich het beste kunnen ontwikkelen waarbij rekening wordt gehouden met genetisch aanleg via de ouders.
- Gericht op het verbeteren van het menselijke ras door selectieve voortplanting
37) Welke uitspraak is juist?
1. Cultuurspecifieke testen zijn testen die ontwikkelt zijn voor een bepaalde cultuur
2. Bij cultuursensitieve testen wordt rekening gehouden met mensen uit verschillende culturen
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- Beiden zijn juist
- Beiden zijn onjuist
38) Welk statistisch begrip hoort niet bij centrale tendentie?
- Modus
- Gemiddelde
- Mediaan
- Bereik
39) De mediaan is vooral handig om te gebruiken wanneer:
- Er sprake is van nominale data
- Er extreme waarden zijn in de data
- Er veel data zijn met een lage waarde
- Er veel data zijn met een hoge waarde
40) Als een verdeling negatief scheef is betekent dit dat:
- De test te moeilijk was
- De test gemiddeld gemaakt is
- Een scheve verdeling zegt niets over de moeilijkheidsgraad van de test
- De test te makkelijk was
41) Door welke factoren kan error ontstaan in een test?
- De deelnemer heeft slecht geslapen
- De testomgeving is onrustig
- De proefleider heeft invloed op de deelnemer
- Alle bovenstaande factoren kunnen een oorzaak zijn van error
42) Een instrument dat consistent een verkeerd resultaat geeft
- kan best betrouwbaar zijn
- kan best valide zijn
- kan aan toeval liggen
- wordt verkeerd gebruikt door de proefleider
43) Wat is een gestratificeerde steekproef?
- Een streekproef waarin ieder lid van de populatie een even grote kans heeft om in de steekproef terecht te komen.
- Voor een populatie waarin 30% katholiek is, wordt een steekproef gekozen waarin 30% van de deelnemers katholiek is
- Bepaalde groepen worden uitgesloten van de steekproef
- Steekproef die bestaat uit mensen die het makkelijkst beschikbaar waren
44) Welke uitspraak over test-hertest-betrouwbaarheid is waar?
1. Hoe langer de tijd is tussen de afnamen van de test, hoe lager de betrouwbaarheid
2. Als betrouwbaarheid over een tijdsinterval van langer dan 12 maanden wordt berekend, wordt het de stabiliteitscoefficient genoemd.
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- beide zijn juist
- beide zijn onjuist
45) Bij parallele vormen van een test:
- zijn testlengte en -niveau van de verschillende versies gelijk
- kan de betrouwbaarheid berekend worden met verschillende groepen mensen
- zijn de gemiddelden en varianties van de verschillende versies gelijk
- a, b en c zijn allen juist
46) Betrouwbaarheid onder andere gemeten worden door interne consistentie betrouwbaarheidsschattingen. Bij wat voor soort test is dit een handige manier om betrouwbaarheid te meten?
- Homogene test
- Heterogene test
- Bijvoorbeeld bij herkansingen van tentamens
- Geen van de bovenstaande testen
47) Voor testen met dichotome items kan de interne consistentie worden berekend aan de hand van:
- Spearman-Brown
- Cronbach’s alfa
- Kuder-Richardson
- Geen van de bovenstaande antwoorden
48) Bij de keuze van een betrouwbaarheidsschatting is het belangrijk om rekening te houden met of het testonderwerp dynamisch is of statisch. Welk antwoord is juist?
- Bij een dynamisch testonderwerp zou een test-hertestschatting zinvol zijn
- Bij een statisch testonderwerp is een interne consistentie schatting zinvol
- Bij een statisch testonderwerp zou een test-hertestschatting zinvol zijn
- Bij een dynamische test is zowel een test-hertest als interne consistentiemeting zinvol
49) Welke uitspraak is juist?
1. Bij een criteriumreferentietest is het niet nuttig om betrouwbaarheid te berekenen op grond van alle scores in de test
2. Bij een criteriumreferentietest neemt de betrouwbaarheid af als de individuele verschillen ook afnemen.
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- Beiden zijn juist
- Beiden zijn onjuist
50) Wat stelt de generaliseerbaarheidstheorie van Cronbach?
- Een test is betrouwbaar als een test gegeneraliseerd is naar een bevolking
- Een test is betrouwbaar als het getest is in verschillende omgevingen waarbij alle facetten gelijk waren
- Betrouwbaarheid is de mate waarin de testscore in staat is de steekproef van gedrag uit een domein te meten
- Een test gemaakt in hetzelfde universum levert dezelfde score en deze is dan generaliseerbaar.
51) Wat houdt de item responstheorie in?
- Het kijkt naar hoe deelnemers reageren op items
- Het meet de kans dat iemand met een bepaald kenmerk een bepaalde score zal halen
- Het houdt rekening met het feit dat proefleiders invloed kunnen uitoefenen op de deelnemers
- Het meet de kans dat iemand met een bepaalde zichtbare trek een bepaalde score zal laten zien.
52) Wat zijn de drie belangrijke aannames bij het gebruik van de item responstheorie?
53) Wat is oppervlaktevaliditeit?
- Hoe adequaat een test een steekproef neemt uit algemeen gedrag dat representatief is voor het gedrag dat door de test gemeten moet worden
- Hoe valide de test er op het eerste gezicht lijkt
- Hoe valide de test voor een deelnemer lijkt
- Validiteit van een test op grond van een testblauwdruk
54) Waar kan voorspellende validiteit mee worden berekend?
- Pearson r
- Met een verwachtingstabel
- Met de Taylor-Russell tabellen
- Door middel van de beslissingstheorie
55) De neiging om extreme scores te vermijden en iedereen als gemiddeld te beoordelen heet:
- Mildheiderror
- Centrale tendentie-error
- Halo-effect
- Strengheiderror
56) Het bepalen van een grensscore hangt af van het doel van de test. Welk antwoord is juist?
- Voor weinig false negative uitkomsten moet de grensscore omhoog
- Voor weinig false positive uitkomsten moet de grensscore omlaag
- Voor weinig false positive moet de grensscore omhoog
- Er moet geen grensscore gebruikt worden als er meer sollicitanten zijn dan vacatures
57) Er zijn verschillende typen grensscores. Zo is er een type grensscore waarbij er een absoluut punt is dat de minimumscore voor de classificaties weergeeft. Hoe wordt dit type genoemd?
- Relatieve grensscore
- Normreferentie grensscore
- Multipele grensscores
- Absolute grensscore
58) Er zijn verschillende manieren om een grensscore vast te stellen. Een nadeel is soms dat wanneer dit door middel van beoordelingen gebeurt er soms grote onenigheden zijn tussen de verschillende beoordelaars. Met welke methode kan dit probleem ontweken worden?
- Angoff methode
- Item-mapping methode
- Methode van contrasterende groepen
- Bladwijzermethode
59) De ontwikkeling van een test bestaat uit verschillende stappen. In een van die stappen wordt een prototype van de test afgenomen. Hoe heet deze stap?
- Pilotstudie
- Testconseptualisering
- Scoring
- Criteriumreferenties
60) Hoe heet de methode waarbij deelnemers steeds moeten kiezen tussen twee items?
- Comparatieve schaal
- Categorische schaal
- Guttman schaal
- Methode van gepaarde vergelijkingen
61) Waarmee moet rekening gehouden worden bij de format?
- Vorm van items
- Structuur van de items
- Rangschikking van de items
- Al het bovenstaande
62) Met welk type item kan goed getest worden of een deelnemer echt iets begrepen en onthouden heeft?
- Essay
- Kort-antwoord-item
- Meerkeuzeitem
- Goed/fout-item
63) Bij computer adaptief testen komt itemvertakking voor. Wat betekent dit?
- Items splitsen zich af per onderwerp
- Doordat de test zich aanpast op de prestatie van de deelnemer, ondergaat iedere deelnemer feitelijk een andere test
- Aan de hand van de computer kan worden gekeken of items nog deugen of niet
- Het goede antwoord staat er niet bij
64) Om testen te scoren kan iemands score op de ene schaal van de test vergeleken worden met die op een andere schaal van dezelfde test. Hoe noem je deze scoringsprocedure?
- Ipsatieve scoringsprocedure
- Categoriescoring
- Cumulatieve model
- Normprocedure
65) Wat is over het algemeen de beste hoogte voor een moeilijkheidsindex?
- .70
- .75
- .50
- .30
66) Items moeten een goed onderscheid kunnen maken tussen hoge en lage scoorders. Hoe wordt dit genoemd?
- Plafondeffect
- Bodemeffect
- Itemdiscriminatie
- Itemkenmerk
67) Welke uitspraak is juist?
1. Een item-kenmerkcurve die van linksboven naar rechtsonder loopt geeft een lage discirminante waarde aan.
2. Een lijn die van linksonder naar rechtsboven loopt geeft een lage discriminante waarde aan
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- beide zijn juist
- beide zijn onjuist
68) Wat is cross-validatie?
- Een test die gevalideerd wordt op grond van de afname van twee testen bij dezelfde steekproef
- Een test opnieuw valideren op grond van een andere steekproef
- Een test valideren op grond van oordelen van verschillende experts
- Een test aanpassen aan een normgroep zodat de test valide blijft
69) Hoeveel componenten onderscheidde Binet in zijn intelligentietest?
- 5
- 3
- 6
- 4
70) Uit factoranalyse bleek dat de Wechsler-test 4 factoren mat. Welke factoren zijn dit?
- Verbaal begrip, werkgeheugen, waarneming en verwerkingssnelheid
- Redeneren, beoordelen, waarneming en verwerkingssnelheid
- Redeneren beoordelen, herinneren en abstract denken
- Verbaal begrip, werkgeheugen, herinneren en abstract denken
71) In welke intelligentiemodel wordt geen g onderkend?
- Drie stratum-theorie van Carroll
- Het intelligentiemodel van Cattell en Horn
- De twee factoren-theorie van intelligentie
- Alle bovenstaande antwoorden zijn juist
72) Hoe heet de methode waarbij bekenden, zoals klasgenoten of leraren, mensen moeten selecteren die het meest begaafd zijn?
- Nominerende techniek
- Normerende techniek
- Case-studie-techniek
- Referentietechniek
73) Wat is het Flynn-effect?
- Intelligentie is in de volwassenheid tamelijk stabiel
- Cognitieve vaardigheden nemen af met ouderdom
- IQ-score neemt jaarlijks in de hele populatie toe
- IQ-score neemt jaarlijks in de hele populatie af
74) Door welke intelligentietest werd het afwisselende item geïntroduceerd?
- WAIS
- WAIS IV
- Wechsler-Bellevue
- Stanford-Binet
75) Met welk model vertoont de WISC IV veel overeenkomsten?
- Het model van Carroll
- Het model van Cattell en Horn
- Het model van Cattell-Horn-Carroll
- Het model van Binet
76) Welke uitspraak is juist?
1. Bij factoranalyse worden correlaties berekend tussen losse items
2. Factoranalyse geeft aanwijzingen over de interpretatie van de factoren
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- Beiden zijn juist
- Beiden zijn onjuist
77) Welke test wordt in het leger gebruikt?
- ASVAB
- Stanford-Binet
- AGCT
- Alle bovenstaande antwoorden zijn juist
78) Een vrije manier van denken waarbij iedere oplossing mogelijk is heet
- Creativiteit
- Convergent denken
- Deductief redeneren
- Divergent denken
79) Welke uitspraak is juist?
1. Baby’s die zich traag ontwikkelen kunnen dit later niet zomaar inhalen
2. Als de scores bij baby’s extreem laag zijn wordt hun voorspellende waarde sterker
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- beiden zijn juist
- beiden zijn onjuist
80) Om in het onderwijs algemene prestatie te meten kan gebruik gemaakt worden van
- Cooperative Achievement Test
- WAIS
- WIAT
- CBA
81) Sommige testen richten zich vooral op informeel leren of levenservaringen. Welke van de volgende testen hoort niet bij dit soort testen?
- Leestesten
- Apitudetesten
- Prognostische testen
- Gereedheidtest
82) Voor wie is de K-ABC ontwikkeld?
- Voor volwassenen vanaf 18 jaar tot 30
- Voor volwassenen vanaf 50 tot 80 jaar
- Voor kinderen vanaf 5 tot 12 jaar
- Voor kinderen van 2 tot 12 jaar
83) Friedman en Rosenman onderscheidden type A en type B persoonlijkheid. Welke uitspraak is juist?
- Type A beslaat de trekken competitiviteit, haast en ongeduld
- Type B bestaat uit tegenovergestelde eigenschappen van type A
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- Beide zijn juist
- Beide zijn onjuist
84) Wat is de belangrijkste persoonlijkheidstest?
- MMPI
- WAIS
- Stanford-Binet
- Personal-Data-Sheet
85) Wat is een responsstijl?
- De neiging van de deelnemer om op een bepaalde manier te antwoorden
- De mogelijkheden van antwoorden op een bepaald item
- Bijvoorbeeld of een item multiple choice is of een essay is
- Overdreven gemiddeld scoren (centrale tendentie error)
86) Waar dienen validiteitsschalen voor?
- Het vaststellen van de validiteit van een test
- Het meten van de mate waarin iemand de test eerlijk heeft ingevuld
- Het meten van de consistentie van de test
- Alle bovenstaande antwoorden zijn juist
87) Bij welke test hoort het volgende plaatje?
- MMPI
- Projectieve methode
- Blacky picture test
- WAIS
88) Bij welke test is het de bedoeling een verhaal te vertellen over de gebeurtenissen die geleid hebben tot een bepaalde situatie die gepresenteerd wordt op een kaart?
- TAT
- APT
- Handtest
- Rosenzweig Picture Frustration study
89) Welke uitspraak is juist?
- Betrouwbaarheid en validiteit zijn bij projectieve testen moeilijk vast te stellen
- Door middel van de split-half-methode kan redelijk goed de betrouwbaarheid van projectieve testen worden vast gesteld
- 1 is juist, 2 is onjuist
- 1 is onjuist, 2 is juist
- Beiden zijn juist
- Beiden zijn onjuist
90) Wat is een therapeutisch contract?
- Therapeuten moeten iedere cliënt met respect behandelen
- Therapeuten mogen cliënten geen hulp weigeren
- Een afspraak tussen cliënt en therapeut
- Het arbeidscontract van een therapeut
91) Wat kan worden getest met de Toren van Hanoi?
- Abstract denkvermogen
- Intellectuele vermogens
- Mentale status
- Executief functioneren
Antwoorden
1. B
2. A
3. C
4. D
5. A
6. B
7. B
8. A
9. D
10. B
11. A
12. A
13. D
14. B
15. D
16. C
17. D
18. C
19. D
20. B
21. B
22. C
23. A
24. C
25. B
26. A
27. D
28. B
29. A
30. B
31. In het onderwijs worden vaardigheden van kinderen gemeten om hun vooruitgang te kunnen evalueren. In een klinische setting om bijvoorbeeld een diagnose bij iemand te kunnen stellen. In een adviserende setting om te kijken voor welke taken mensen geschikt zijn. In het leger, in rechtszaken, bij het verwerven van een bepaalde titel en in de gezondheidspsychologie.
32. B
33. A
34. D
35. C
36. D
37. C
38. D
39. B
40. C
41. D
42. A
43. B
44. A
45. C
46. A
47. C
48. C
49. C
50. D
51. B
52. Unidimensionaliteit, de items meten 1) construct. 2) Lokale afhankelijkheid: er bestaat een systematische relatie tussen de items en die relatie heeft alleen te maken met het gemeten construct. 3) monotonie: als iemand een itemrespons kiest die een hoge mate van de eigenschap indiceert, zou dit gepaard moeten gaan met een hogere mate van die eigenschap.
53. B
54. A
55. B
56. C
57. D
58. C
59. A
60. D
61. D
62. A
63. B
64. A
65. C
66. C
67. A
68. B
69. D
70. A
71. B
72. A
73. C
74. D
75. C
76. A
77. D
78. D
79. B
80. C
81. A
82. D
83. C
84. A
85. A
86. B
87. C
88. A
89. A
90. C
91. D
Add new contribution