Hoorcollege 8: Beslissend testgebruik (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Base rate neglect: onvoldoende rekening houden met het daadwerkelijke voorkomen/afwezigheid van de eigenschap in de populatie.

Signaal detectie theorie (SDT): een theorie die de mogelijkheid biedt diagnostiek vanuit modelmatig, besliskundig perspectief aan te pakken. De theorie gaat over de kans op goede en foute beslissingen, met aannames over verdelingen van testuitkomsten onder verschillende omstandigheden. Het is van toepassing in alle te onderscheiden gebieden binnen de psychologie.

Sensiviteit: hoe groot is de kans op een positieve diagnose, gegeven dat iemand de stoornis heeft? Dit is gelijk aan de voorwaardelijke/conditionele kans.

Specifiteit: hoe groot is de kans op een negatieve diagnose, gegeven dat de persoon de stoornis inderdaad niet heeft? Om dit te berekenen heb je een aselecte selectieve steekproef nodig.

Positieve predictieve waarde (PPV): proportie ware positieven gegeven een positieve diagnose

Negatieve predictieve waarde (NPV): proportie ware negatieven gegeven een negatieve diagnose

Bij de PPV en de NPV gaat het om een proportie en niet om de kans. Als de proportie niet klopt met de proportie in werkelijke populatie is dat problematisch.

Prevalentie (base rate) is nodig om goed te testen. Voor prevalentie is aselecte steekproef nodig.

Selectieratio: hoe groot is de kans dat iemand uit de populatie een positieve diagnose (ware en valse positieve) krijgt.

Met de sensiviteit en specifiteit, prevalentie kan je de selectieratio berekenen zonder dat je een aselecte steekproef hebt getrokken.

Regel van Bayes: kan je gebruiken bij predictieve accuratesse: hoe groot is de kans dat iemand bij een positieve diagnose daadwerkelijk de stoornis heeft?

De predictieve accuratesse in een diagnostische test is afhankelijk van de kwaliteit van het instrument (sensiviteit en specifiteit) en het voorkomen van de stoornis (prevalentie). Zelfs bij een betrouwbaar instrument is bij een lage prevalentie de kans op een correcte beoordeling klein.

Met een subjectieve a-priori verwachting kun je P(C+) aanpassen.

Cut-off score (beta): grenswaarde. De optimale grenswaarde en subjectieve nut (hoe belangrijk is een correcte beslissing?) kan je weergeven in een opbrengstmatrix.

Een hoog percentage ware positieve is gewenst (hoge sensiviteit).

Een lage percentage valse positieven is gewenst (lage 1- specifiteit).

Hulpmiddel om dit te bereiken: voor alle grenswaarden de sensiviteit en (1-specifiteit) bekijken in een ROC-curve. Deze curve zet alle mogelijke grenswaarden tegen elkaar af. Een diagonale lijn is optimaal.

De area under curve (AUC) is een objectieve maat voor de testkwaliteit. Hoe groter de oppervlakte, hoe beter.

 

Overzicht:

Sensiviteit = ware positieven

Specifiteit = ware negatieven

Valse positieven = 1-specifiteit 

Valse negatieven = 1-sensiviteit

Als je deze aantekeningen handig vond, volg dan gelijk mijn WorldSupport account! Dit kan door rechts naast deze samenvatting op '+ Follow' te klikken. Wordt erg gewaardeerd :)

Check page access:
Public
Check more or recent content:

Hoorcolleges Grondslagen van psychologische diagnostiek en testtheorie

Hoorcollege 1: Introductie - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 1: Introductie - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

De doelen van diagnostiek zijn beschrijven, verklaren, indiceren, voorspellen en evalueren.

Bad practice ontstaat onder andere wanneer informatie onsystematisch is verkregen, conclusies onvoldoende zijn onderbouwd en je niet meet wat je wilde meten.

Cognitive biases zijn valkuilen, want:

  • Evolutie selecteert snelle beslissysteem
  • Mentale shortcuts bij probleemoplossen
  • Niet perfect, maar wel snel
  • Overgevoelig voor gevaar ‘better safe than sorry’
  • Ongevoelig voor kansen
  • Vaak effectief, maar problematisch als iets heel zorgvuldigs dient te gebeuren

Halo/horn effect: als je een goede/slechte indruk van iemand hebt ben je geneigd om te denken dat die persoon in andere specifieke taken ook goed/slecht is.

Representativiteitsbias: je linkt een vooroordeel aan iets wat je ziet.

Confirmation bias: als we van tevoren iets denken over iemand gaan we opzoek naar informatie die deze gedachtes bevestigd.

Gedragsconfirmatie: met ons gedrag duw je de persoon in de hoek waar je hem wil hebben (bijv ‘ah, dat moet wel heel vervelend zijn’ als iemand verteld over een scheiding.

Causale actor-observator attributie: als iets niet goed verloopt, schrijf je het bij jezelf toe aan anderen, maar bij anderen schrijf je het toe aan interne factoren.

Availability bias: als je heel vaak dezelfde soort stoornis/ongeluk tegenkomt, heb je de neiging om te denken dat het veel vaker voorkomt dan objectief gezien het geval is.

Base-rate fallacy: we zijn niet goed instaat de basiskansen van iets in te schatten.

Anchoring (verankering): omdat je gewend bent aan een bepaald niveau ligt het (door jou ingeschatte) basislevel te hoog, waardoor je niet meer goed instaat bent om variatie te zien in andere situaties (bijvoorbeeld: als leraar ben je gewend aan een drukke klas, wat dan voor jou de norm wordt. Bij een nieuwe klas schat je het druktelevel dan te hoog in).

Met tests, testtheorie en het hypothesetoetsend model kan je psychologische diagnostiek goed verrichten.

10 assumpties volgens Reynolds & Livingston:

  • Psychologische constructen bestaan
  • Dat deze constructen gemeten kunnen worden
  • Dat die meting nooit perfect is
  • Dat er verschillende manieren zijn om een construct te meten
  • Alle manieren van meten hebben zowel sterktes als beperkingen
  • Meerdere informatiebronnen gebruiken is belangrijk
  • Prestatie kan gegeneraliseerd worden naar gedrag buiten de test
  • Assessment kan informatie geven die helpt om een psycholoog een betere keuze te laten maken
  • Assessment kan afgenomen worden op een eerlijke manier
  • Testen en het uitvoeren van diagnostiek kan ook echt een bijdrage leveren aan de samenleving

Soorten tests:

Maximum performance tests: laten zien dat je iets kunt (voorbeeld: tentamen)

  • Achievement tests – wat heb je geleerd?
  • Aptitude test – wat kun je?
  • Speed – zo snel mogelijk
  • Power – zo goed mogelijk

Typical response test: typisch antwoord van een persoon waardoor je iets kan zeggen over zijn/haar functioneren (voorbeeld: depressievragenlijst)

Projectieve tests: testen hoe iemand vanuit zijn

.....read more
Access: 
Public
Hoorcollege 2: De Diagnostische Cyclus - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 2: De Diagnostische Cyclus - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Overconfidence bias: mensen zijn zekerder van hun oordeel dan eigenlijk het geval is.

Een goede psychodiagnosticus maakt evidence based beslissingen (vanuit wetenschappelijke theorie), gebruikt meetinstrumenten die de testkwaliteit waarborgen, gaat hypothesetoetsend te werk en hanteert een navolgbare strategie voor besluitvormen.

De randvoorwaarden tijdens een diagnose zijn een balans tussen snel en goed, rechtdoend aan de situatie en belevingswereld van de cliënt en zo volledig maar beperkt mogelijk uitspraken doen.

In de empirische cyclus staat empirisch wetenschappelijk onderzoek, waarbij hypotheses systematisch getoetst worden, centraal.  In de diagnostische cyclus is de empirische cyclus vertaald naar de diagnostiek van een individu.

De regulatieve cyclus is praktijkgericht en situatiespecifiek. Deze cyclus is zichtbaar in de indicatiefase van de DC en is gericht op het nemen van beslissingen.

Dat een diagnose enkel een DSM-classificatie is en dat een DSM-classificatie de oorzaak is van de ervaarde problemen zijn misvattingen.

Je hebt verschillende type diagnoses:

  • Verhelderende diagnose: welke klachten zijn er?
  • Onderkennende diagnose: wat is er aan de hand?
  • Verklarende diagnose: wat is de oorzaak van de klachten?
  • Indicerende diagnose: wat is er nodig om deze klachten te verhelpen?

Afbeelding met schermafbeelding

Automatisch gegenereerde beschrijving

 

 

 

 

 

 

 

Tijdens de klachtenanalyse (KA) inventariseer je het probleem volgens de cliënt. Je maakt een overzicht van de klachten. Je formuleert een hulpvraag (wat wil de cliënt van jou?) en maakt vraagstellingen voor onderzoek. Uiteindelijk stel je een verhelderende diagnose op.

Tijdens de probleemanalyse (PA) cluster je het probleemgedrag in categorieën. Je bepaalt de ernst van de problemen (bijvoorbeeld met de crteria van Rutter) en je doet eventueel onderkennend onderzoek (toetsen of de problemen voldoen aan de criteria van de DSM-4/5 met vooraf geformuleerde toetsingscriteria en eventueel een DSM classificatie vaststellen. Uiteindelijk stel je een onderkennende diagnose op.

Tijdens de verklaringsanalyse (VA) zoek je naar condities die de klachten in stand houden. Op basis van literatuur formuleer je een verklarende hypothese. Eventueel maak je een denkschema. Je kiest geschikte meetinstrumenten, formuleert toetsingscriteria en toetst de hypothese. Uiteindelijk stel je een verklarende diagnose op.

Tijdens de indicatieanalyse (IA) wordt een behandeling of begeleiding aanbevolen op basis van het werkmodel. Je formuleert eert advies. Uiteindelijk stel je een indicerende diagnose op.

Access: 
Public
Hoorcollege 3: Betrouwbaarheid (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 3: Betrouwbaarheid (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Puntschatting: een testscore van meetinstrument. Deze score is niet perfect, je kan beter intervalschatting gebruiken om de onnauwkeurigheid in de schatting mee te nemen.

Om een intervalschatting te krijgen heb je een schatting van de betrouwbaarheid nodig.

Theoretisch construct: abstract kenmerk, eigenschap, variabele, concept, begrip, trait or state

Klassieke meetmodel: een testscore X wordt bepaald door de ware score T en door de toevallige meetfout E --> X = T + E

Een testscore (X) komt tot stand door systematische invloeden (het theoretisch construct dat de test wil meten + systematische meetfout (bijvoorbeeld sociale wenselijkheid) en door toevallige invloeden. Dus twee soorten meetfouten: systematische meetfout en toevallige meetfout.

Een score is betrouwbaar bij afwezigheid van toevallige meetfout.          Een score is valide bij afwezigheid van toevallige meetfout én systematische meetfout.

Als iemand oneindig vaak dezelfde test uitvoert ontstaat er uiteindelijk een normaalverdeling met een gemiddelde (is gelijk aan de ware score T) en een standaardafwijking σ (is gelijk aan de standaardmeetfout σE).

De standaardmeetfout σE is de spreiding van de toevallige meetfout en geeft een indicatie van de nauwkeurigheid van de meting. Is identiek voor alle individuen bij hetzelfde meetinstrument. Hiermee kan je het betrouwbaarheidsinterval berekenen.

Eigenschappen van meetfout E:

  • Bij replicaties geldt E=0.
  • In populaties correleert de meetfout niet met de ware score: de meetfout komt alleen door toevallige invloeden tot stand.
  • De meetfout van verschillende tests correleert niet.

Testvariantie (S2X) = ware scorevariantie (S2T) + errorvariantie (S2E) + 2x de covariantie (2STE)

Betrouwbaarheid (rxx’) = S2T / (S2T + S2E )

Bronnen van toevallige meetfouten kan de inhoud zijn (verschil items op steekproef en domein van items; content sampling error) en de tijd (tijdstip heeft invloed op resultaat; time sampling error).

De betrouwbaarheid kan geschat worden door middel van:

  1. Test-hertest: correlatie tussen testafname X1 en X2. Nadelen: leereffect (carryover effects), kort tijd tussen afnames (herinnering, ervaring), lange tijd tussen afnames (wijziging ware scores).
  2. Paralleltest betrouwbaarheid: correlatie tussen parallele tests X en X’ (X’ is vergelijkbaar met, maar verschillend van X). Nadelen: parallelle test zijn moeilijk te realiseren.
  3. Split-half methode: gecorrigeerde correlatie tussen testhelften. Nadelen: test moeilijk in twee delen te splitsen, een andere tweedeling levert een andere schatting. Oplossing: met computer gemiddelde van alle splitsingen nemen

Bij testverlenging of testverkorting kan met parallelle items een schatting van de betrouwbaarheid gegeven worden volgens de Spearman-Brown formule. De verlengingsfactor bereken je met nieuwe aantal items/ oude aantal.

  1. Kuder-richardson formule 20: met de kuder-richardson formule 20 kan je voor dichotome items (1=goed, 0=fout) en voor homogene set van items (eendimensionaal) een betrouwbaarheidsschatting maken. Je hoeft niet met deze formule te rekenen, alleen weten welke dingen nodig zijn om de betrouwbaarheid te bepalen: dit zijn het aantal items (k), de proportie goede antwoorden (p), proportie fouten antwoorden (q) en de variantie van
.....read more
Access: 
Public
Hoorcollege 4: Validiteit (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 4: Validiteit (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Standaard schattingsfout: fout als je een schatting doet van een testuitkomst

Testscore X bestaat uit de ware score + syst. fout + toevallige fout

Een groot interval is minder betrouwbaar.

De testscore valt hoger uit dan de ware score: wel betrouwbaar (want klein interval) maar niet valide (meet niet wat het wil meten).

Soorten validiteit:

Inhoudsvaliditeit: je beoordeelt de inhoud en achtergronden van de test. Alle testitems moeten het hele domein goed representeren. Beoordeling: ga na in hoeverre testitems gehele domein dekken (oordeel van deskundigen en/of oordeel van gebruikers (indruksvaliditeit)

Begripsvaliditeit: meet je wat je beoogt te meten? Beoordeling: ga Interne structuur van de test na (homogeniteit) en ga externe structuur van test na:

    1. Convergente validiteit
    2. Discriminante validiteit
    3. Nomologisch netwerk (betekenis afleiden uit relaties)

Criteriumvaliditeit: is mijn test in staat om te voorspellen? Kan voor cerleden, heden (concurrent validity) of toekomst (predictieve validiteit)

Inter-rater reliability/Cohen’s kappa: in hoeverre delen twee beoordelaars een test hetzelfde op. Hoe meer overeenkomst, hoe betrouwbaarder (houdt rekening met toeval)

Analyses waarmee de validiteit bepaald kan woorden:

  1. Factoranalyse, itemanalyse
  2. Vergelijken van groepen (t-toets, ANOVA)
  3. Berekenen van samenhang met tests voor (niet) verwante constructen (r, rho, tau, eta, phi, Cramer’s V)
  4. Multitrek-multimethode analyse
  5. Multiple regressieanalyse

Factoranalyse: de items die hoog correleren in een correlatiematrix identificeren (die hebben een gemeenschappelijke oorzaak)

Multitrek-multimethode analyse: meerdere constructen (trekken) tegelijkertijd meten op verschillende manieren

Multipele regressieanalyse: beoordeelt criteriumvaliditeit, selecteert tests die kunnen voorspellen en voorspelt uitkomsten bij bepaalde waarschijnlijkheid (90%, 95%, 99%)

R = multipele correlatiecoëfficiënt: relatie tussen de geobserveerde en de voorspelde score. Hoe hoger hoe beter. Als die .24 is voor een bepaalde factor, wordt de uitkomst voor 24% bepaald door die factor.

R2 = proportie verklaarde variantie: totaal aan spreiding

b-coëfficiënt: gebruik je bij het voorspellen. Één eenheid verandering in X zorgt voor zoveel eenheden toename in Y.

Béta: gestandaardiseerde b-coëfficiënt

Standaardschattingsfout (Sy.x): standaardafwijking van schattingsfouten (residuen)

Als je deze aantekeningen handig vond, volg dan gelijk mijn WorldSupport account! Dit kan door rechts naast deze samenvatting op '+ Follow' te klikken. Wordt erg gewaardeerd :)

Access: 
Public
Hoorcollege 5: Factoranalyse (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 5: Factoranalyse (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

De doelen van een factoranalyse zijn:

  • Het beoordelen van de dimensionaliteit (begripsvaliditeit). Hierbij kijk je of je het aantal dimensies vindt dat je vooraf op basis van theorie verwacht. Dit doe je door middel van een confirmerende factoranalyse.
  • Het reduceren van data. Hierbij kijk je of je een groot aantal variabelen kan samenvatten in een klein aantal nieuwe variabelen/factoren. Dit doe je door middel van een explorerende factoranalyse.

Sterkte van een invloed wordt aangegeven met de factorlading (a).

Het factormodel bestaat uit twee componenten: hoofdcomponentenanalyse (principal components analyses; PCA) en factoranalyse (principal axis factoring; PAF). Bij de PAF houd je rekening met de U (error; overige invloeden). Bij PCA zijn enkel de factoren bepalend voor de score.

Stap 1 van facoranalyse: kiezen PCA of PAF

X = individuele score op variabele (van steekproef uit mensen waar de test voor ontwikkeld is)

Zx = X getransformeerd naar z-score

Factorscore (F): alle factoren gewogen bij elkaar opgeteld. Dit bereken je door elke gestandaardiseerde score (Z) te vermenigvuldigen met de bijpassende factorlading (a) en vervolgens bij elkaar op te tellen.

Voor een verdeling van factorscores geldt: gemiddelde M=0, standaardafwijking SD=1.

Stap 2 van factoranalyse: het bepalen van het aantal factoren. Dit kan door middel van het eigenwaardecriterium of het knikcriterium.

Maximaal aantal factoren is gelijk aan het totaal aantal variabelen (k) van de analyse. Maar het doel van de analyse is met zo weinig mogelijk factoren zo veel mogelijk variantie in variabelen verklaren (datareductie). Factor 1 verklaart een zo groot mogelijk deel van de testvariantie. De overige factoren verklaren een zo groot mogelijk deel van de restvariantie.

De totale variantie is gelijk aan het aantal variabelen (k). Dat betekent dat per variabele de variantie maximaal 1 is.

Eigenwaarde (λ): de verklaarde variantie in een variabele door een factor. Is te berekenen door de som van alle gekwadrateerde factorladingen van die factor te nemen.

Eigenwaarde-criterium (Kaiser-Guttman criterium): kies voor het aantal factoren met eigenwaarde groter dan 1 (vuistregel). Deze factoren verklaren genoeg variantie.

Knikcriterium: kijk naar het scree-plot, kies het aantal factoren gelijk aan het aantal voor de knik in de grafiek

Stap 3 van factoranalyse: interpretatie van de factoren. Dit kan door de data te roteren, orthogonaal of oblique. Kijk vervolgens naar de ladingen van de variabelen op de factor. De variabelen met de hoogste lading is meest kenmerkend voor de factor. Gebruik de variabelen met een hoge lading (vaak |a| > .3) en gebruik de inhoud van de variabelen.

Resultaat orthogonale (rechte) rotatie: ongecorreleerde factoren, assen staan na rotatie loodrecht op elkaar. Interpretatie factorladingen na rechte rotatie: correlaties tussen factoren en variabelen in de analyse

Resultaat oblique (scheve) rotatie: na rotatie meer of minder gecorreleerde factoren, assen niet loodrecht op elkaar. Interpretatie factorladingen na scheve rotatie: partiële regressiegewichten in plaats van correlaties

.....read more
Access: 
Public
Hoorcollege 6: Betekenis testcores en Itemanalyse (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 6: Betekenis testcores en Itemanalyse (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Soorten tests:

Maximum performance tests: kennis, vaardigheden en competenties. Kan als snelheidstest of als niveau test.

Typical response tests (test voor gedragswijzen): gedrag, houding, persoonlijkheid

Interpretatie testscore:

Normgericht beoordelen doe je door de testscore te vergelijken binnen de groep of populatie (relatief meten), hieruit komen percentielscores.

Criteriumgericht beoordelen doe je door de testscore te vergelijken met een vooraf gestelde maatstaf of standaard (absoluut meten), hieruit volgt een percentage correct (mastery testing; kijken of je een level of performance hebt).

Normering: het bepalen van de verdeling in een populatie en een standaard voor de beoordeling bepalen.

Transformeren: omzetten van ruwe scores naar gestandaardiseerde scores om te beschrijven, vergelijken en beoordelen.

Transformaties:

Standaard z-transformatie: is mogelijk als de eigenschap in de populatie theoretisch en empirisch gezien normaal verdeeld is. Om dit te berekenen heb je de testscore, het gemiddelde en de standaardafwijking nodig. De uitkomst is de afstand van het gemiddelde (dus als Z-score= -1, zit je score één SD onder het gemiddelde). De ruwe testscores moeten minimaal interval meetniveau zijn.

Lineaire transformatie: is mogelijk als de eigenschap in de populatie theoretisch en empirisch gezien normaal verdeeld is. Dit gebruik je bijvoorbeeld om een z-score naar IQ-score of T-score te transformeren. Om dit te berekenen heb je de gewenste SD, Z-score en gewenste gemiddelde nodig. De ruwe testscores moeten minimaal interval meetniveau zijn.

Percentielscore transformatie: het omzetten van ruwe scores in percentielscores. Om dit te berekenen heb je de cumulatieve frequentie klassen waar het individu in valt, de frequentie van de klasse waar het individu in valt en het totaal aantal vragen nodig. Het maakt niet uit hoe de scores verdeeld zijn, het minimale meetniveau is ordinaal. Om percentielscores te berekenen heb je alle scores van de populatie nodig. Er is een verschil tussen percentielscore en percentiel! Percentiel is de waarde van een testscore waarvoor geldt dat een bepaalde proportie (.25, .50, .90) in de groep dezelfde of lagere testscore heeft.

Stanines: lineaire transformatie van standaard normaalverdeerde testscores in negen even grote groepen. Het is discutabel of de intervalschaal hiervoor gebruikt kan worden. Ook zijn de scores die hieruit komen niet precies. Is te berekenen met de z-score.

Normaliserende transformatie: te gebruiken als de eigenschap in de populatie theoretisch normaal verdeeld is, maar de testscores niet normaal verdeeld zijn. Een niet lineaire transformatie veranderd de vorm van de verdeling. Het resultaat van een normaliserende transformatie is een verdeling van de normale z-scores. Ze worden geïnterpreteerd als z-scores, maar zijn het niet!

Itemanalyse wordt gedaan om de individuen betrouwbaar te onderscheiden.  Dit kan door de hele test te beoordelen op kwaliteit (betrouwbaarheids analyse en validiteit onderzoek), door de afzonderlijke items te beoordelen (item difficulty en item discrimination) of door de relatie tussen de afzonderlijke items en de hele test te beoordelen (item totalcorrelation). Ook kunnen de antwoordalternatieve beoordeelt worden (disctracter analysis).

Intermoeilijkheid

.....read more
Access: 
Public
Hoorcollege 7: Intelligentiediagnostiek en Neuropsychologie - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 7: Intelligentiediagnostiek en Neuropsychologie - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Franz Joseph Gall is de grondlegger van de frenologie (iemands karakter en functies konden achterhaald worden door te kijken naar de vorm van het schedel, bijvoorbeeld de wiskunde knobbel). Paul Pierre Broca is de ontdekker van afasie.  Phineas Cage is een bekende case van extreme gedragsverandering door beschadiging in de frontaalkwab. H.M. is een bekende case van geheugenstoornis door verwijdering van de hippocampus. Clive Wearing liep als peuter hersenbeschadiging op en onthoud daardoor gebeurtenissen maar seconden-minuten.

Dubbele dissociatie: patiënt met laesie A doet het slecht op taak 1, maar niet op taak 2. Patiënt met laesie B doet het slecht op taak 2, maar niet op taak 1. Dit is bewijs voor functies van hersendelen.

Functielokalisatie: toeschrijven van een functie aan een specifieke locatie in het brein.

EEG: hersenactiviteit, bijvoorbeeld bij epileptische aanvallen

MRI-scans: bij verdenking hersentumor of infarct

Angiogram: röntgenfoto van bloedvaten in brein

Tegenwoordig meer aandacht voor netwerken van het brein (DTI: met MRI zenuwbanen in kaart brengen)

Bij neuropsychologie bestaat de diagnostiek uit het meten van cognitieve functies. Met neuropsychologisch onderzoek (NPO) kunnen cognitieve functies gemeten worden. Gestandaardiseerd testonderzoek waarmee zichtbaar (overt) gedrag wordt uitgelokt om uitspraken te kunnen doen over niet-zichtbare (coverte) processen in de hersenen.

Onderdelen diagnostisch proces:

  1. Verwijzing door huisarts/specialist/werkgever
  2. Vraagstelling & hypothesevorming
  3. Anamnese & heteroanamnese: gesprek met patiënt en met partner/familielid/vriend
  4. Testselectie & testafname
  5. Observaties
  6. Interpretatie
  7. Schriftelijke & mondelinge rapportage

Diagnostische cyclus:

Klachtenanalyse         -->        (hetero)anamnese

Probleemanalyse        -->        testonderzoek

Verklaringsanalyse      -->        diagnosestelling

Indicatieanalyse         -->        advies

 

Onderkennende vraagstelling: is er sprake van een geheugenstoornis?

Verklarende vraagstelling: passen de cognitieve stoornissen bij de ziekte van alzheimer of stemmingsstoornis?

Indicerende vraagstelling: heeft deze patiënt een revalidatietraject nodig?

Hypothesetoetsend model: niet random testen, maar hypothesen opstellen voorafgaand aan én tijdens NPO. Je kan ook je hypothese aanpassen tijdens het toetsen. Je begint met een vraagstelling en vervolgens circuleren de hypothesevorming, hypothesetoetsing en interpretatie om elkaar heen.

De prestaties van de patiënt worden het liefst afgezet tegen het eigen premorbide niveau (= voor de ziekte). Maar meestal is er geen eerder onderzoek gedaan. Oplossing: vergelijken met vergelijkbare groep mensen op basis van leeftijd, geslacht, opleidingsniveau.

Als de score van een client buiten de 2 SD valt is dat zorgelijk. De normaalverdeling is erg belangrijk. Binnen (-)1 SD is gemiddeld. Tussen de (-)1 en (-)2 is beneden/boven gemiddeld. Op basis van de NPO worden conclusies getrokken over stoornissen (afwijkend) of tekorten (benedengemiddeld) in cognitieve functies. Vaak ook uitspraken over onderliggende verklaring. Soms komt de oorzaak vanuit neurologsiche aandoening (dementie, herseninfarct, hersentumor en soms vanuit psychiatrisch stoornis (psychose, depressie).

Mogelijke valkuilen tijdens onderzoek zijn: onvoldoende testcondities, test-hertest effect, onderpresteren en beperkingen patiënt.

Neuropsychologisch onderzoek vereist een

.....read more
Access: 
Public
Hoorcollege 8: Beslissend testgebruik (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 8: Beslissend testgebruik (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Base rate neglect: onvoldoende rekening houden met het daadwerkelijke voorkomen/afwezigheid van de eigenschap in de populatie.

Signaal detectie theorie (SDT): een theorie die de mogelijkheid biedt diagnostiek vanuit modelmatig, besliskundig perspectief aan te pakken. De theorie gaat over de kans op goede en foute beslissingen, met aannames over verdelingen van testuitkomsten onder verschillende omstandigheden. Het is van toepassing in alle te onderscheiden gebieden binnen de psychologie.

Sensiviteit: hoe groot is de kans op een positieve diagnose, gegeven dat iemand de stoornis heeft? Dit is gelijk aan de voorwaardelijke/conditionele kans.

Specifiteit: hoe groot is de kans op een negatieve diagnose, gegeven dat de persoon de stoornis inderdaad niet heeft? Om dit te berekenen heb je een aselecte selectieve steekproef nodig.

Positieve predictieve waarde (PPV): proportie ware positieven gegeven een positieve diagnose

Negatieve predictieve waarde (NPV): proportie ware negatieven gegeven een negatieve diagnose

Bij de PPV en de NPV gaat het om een proportie en niet om de kans. Als de proportie niet klopt met de proportie in werkelijke populatie is dat problematisch.

Prevalentie (base rate) is nodig om goed te testen. Voor prevalentie is aselecte steekproef nodig.

Selectieratio: hoe groot is de kans dat iemand uit de populatie een positieve diagnose (ware en valse positieve) krijgt.

Met de sensiviteit en specifiteit, prevalentie kan je de selectieratio berekenen zonder dat je een aselecte steekproef hebt getrokken.

Regel van Bayes: kan je gebruiken bij predictieve accuratesse: hoe groot is de kans dat iemand bij een positieve diagnose daadwerkelijk de stoornis heeft?

De predictieve accuratesse in een diagnostische test is afhankelijk van de kwaliteit van het instrument (sensiviteit en specifiteit) en het voorkomen van de stoornis (prevalentie). Zelfs bij een betrouwbaar instrument is bij een lage prevalentie de kans op een correcte beoordeling klein.

Met een subjectieve a-priori verwachting kun je P(C+) aanpassen.

Cut-off score (beta): grenswaarde. De optimale grenswaarde en subjectieve nut (hoe belangrijk is een correcte beslissing?) kan je weergeven in een opbrengstmatrix.

Een hoog percentage ware positieve is gewenst (hoge sensiviteit).

Een lage percentage valse positieven is gewenst (lage 1- specifiteit).

Hulpmiddel om dit te bereiken: voor alle grenswaarden de sensiviteit en (1-specifiteit) bekijken in een ROC-curve. Deze curve zet alle mogelijke grenswaarden tegen elkaar af. Een diagonale lijn is optimaal.

De area under curve (AUC) is een objectieve maat voor de testkwaliteit. Hoe groter de oppervlakte, hoe beter.

 

Overzicht:

Sensiviteit = ware positieven

Specifiteit = ware negatieven

Valse positieven = 1-specifiteit 

Valse negatieven = 1-sensiviteit

Als je deze aantekeningen handig vond, volg dan gelijk mijn WorldSupport account! Dit kan door rechts naast deze samenvatting op '+ Follow' te klikken. Wordt erg gewaardeerd :)

Access: 
Public
Hoorcollege 9: Arbeids- en organisatiepsychologie - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 9: Arbeids- en organisatiepsychologie - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

In de arbeids- en organisatiecontext gaat het vaak niet om klinische toepassing maar om een selectie van werknemers, onder andere voor een organisatie-diagnose.

Vroeger werd er niet of nauwelijks nagedacht hoe mensen het effectiefst konden werken

Frederick Winslow Taylor: optimale productiviteit als de person en arbeid bij elkaar passen (persoon-omgeving-fit). Ook zei hij dat moeilijkere taken opgedeeld moeten worden. Hier was veel kritiek op, onder andere door van Ginneken.

Volgens Gilbreth diende de taak aangepast te worden aan de werknemer of diende de werknemer aangepast te worden aan de taak (of de juiste persoon moest ervoor geselecteerd worden).

Psychotechniek: het begin van de arbeids- en organisatiepsychologie. Hiervan waren de kerndoelen de werknemer aanpassen of de juiste persoon voor de taak selecteren.

Tests die onder andere worden gebruikt zijn de vierplatentest (van lennep), de test voor weldoordacht handelen, de rijsimulator en de afstreeptest.

De kern is dus: gebruik psychologische inzichten om de fit tussen werknemer en diens omgeving te optimaliseren. Hiervoor zijn psychologische instrumenten essentieel.

Aan skill zit een leer/oefenproces.

Abilities kan je van nature al.

Taak analyse: het verzamelen van gegevens die betrekking hebben op observeerbaar gedrag op het werk, en op fysieke kenmerken van de werkomgeving. Uit de taak analyse krijg je een beeld van de KSA’s (knowledge, skills en abilities).

Data verzamelen kan via interviews met taakuitvoerders, vragenlijsten die door taakuitvoerders worden ingevuld, observatie van taakuitvoerders en beoordeling van experts.

Selectie: de juiste persoon voor een bepaalde functie selecteren, dat wil zeggen de persoon met de juiste KSA’s.

Instrumenten:

  • Interviews (ongestructureerd of gestructureerd)
  • Tests (IQ, persoonlijkheid, attitude)
  • Gedragsmetingen, bijvoorbeeld met assessment center: simulatie van werksituatie. Experts beoordelen kandidaten op specifieke aspecten.

Work sample: een deel van de taak uitvoeren om te laten zien wat je kunt.  

Organisatiediagnose: psychologische inzichten gebruiken om de fit tussen taak en werknemer te optimaliseren. De ‘cultuur’ binnen een bedrijf is in kaart te brengen met tests (cultuur binnen bedrijf kan formeel of informeel).

Vier aspecten van organisaties volgens Quinn’s competing values model:

Mensgericht: leuke dingen voor de mens, overleg, inspraak

Innovatiegericht: innovatie en vernieuwing: ideeën, ontwikkeling

Beheersgericht: regels, procedures, hiërarchie, vergaderen

Resultaatgericht: eindproduct centraal, snelheid, kwantiteit, productiviteit

Dit model ziet er als volgt uit:

 

 

 

 

 

 

 

 

Als je deze aantekeningen handig vond, volg dan gelijk mijn WorldSupport account! Dit kan door rechts naast deze samenvatting op '+ Follow' te klikken. Wordt erg gewaardeerd :)

Access: 
Public
Hoorcollege 10: Item-responstheorie (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 10: Item-responstheorie (testtheorie) - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

De klassieke testtheorie heeft een aantal onvolkomenheden , waaronder:

  • Er is weinig informatie over de afzonderlijke items.
  • De schatting van de betrouwbaarheid is afhankelijk van de populatie.
  • De meetfout is onafhankelijk van het niveau van de respondent
  • Het is niet statistisch te toetsen
  • Bij het vergelijken van respondenten is de middengroep vooral betrouwbaar
  • Alle respondenten moeten de hele test maken

De item responstheorie komt de onvolkomenheden van de klassieke testtheorie tegemoet:

Deze theorie gaat over de itemscores in plaats van de testscores. Hierbij is de schatting van de psychometrische kwaliteit van de items onafhankelijk van de populatie. De betrouwbaarheid kan binnen de IRT variëren tussen respondenten. De aannames over dit model zijn statistisch toetsbaar. Als laatste is de schatting van de vaardigheid onafhankelijk van de verzameling items, waardoor adaptief testen mogelijk is.

In het meetmodel van de IRT wordt de itemscore bepaald door T (latente trek of latente klasse).

Item-responsfunctie: geeft weer hoe de kans (P) op een goed gegeven antwoord afhangt van de latente trek.

Er zijn dominantiegegevens (cognitieve vaardigheden, zijn op goedheid te beoordelen) en preferentiegegevens (gedragingen, moeilijker te beoordelen of het goed is).

Soorten antwoord categorieën:

  • Continu of discreet
  • Geordend of niet geordend
  • Polytoom of dichotoom (dichotoom is 1=goed, 0=fout)

In een deterministische model wordt het respons beïnvloed door één latente trek en zijn de items ééndimensionaal. De antwoordopties zijn dichotoom.

In het probabilistisch model wordt het respons ook beïnvloed door één latente trek en zijn de items ééndimensionaal, maar de functie is (in tegenstelling tot het deterministische model) monotoon niet dalend en de snelheid varieert (in de staarten is de functie minder steil). Deze functie begint niet bij 0 omdat er rekening wordt gehouden met de gokkans.

Gokkans: kans op goed antwoord op item g bij zeer lage waarde van latente trek. Is afhankelijk van het aantal alternatieve bij meerkeuze vragen. Is bij openvragen 0.

Moeilijkheid: de waarde op de latente trek waarvoor geldt dat de succeskans midden tussen de giskans en P(X=1) ligt. Het geeft de locatie van de item-respons functie.

Discriminatie: het onderscheidend vermogen rond de moeilijkheid. De discriminatiewaarde ligt op het steilste punt van de functie (bereken je door (1+gokkans)/2.). Bij maximale discriminatie loopt dit punt verticaal, bij minimale discriminatie loopt dit punt horizontaal.

Gemeenschappelijke aannames IRT: itemresponsen binnen een test zijn ééndimensioneel (bepaald door één latente trek). De items zijn globaal afhankelijk (de proportie goede antwoorden is afhankelijk van gemiddelde vaardigheid in groep). Dit kan je controleren door na te gaan of alle rho’s groter dan 0 zijn. Ook zijn de items lokaal onafhankelijk (de kans dat je item a goed hebt is onafhankelijk van of je item b goed hebt). Hierbij liggen de kansen op antwoordpatronen vast. Te controleren door te kijken of de rho gelijk is aan 0.

Afhankelijk van

.....read more
Access: 
JoHo members
Hoorcollege 11: Forensische diagnostiek en Gedrag - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 11: Forensische diagnostiek en Gedrag - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

De keuzes die je maakt in de forensische diagnostiek kunnen grote gevolgen hebben.

Forensische psychodiagnostiek: alle diagnostische beslissingen met een juridisch component (strafrecht, civielrecht, jeugdrecht).

Een expert kan beslissen onder onzekerheid door middel van helder onderbouwde keuzes, repliceerbaar onderzoek, begrijpelijke presentatie gegevens en onderbouwde conclusies.

De empirische cyclus is niet altijd geheel bruikbaar in alledaagse forensische praktijk.

In Nederland zijn er verschillende registraties die forensische psychodiagnostiek verrichten (bijvoorbeeld forensisch psycholoog / orthopedagoog; NRGD).

Doelen forensische psychodiagnostiek:

  • Stellen van diagnose volgens DSM-5 die het probleemgedrag verklaart
  • Factoren in kaart brengen
  • Aanbevelingen voor behandeling
  • In strafrechtelijke zaken: toerekeningsvatbaarheid en recidiverisico bepalen

TBS: behandeling van psychiatrische problematiek bij gevaar op herhaling voor zelf of anderen. Kan in termijnen van twee jaar onbeperkt verlengd worden.

Manieren om diagnostiek te verrichten:

  • Screening: met korte vragenlijst kijken of er risico is op problemen. Nadelen: sociale wenselijkheid, eigenbelang cliënt, verstoord besef van zelf? Voordelen: gestandaardiseerd, alleen cliënt kent eigen gedachten, valide.
  • Risicotaxatie: score op recidiverisico, hier hangt het strafadvies en behandelplan van af.
  • Testdiagnostiek: bijvoorbeeld IQ-tests, gestandaardiseerde instrumenten met normgroepen. Je hoeft niet te wachten op spontaan gedrag, maar daardoor ook geen ecologische validiteit.
  • Gestructureerde observaties: geeft veel informatie, goed te operationaliseren. Maar: arbeidsintensief, alleen voor zichtbaar gedrag.
  • Interviews/anamneses (auto-anamnese, hetero-anamnese)
  • Dossierinformatie
  • Fysiologische metingen

Vroeger bestond er bij de risicotaxatie een lange traditie van ongestructureerd oordelen door deskundige. Er lag een nadruk op de categorische indeling.

De test-hertest van een klinisch oordeel is niet altijd goed: verschillende deskundigen geven verschillende diagnoses.

Valkuilen van de klinische blik zijn:

  • Beoordelaars zijn het oneens
  • Beoordelingen komen niet overeen met gestructureerde assessments
  • Grote rol verwachtingen en vooroordelen beoordelaar
  • Zelfoverschatting van kwaliteit oordeel

Dus: niet uitsluitend gebruik maken van een klinische blik: alleen voor hypothesevorming en niet voor hypothesetoetsing. Inmiddels zijn er vele risicotaxatie instrumenten.

Adrian Raine: 'Als iemand hersenbeschadiging heeft en geen controle meer over zijn/haar gedrag heeft, verdient die dan minder straf? Of een langere gesloten behandeling wegens blijvend gevaar?'

Om goede en volledige forensische diagnostiek te verrichten gebruik je nooit één informatiebron, gebruik je informatie van de slachtoffers, gebruik je betrouwbaar en valide testmateriaal, SW-schalen en je klinische indruk.

Om een goede werkrelatie op te bouwen is het belangrijk om:

  • De cliënt de ruimte geven voor zijn verhaal
  • Transparant te communiceren
  • Te zoeken naar autonomie binnen kaders
  • Toekomstgericht te werken

Bij FO diagnostiek gaat het om complexe problematiek. Toepassing van het hypothese-toetsend model is daardoor beperkt mogelijk. Dit vraagt om systematisch onderzoek van risico-en beschermende factoren om aangrijpingspunten te vinden voor passende interventie.

Als je deze aantekeningen handig vond, volg dan gelijk mijn WorldSupport account! Dit kan door rechts naast deze samenvatting op '+ Follow' te klikken. Wordt erg gewaardeerd :)

Access: 
JoHo members
Hoorcollege 12: Bias en ethiek in de diagnostiek - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Hoorcollege 12: Bias en ethiek in de diagnostiek - Grondslagen van psychologische diagnostiek en testtheorie (GPDTT) aan de Universiteit Utrecht

Testbias: een fout in de testscore die systematisch een groep onder- of overschat. Bedreigt de validiteit.

De testsetting kan het resultaat beïnvloeden: verschillende personen hebben verschillende verwachting van de test waartussen interactie plaats vindt. Er zijn verschillende randvoorwaarden (heeft de deelnemer goed geslapen? Is de deelnemer zenuwachtig), de testomschrijving en testinhoud kan verschillen/verschillend geïnterpreteerd worden. 

Vormen van vertekening:

  • Constructbias (begripsvaliditeit)
  • Methode (afname, afnemer, interactie)
  • Itembias (in de test zelf)

Culturele verschillen beïnvloeden de itembias: ben je bekend met items? Hoe praat je over symptomen? Vertalings- en formuleringskwesties? Etc.

Hoe kan je een bias voorkomen?

  • Check de inhoud (items) en procedure van tests met vertegenwoordigers van verschillende groepen.
  • Specificeer de afname goed en maak deze toepasbaar op alle groepen.
  • Doe psychometrisch onderzoek voor verschillende doelgroepen (bias erkennen!).

Fairness: een zo eerlijk mogelijke test, zonder bias in de inhoud, met gelijke testomstandigheden, mogelijkheden en testuitkomsten voor alle groepen.

Cultural test bias hypothesis: neemt aan dat groepen niet verschillen. Ieder verschil tussen groepen is het gevolg van bias. Een compleet faire test levert geen verschil in resultaten op.

Bell curve: stelt dat arme en donkere mensen in de US dit te danken hebben aan een geërfde lage intelligentie. Stephen Jay Gould had op de volgende aannames van de Bell curve kritiek:

  1. Intelligentie is een getal (Gould: intelligentie is een marge)
  2. Je kunt mensen rangordenen op basis van dat getal
  3. Intelligentie is erfelijk (Gould: ook grotendeels niet)
  4. Intelligentie is onveranderlijk (Gould: het feit dat het genetisch is betekent niet dat het niet ontwikkelbaar is)

Het Flynn effect: toename van IQ tussen 1932-1997 (Hoeft niet te betekenen dat we slimmer zijn geworden; we zijn in ieder geval beter geworden in het maken van een IQ-test).

Het biologisch gegeven ‘ras’ bestaat niet (human genome project).

Inhoud van de tests is ontwikkeld door westerse witte mensen, dit vergroot substantieel de kans op bias t.a.v. andere groepen in de test.

De COTAN beoordeelt fairness d.m.v. een matrijs.

Klachten analyse: stellen van goede vragen. Wat heeft deze cliënt nodig? Wat is er aan de hand? (ipv ‘is er sprake van ADHD’? Stel alleen vragen die cliënt echt verder helpen.

Probleem-analyse: voldoet het gedragspatroon aan de DSM-classificatie? Wat zijn de cognitieve vermogens van de cliënt? Gewetensontwikkeling?

Indicatie-analyse: welke behandeling kies je voor je cliënt? Evidence-based keuze maken: kies voor behandeling die op grond van de best beschikbare gegevens het meest waarschijnlijk werkt. Hoe groter de impact van de keuze, hoe eerlijker je moet zijn over de onzekerheid.

Van symptoom naar classificatie: als er x aantal symptomen aanwezig zijn dan word je gediagnosticeerd met stoornis y. Niet andersom: de symptomen komen niet door de stoornis.

Als je deze aantekeningen handig vond, volg dan gelijk mijn WorldSupport account! Dit kan door rechts naast deze samenvatting op '+ Follow' te klikken. Wordt

.....read more
Access: 
JoHo members
Work for WorldSupporter

Image

JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Check more of this topic?
How to use more summaries?


Online access to all summaries, study notes en practice exams

Using and finding summaries, study notes en practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Starting Pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
  2. Use the menu above every page to go to one of the main starting pages
  3. Tags & Taxonomy: gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
  4. Follow authors or (study) organizations: by following individual users, authors and your study organizations you are likely to discover more relevant study materials.
  5. Search tool : 'quick & dirty'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject. The search tool is also available at the bottom of most pages

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study (main tags and taxonomy terms)

Field of study

Access level of this page
  • Public
  • WorldSupporters only
  • JoHo members
  • Private
Statistics
1434
Comments, Compliments & Kudos:

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.