Hoorcollege 12 Psychologie als Wetenschap 2023 Universiteit Utrecht

Join Log in Profile Search

Hoorcollege 12

Onvolkomenheden KTT (klassieke test theorie beperkingen)

Theorie over testscores: weinig informatief over afzonderlijke items (hoe de items werken bv)
Schatting betrouwbaarheid testscore: afhankelijk van populatie(variatie). Dus de steekproef
Aanname over toevallige meetfout: meetfout is onafhankelijk van niveau respondent
Aanname over meetniveau testscore: niet statistisch te toetsen (‘meten bij fiat’)
Beperkingen in vergelijken respondenten: betrouwbaar voor middengroepen is goed, maarde buitenkant minder. En ontwikkeling (Xt2 – Xt1) lastig vast te stellen.
Inefficiëntie: alle respondenten moeten hele test maken. Dus geen selectie.

Item-responstheorie (IRT). Komt tegemoet aan de onvolkomenheden KTT.

Het is een theorie over itemscores in plaats van testscores
Schatting van psychometrische kenmerken van items en testscore is onafhankelijk van de populatie (sample free of sample independent)
Nauwkeurigheid van schatting (= betrouwbaarheid) kan binnen IRT variëren tussen respondenten (er is differentiatie in niveau mogelijk)
Aannames over model(len) statistisch toetsbaar (‘meten bij implicatie’)
Op IRT gebaseerde tests maken beoordeling ontwikkeling beter mogelijk
Schatting vaardigheid onafhankelijk van verzameling items: dit maakt testafname op maat (adaptief testen) mogelijk. (Met een beperkt aantal items komen op een vaardigheid)

Item-responsmodel (het is een meetmodel voor itemscores)

Waargenomen itemscore X1 wordt bepaald door latente variabele T (latente trek
(continu)of latente klasse (categorisch)). De t staat voor teta (vaardigheid)
Het is een factormodel voor discrete (2 antwoordmogelijkheid, dus ja of nee) en ordinale (likert schade, dus van mee eens tot niet mee eens) itemresponsen.

Item-responsfunctie (functie zegt iets over de relatie tussen teta en P) engelse afkorting: ICC

Kans op item goed (P (Xg = 1)) afgezet tegen latente trek 0.
De item-responsfunctie laat met figuur of formule zien hoe P(Xg= 1) afhangt van latente trek 0. (Van je kwaliteit)
Het gaat om dichotome antwoorden, dus goed/fout. Ja of nee.

Soort gegevens

dominantiegegevens (als je antwoord goed hebt, beschik je over de vaardigheid, zoals cognitie) en preferentiegegevensAantal en soort antwoordcategorieën
continu of discreet
geordend of niet geordend
polytoom of dichotoom

Dichotome dominantiegegevens (hier beperken we ons tot)

Xig = 1, voor een goed antwoord van persoon i op item g.
Xig = 0, voor een fout antwoord van persoon i op item g.

Deterministisch model (Guttman)

Een respons wordt beïnvloed door 1 latente trek (0): De items zijn ééndimensionaal. Je hebt het dus wel of niet.
Functie (= stap- of sprongfunctie)

- als 0 < 0’, dan P (Xg = 1) = 0 (dus als je niet vaardig ben)

- als 0 ≥ 0’, dan P (Xg = 1) = 1 (dus als je vaardig ben)

Probabilistisch model (Mokken, Rasch, Birnbaum) (de kans dat je een vraag

goed beantwoord, gegeven een vaardigheid)

Een respons wordt beïnvloed door één latente trek (0): ééndimensionaal
Functie: monotoon niet dalend
0 < P (Xg = 1 | 0) < 1 (waarden tussen de 0 en de 1)

Kenmerkende eigenschappen ICC: Probabilistisch model

vorm: monotoon niet dalende curve
helling: steilheid varieert; in staarten (a, c) is functie minder steil dan in het middendeel (b)

Giskans: Definitie giskansparameter (Yg )

Kans op goed antwoord op item g bij zeer lage waarde van latente trek. (Geen vaardigheid)
Giskans (= gokkans = raadkans) is afhankelijk van aantal alternatieven bij meerkeuzevragen.
Het is de start van de ICC (symbool is g= gamma)

Moeilijkheid : moeilijkheidparameter (Sg)

Itemmoeilijkheid (Sg ) is waarde op latente trek (0) waarvoor geldt dat de succeskans midden tussen giskans Yg en P(Xg = 1) ligt (omslagpunt).
Sg geeft de locatie van de item-responsfunctie op 0-schaal.

Maximale discriminatie: onderscheidend vermogen van een item (bepaald door stijlheid)

Als respondent i item X1 goed beantwoord (X1 = 1), dan 0i ≥ 0’.
Als respondent i item X1 niet goed beantwoord (X1 = 0), dan 0i < 0’. —> X1 is maximaal
onderscheidend rond 0’.

Minimale discriminatie: Onderscheidend vermogen (kan niks afleiden van een antwoord)

Voor alle respondenten geldt P (X2 = 1) = 0.5.
Geen onderscheid tussen respondenten mogelijk op basis van de itemrespons. —> X2 is een minimaal (= niet) onderscheidend item.

Discriminatie: Definitie discriminatieparameter (Ag)

Discriminatieparameter (Ag ) is steilheid van functie in punt (Sg, (Yg+1)/2)).
Hoe groter Ag, hoe beter het item discrimineert (= onderscheidend vermogen) voor personen rond 0 = Sg.

Aannames item-responsmodellen (is om de aannames over model statistisch te toetsen)

Gemeenschappelijke aanname IRT: Itemresponsen binnen een test worden bepaald door één latente trek (ééndimensionaliteit). Waaruit volgt dat items:

Globaal afhankelijk: in populatie geldt dat Pgh > 0 (hebben onderling positieve samenhang)
Lokaal onafhankelijk: in homogene subpopulaties (groepen binnen de populatie met dezelfde vaardigheid) geldt dat (Pgh | teta) = 0 (afwezigheid samenhang bij gelijkwaardige vaardigheden)

Modelspecifieke aannamen: Afhankelijk van model (Guttman, Mokken-, Rasch- en, Birnbaummodellen) zijn er extra aannamen over de parameters van de item-responsfuncties.. Controle aannames (dus toetsen)

Globale afhankelijkheid: Bij afname van test bij steekproef uit heterogene (verschilt) populatie:

De proportie goede antwoorden is afhankelijk van gemiddelde vaardigheid in groep.
Binnen hele groep positieve samenhang tussen item g en item h.
Controle (toetsing) door na te gaan of alle rgh > 0. (Dus positieve correlaties)

Lokale onafhankelijkheid: Bij afname test bij steekproef uit homogene subpopulatie: De kans op item g goed is onafhankelijk van item h goed.

De kansen op antwoordpatronen liggen vast. (Allebei goed/fout of 1 goed en 1 fout)
Controle (toetsing) mogelijk door vergelijken van verwachte proporties en geobserveerde
proporties.

Beoordeling Guttmanmodel

Gegeven een bepaalde θ (teta) maak je een item goed of fout.
Gegeven een bepaalde θ mag het niet zo zijn dat moeilijke item g goed (=1) en makkelijke item h fout (=0). Hier mag geen schending in zitten.

Beoordeling

Stel Item g en item h.
Item g is moeilijker dan item h.
Mogelijke antwoordpatronen: (0, 0), (1, 1), (1, 0), (0, 1), waarbij eerstgenoemde het antwoord op

moeilijkste item.

Antwoordpatroon (1, 0) noemen we foutenpatroon. Omdat het makkelijke fout is.
Tel foutenpatronen voor alle paren van items.
Als foutenpatronen voorkomen, dan wordt Guttmanmodel verworpen.
Mogelijk past een Mokkenmodel.

Mokkenmodellen met monotone homogeniteit. Aannamen:

1. Eéndimensionaliteit: globale afhankelijkheid items en lokale onafhankelijkheid items

2. Succeskans p is monotoon niet-dalende functie: monotoon naar theta (θ)

Mokkenmodel met dubbele monotonie. Met nog een extra aanname:

3. Item-responsfuncties mogen elkaar ook niet snijden: monotoon naar theta (θ) èn delta (δ)

Controle monotone homogeniteit

1. Bepaal voor alle personen restscore (= testscore – score item g).

2. Bepaal voor subgroepen (dezelfde restscore) kans op item g goed.

3. Teken item-responsfunctie (ICC) voor item g.

4. Toets schending van monotonie naar 0. Je ziet in het figuur dat de verwachting is

geschonden, want hoe meer vaardig je bent, maak je de test niet beter. Kijk naar de 5e X.

Als ICC’s monotoon niet dalend, dan: Ordenen personen en items: personen: ordenen op

totaalscore test. En items: ordening items afhankelijk van 0.

Mokkenmodel dubbele monotonie. De volgende aannames over de functie:

monotonie naar 0 èn
monotonie naar S
item-responsfuncties snijden elkaar niet
voor elke 0-waarde is volgorde van items naar moeilijkheid gelijk

Controle monotonie naar S

1. Bepaal voor alle personen restscore

2. Bepaal voor subgroepen (dezelfde restscore) kans op item g goed

en item h goed

3. Teken itemrespons-functies voor item g en item h

4. Vergelijk ordening items voor elke groep met ordening in hele

steekproef

5. Toets schending van aannamen monotonie naar S. Hier een

schending, omdat ze elkaar snijden, kijk naar de 3e X.

Als ICC’s monotoon niet dalend en ICC’s snijden niet, dan: Ordenen personen en items

- personen: ordenen op totaalscore test (= aantal goed).

En items: ordening items onafhankelijk van 0.

Access:

Public

Check more of this topic?

Samenvattingen voor psychologie en gedrag

Search other summaries?

Associate with your Field of Study

Search Summaries or Notes

Start using Summaries

Add a Summary

This content is also used in .....

aantekeningen hoorcolleges Psychologie als Wetenschap 2023 UU

Hoorcollege 4 Psychologie als Wetenschap 23 UU

Hoorcollege 4

Bias: systematische vertekening die een objectieve interpretatie van de realiteit in de weg staat. Vooroordeel of vooringenomenheid die de perceptie kleurt

Mens (persoonlijke biases): staan ons als mens/psycholoog/onderzoeker in de weg om objectief waar te nemen
Methode (bias in tests en methode): hebben invloed op de middelen waarmee we iets objectief willen meten
Systeem (systematische biases) beïnvloeden de invloed van het wetenschapssysteem

Persoonlijke bias: er is subjectiviteit in je individuele waarneming van de wereld doordat wij verschillen in emotionele staat, ervaringen, omgevingen, taal, begrip

Confirmation bias: je gaat op zoek naar feiten en bewijs die bevestigen waar jij gelooft. Hierbij negeer je dus informatie die hier niet bij past
Hindsight bias: achteraf schat je de kans groter in dan voorheen. Bvb ik denk dat Tina Turner live goed is en achteraf concert zeggen ja ik wist zeker dat ze live goed is.
Bias blind spot: je denkt dat jezelf minder vatbaar bent voor persoonlijke biases dan anderen
Halo/horn effect
Overconfidence
Representativiteits
Attributie
Availibility

Nut van biases

Zijn mentale shortcuts bij probleemoplossen
Helpt met het vormen van een coherentie werkelijkheid die cognitief minder belastend is
Is een snel beslissysteem en dus handig als er gevaar dreigt, maar wel slecht in kansen

Verschillende punten waarop een vertekening kan ontstaan in wetenschappelijk onderzoek

(on)bewust belang van de onderzoeker: ondersteuning voor zijn/haar theorie, gepubliceerd willen worden etc
Selectiebias: slechts een deel van de populatie wordt omvat
Bij het operationalisatieproces kan het ook fout gaan

Psychologische test: middel of procedure in welke een sample van een individu’s gedrag is verzameld, geëvalueerd of gescoord middels gestandaardiseerde procedures

Peformance tests: prestatietaken, aptiude tests, reactietijden
Typical response tests: vragenlijsten naar kenmerken, symptomen of attitudes
Systematische observaties
Kwalitatieve interviews
Fysiologische maten

Voorbeeld meten van persoonlijkheid

Rorschach vlekkentest: inktvlekken worden getoond en gevraagd om te beschrijven wat er wordt gezien, hierbij owrdt gelet op inhoud, plaats en vorm determinanten
Vragenlijsten: bvb de MMPI-2 of de PID-5 voor stoornissen
Systematische observaties: bb middels video-opnamen in verschillende sociale situaties
Op basis van online gedrag (Big Data)

Belangrijke onderdelen van een test/meetinstrument

Gebaseerd op een theorie
Meet wat je wilt meten (validiteit)
Meet wat het zegt te meten
Resultaten moet niet afhankelijk zijn van toeval, moment of situatie (betrouwbaar)
Test moet uitvoerbaar zijn binnen de gegeven context en populatie (generalisatie)

Bias in test en afname

Vertekening die de validiteit van een testuitslag bedreigt
Vertekening die een groep met bepaalde kenmerken systematisch onder- of overschat ten opzichte van een andere groep

Access:

Public

Hoorcollege 5 Psychologie als Wetenschap 2023 Universiteit Utrecht

Hoorcollege 5

4 richtingen binnen psychologie (functieleer PF, Sociale (en organisatie) SHOP, Ontwikkelings OWP, Klinsich KP)

Horen allemaal bij psychologie
Kennen hun eigen prominenten vraagstukken en onderwerpen
Zijn soms bepalend voor methodologie, meetmethoden en onderzoeksopzet
Hebben hun eigen uitdagingen

	Centrale vragen	Kenmerkende methoden	Uitdagingen
PF	Wat zijn eigenschappen van cognitieve en sociaal-affectieve functies bij de mens? En wat is hun biologisch basis?	Gedragsmaten (psychofysica, reactietijd) Biofysica (oogbewegingen, fysiologische maten) Neurowetenschappelijke methoden (EEG etc)	Wat is eigenlijk precies de relatie tussen gedrag en fysiologie? Hoe vertalen we onderzoeksresultaten uit het lab naar een andere (alledaagse) context?
SP	Hoe worden gedrag, beslissingen, cognities en emoties van mensen beïnvloed door hun sociale omgeving?	Vrangelijstenonderzoek Experimenteel onderzoek Labonderzoek met cognitieve tests en neurologische uitleesmaten	Rapporteren mensen daadwerkelijk wat ze echt denken, voelen en vinden? Is het resultaat van (lab)onderzoek of experimenteren wel te generaliseren naar echte situaties?
OWP	Hoe ontwikkelen kinderen zich op allerlei terreinen? Welke factoren oefenen hier invloed op uit? Hoe kun je de ontwikkeling (positief) beïnvloeden?	Vragenlijstenonderzoek, afgenomen bij meerdere informanten Cognitieve taken voor kinderen Longitudinale opzet	Oordelen in vragenlijsten kennen een subjectieve invloed Gedrag is context specifiek Wanneer is iets eigenlijk een probleem? Interventies worden uitgevoerd in een dynamische setting Ethische vraagstukken
KP	Hoe kenmerken psychische problemen zich? Welke onderliggende psychologische processen spelen een rol? Hoe kunnen psychische problemen voorkomen en effectief behandel worden?	Klinisch onderzoek (vragenlijsten, interviews en/of gedragsmaten) Experimenteel of observationeel uitgevoerd	Kleine complexe samples (power) Wanner is iets eigenlijk een probleem? Interventies worden in een dynamische setting uitgevoerd Ethische vraagstukken

Uitgangspunten bij testgebruik

Psychologische constructen bestaan en kunnen gemeten worden
Metingen van psychologische constructen zijn iet perfect
ER zijn verschillende manieren om een construct te meten
Alle meetmethoden hebben krachten en beperkingen
Prestaties op tests kunnen gegeneraliseerd worden naar niet-testgeboden gedrag
Een combinatie van tests kunnen informatie verstrekken die psychologen helpt om betere professionele beslissingen te nemen
Testgebruik kan bevorderlijk zijn voor individu en maatschappij

Drie niveaus van testgebruik

Access:

Public

Hoorcollege 6 Psychologie als Wetenschap 2023 Universiteit Utrecht

Hoorcollege 6

Psychologie heeft een verkeerd imago. Nadelen hiervan zijn:

Minder erkend en krijgt hierdoor minder kans op onderzoeksfunding
Minder erkenning vna het belang van psychologische kennis in maatschappelijke vraagstukken
Kan in de weg staan van het krijgen van een goede behandeling of interventie

Begrip van public sceptism is belangrijk omdat het helpt

psychologen om te kunne nagaan met ideeën die leven in de maatschappij
psychologische begrijpen waar de weerstand zit
om de relevantie van het vakgebied uit te kunnen leggen
bij het schrijve van aanbevelingen voor beleidsmakers

6 misvattingen over psychologie

Is gewoon commons sense
Gebruikt geen wetenschappelijke methoden
Kan geen generieke claims maken, want iedereen is uniek
Levert geen herhaalbare resultaten op
Kan geen precieze voorspellingen doen
Is niet bruikbaar voor de maatschappij

Populaire wetenschap: er worden veel psychologische boeken etc gepubliceerd, waarvan maar 5% wetenschappelijk is ondersteund

Mythes: er zijn veel hardnekkige mythes, bvb kinderen worden druk van suiker, je handschrift verteld veel over je persoonlijkheid etc. Karl popper zegt dat deze het begin zijn van onderzoek

Dilemma’s in het communiceren van wetenschappelijke bevindingen

Als je bevindingen spannender/betekenisvoller overbrengt, genereert dit meer aandacht voor je bevindingen en jouw CV
Media kan een bevinding uit proportie trekken, waardoor dit weetje een eigen leven gaat leiden en uit de wetenschapper alleen maar spannende uitspraken worden ontlokt
Een bevinding met mogelijke consequenties wordt gedaan. Als niet-wetenschappers zich gaan bemoeien, wordt de noodzaak ervaren de evidentie harder aan te zetten dan gewilt
Evicence based uitspraken over een politiek gevoelig gebied leidt tot social media aanvallen en zo een onveilig gevoel

Ongewenste resultaten

Wetenschappers mijden sommige media
Niet-wetenschappers en pseudowetenschappers krijgen meer ruimte om hun meningen te ventileren
Experts komen minder in beeld
De nuance verdwijnt en de kennis waarop we ons baseren is deels onjuist
Er leeft angst onder wetenschappers

5 regels voor effectieve communicatie

Informeer, haal niet over
Biedt balans, niet vals balans
Sluit onzekerheden af
Benadruk bewijskwaliteit
Hoe rekening met misinformatie

Toekomstige uitdagingen

Snelheid van technologie en maatschappelijke ontwikkelingen vs de traagheid en zorgvuldigheid van wetenschap
Ruim beschikbare misinformatie
AI (Chat GPT)
Rabbitholes en Echochambers
Algoritmen en technologieën, inclusief hun biases
Ethiek en prvacy
Deep fake technologieën

Access:

Public

Hoorcollege 7 Psychologie als Wetenschap 2023 Universiteit Utrecht

Hoorcollege 7

Publicatie bias: gedrag tijdens het pbulicatieproces dat papers met positieve resultaten bevoordeelt over papers met negatieve resultaten

Reviewer bias: editors en reviewers bevoordelen papers met positieve resultaten

File-drawering: onderzoeks probleren negatieve resulataten niet te publiceren

Mertoniaanse nomren

Universalisme: kennis moet persoononafhankelijk zijn
Communalisme: kennis moet openbaar zijn (transpirantie)
Belangeloosheid: streven naar waarheid, niet eigenbelang
Georganiseerd skepsis: systeem voor beoordeling van uitspraken

P-hacking: exploiteren van felxibiliteit in data analyse om statisch significante resultaten te verkrijgen. Dit kan bewust of onbewus (bvb hindsight bias). Of door de data de vormen naar ee theorie of hypothese zonder hier transparant over te zijn.

Hypothesizing after results are known (HARKing): hypothesen bepalen op basis van onderzoeksresultaten. Het presteren vna theoretische onverwachte data alsof deze wel door theorie voorspeld waren en een theorie of hypothese vormen naar data

Credibiliteit revolutie: door transparant te zijn zorg je ervoor dat je onderzoek credible is en word teen tweede refplicatiecrisis vermeden

Transparant in alle stappen van onderzoek. T.b.v. beoordeling en reproduceerbaarheid
Onderzoeksmaterialen, data, analyse code worden gedeeld
Vakbladen, universiteiten en subsidiegevers waarderen transparantie
Transparantere onderzoekspraktijken

Transparantere onderzoekspraktijken

Pregregistratie: onderzoeksplan, beslissingen of beslisblomen, gedetailleerde plannen worden van te voren gedeeld. Levert meer reflectie, overleg, feedback
Registered reports: er was preregistratie en daarna report
Multiverse analyse:Ondercheid tussen arbitratir (meerdere redelijke opties) en niet-arbitraire (duidelijk een beste optie), waarbij alle paden worden bekeken. Dit kan in combinatie met pre-registratie. Alle paden worden verkent en gerapporteerd

Open science

Verkent data op transparante en comfortabele wijze
Beloont kwaliteit, waarover we controle hebben, in plaats van uitkomsten waarover we geen controle hebben
Verminder de druk op het verkrijgen van significante resultaten

Metascience: de studie van wetenschappelijke normen, praktijk en cutluur, met het doel om te interfereren en te verbeteren

Access:

Public

Hoorcollege 8 Psychologie als Wetenschap 2023 Universiteit Utrecht

Hoorcollege 8: testtheorie: betrouwbaarheid en validiteit

NIP beroepscode:

integer,
respectvol,
verantwoordelijk
deskundig.

Hierbij moeten psychologen: theoretische concepten opstellen, operationaliseren, meetinstrument kiezen, gestandaardiseerde afname en uiteindelijk komen met een testscores (puntschatting) en een Intervalschatting (grenzen waarbinnen zijn echte positie zich bevind).

Een theoretisch concept is een abstract kenmerk, eigenschap, variabele, construct, begrip, trait or state.

Gender (vragen naar man / vrouw / X)
Lengte (geregisseerde meting in cm)
Rekenvaardigheid (aantal goed op rekentest)
Prestatie-motivatie (score op onderdeel van PMTK, motivatie en prestatie scores)
Integriteit (score op integriteitstest).

Operationarisatie is de beschrijving van operaties die nodig zijn om de bedoelde eigenschap te meten.

Model klassieke testtheorie: De testscore X wordt bepaalde door 2 invloeden:

Latente of ware score T (true score). De echte mate van integriteit. Is ook de belangrijkste score. Ben jij niet integer dan scoor je laag.
Toevallige meetfout E (error). Er zijn allemaal invloeden: persoon, omgeving, test of de testleider. Het kan dus overal aanliggen. Hoe groter deze fout, hoe minder zeker je bent van de daadwerkelijke score van een persoon.

1. Systematische invloeden wat test beoogt te meten systematische meetfout (niet bedoeld, maar die wel meespelen. Denk aan sociaal wenselijke antwoorden willen geven). maat voor spreiding van toevallige meetfout. Zegt iets over de precisie. Deze hebben we nodig om intervalschatting te komen op basis van de testscore

2. Toevallige invloeden (die zitten in de error) Een meetfout. verschil tussen xi (observatie) en ti (de ware score)

betrouwbaarheid (reliability) Mate van nauwkeurigheid, mate van herhaalbaarheid. Betrouwbare meting —> afwezigheid toevallige meetfout (de mate van aanwezigheid van de meetfout)

toevallige meetfout

1. Bij replicaties is gemiddelde van E (de meetfouten) gelijk aan 0: 1. Voor individu is gemiddelde meetfout gelijk aan nul. 2. In populatie is gemiddelde meetfout gelijk aan nul. T Gedownload door: yaraclaassen | yara.claassen@gmail.com Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar. € 912 per jaar extra verdienen? Stuvia - Koop en Verkoop de Beste Samenvattingen

2. Meetfout E correleert niet met ware score T: PET = 0 1. Meetfout komt uitsluitend door toevallige invloeden tot stand.

3. Meetfout E van verschillende tests correleren niet: PEE’ = 0 1. Meetfout komt uitsluitend door toevallige invloeden tot stand.

Standaardmeetfout (SE)

Standard error of measurement (SE, SEM)

Spreiding van de toevallige meetfout bij oneindig aantal replicaties.
Geeft een indicatie van de nauwkeurigheid van de meting in een populatie.
De standaardmeetfout is identiek voor alle individuen waarbij je het instrument afneemt (= aanname). Het is voor iedereen hetzelfde. Met de standaardmeetfout kunnen we het betrouwbaarheidsinterval afleiden voor de ware score.
formule: Betrouwbaarheid: Testscore is ware score plus toevallig fout: Testvariantie is ware scorevariantie plus errorvariantie: Betrouwbaarheid is verhouding tussen ware scorevariantie en testvariantie: Hoe dichter bij 1 hoe betrouwbaarder de test, hoe dichter bij 0, hoe onbetrouwbaarder. Toch is er een probleem. Want de variantie van ware scores S2/t is bekend, we moeten dus de betrouwbaarheid testscore moeten we daarom schatten.

Access:

Public

Hoorcollege 9 Psychologie als Wetenschap 2023 Universiteit Utrecht

Hoorcollege 9: factoranalyse

Factoranalyse (begripsvaliditeit): kijkt naar relaties binnen een test. Je wilt samenhangende items, wat zorgt voor dimensionale schaal. Doelen van een factoranalyse:

Beoordelen dimensionaliteit van test: Vinden we het aantal theoretisch veronderstelde dimensies (= factoren) binnen de verzameling van testitems? -> confirmerende factoranalyse (CFA). We hebben namelijk een verwachting, en willen we dit ook bevestigen.
Realiseren van datareductie, Kunnen we informatie uit groot aantal variabelen samenvatten in kleiner aantal nieuw te construeren variabelen (= factoren)? -> explorerende factoranalyse (EFA). Je komt dus tot nieuwe variabelen. We hebben item variabelen en test (scores) variabelen. We hebben hier geen verwachting, maar we willen nagaan hoe iets zit.

De stappen in een factoranalyse: factormodellen

Stap 1: welk model? Hier wordt gekeken naar factormodellen: Hoofdcomponentenanalyse (PCA) en Principal axis factoring (PAF) zijn de 2 meest gebruikte modellen
Stap 2: aantal factoren? Eigenwaarde criterium en Knikcriterium
Stap 3: interpretatie factor(en)? Doen we door een van de 2 te kiezen: Orthogonale rotatie en Oblique rotatie
Stap 4: kwaliteit factoroplossing? Simple structure, Correlatie tussen factoren, Proportie verklaarde variantie factoren en Communaliteit

Stap 1: factoranalyse: keuze voor de achterliggende factormodel.

Hoofdcomponentenanalyse (Principal Components Analyses). Hierbij woorden de A’s berekend. De sterke van de invloed van de factor op de afzonderlijke variabale/observaties.
Factoranalyse (Principal Axis Factoring); met U(nieke factor). Is een iets uitgebreider model. Ze hebben ook andere invloeden.

Toelichting factormodel

Geobserveerde variabele (X , Zx )
X = individuele score op variabele en Zx = X getransformeerd naar z-score
Factorlading (a) Correlatie van variabele met factor. NB. De factorladingen a worden
geschat. Dus hoe goed/slecht de is factor op een item. Het zijn achterliggende verklaringen. Factor (F ) Achterliggende verklaring voor variatie (variantie) in en samenhang (correlaties)
tussen de variabelen. NB. In PCA spreekt men van componenten in plaats van factoren.
Unieke factor (u) Unieke factor voor verklaring van specifieke en error variantie.

Vergelijking voor factorscore F

Voor ieder individu een score op (elke) factor.
Voor persoon i is Fji de gewogen som (lineaire combinatie) van k naar Z gestandaardiseerde variabelen.
F is een nieuwe variabele, die meerdere variabele
samen pakken.
Voor verdeling van factorscores geldt: gemiddelde M = 0 en standaardafwijking SD =1

Stap 2: bepalen van het aantal factoren

Aantal mogelijke factoren: Maximaal aantal factoren is gelijk aan totaal aantal variabelen (k) in de analyse. Hebben we 11 variabele in de analyse, kunnen we 11 factoren krijgen.
Doel factoranalyse: Met zo weinig mogelijk factoren zo veel mogelijk variantie in variabelen verklaren (datareductie). Dus hoe goed die test zijn gemaakt.
Verklaarde variantie factoren
- Factor 1: verklaart zo groot mogelijk deel van testvariantie. Heeft de meeste invloed/gewicht
- Factor 2: verklaart zo groot

Access:

Public

Hoorcollege 10 Psychologie als Wetenschap 2023 Universiteit Utrecht

College 10: Itemanalyse en transformaties

Itemanalyse; het doel van deze analyse is het verkrijgen van een optimale test (of schaal); met zo weinig als mogelijk items zo’n hoog mogelijke betrouwbaarheid voor testscore. De scores die je toekent kan je ordenen. NB. Dit zonder verlies van inhoudsvaliditeit. Het is de volgende procedure

Factoranalyse ter beoordeling van eendimensionaliteit. Je wilt een selectie van items.
Selecteer items voor schaal
Codeer items in zelfde richting. Een hoge code, betekent veel van het kenmerk.
Betrouwbaarheidsanalyse met Cronbach’s alfa voor schatting betrouwbaarheid. Geeft een
betrouwbaarheid van de hele schaal, maar ook van de afzonderlijke items.
Itemanalyse voor selecteren items voor schaalscore. Hierdoor komen we tot een definitieve selectie, dus een definitieve schaal.

Selectiecriteria test-items

Het doel van prestatieniveautest: personen betrouwbaaronderscheiden. Er zijn dus veel verschillende scores nodig, die we dan weer kunnen ordenen. Je wilt de optimale score krijgen.

Criteria itemselectie

Test (of schaal) moet zo goed als mogelijk differentiëren (Heeft te maken met onderscheiden)
Testbetrouwbaarheid zo hoog als mogelijk (heeft te maken met betrouwbaarheid)

Hoe?

realiseer een test met de grootste spreiding testscores:
kies voor items die ‘goed’ differentiëren
kies voor items die onderling ‘sterk’ samenhangen

Met wat?

itemvarianties (Sg/2); hoe groter hoe meer differentiatie. Je wilt dus veel spreiding.
inter-itemcorrelaties (R gh); hoe hoger hoe betrouwbaarder.
Inter-itemcorrelaties

Itemcorrelatie:

Voor elk item is er een correlatie met alle overige items.
Is er een samenvattende maat voor de correlatie van item i met alle overig
items? Dan maak je gebruik van:
Item-totaalcorrelatie (Item-total correlation). Dit is de hele test.
Correlatie ri,x tussen item (i) en testscore (X). —> rit - waarde
Item-restcorrelatie (Item-rest correlation). Dit is de correlatie met het item en de overige items.
Correlatie ri,(X-g) tussen item (i) en score op test zonder item (X - g). —> rit - waarde
Bij de SPSS output kijken bij: corrected item-total correlation.

Resultaat itemselectie : Gevolgen procedure itemselectie:

Een zo betrouwbaar als mogelijke test.
Globaal een zo goed als mogelijk differentiërende test.
Een test die nauwkeurig meet in midden van verdeling:
maakt differentiatie voor middengroepen goed mogelijk.

Cronbach’s alfa (coëfficiënt alpha)

de Cronbach’s alfa is een procedure voor het schatten van de betrouwbaarheid, met Likert achtige schalen.
Populaire methode betrouwbaarheidsschatting testscore.
Voor items met meer dan twee geordende categorieën.
Voor homogene set van items (eendimensionaal).

Kuder-Richardson 20 (KR-20)

Speciaal geval van Cronbach’s alfa
Voor dichotome items (positief = 1, negatief = 0; goed =
1, fout = 0). Je kan alleen maar 0 of 1 toekennen.
Voor homogene

Access:

Public

Hoorcollege 11 Psychologie als Wetenschap 2023 Universiteit Utrecht

Hoorcollege 11: Signaal-detectie theorie (beslissend test gebruik)

Signaal detectie theorie

Is een vervolg op de criterium gerichtheid. Er worden namelijke beslissingen in onzekerheid
genomen (subjectieve oordelen van cliënt en diagnosticus, onbetrouwbaarheid test en lastig om veelheid van informatie te integreren tot een oordeel).
Theorie die de mogelijkheid biedt diagnostiek vanuit modelmatig, besliskundig perspectief aan te pakken. Het maakt het mogelijk om grip te krijgen op deze onzekerheid.
Denkkader en verzameling analysemethoden rondom het nemen van beslissingen.
Theorie over kans op goede en foute beslissingen, met aannamen over verdelingen van testuitkomsten onder verschillende omstandigheden.
Van toepassing in alle te onderscheiden gebieden binnen de psychologie.
Bij de SDT wordt gebruikt gemaakt van een grensaarde: rechts van de grenswaarde heeft een stoornis en link van de grenswaarde heeft geen stoornis. Er zijn 4 oppervlaktes te onderkennen.

Sensitiviteit (gevoeligheid voor wat je wilt meten)

Hoe groot is de kans op een positieve diagnose gegeven dat iemand de stoornis heeft?
Kans op positieve diagnose (D+) gegeven dat het individu behoort tot categorie (C+). Je wilt een hoge waarden hebben.

Specificiteit (zegt iets over de kwaliteit van de test)

Hoe groot is de kans op een negatieve diagnose gegeven dat iemand de stoornis niet

heeft? Je wilt een hoge waarden hebben.

Predictieve waarde

Positieve predictieve waarde (PPV): Proportie ware positieven gegeven een positieve diagnose.
Negatieve predictieve waarde (NPV) Proportie ware negatieven gegeven een negatieve diagnose. Beide waarde zijn problematisch.

Prevalentie (base rate) het voorkomen van de stoornis in de populatie.

Kans op aanwezigheid stoornis (C+) voor iemand uit de populatie. Het is een problematische waarde, het is geen goede schatting. Er is namelijk een aselecte steekproef nodig uit de populatie of eerder onderzoek of expertschatting.

Selectieratio

Hoe groot is de kans dat iemand uit de populatie een positieve diagnose (ware en valse positieven) krijgt? Kans op positieve diagnose (D+) voor iemand uit de populatie.
Het is dus de valse en ware positieven bij elkaar opgeteld. Ook deze waarden zijn problematische waarde. Er is namelijk een aselecte steekproef nodig uit de populatie of eerder onderzoek of expertschatting.

Predictieve accuratesse: diagnostische test is afhankelijk van:

kwaliteit instrument (sensitiviteit en specificiteit van het instrument)
voorkomen van stoornis, ziekte, trauma (prevalentie)
Zelfs bij betrouwbaar instrument is bij lage prevalentie de kans op correcte beoordeling klein.

Base rate neglect (base rate fallacy) Het niet betrekken van (lage) prevalentie bij beoordeling van cliënt op basis van positieve diagnose en de sensitiviteit van de test.

predictieve accuratesse is bij lage prevalentie altijd gering. Stoornissen die weinig voorkomen, kan je snel overschatten. Dus zeggen dat de stoornis aanwezig is, terwijl deze niet aanwezig is.
met subjectieve a-priori verwachting kun je P(C+) aanpassen

Keuze grenswaarde. Wat is een

Access:

Public

Hoorcollege 12 Psychologie als Wetenschap 2023 Universiteit Utrecht

Hoorcollege 12

Onvolkomenheden KTT (klassieke test theorie beperkingen)

Theorie over testscores: weinig informatief over afzonderlijke items (hoe de items werken bv)
Schatting betrouwbaarheid testscore: afhankelijk van populatie(variatie). Dus de steekproef
Aanname over toevallige meetfout: meetfout is onafhankelijk van niveau respondent
Aanname over meetniveau testscore: niet statistisch te toetsen (‘meten bij fiat’)
Beperkingen in vergelijken respondenten: betrouwbaar voor middengroepen is goed, maarde buitenkant minder. En ontwikkeling (Xt2 – Xt1) lastig vast te stellen.
Inefficiëntie: alle respondenten moeten hele test maken. Dus geen selectie.

Item-responstheorie (IRT). Komt tegemoet aan de onvolkomenheden KTT.

Het is een theorie over itemscores in plaats van testscores
Schatting van psychometrische kenmerken van items en testscore is onafhankelijk van de populatie (sample free of sample independent)
Nauwkeurigheid van schatting (= betrouwbaarheid) kan binnen IRT variëren tussen respondenten (er is differentiatie in niveau mogelijk)
Aannames over model(len) statistisch toetsbaar (‘meten bij implicatie’)
Op IRT gebaseerde tests maken beoordeling ontwikkeling beter mogelijk
Schatting vaardigheid onafhankelijk van verzameling items: dit maakt testafname op maat (adaptief testen) mogelijk. (Met een beperkt aantal items komen op een vaardigheid)

Item-responsmodel (het is een meetmodel voor itemscores)

Waargenomen itemscore X1 wordt bepaald door latente variabele T (latente trek
(continu)of latente klasse (categorisch)). De t staat voor teta (vaardigheid)
Het is een factormodel voor discrete (2 antwoordmogelijkheid, dus ja of nee) en ordinale (likert schade, dus van mee eens tot niet mee eens) itemresponsen.

Item-responsfunctie (functie zegt iets over de relatie tussen teta en P) engelse afkorting: ICC

Kans op item goed (P (Xg = 1)) afgezet tegen latente trek 0.
De item-responsfunctie laat met figuur of formule zien hoe P(Xg= 1) afhangt van latente trek 0. (Van je kwaliteit)
Het gaat om dichotome antwoorden, dus goed/fout. Ja of nee.

Soort gegevens

dominantiegegevens (als je antwoord goed hebt, beschik je over de vaardigheid, zoals cognitie) en preferentiegegevensAantal en soort antwoordcategorieën
continu of discreet
geordend of niet geordend
polytoom of dichotoom

Dichotome dominantiegegevens (hier beperken we ons tot)

Xig = 1, voor een goed antwoord van persoon i op item g.
Xig = 0, voor een fout antwoord van persoon i op item g.

Deterministisch model (Guttman)

Een respons wordt beïnvloed door 1 latente trek (0): De items zijn ééndimensionaal. Je hebt het dus wel of niet.
Functie (= stap- of sprongfunctie)

- als 0 < 0’, dan P (Xg = 1) = 0 (dus als je niet vaardig ben)

- als 0 ≥ 0’, dan P (Xg = 1) = 1 (dus als je vaardig ben)

Probabilistisch model (Mokken, Rasch, Birnbaum) (de kans dat je een vraag

goed beantwoord,

Access:

Public

Follow the author: Yara Claassen

Yara Claassen

More contributions of WorldSupporter author: Yara Claassen:

Work for WorldSupporter

JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Comments, Compliments & Kudos:

Add new contribution

Promotions

Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland

Study or work abroad? check your insurance options with The JoHo Foundation

Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams
How and why would you use WorldSupporter.org for your summaries and study assistance?
Using and finding summaries, study notes en practice exams on JoHo WorldSupporter
Quicklinks to fields of study for summaries and study assistance

Online access to all summaries, study notes en practice exams

Check out: Register with JoHo WorldSupporter: starting page (EN)
Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)

How and why would you use WorldSupporter.org for your summaries and study assistance?

For free use of many of the summaries and study aids provided or collected by your fellow students.
For free use of many of the lecture and study group notes, exam questions and practice questions.
For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
For compiling your own materials and contributions with relevant study help
For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, study notes en practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

Use the menu above every page to go to one of the main starting pages
- Starting pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
Use the topics and taxonomy terms
- The topics and taxonomy of the study and working fields gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
Check or follow your (study) organizations:
- by checking or using your study organizations you are likely to discover all relevant study materials.
- this option is only available trough partner organizations
Check or follow authors or other WorldSupporters
- by following individual users, authors you are likely to discover more relevant study materials.
Use the Search tools
- 'Quick & Easy'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject.
- The search tool is also available at the bottom of most pages

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Check out: Why and how to add a WorldSupporter contributions
JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form

Quicklinks to fields of study for summaries and study assistance

Field of study

Check the related and most recent topics and summaries:

Activity abroad, study field of working area:

Samenvattingen voor psychologie en gedrag

Institutions, jobs and organizations:

Samenvattingen voor psychologie in Utrecht via Alcmaeon en JoHo

Access level of this page

Public
WorldSupporters only
JoHo members
Private

Statistics

1141