Hoorcollege Betrouwbaarheid

Sheetnotes 19/20

Welke onderwerpen worden behandeld in het hoorcollege?
In dit college staat betrouwbaarheid centraal. Er worden verschillende soorten betrouwbaarheid benoemd en andere concepten gerelateerd aan betrouwbaarheid. De bijbehorende literatuur is H4 van Mastering Modern Psychological Testing; Theory & Methods.

Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
De onderwerpen komen overeen met het hoofdstuk uit het boek.

Welke recente ontwikkelingen in het vakgebied worden besproken?
Er worden geen recente ontwikkelen besproken.

Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
Er worden geen opmerkingen over het tentamen gemaakt.

Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
Er worden geen tentamenvragen behandeld.

Hoorcollegeaantekeningen 19/20

Betrouwbaarheid

Schatting van de betrouwbaarheid van een test = hoe nauwkeurig meet de test. We gaan van een puntschatting (score op een test) naar een intervalschatting. Hoe onbetrouwbaarder een instrument, hoe breder de intervalschatting.

NIP/COTAN evalueert een test op betrouwbaarheid. Er zijn drie niveaus waarop beslissingen genomen worden gebaseerd op een test, deze niveaus hebben verschillende betrouwbaarheidscriteria.

Belangrijke beslissingen op individueel niveau;
Minder belangrijke beslissingen op individueel niveau;
Testgebruik voor onderzoek op groepsniveau.

Tests zijn operationalisaties van theoretische constructen (= abstract kenmerk, eigenschap, variabele). Operationalisering = specificatie van operaties die nodig zijn om de bedoelde eigenschap te meten.

Meetfouten

Betrouwbaarheidsschatting is gebaseerd op klassieke meetmodel. De testscore wordt bepaald door de true score (T) (werkelijke kennis, gedrag) en door een toevallige meetfout (E). De test zelf, de persoon en de omstandigheden kunnen invloed hebben op de testscore. In een vergelijking wordt dit weergegeven als:

X_ij= T_i+ E_ij

Meetfouten kun je onderscheiden in systematische invloeden (wat test beoogt te meten of systematische meetfout) en door toevallige invloeden. In een test voor rekenen is er soms ook lezen nodig, je moet dus kunnen onderscheiden wat de prestatie is op alleen het rekenen en niet het lezen. Betrouwbare meting = wanneer toevallige meetfouten afwezig zijn. Validiteit gaat om afwezigheid van systematische meetfouten (en van toevallige meetfouten).

Stel iemand (i) doet oneindig vaak dezelfde test (= replicaties), dan krijg je heel veel testscores die in een normaalverdeling zichtbaar worden. In de piek ligt de ware score van die individu. Maar we nemen maar één test af, waardoor je maar één meting hebt die ver verwijderd kan liggen van zijn ware score. De spreiding van meetfouten = de gemiddelde fout die je maakt bij het afnemen van een test bij een individu = standaardafwijking = standaard meetfout S_E. De toevallige meetfout is het verschil tussen de gekregen score (x_ij) en de ware score (t_i).

Standaard meetfout geeft spreiding van de toevallige meetfout bij oneindig aantal replicaties. Het geeft een indicatie van de nauwkeurigheid van de test in een populatie. De standaard meetfout is identiek voor alle individuen waarbij je het instrument afneemt. Met de standaardmeetfout kunnen we het betrouwbaarheidsinterval afleiden van de ware score.

Assumpties model klassieke testtheorie

Bij oneindig veel replicaties is het gemiddelde van de meetfout 0.
Meetfout correleert niet met de ware score. Meetfout komt uitsluitend toevallig tot stand.
Meetfout van verschillende tests correleren niet.

Testvariantie

Testvariantie is spreiding van scores. S_x²= S_T²+ S_E². Spreiding in testscores is opgebouwd van spreiding van individuele verschillen plus spreiding van toevallige invloeden. Spreiding = varianties.

Betrouwbaarheid is verhouding tussen ware scorevariantie en testvariantie: r_xx= S_T²/ S_E². Betrouwbaarheid wordt weergegeven met een getal tussen 0 en 1. Het probleem is dat de variantie van ware scores onbekend is. Betrouwbaarheid moeten we dus schatten, bij een schatting maken we gebruik van het symbool ^. Een betrouwbare schatting is een testscore die vrij is van toevallige meetfouten.

Bronnen van meetfouten

Er zijn twee hoofdbronnen van meetfouten:

Inhoud (content sampling error) = verschil tussen steekproef van items en domein van items.
Tijd (time sampling error) = tijdstip (met de omstandigheden) van testafname is van invloed op testresultaat.

Deze twee bronnen zijn aanleiding voor een aantal methoden om te komen tot schatting van betrouwbaarheid.

Methoden schatten van betrouwbaarheid

Test-hertest betrouwbaarheid = r_x1x2
Correlatie tussen testafnames X₁en X₂als schatting voor betrouwbaarheid. Als de omstandigheden heel erg van invloed zijn om de scores, is de correlatie lager en is de betrouwbaarheid minder hoog. Problemen zijn het leereffect, de korte tijd tussen afnames (herinnering van de test) en aan de andere kant de lange tijd tussen afnames (persoonlijke veranderingen).

Paralleltest betrouwbaarheid = r_XX’
Correlatie tussen parallelle test X en X’ als schatting voor betrouwbaarheid. Een individu maakt nu twee verschillende testen die vergelijkbaar zijn. Probleem is dat parallelle tests moeilijk te realiseren zijn.

Split-half betrouwbaarheid = 2 * r_H1H2/ 1 + r_H1H2
Correlatie tussen parallelle testhelften als schatting voor betrouwbaarheid. Omdat we dan maar schatten voor de halve test, maar we willen voor de hele test, is de formule complexer. Bij testverlenging of testverkorting met parallelle items kun je een betrouwbaarheidsschatting, deze bereken je met de Spearman-Brown formule. Die berekent hoe je betrouwbaarheid verandert als je de test verlengt of verkort. Bij een langere test wordt de betrouwbaarheid hoger. Bij een kortere test wordt betrouwbaarheid lager.

Probleem is hoe je de test in twee delen splitst? Je kan van elk mogelijke verdeling de correlatie berekenen en daaruit het gemiddelde nemen, dit is de cronbachs alfa.

Kuder-Richardson formula 20 (KR20)
Items kunnen verschillende aantal antwoordmogelijkheden hebben. KR20 is voor dichotome items (twee antwoorden mogelijk) en voor homogene set van items (eendimensionaal).

Coëfficiënt alfa
Deze methode wordt gebruikt voor items met meer dan twee geordende categorieën (zoals Likert schaal) en voor homogene set van items. De interpretatie van Cronbachs alfa is het gemiddelde van alle split-half betrouwbaarheden en is daarom te zien als ondergrens voor de schatting van betrouwbaarheid. De werkelijke betrouwbaarheid is waarschijnlijk hoger. Een alfa van .80 betekent dat minimaal 80% van variantie in testscores wordt veroorzaakt door variantie in ware scores.

Invloeden op betrouwbaarheid

Lengte test: Spearman-Brown formule. Hoe langer de test, hoe betrouwbaarder de score.
Samenstelling groep: mate van variatie (heterogeniteit/homogeniteit) van testscores binnen een groep (steekproef). Hoe meer spreiding aan scores binnen de groep, hoe hoger de betrouwbaarheid.
Tijdslimiet: stel je hebt een speedtest met een groot aantal items, zal bij tijdgebrek niet alle items worden beantwoord. Test-hertest of paralleltest is hierbij geschikt.

Betrouwbaarheidsinterval

Voor het berekenen van het betrouwbaarheidsinterval heb je de puntschatting nodig, dit is de score op een test van een individu. Daarnaast is de standaard meetfout van belang om te betrouwbaarheid te schatten. Deze kun je berekenen met de formule S_E.

Een puntschatting is waardeloos, aangezien er heel veel invloeden deze score beïnvloeden. Een betrouwbaarheidsinterval geeft een betere indicatie van de ware score.

Access:

Public

Join WorldSupporter!

Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Check more of topic:

Samenvattingen voor psychologie en gedrag

Universiteit Utrecht en studieverenigingen

This content is used in:

Grondslagen van de Psychologische Diagnostiek en Testtheorie - Hoorcollege aantekeningen 19/20

Going abroad?

Insure your way around the world

International expat insurances

Travel & Worldsupporter insurances (NL)

Study with summaries

Associate with your Field of Study

Search Summaries or Notes

Start using Summaries

Add a Summary

Search a summary

Contributions: posts

Help other WorldSupporters with additions, improvements and tips

Add new contribution

Spotlight: topics

Check the related and most recent topics and summaries:

Institutions, jobs and organizations:

Universiteit Utrecht en studieverenigingen

Activity abroad, study field of working area:

Samenvattingen voor psychologie en gedrag

This content is also used in .....

Grondslagen van de Psychologische Diagnostiek en Testtheorie - Hoorcollege aantekeningen 19/20

Hoorcollege Inleiding Diagnostiek

Hoorcollege Diagnostische Cyclus

Hoorcollege Betrouwbaarheid

Hoorcollege Validiteit

Hoorcollege Factoranalyse

Hoorcollege Betekenis testscores en Itemanalyse

Hoorcollege Intelligentiediagnostiek en Neuropsychologie

Hoorcollege Beslissend Testgebruik (signaal detectie theorie)

Hoorcollege Arbeids- en Organisatiepsychologie

Hoorcollege Item responstheorie

Hoorcollege Forensisch Diagnostiek

Hoorcollege Bias en Ethiek in de Diagnostiek

Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams
How and why use WorldSupporter.org for your summaries and study assistance?
Using and finding summaries, notes and practice exams on JoHo WorldSupporter
Quicklinks to fields of study for summaries and study assistance

Online access to all summaries, study notes en practice exams

Check out: Register with JoHo WorldSupporter: starting page (EN)
Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)

How and why use WorldSupporter.org for your summaries and study assistance?

For free use of many of the summaries and study aids provided or collected by your fellow students.
For free use of many of the lecture and study group notes, exam questions and practice questions.
For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
For compiling your own materials and contributions with relevant study help
For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, notes and practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

Use the summaries home pages for your study or field of study
Use the check and search pages for summaries and study aids by field of study, subject or faculty
Use and follow your (study) organization
- by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
- this option is only available through partner organizations
Check or follow authors or other WorldSupporters
Use the menu above each page to go to the main theme pages for summaries
- Theme pages can be found for international studies as well as Dutch studies

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Check out: Why and how to add a WorldSupporter contributions
JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form

Quicklinks to fields of study for summaries and study assistance

Main summaries home pages:

Main study fields:

Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports

Main study fields NL:

Studies: Bedrijfskunde en economie, communicatie en marketing, geneeskunde en gezondheidszorg, internationale studies en betrekkingen, IT, Logistiek en technologie, maatschappij, cultuur en sociale studies, pedagogiek en onderwijskunde, rechten en bestuurskunde, statistiek, onderzoeksmethoden en SPSS
Studie instellingen: Maatschappij: ISW in Utrecht - Pedagogiek: Groningen, Leiden , Utrecht - Psychologie: Amsterdam, Leiden, Nijmegen, Twente, Utrecht - Recht: Arresten en jurisprudentie, Groningen, Leiden

WorldSupporter: what are the features, functionalities and rules on WorldSupporter.org?

WorldSupporter NL: hoe vind je samenvattingen en studiehulp op WorldSupporter.org en JoHo.org

Summaries and Study Assistance - Start

Follow the author: Britt van Dongen

Britt van Dongen

Work for WorldSupporter

JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Statistics

3260