Hoorcollege 8: testtheorie: betrouwbaarheid en validiteit
- integer,
- respectvol,
- verantwoordelijk
- deskundig.
- Gender (vragen naar man / vrouw / X)
- Lengte (geregisseerde meting in cm)
- Rekenvaardigheid (aantal goed op rekentest)
- Prestatie-motivatie (score op onderdeel van PMTK, motivatie en prestatie scores)
- Integriteit (score op integriteitstest).
- Latente of ware score T (true score). De echte mate van integriteit. Is ook de belangrijkste score. Ben jij niet integer dan scoor je laag.
- Toevallige meetfout E (error). Er zijn allemaal invloeden: persoon, omgeving, test of de testleider. Het kan dus overal aanliggen. Hoe groter deze fout, hoe minder zeker je bent van de daadwerkelijke score van een persoon.
- Spreiding van de toevallige meetfout bij oneindig aantal replicaties.
- Geeft een indicatie van de nauwkeurigheid van de meting in een populatie.
- De standaardmeetfout is identiek voor alle individuen waarbij je het instrument afneemt (= aanname). Het is voor iedereen hetzelfde. Met de standaardmeetfout kunnen we het betrouwbaarheidsinterval afleiden voor de ware score.
- formule: Betrouwbaarheid: Testscore is ware score plus toevallig fout: Testvariantie is ware scorevariantie plus errorvariantie: Betrouwbaarheid is verhouding tussen ware scorevariantie en testvariantie: Hoe dichter bij 1 hoe betrouwbaarder de test, hoe dichter bij 0, hoe onbetrouwbaarder. Toch is er een probleem. Want de variantie van ware scores S2/t is bekend, we moeten dus de betrouwbaarheid testscore moeten we daarom schatten.
- Test-hertest betrouwbaarheid (test-retest): Maakt gebruik van het idee dat testscores over de tijd hetzelfde zijn. - Correlatie rx1 en x2 tussen testafnames X1 en X2 als schatting voor de betrouwbaarheid van schaalscores. Waarde tussen de 0 en 1 is de schatting van de betrouwbaarheid) Problemen - Leereffect (carryover effects). Zorgt voor onder of overschatting van betrouwbaarheid. - Kort tijd tussen afnames is er sprake van herinnering, ervaring. - Lange tijd tussen afnames is er sprake van wijziging van de ware scores.
- Paralleltest betrouwbaarheid (alternate form): betrouwbaarheid (vaak bij cognitieve test, denk aan taal of rekenen) - Maakt gebruik van het idee dat twee gelijkwaardige versies van dezelfde test dezelfde scores moet opleveren. Het is een andere test, maar wel een gelijkwaardige test. - Correlatie rx en x1, tussen parallelle tests X en X’ als schatting voor de betrouwbaarheid. Probleem: zorgt voor onderschatting van betrouwbaarheid. - Strikte parallelle tests zijn moeilijk te realiseren. (Inhoud, Moeilijkheid en Vorm)
- Split-half betrouwbaarheid: Maakt gebruik van het idee dat twee helften van een test dezelfde scores op moet leveren. - (Gecorrigeerde) correlatie rh1 en h2 tussen parallelle testhelften als schatting voor betrouwbaarheid. Probleem (elke andere tweedeling levert een andere schattin van de betrouwbaarheid) - Hoe is de test in 2 delen te splitsen? (Even - oneven of Onderste helft - bovenste helft)
- Cronbach’s alfa (coëfficiënt alpha): Populaire methode betrouwbaarheidsschatting testscore. Maakt gebruik van het idee dat elk item van een schaal een indicatie is voor het te meten theoretisch concept. - Voor items met meer dan twee geordende categorieën. Dus een likert schaal. Met meer dan 3 categorieën. - Voor homogene set van items (een-dimensionaal). De interpretatie van Cronbach’s alfa - Ondergrens voor schatting betrouwbaarheid (rXX’ ≥ alfa - alfa = 0.80 betekent dat minimaal 80% van variantie in testscores wordt veroorzaakt door variantie in ware scores. - Waardering afhankelijk doel van de meting.
- Lange test: Hoe langer test, hoe betrouwbaarder testscore. —> afwijkende itemscores hebben minder invloed op totaalscore
- Samenstelling groep: De mate van variatie (heterogeniteit) van testscores binnen een groep (steekproef) beïnvloedt de betrouwbaarheidschatting. Hoe meer spreiding, hoe hoger de betrouwbaarheid. Je wilt een heterogene groep hebben.
- Tijdslimiet: Stel je hebt een speedtest met een groot aantal items. Bij tijdgebrek worden niet alle items beantwoord. (Bij een powertest heb je alle tijd om de vragen in te vullen) - Cronbach's alfa is dan niet geschikt - test-hertestmethode is dan wel geschikt Intervalschatting ware score
- De betrouwbaarheidsinterval: Bereken een 95%-betrouwbaarheidsinterval voor de ware score van integriteit voor een persoon. Je hebt een ondergrens en een bovengrens.
- Inhoudsvaliditeit (content validity).
- Indruksvaliditeit (face validity -> we vragen of een deskundige/gebruikers wat denk je meten)
- Begripsvaliditeit (construct validity)
- relaties binnen test (interne structuur)
- relaties met andere variabelen (externe structuur)
- Criteriumvaliditeit (criterion validity)
- voorspelling (predictie) van een criterium (predictieve validiteit)
- Hoe goed voorspelt een testscore een concreet criterium (= gedrag of prestatie dat niet met test wordt gemeten)? Om in de toekomst/heden te voorspellen. - Criteriumvaliditeit is van belang voor tests die tot doel hebben om iets (criterium) te voorspellen.
- Onderscheid naar concurrente validiteit en predictieve validiteit
- Beoordeling
- Op basis van onderzoek naar de voorspellende waarde van testscores. —> (multipele) regressie analyse
aantekeningen hoorcolleges Psychologie als Wetenschap 2023 UU
- Hoorcollege 4 Psychologie als Wetenschap 23 UU
- Hoorcollege 5 Psychologie als Wetenschap 2023 Universiteit Utrecht
- Hoorcollege 6 Psychologie als Wetenschap 2023 Universiteit Utrecht
- Hoorcollege 7 Psychologie als Wetenschap 2023 Universiteit Utrecht
- Hoorcollege 8 Psychologie als Wetenschap 2023 Universiteit Utrecht
- Hoorcollege 9 Psychologie als Wetenschap 2023 Universiteit Utrecht
- Hoorcollege 10 Psychologie als Wetenschap 2023 Universiteit Utrecht
- Hoorcollege 11 Psychologie als Wetenschap 2023 Universiteit Utrecht
- Hoorcollege 12 Psychologie als Wetenschap 2023 Universiteit Utrecht
Contributions: posts
Spotlight: topics
Online access to all summaries, study notes en practice exams
- Check out: Register with JoHo WorldSupporter: starting page (EN)
- Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)
How and why use WorldSupporter.org for your summaries and study assistance?
- For free use of many of the summaries and study aids provided or collected by your fellow students.
- For free use of many of the lecture and study group notes, exam questions and practice questions.
- For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
- For compiling your own materials and contributions with relevant study help
- For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, notes and practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
- Use the summaries home pages for your study or field of study
- Use the check and search pages for summaries and study aids by field of study, subject or faculty
- Use and follow your (study) organization
- by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
- this option is only available through partner organizations
- Check or follow authors or other WorldSupporters
- Use the menu above each page to go to the main theme pages for summaries
- Theme pages can be found for international studies as well as Dutch studies
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
- Check out: Why and how to add a WorldSupporter contributions
- JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
- Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Quicklinks to fields of study for summaries and study assistance
Main summaries home pages:
- Business organization and economics - Communication and marketing -International relations and international organizations - IT, logistics and technology - Law and administration - Leisure, sports and tourism - Medicine and healthcare - Pedagogy and educational science - Psychology and behavioral sciences - Society, culture and arts - Statistics and research
- Summaries: the best textbooks summarized per field of study
- Summaries: the best scientific articles summarized per field of study
- Summaries: the best definitions, descriptions and lists of terms per field of study
- Exams: home page for exams, exam tips and study tips
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
- Studies: Bedrijfskunde en economie, communicatie en marketing, geneeskunde en gezondheidszorg, internationale studies en betrekkingen, IT, Logistiek en technologie, maatschappij, cultuur en sociale studies, pedagogiek en onderwijskunde, rechten en bestuurskunde, statistiek, onderzoeksmethoden en SPSS
- Studie instellingen: Maatschappij: ISW in Utrecht - Pedagogiek: Groningen, Leiden , Utrecht - Psychologie: Amsterdam, Leiden, Nijmegen, Twente, Utrecht - Recht: Arresten en jurisprudentie, Groningen, Leiden
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
1436 |
Add new contribution