Deze collegeaantekeningen bevatten notities bij college 6 van 2014-2015.
Week 6 Normaalverdeling en standaardscores
Analyse van de verdeling van variabele
Maak eerst een grafische weergave van je variabele (bijvoorbeeld een histogram). Kijk naar de grafische weergave naar de verdeling en eventuele afwijkende variabele. Geef vervolgens een numerieke beschrijving van de verdeling (in een tabel bijvoorbeeld). Fit vervolgens een dichtheidscurve.
Dichtheidscurve
Een dichtheidscurve is de ideale benadering van je empirische verdeling; het vormt om je verdeling een gladde curve. Als deze curve overeenkomt met de daadwerkelijke verdeling kan je deze gebruiken om waarden af te lezen en berekeningen te maken. Je kunt een dichtheidscurve toepassen bij een interval meetniveau of hoger. De parameters van een dichtheidscurve zijn het gemiddelde (µ) en de standaardafwijking (σ). De dichtheidscurve toont de relatieve frequentie als oppervlakte. Het gedeelte onder de lijn van de curve is de oppervlakte. De totale oppervlakte van de curve is 1; dit is 100% en dat komt omdat alle waardes binnen de curve liggen. De curve ligt altijd op of boven de x-as. Dit komt omdat de y-as frequenties aangeeft. Al zou de curve onder de x-as liggen betekent dit dat de curve een negatieve y-waarde heeft en dit kan niet, je kan namelijk geen -1 of -2 frequentie hebben, 0 is het minimum. Een dichtheidscurve kan een staart naar links hebben (negative skew) als er veel hoge waardes zijn of een (positive skew) als er veel lage waardes zijn (zie sheet 5).
Eigenschappen van een normale verdeling.
Een normale verdeling is klokvormig en symmetrisch. Symmetrisch wilt zeggen dat de vorm van een perfecte normaalverdeling links en rechts van het gemiddelde hetzelfde is. De normale verdeling wordt bepaald door de parameters σ en µ. µ geeft de horizontale locatie en is precies in het midden van een perfecte normaalverdeling. Let op het gemiddelde zit vaak niet precies in het midden, omdat de meeste verdeling niet perfect symmetrisch zijn. De σ geeft het buigpunt van de verdeling aan. Op dit punt verandert de richting waar de normaalverdeling heenbuigt. Als er een hoge waarde van σ is zal de verdeling breder en lager zijn. Bij een lage waarde van σ zal de verdeling smaller en hoger zijn. Op sheet 6 kun je alle eigenschappen van een normale verdeling in een figuur zien. Op sheet 5 kun je voorbeelden van verschillende breedtes en hoogtes van verdelingen zien (laptokurtic, normaal en platykurtic).
Waarom is een normale verdeling belangrijk?
Een normale verdeling is een model maar ook een norm. Er zijn drie redenen waarom een normale verdeling een norm is:
biedt de mogelijkheid tot verschillende berekeningen
belangrijke aanname voor veel statistische toetsen
Verdeling van steekproefgemiddelden (hier wordt verder op ingegaan bij het vak Toetsende Statistiek)
Standaardscores (z-scores) berekenen
Een normaalverdeling wordt bepaald door het gemiddelde en de standaarddeviatie. Omdat je oneindig veel combinaties van waarden voor het gemiddelde en de standaarddeviatie kunt hebben betekent het dat je ook een oneindig veel verschillende normaal verdelingen kunt tekenen. Met behulp van een tabel kan je met een normaalverdeling berekeningen maken hoeveel procent van de scores tussen twee grenzen of boven of onder een grens valt. Dit geeft ook een indicatie voor de kans dat iemand van een populatie binnen twee of onder of boven een grens valt. Als 20% van de scores tussen twee grenzen vallen is ook de kans dat iemand uit die populatie tussen die twee grenzen valt 20%.Voor elke verschillende gemiddeldes en standaarddeviaties (en dus ook een andere normale verdeling) heb je een tabel met andere waardes nodig om berekeningen te maken. Omdat er oneindig veel combinaties gemiddeldes en standaarddeviaties zijn, is het handig om je gemiddelde en standaarddeviatie om te rekenen naar een standaardscore. Voor deze standaardscore is al een tabel gemaakt (die achter in met boek van Howell staat: appendix z of op collegesheet 14 en 22). Deze standaardscore heeft altijd een gemiddelde van 0 en een standaarddeviatie van 1. Deze scores worden ook wel z-scores genoemd en je kunt ze berekenen per x-waarde. De formule voor een z-score is:
Z = (x- µ)/σ
Je kunt ook een x-score berekenen als je de z-score, de standaarddeviatie en het gemiddelde weet. De formule hiervoor is:
X = µ+zσ
De z-scores staan op de x-as van een gestandaardiseerde verdeling. Met behulp met appendix z achter in het boek van Howell of met de tabel op sheet 17 en 19 kun je bepalen wat voor oppervlakte er links, rechts of tussen twee grenzen ligt. Deze oppervlakte heeft een relatieve frequentie. Links van de tabellen van sheet 17 en 19 staat een rij (de verticale)met scores. Dit is de z-score afgerond op 1 decimaal. De horizontale rij geeft de tweede decimaal achter de komma aan. Op deze manier kun je verschillende waardes uitrekenen. Bijvoorbeeld de cumulatieve waarde van het gebied links van een z-score en rechts van een z-score. Door de cumulatieve relatieve waarde links van een lagere z-score van de cumulatieve relatieve waarde recht van een z-score af te trekken kun je de cumulatieve relatieve waarde tussen de twee punten uitrekenen. Op sheet 13 en 21 kun je voorbeelden van sommen zien die je met de normale verdeling en de tabel kunt maken.
Dus:
standaardiseren geeft een gemiddelde van 0 en een standaarddeviatie van 1.
als de waardes van de verdeling voor het standaardiseren een normale verdeling waren zijn ze het na het standaardiseren ook. Je kunt een niet-normale verdeling niet normaal maken door ze te standaardiseren; de verdeling blijft namelijk hetzelfde.
Het gemiddelde verschuift met afstand µ; dit kun je ook zien omdat je van elke x score µ aftrekt. Als je dat bij elke score doet en je zou dat bij elkaar optellen kom je op 0 uit.
De standaardafwijking verandert met 1/σ. Al was je standaardafwijking eerst 15 en het is nu 1 (bij het standaardiseren maak je de standaardafwijking 1) dan is het 0.07% van wat het eerst was.
De 68 – 95 – 99.7% regel
Een handige vuistregel is dat bij elke normale verdeling ongeveer 68% van de scores tussen -1σ en 1σ ligt, ongeveer 95% tussen -2σ en 2σ en ongeveer 99.7% tussen -3σ en 3σ. Dit kun je gebruiken bij het aflezen van een verdeling. Ook is het handig als je een tekening maakt van een verdeling om deze waardes te vermelden.
Normaliteit vaststellen
Je kunt met spss met een P-P plot en een Q-Q plot de normaliteit van een verdeling vaststellen. Soms is het lastig om aan een verdeling te zien of het normaal verdeelt is. Je kunt met spss een P-P plot en een Q-Q plot de normaliteit van een verdeling vaststellen. Op sheet 25 zie je links een P-P plot en rechts een Q-Q plot. Bij de Q-Q plot kun je zien aan de puntjes welke waarde de observaties die op de x-as staan hebben en op de y-as kun je zien welke waarde je deze waarde verwacht te zijn als de verdeling normaal was. Bij de P-P plot zijn de waarden op de y-as de cumulatieve verwachte relatieve scores en op de x-as de cumulatieve geobserveerde relatieve scores. Bij de Q-Q plot zijn de waarden op de y-as de absolute verwachte scores en op de x-as de absolute geobserveerde scores. De lijn geeft aan waar de puntjes zouden moeten staan als de verdeling perfect normaal verdeeld is. Dit is echter vrijwel nooit zo. Hoe ver de puntjes van de lijn afstaan bepaalt hoe normaal verdeeld de verdeling is. Als de lijntjes systematisch afwijken van de diagonale lijn is de verdeling niet normaal verdeeld. Aan het begin en aan het einde van de lijn zijn vaak afwijkingen; dit komt door outliers (uitschieters). Daarnaast kun je naar de skewness (scheefheid van een verdeling) of de kurtosis kijken: zie sheet 5. Ten slotte heb je nog de Kolmorgorov-Smirnov (K-S) test die kan uitrekenen of een verdeling normaal verdeeld is. Deze test is echter zeer (over)gevoelig en kan daardoor soms iets bepalen als niet-normaal verdeeld hoewel het wel normaal verdeeld is.
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
Contributions: posts
Spotlight: topics
Online access to all summaries, study notes en practice exams
- Check out: Register with JoHo WorldSupporter: starting page (EN)
- Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)
How and why use WorldSupporter.org for your summaries and study assistance?
- For free use of many of the summaries and study aids provided or collected by your fellow students.
- For free use of many of the lecture and study group notes, exam questions and practice questions.
- For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
- For compiling your own materials and contributions with relevant study help
- For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, notes and practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
- Use the summaries home pages for your study or field of study
- Use the check and search pages for summaries and study aids by field of study, subject or faculty
- Use and follow your (study) organization
- by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
- this option is only available through partner organizations
- Check or follow authors or other WorldSupporters
- Use the menu above each page to go to the main theme pages for summaries
- Theme pages can be found for international studies as well as Dutch studies
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
- Check out: Why and how to add a WorldSupporter contributions
- JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
- Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Quicklinks to fields of study for summaries and study assistance
Main summaries home pages:
- Business organization and economics - Communication and marketing -International relations and international organizations - IT, logistics and technology - Law and administration - Leisure, sports and tourism - Medicine and healthcare - Pedagogy and educational science - Psychology and behavioral sciences - Society, culture and arts - Statistics and research
- Summaries: the best textbooks summarized per field of study
- Summaries: the best scientific articles summarized per field of study
- Summaries: the best definitions, descriptions and lists of terms per field of study
- Exams: home page for exams, exam tips and study tips
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
- Studies: Bedrijfskunde en economie, communicatie en marketing, geneeskunde en gezondheidszorg, internationale studies en betrekkingen, IT, Logistiek en technologie, maatschappij, cultuur en sociale studies, pedagogiek en onderwijskunde, rechten en bestuurskunde, statistiek, onderzoeksmethoden en SPSS
- Studie instellingen: Maatschappij: ISW in Utrecht - Pedagogiek: Groningen, Leiden , Utrecht - Psychologie: Amsterdam, Leiden, Nijmegen, Twente, Utrecht - Recht: Arresten en jurisprudentie, Groningen, Leiden
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
1819 |
Add new contribution