HC4: Beschrijvende statistiek
Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- Dit college beschrijft een aantal essentiële begrippen voor de statistiek
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alle onderwerpen in dit college worden ook behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Voor het tentamen is het belangrijk bekend te zin met SPSS
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Het probleem van variatie
Heel veel waarnemingen zijn normaal verdeeld: als de ene waarneming wat meer naar rechts ligt, gaat de andere waarneming meer naar links. De meeste waarnemingen liggen op of rond het midden. Een normale verdeling wordt bepaald door:
- Gemiddelde (μ): het centrum
- Bijvoorbeeld 1,68 m
- Standaarddeviatie (σ): bepaalt de spreiding
- Bijvoorbeeld 0,07 m → meestal lig je ongeveer 7 cm van het gemiddelde af
Een kans kan berekend worden als:
- Er een normale verdeling in de populatie aangenomen kan worden
- De waarden van μ en σ bekend zijn
De kans is de oppervlakte onder de grafiek.
Getallen voor de normale verdeling:
- 2,5% ligt onder de μ - 1,96 σ
- 5% ligt onder de μ -1,65 σ
- 50% ligt onder de μ
- 95% ligt onder de μ +1,65 σ
- 97,5% ligt onder de μ +1,96 σ
95% van de populatie met een normaalverdeling ligt dus altijd tussen -1,96 σ en +1,96 σ (soms wordt 2 i.p.v. 1,96 gebruikt). Dit heet de normaalwaarde of het referentie-interval. Als een individu hierbuiten ligt is zijn waarde bijzonder laag of hoog.
Een standaardnormale verdeling is een normale verdeling met gemiddelde 0 en standaarddeviatie 1.
Wat is statistiek?
Statistiek is het afleiden van kenmerken van een populatie uit kenmerken van een steekproef. Bij statistiek wordt aangenomen dat de steekproef aselect (willekeurig) is.
- Beschrijvende statistiek: het beschrijven van kenmerken van de steekproef
- Wet van grote aantallen: hoe groter de steekproef wordt, des te meer de kenmerken van de steekproef zullen gaan lijken op de kenmerken van de populatie
- Via een grote steekproef kan een populatie vaak adequaat worden beschreven
- Toetsende statistiek: het kwantificeren van onzekerheid
- Steekproeven zijn erg variabel → de kenmerken van een steekproef zijn “ongeveer” gelijk aan die van de populatie → conclusies zijn onzeker
Typen variabelen
Er zijn verschillende typen variabelen:
- Categorisch
- Nominaal: zonder volgorde
- Beroep, geslacht, nationaliteit
- Ordinaal: met volgorde
- Tumorstadium, 5-puntschaal op enquête
- Worden beschreven met:
- Frequentietabel
- Taart/staafdiagram
- Worden beschreven met:
- Tumorstadium, 5-puntschaal op enquête
- Nominaal: zonder volgorde
- Numeriek
- Discreet: tellingen (alleen hele getallen)
- Continu: kan niet-gehele waarden aannemen
- Lengte, gewicht, bloeddruk
- Worden beschreven met:
- Locatiematen (gemiddelde, mediaan)
- Mediaan: het middelste getal (of het gemiddelde van de middelste 2) nadat de getallen op volgorde zijn gezet
- Spreidingsmaten (σ, kwartielen, interkwartielafstand)
- Overige kenmerken (scheefheid, uitbijters)
- Locatiematen (gemiddelde, mediaan)
Centrale tendentie:
Het gemiddelde en de mediaan zijn allebei maten voor de centrale tendentie: de meest typische waarde die de variabele kan hebben. Het gemiddelde of de mediaan wordt gebruikt om met één getal de steekproef samen te vatten.
Maten voor spreiding
De standaarddeviatie is de typische afstand tot het gemiddelde. Kwartielen zijn de typische afstand tot de mediaan.
Standaarddeviatie (s) en variantie (s2):
De variantie is de gemiddelde kwadratische afstand tot het gemiddelde → de standaarddeviatie is de wortel uit de variantie:
s = √s2
Kwartielen:
Kwartielen beschrijven dus hoe ver een punt van de mediaan ligt.
- 1e kwartiel: de middelste van alle waarnemingen onder de mediaan
- 25% eronder, 75% erboven
- 2e kwartiel: mediaan
- 3e kwartiel: de middelste van alle waarnemingen boven de mediaan
- 75% eronder, 25% erboven
- Interkwartielafstand: afstand tussen het 1e en het 3e kwartiel
Percentielen:
- Het kde percentiel is de waarde waaronder k% van de data ligt
- Mediaan: het 50ste percentiel
- Het 97,5de percentiel van de standaardnormale verdeling ligt op 1,96
Uitbijters:
Uitbijters moeten voordat ze weggegooid worden goed onderzocht worden (kunnen veroorzaakt worden door o.a. meetfouten of spelfouten):
- Gemiddelde wordt meer beïnvloed dan de mediaan → de mediaan kan bij uitbijters beter gebruikt worden
- De standaarddeviatie wordt meer beïnvloed dan kwartielen
Boxplot:
Een boxplot verloopt als volgt:
- Hoogste waarde (uitbijters)
- 3e kwartiel
- Mediaan
- 1e kwartiel
- Laagste waarde (uitbijters)
Een histogram is een staafdiagram die het aantal observaties in elke lengteklasse beschrijft.
Scheve verdelingen:
Een scheve verdeling heeft een aantal kenmerken:
- Frequentie uitbijters
- Een “zware staart” naar links of naar rechts in het histogram
- Het gemiddelde is groter of kleiner dan de mediaan
Een normaalverdeling is symmetrisch. Vaak is het gemiddelde gelijk aan de mediaan.
Ontbrekende waarden
Soms is een waarde niet beschikbaar, bijvoorbeeld doordat een meting niet gedaan is, de meting misging of de patient een vraag niet wilde beantwoorden. Onder de “missing at random” aanname mogen deze waarden weggelaten worden:
- Hoge waarden ontbreken niet vaker dan lage waarden
- Het ontbreken van de waarde is onafhankelijk van de waarde die ontbreekt
Centrale limietstelling
In een grote steekproef is de waarde van een schatting van een gemiddelde of proportie altijd normaal verdeeld met:
- Gemiddelde: in een proportie of in de populatie
- Standaarddeviatie: standaardfout van de schatter
Standaardfout:
De standaardfout wordt afgekort als s.e. (standard error). Er zijn verschillende soorten standaardfouten:
- Standaarddeviatie: hoe ver ligt een individuele waarneming typisch van het populatiegemiddelde af?
- De standaarddeviatie is een maat voor de spreiding in een populatie → individuen
- Standaardfout van een gemiddelde: hoe ver ligt een steekproefgemiddelde typisch van het populatiegemiddelde af?
- Standaardfout van een proportie: hoe ver ligt een steekproefproportie typisch van de populatieproportie af?
Standaardfout van een gemiddelde (s = de standaarddeviatie, n = het aantal waarnemingen)
s.e. = s / √n
Standaardfout van een proportie:
s.e. = √ p(1-p) / √ n
Hoe groter de steekproef, hoe kleiner de standaardfout. De standaarddeviatie blijft gelijk. Dit betreft de normaalwaarde:
- Als de waarnemingen normaal zijn verdeeld liggen 95% van de waarnemingen tussen +/- 1,96 σ
- Als steekproefgemiddelden normaal zijn verdeeld liggen 95% van de steekproefgemiddelden tussen +/- 1,96 x s.e. → de standaardfout is de spreiding van steekproefgemiddelden
De centrale limietstelling zegt dat het steekproefgemiddelde normaal is verdeeld → bij een steekproef van n = 10 is er een grotere s.e. dan bij een steekproef van n = 100.
De statistische omdraaitruc:
We weten: met 95% kans ligt het steekproefgemiddelde niet meer dan 1,96 x s.e. af van het populatiegemiddelde. Hierdoor weet je ook dat met 95% kans het populatiegemiddelde niet meer dan 1,96 x s.e. van het steekproefgemiddelde afligt.
Het betrouwbaarheidsinterval
Het populatiegemiddelde ligt dus tussen het steekproefgemiddelde +/- 1,96 x s.e. Dit heet het 95% betrouwbaarheidsinterval → bij 95% van de betrouwbaarheidsintervallen ligt het echte populatiegemiddelde tussen de boven- en ondergrens.
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
Collegeaantekeningen blok Algemeen Wetenschappelijke Vorming 2019/2020
- Blok AWV HC1: Introductie klinisch onderzoek & opzet blok
- Blok AWV HC2: Waarom statistiek?
- Blok AWV HC3: Introductie wetenschapsfilosofie
- Blok AWV HC4: Beschrijvende statistiek
- Blok AWV HC5: Opzet van onderzoek
- Blok AWV HC6: Effectmaten & onderzoeksinspiratie
- Blok AWV HC7: Hypothese toetsen
- Blok AWV HC8: Welke statistische toets?
- Blok AWV HC9: Bias & confounding
- Blok AWV: Tentamen
Contributions: posts
Spotlight: topics
Collegeaantekeningen blok Algemeen Wetenschappelijke Vorming 2019/2020
Een complete bundel voor het blok Algemeen Wetenschappelijke Vorming aan de Universiteit Leiden met alle hoorcolleges en beschikbare (proef)tentamens.
Online access to all summaries, study notes en practice exams
- Check out: Register with JoHo WorldSupporter: starting page (EN)
- Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)
How and why use WorldSupporter.org for your summaries and study assistance?
- For free use of many of the summaries and study aids provided or collected by your fellow students.
- For free use of many of the lecture and study group notes, exam questions and practice questions.
- For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
- For compiling your own materials and contributions with relevant study help
- For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, notes and practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
- Use the summaries home pages for your study or field of study
- Use the check and search pages for summaries and study aids by field of study, subject or faculty
- Use and follow your (study) organization
- by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
- this option is only available through partner organizations
- Check or follow authors or other WorldSupporters
- Use the menu above each page to go to the main theme pages for summaries
- Theme pages can be found for international studies as well as Dutch studies
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
- Check out: Why and how to add a WorldSupporter contributions
- JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
- Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Quicklinks to fields of study for summaries and study assistance
Main summaries home pages:
- Business organization and economics - Communication and marketing -International relations and international organizations - IT, logistics and technology - Law and administration - Leisure, sports and tourism - Medicine and healthcare - Pedagogy and educational science - Psychology and behavioral sciences - Society, culture and arts - Statistics and research
- Summaries: the best textbooks summarized per field of study
- Summaries: the best scientific articles summarized per field of study
- Summaries: the best definitions, descriptions and lists of terms per field of study
- Exams: home page for exams, exam tips and study tips
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
- Studies: Bedrijfskunde en economie, communicatie en marketing, geneeskunde en gezondheidszorg, internationale studies en betrekkingen, IT, Logistiek en technologie, maatschappij, cultuur en sociale studies, pedagogiek en onderwijskunde, rechten en bestuurskunde, statistiek, onderzoeksmethoden en SPSS
- Studie instellingen: Maatschappij: ISW in Utrecht - Pedagogiek: Groningen, Leiden , Utrecht - Psychologie: Amsterdam, Leiden, Nijmegen, Twente, Utrecht - Recht: Arresten en jurisprudentie, Groningen, Leiden
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
1615 |
Add new contribution