Blok AWV HC4: Beschrijvende statistiek

HC4: Beschrijvende statistiek

Algemene informatie

  • Welke onderwerpen worden behandeld in het hoorcollege?
    • Dit college beschrijft een aantal essentiële begrippen voor de statistiek
  • Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
    • Alle onderwerpen in dit college worden ook behandeld in de literatuur
  • Welke recente ontwikkelingen in het vakgebied worden besproken?
    • Er zijn geen recente ontwikkelingen besproken
  • Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
    • Voor het tentamen is het belangrijk bekend te zin met SPSS
  • Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
    • Er zijn geen mogelijke vragen behandeld

Het probleem van variatie

Heel veel waarnemingen zijn normaal verdeeld: als de ene waarneming wat meer naar rechts ligt, gaat de andere waarneming meer naar links. De meeste waarnemingen liggen op of rond het midden. Een normale verdeling wordt bepaald door:

  • Gemiddelde (μ): het centrum
    • Bijvoorbeeld 1,68 m
  • Standaarddeviatie (σ): bepaalt de spreiding
    • Bijvoorbeeld 0,07 m → meestal lig je ongeveer 7 cm van het gemiddelde af

Een kans kan berekend worden als:

  • Er een normale verdeling in de populatie aangenomen kan worden
  • De waarden van μ en σ bekend zijn

De kans is de oppervlakte onder de grafiek.

Getallen voor de normale verdeling:

  • 2,5% ligt onder de μ - 1,96 σ
  • 5% ligt onder de μ -1,65 σ
  • 50% ligt onder de μ
  • 95% ligt onder de μ +1,65 σ
  • 97,5% ligt onder de μ +1,96 σ

95% van de populatie met een normaalverdeling ligt dus altijd tussen -1,96 σ en +1,96 σ (soms wordt 2 i.p.v. 1,96 gebruikt). Dit heet de normaalwaarde of het referentie-interval. Als een individu hierbuiten ligt is zijn waarde bijzonder laag of hoog.

Een standaardnormale verdeling is een normale verdeling met gemiddelde 0 en standaarddeviatie 1. 

Wat is statistiek?

Statistiek is het afleiden van kenmerken van een populatie uit kenmerken van een steekproef. Bij statistiek wordt aangenomen dat de steekproef aselect (willekeurig) is.

  • Beschrijvende statistiek: het beschrijven van kenmerken van de steekproef
  • Wet van grote aantallen: hoe groter de steekproef wordt, des te meer de kenmerken van de steekproef zullen gaan lijken op de kenmerken van de populatie
    • Via een grote steekproef kan een populatie vaak adequaat worden beschreven
  • Toetsende statistiek: het kwantificeren van onzekerheid
    • Steekproeven zijn erg variabel → de kenmerken van een steekproef zijn “ongeveer” gelijk aan die van de populatie → conclusies zijn onzeker

Typen variabelen

Er zijn verschillende typen variabelen:

  • Categorisch
    • Nominaal: zonder volgorde
      • Beroep, geslacht, nationaliteit
    • Ordinaal: met volgorde
      • Tumorstadium, 5-puntschaal op enquête
        • Worden beschreven met:
          • Frequentietabel
          • Taart/staafdiagram
  • Numeriek
    • Discreet: tellingen (alleen hele getallen)
    • Continu: kan niet-gehele waarden aannemen
      • Lengte, gewicht, bloeddruk
    • Worden beschreven met:
      • Locatiematen (gemiddelde, mediaan)
        • Mediaan: het middelste getal (of het gemiddelde van de middelste 2) nadat de getallen op volgorde zijn gezet 
      • Spreidingsmaten (σ, kwartielen, interkwartielafstand)
      • Overige kenmerken (scheefheid, uitbijters)

Centrale tendentie:

Het gemiddelde en de mediaan zijn allebei maten voor de centrale tendentie: de meest typische waarde die de variabele kan hebben. Het gemiddelde of de mediaan wordt gebruikt om met één getal de steekproef samen te vatten.

Maten voor spreiding

De standaarddeviatie is de typische afstand tot het gemiddelde. Kwartielen zijn de typische afstand tot de mediaan.

Standaarddeviatie (s) en variantie (s2):

page6image13736 

De variantie is de gemiddelde kwadratische afstand tot het gemiddelde → de standaarddeviatie is de wortel uit de variantie:

s = √s2

Kwartielen:

Kwartielen beschrijven dus hoe ver een punt van de mediaan ligt.

  • 1e kwartiel: de middelste van alle waarnemingen onder de mediaan

    • 25% eronder, 75% erboven
  • 2e kwartiel: mediaan
  • 3e kwartiel: de middelste van alle waarnemingen boven de mediaan
    • 75% eronder, 25% erboven
  • Interkwartielafstand: afstand tussen het 1e en het 3e kwartiel

Percentielen:

  • Het kde percentiel is de waarde waaronder k% van de data ligt
  • Mediaan: het 50ste percentiel
  • Het 97,5de percentiel van de standaardnormale verdeling ligt op 1,96

Uitbijters:

Uitbijters moeten voordat ze weggegooid worden goed onderzocht worden (kunnen veroorzaakt worden door o.a. meetfouten of spelfouten):

  • Gemiddelde wordt meer beïnvloed dan de mediaan → de mediaan kan bij uitbijters beter gebruikt worden
  • De standaarddeviatie wordt meer beïnvloed dan kwartielen

Boxplot:

Een boxplot verloopt als volgt:

  1. Hoogste waarde (uitbijters)
  2. 3e kwartiel
  3. Mediaan
  4. 1e kwartiel
  5. Laagste waarde (uitbijters)

Een histogram is een staafdiagram die het aantal observaties in elke lengteklasse beschrijft. 

Scheve verdelingen:

Een scheve verdeling heeft een aantal kenmerken:

  • Frequentie uitbijters
  • Een “zware staart” naar links of naar rechts in het histogram
  • Het gemiddelde is groter of kleiner dan de mediaan

Een normaalverdeling is symmetrisch. Vaak is het gemiddelde gelijk aan de mediaan.

Ontbrekende waarden

Soms is een waarde niet beschikbaar, bijvoorbeeld doordat een meting niet gedaan is, de meting misging of de patient een vraag niet wilde beantwoorden. Onder de “missing at random” aanname mogen deze waarden weggelaten worden:

  • Hoge waarden ontbreken niet vaker dan lage waarden
  • Het ontbreken van de waarde is onafhankelijk van de waarde die ontbreekt

Centrale limietstelling

In een grote steekproef is de waarde van een schatting van een gemiddelde of proportie altijd normaal verdeeld met:

  • Gemiddelde: in een proportie of in de populatie
  • Standaarddeviatie: standaardfout van de schatter

Standaardfout:

De standaardfout wordt afgekort als s.e. (standard error). Er zijn verschillende soorten standaardfouten:

  • Standaarddeviatie: hoe ver ligt een individuele waarneming typisch van het populatiegemiddelde af?
    • De standaarddeviatie is een maat voor de spreiding in een populatie → individuen
  • Standaardfout van een gemiddelde: hoe ver ligt een steekproefgemiddelde typisch van het populatiegemiddelde af?
  • Standaardfout van een proportie: hoe ver ligt een steekproefproportie typisch van de populatieproportie af?

Standaardfout van een gemiddelde (s = de standaarddeviatie, n = het aantal waarnemingen)

s.e. = s / √n

Standaardfout van een proportie:

s.e. = √ p(1-p) / √ n

Hoe groter de steekproef, hoe kleiner de standaardfout. De standaarddeviatie blijft gelijk. Dit betreft de normaalwaarde:

  • Als de waarnemingen normaal zijn verdeeld liggen 95% van de waarnemingen tussen +/- 1,96 σ
  • Als steekproefgemiddelden normaal zijn verdeeld liggen 95% van de steekproefgemiddelden tussen +/- 1,96 x s.e. → de standaardfout is de spreiding van steekproefgemiddelden

De centrale limietstelling zegt dat het steekproefgemiddelde normaal is verdeeld → bij een steekproef van n = 10 is er een grotere s.e. dan bij een steekproef van n = 100.

De statistische omdraaitruc:

We weten: met 95% kans ligt het steekproefgemiddelde niet meer dan 1,96 x s.e. af van het populatiegemiddelde. Hierdoor weet je ook dat met 95% kans het populatiegemiddelde niet meer dan 1,96 x s.e. van het steekproefgemiddelde afligt.

Het betrouwbaarheidsinterval

Het populatiegemiddelde ligt dus tussen het steekproefgemiddelde +/- 1,96 x s.e. Dit heet het 95% betrouwbaarheidsinterval → bij 95% van de betrouwbaarheidsintervallen ligt het echte populatiegemiddelde tussen de boven- en ondergrens.

Image

Access: 
Public

Image

Join: WorldSupporter!

Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Check: concept of JoHo WorldSupporter

Concept of JoHo WorldSupporter

JoHo WorldSupporter mission and vision:

  • JoHo wants to enable people and organizations to develop and work better together, and thereby contribute to a tolerant and sustainable world. Through physical and online platforms, it supports personal development and promote international cooperation is encouraged.

JoHo concept:

  • As a JoHo donor, member or insured, you provide support to the JoHo objectives. JoHo then supports you with tools, coaching and benefits in the areas of personal development and international activities.
  • JoHo's core services include: study support, competence development, coaching and insurance mediation when departure abroad.

Join JoHo WorldSupporter!

for a modest and sustainable investment in yourself, and a valued contribution to what JoHo stands for

Check: how to help

Image

 

 

Contributions: posts

Help others with additions, improvements and tips, ask a question or check de posts (service for WorldSupporters only)

Image

Check: more related and most recent topics and summaries
Check more: study fields and working areas
Check more: institutions, jobs and organizations

Image

Share: this page!
Follow: nathalievlangen (author)
Add: this page to your favorites and profile
Statistics
2144
Submenu & Search

Search only via club, country, goal, study, topic or sector