Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- Dit college vormt een introductie voor het blok AWV
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alles wordt behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Er zijn geen opmerkingen over het tentamen gemaakt
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Vraagstelling
Vraagstelling moet een aantal eigenschappen hebben:
- Precies, concreet en duidelijk
- Beperkt
- Wetenschappelijk
- Relevant
- Onderzoekbaar
Een algemene vraag bevat:
- Een determinant
- Uitkomst
- Doelgroep/domein
Bijvoorbeeld: Wat is het effect van stoppen met roken op de longfunctie bij mannen die minder dan 20 jaar hebben gerookt?
Wat is bij doelgroep D het effect van determinant X op uitkomst Y? → dit kan worden weergegeven in een 2x2 tabel (X en Y, beide met + en -).
Een verslag bestaat uit:
- Inleiding met vraagstelling
- Methode
- Resultaten
- Discussie
Soorten statistiek
- Beschrijvende statistiek: alle numerieke uitkomsten worden samengevat tot een gemiddelde
- De uitbuiters worden weggelaten
- Toetsende statistiek: hoe ver kan het gemiddelde van de steekproef afwijken van die van de hele populatie?
- Meestal verschilt dit een paar punten → standaardfout
Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- In dit college wordt kort het belang van statistiek toegelicht en worden de eerste paar basisbegrippen behandeld
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alle onderwerpen in dit college worden ook behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Er zijn geen opmerkingen over het tentamen gemaakt
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Typen onderzoek
Cross-sectioneel onderzoek is een onderzoek waarbij men een dwarsdoorsnee van de totale populatie in de steekproef opneemt. Hoe groter de steekproef, hoe betrouwbaarder. Cross-sectioneel onderzoek wordt vaak gebruikt in de beschrijvende statistiek:
- Steekproef wordt samengevat in één getal
- Data wordt kritisch bekeken (zijn er uitbijters?)
- Hoe groter de steekproef, hoe betrouwbaareder
Naast beschrijvende statistiek heb je toetsende statistiek:
- Hoe ver ligt het gemiddelde in de steekproef van het gemiddelde in de populatie?
- Dit noemt men de standaardfout
- Vaak is het verschil “niet significant”
Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- Dit college vormt een introductie voor de wetenschapsfilosofie, er worden begrippen zoals inductie, deductie en falsificationisme toegelicht
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alle onderwerpen in dit college worden ook behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Er zijn geen opmerkingen over het tentamen gemaakt
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Wetenschapsfilosofie & statistiek
Er zijn enkele contrasten tussen wetenschap en kliniek:
- Wetenschap
- Ontwikkelen van theorieën
- Ontwikkelen van algemene inzichten over populaties
- Individu → populatie
- Kliniek
- Specifieke uitspraken over een individu
- Het liefst vanuit wetenschappelijk onderzoek → evidence-based
- Populatie → individu
Inductie en deductie
Twee begrippen zijn in de wetenschapsfilosofie erg belangrijk:
- Deductie: het afleiden van specifieke uitspraken uit algemene uitspraken (logica)
- Bijvoorbeeld: alle mensen zijn sterfelijk (algemeen) → Socrates is een mens → Socrates is sterfelijk (specifiek)
- Inductie (generaliseren): het afleiden van algemene uitspraken uit specifieke uitspraken
- Zonder inductie is er geen wetenschap
- Oma is vergeetachtig en heeft Alzheimer → buurvrouw is vergeetachtig en heeft Alzheimer → oud-oom is vergeetachtig en heeft Alzheimer → alle oude mensen die vergeetachtig zijn hebben Alzheimer
- Inductie leidt niet altijd tot zekere waarheid
Wetenschap en kliniek
- Ontwikkeling van de wetenschap
- Doel: een theorie ontwikkelen
- Vanuit: specifieke observaties (empirische data)
- Nodig: inductief redeneren
- Ontwikkeling van evidence-based medicine
- Doel: specifieke uitspraken over individuen
- Vanuit: wetenschappelijke theorie
- Nodig: deductief redeneren
Paradox van Hume
Enkele filosofische vragen zijn:
- Waarom gebruiken we inductie?
- Waarom geloven we erin dat de zon elke dag opkomt? → omdat het tot nu toe altijd heeft gewerkt
Dit is dus een inductieve redenering. Hume stelt dat ons vertrouwen in inductie gebaseerd is in inductie.
Confirmatie
Confirmatie (het bevestigen van een theorie) speelt in de wetenschapsfilosofie een grote rol.
- Voorbeeld: alle raven zijn zwart → hoe meer zwarte raven je ziet, hoe meer je gaat geloven dat echt alle raven zwart zijn: het wordt steeds geconfirmeerd
- Modus Tollens zegt dat “alle raven zijn zwart” hetzelfde is als “alles wat niet zwart is, is geen raaf”
Paradox van Hempel
- “Alle raven zijn zwart” wordt bevestigd door het zien van een zwarte raaf
- “Alles wat zwart is, is geen raaf” wordt bevestigd door het zien van een bruine koe, rood potlood, etc.
In de paradox van Hempel wordt afgevraagd wat dan nog de waarde van confirmatie is.
Falsificationisme
Eén tegenvoorbeeld is voldoende om een theorie eronderuit te halen:
- Eén witte raaf bewijst dat niet alle raven zwart zijn
- Duizenden zwarte raven bewijzen niet dat alle raven zwart zijn
Inductie en confirmatie leiden dus niet tot zekere kennis.
Popper
Popper heeft hier een aantal uitspraken over gedaan: wetenschap groeit niet door theorieën te bevestigen, maar door ze te verwerpen → er wordt gewerkt met de nulhypothese → moet verworpen worden om een theorie te bevestigen.
- De taak van de wetenschapper is niet het bevestigen, maar het onderuithalen van een bestaande theorie
- Wetenschap vernieuwt zichzelf continu via falsificatie van bestaande theorieën
- Hoe meer theorieën er ontkracht zijn, hoe groter onze kennis
In de praktijk
Om een theorie te falsificeren moeten via deductie voorspellingen voor de theorie ontlokt worden:
- Als theorie A waar is, zou (onder de omstandigheden C) verschijnsel B zichtbaar moeten zijn
- Zet een experiment op met omstandigheden C
- Als B niet optreedt, wordt A verworpen
Er moeten dus duidelijke voorspellingen gedaan worden, die bevestigd of verworpen kunnen worden.
Tijdelijkheid van kennis
Aan de hand van deze theorieën kunnen er een aantal uitspraken gedaan worden:
- Popper: “confirmatie” is zinloos → theorieën worden nooit bevestigd
- De hoogste status die een theorie kan bereiken is “voorlopig onweerlegd”
- Wanneer een experiment of theorie immuun is voor falsificatie, is het inhoudelijk niks →niet wetenschappelijk.
- Denkkader/paradigma: men denkt binnen een bepaald denkkader → pas als er te veel problemen zijn, wordt het denkkader vervangen (Popper)
Kritiek op Popper
De theorie van Popper wordt heeft een aantal punten die bekritiseerd worden:
- Thomas Kuhn: falsificationisme is een rigide moraal: wetenschappers zijn terecht huiverig om een geliefde theorie te verwerpen
- Wetenschappers werken heel lang binnen een denkkader (paradigma)
- Pas als er te veel problemen zijn wordt het denkkader vervangen → wetenschappelijke revolutie
- Wat te doen na falsificatie?
- Na falsificatie moet via inductie een nieuwe theorie bedacht worden → dit wordt door Popper niet belicht
Empirische cyclus
Popper belicht dus slechts een deel van de empirische cyclus. In de empirische cyclus volgen inductieve en deductieve fases elkaar op:
- Observatie
- Hypothese
- Predictie
- Testen
- Evaluatie
Statistiek in de Geneeskunde
In de Geneeskunde is er veel onzekerheid → bijna nooit wordt iets foutloos gemeten. Een theorie gaat nooit 100% op. Daarom zijn er in de Geneeskunde theorieën op basis van kansen en gemiddelden. Omdat deze theorieën niet dwingend zijn, is falsificatie heel lastig. De wereld kent een grote variabiliteit:
- Geen twee patiënten zijn hetzelfde
- Geen twee steekproeven zijn hetzelfde
Plato’s kennisleer
Plato maakt dus onderscheid tussen kennis en werkelijkheid:
- Ideeën: abstractie entiteiten (een perfecte cirkel)
- De waarneembare werkelijkheid (een getekende cirkel)
- Plato stelt: “Kennis gaat over ideeën, waarneming is een imperfecte afspiegeling van die ideeën.”
Het gaat dus om het achterliggende idee versus de imperfecte waarneming. In de statistiek komt dit naar boven als het populatiegemiddelde versus het steekproefgemiddelde:
- Echte kennis: kennis over de populatie
- Steekproef: imperfecte afspiegeling van de achterliggende populatie
Statistiek is dus Platonisch.
Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- Dit college beschrijft een aantal essentiële begrippen voor de statistiek
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alle onderwerpen in dit college worden ook behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Voor het tentamen is het belangrijk bekend te zin met SPSS
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Het probleem van variatie
Heel veel waarnemingen zijn normaal verdeeld: als de ene waarneming wat meer naar rechts ligt, gaat de andere waarneming meer naar links. De meeste waarnemingen liggen op of rond het midden. Een normale verdeling wordt bepaald door:
- Gemiddelde (μ): het centrum
- Standaarddeviatie (σ): bepaalt de spreiding
- Bijvoorbeeld 0,07 m → meestal lig je ongeveer 7 cm van het gemiddelde af
Een kans kan berekend worden als:
- Er een normale verdeling in de populatie aangenomen kan worden
- De waarden van μ en σ bekend zijn
De kans is de oppervlakte onder de grafiek.
Getallen voor de normale verdeling
- 2,5% ligt onder de μ - 1,96 σ
- 5% ligt onder de μ -1,65 σ
- 50% ligt onder de μ
- 95% ligt onder de μ +1,65 σ
- 97,5% ligt onder de μ +1,96 σ
95% van de populatie met een normaalverdeling ligt dus altijd tussen -1,96 σ en +1,96 σ (soms wordt 2 i.p.v. 1,96 gebruikt). Dit heet de normaalwaarde of het referentie-interval. Als een individu hierbuiten ligt is zijn waarde bijzonder laag of hoog.
Een standaardnormale verdeling is een normale verdeling met gemiddelde 0 en standaarddeviatie 1.
Wat is statistiek?
Statistiek is het afleiden van kenmerken van een populatie uit kenmerken van een steekproef. Bij statistiek wordt aangenomen dat de steekproef aselect (willekeurig) is.
- Beschrijvende statistiek: het beschrijven van kenmerken van de steekproef
- Wet van grote aantallen: hoe groter de steekproef wordt, des te meer de kenmerken van de steekproef zullen gaan lijken op de kenmerken van de populatie
- Via een grote steekproef kan een populatie vaak adequaat worden beschreven
- Toetsende statistiek: het kwantificeren van onzekerheid
- Steekproeven zijn erg variabel → de kenmerken van een steekproef zijn “ongeveer” gelijk aan die van de populatie → conclusies zijn onzeker
Typen variabelen
Er zijn verschillende typen variabelen:
- Categorisch
- Nominaal: zonder volgorde
- Beroep, geslacht, nationaliteit
- Ordinaal: met volgorde
- Tumorstadium, 5-puntschaal op enquête
- Worden beschreven met:
- Frequentietabel
- Taart/staafdiagram
- Numeriek
- Discreet: tellingen (alleen hele getallen)
- Continu: kan niet-gehele waarden aannemen
- Lengte, gewicht, bloeddruk
- Worden beschreven met:
- Locatiematen (gemiddelde, mediaan)
- Mediaan: het middelste getal (of het gemiddelde van de middelste 2) nadat de getallen op volgorde zijn gezet
- Spreidingsmaten (σ, kwartielen, interkwartielafstand)
- Overige kenmerken (scheefheid, uitbijters)
Centrale tendentie
Het gemiddelde en de mediaan zijn allebei maten voor de centrale tendentie: de meest typische waarde die de variabele kan hebben. Het gemiddelde of de mediaan wordt gebruikt om met één getal de steekproef samen te vatten.
Maten voor spreiding
De standaarddeviatie is de typische afstand tot het gemiddelde. Kwartielen zijn de typische afstand tot de mediaan.
Standaarddeviatie (s) en variantie (s2)
De variantie is de gemiddelde kwadratische afstand tot het gemiddelde → de standaarddeviatie is de wortel uit de variantie:
s = √s2
Kwartielen
Kwartielen beschrijven dus hoe ver een punt van de mediaan ligt.
- 1e kwartiel: de middelste van alle waarnemingen onder de mediaan
- 2e kwartiel: mediaan
- 3e kwartiel: de middelste van alle waarnemingen boven de mediaan
- Interkwartielafstand: afstand tussen het 1e en het 3e kwartiel
Percentielen
- Het kde percentiel is de waarde waaronder k% van de data ligt
- Mediaan: het 50ste percentiel
- Het 97,5de percentiel van de standaardnormale verdeling ligt op 1,96
Uitbijters
Uitbijters moeten voordat ze weggegooid worden goed onderzocht worden (kunnen veroorzaakt worden door o.a. meetfouten of spelfouten):
- Gemiddelde wordt meer beïnvloed dan de mediaan → de mediaan kan bij uitbijters beter gebruikt worden
- De standaarddeviatie wordt meer beïnvloed dan kwartielen
Boxplot
Een boxplot verloopt als volgt:
- Hoogste waarde (uitbijters)
- 3e kwartiel
- Mediaan
- 1e kwartiel
- Laagste waarde (uitbijters)
Een histogram is een staafdiagram die het aantal observaties in elke lengteklasse beschrijft.
Scheve verdelingen
Een scheve verdeling heeft een aantal kenmerken:
- Frequentie uitbijters
- Een “zware staart” naar links of naar rechts in het histogram
- Het gemiddelde is groter of kleiner dan de mediaan
Een normaalverdeling is symmetrisch. Vaak is het gemiddelde gelijk aan de mediaan.
Ontbrekende waarden
Soms is een waarde niet beschikbaar, bijvoorbeeld doordat een meting niet gedaan is, de meting misging of de patiënt een vraag niet wilde beantwoorden. Onder de “missing at random” aanname mogen deze waarden weggelaten worden:
- Hoge waarden ontbreken niet vaker dan lage waarden
- Het ontbreken van de waarde is onafhankelijk van de waarde die ontbreekt
Centrale limietstelling
In een grote steekproef is de waarde van een schatting van een gemiddelde of proportie altijd normaal verdeeld met:
- Gemiddelde: in een proportie of in de populatie
- Standaarddeviatie: standaardfout van de schatter
Standaardfout
De standaardfout wordt afgekort als s.e. (standard error). Er zijn verschillende soorten standaardfouten:
- Standaarddeviatie: hoe ver ligt een individuele waarneming typisch van het populatiegemiddelde af?
- De standaarddeviatie is een maat voor de spreiding in een populatie → individuen
- Standaardfout van een gemiddelde: hoe ver ligt een steekproefgemiddelde typisch van het populatiegemiddelde af?
- Standaardfout van een proportie: hoe ver ligt een steekproefproportie typisch van de populatieproportie af?
Standaardfout van een gemiddelde (s = de standaarddeviatie, n = het aantal waarnemingen)
s.e. = s / √n
Standaardfout van een proportie:
s.e. = √ p(1-p) / √ n
Hoe groter de steekproef, hoe kleiner de standaardfout. De standaarddeviatie blijft gelijk. Dit betreft de normaalwaarde:
- Als de waarnemingen normaal zijn verdeeld liggen 95% van de waarnemingen tussen +/- 1,96 σ
- Als steekproefgemiddelden normaal zijn verdeeld liggen 95% van de steekproefgemiddelden tussen +/- 1,96 x s.e. → de standaardfout is de spreiding van steekproefgemiddelden
De centrale limietstelling zegt dat het steekproefgemiddelde normaal is verdeeld → bij een steekproef van n = 10 is er een grotere s.e. dan bij een steekproef van n = 100.
De statistische omdraaitruc
We weten: met 95% kans ligt het steekproefgemiddelde niet meer dan 1,96 x s.e. af van het populatiegemiddelde. Hierdoor weet je ook dat met 95% kans het populatiegemiddelde niet meer dan 1,96 x s.e. van het steekproefgemiddelde afligt.
Het betrouwbaarheidsinterval
Het populatiegemiddelde ligt dus tussen het steekproefgemiddelde +/- 1,96 x s.e. Dit heet het 95% betrouwbaarheidsinterval → bij 95% van de betrouwbaarheidsintervallen ligt het echte populatiegemiddelde tussen de boven- en ondergrens.
Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- In dit college worden verschillende soorten onderzoek behandeld
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alle onderwerpen in dit college worden ook behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Er zijn geen opmerkingen over het tentamen gemaakt
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Observationeel onderzoek
Om te kijken naar de opzet van onderzoek moet de 2x2 tabel erbij gehaald worden. Deze kan aan de hand van observationeel onderzoek ingevuld worden. Bij observationeel onderzoek wordt enkel het natuurlijke beloop geobserveerd:
- Retrospectief: terugkijkend
- Retrospectief onderzoek is makkelijker → is sneller klaar
- Het nadeel is dat je afhankelijk bent van wat er geregistreerd is
- Prospectief: vooruitkijkend
- Prospectief onderzoek heeft als nadeel dat je moet wachten op de uitkomsten
Follow-up onderzoek
Bij een follow-up onderzoek volg je mensen in de tijd. Soms heet dit een cohortonderzoek. Er wordt bekeken of hetgeen wat je onderzoekt voorvalt. Een follow-up onderzoek verloopt als volgt:
- Selectie deelnemers
- Risicofactor vaststellen
- Uitkomst vaststellen
Case-control study
Een case-control study is een onderzoek waarbij je begint met de uitkomst en terug gaat zoeken naar de oorzaak, bijvoorbeeld een onderzoek over roken en longkanker:
- Selectie deelnemers
- Uitkomst vaststellen
- Risicofactor vaststellen
Er wordt eerst teruggekeken en dan pas gekeken naar wat de verdeling van de risicofactoren zijn → er zijn minder mensen nodig. Case-control is dus efficiënter dan follow-up.
Experimenteel onderzoek
Om bijvoorbeeld te onderzoek of ziekere mensen vaker vallen omdat ze slechter eten, kan experimenteel onderzoek opgesteld worden: de helft van de mensen laten afvallen om te onderzoeken of ze vaker vallen.
- Experimenteel onderzoek gebeurt via lootjes trekken → randomized controlled trial (RCT)
- Is vaak niet mogelijk
- Is de standaard bij onderzoek naar het effect van geneesmiddelen
- Bij observationeel onderzoek wordt alleen gekeken naar mensen die even ziek zijn (restrictie of stratificeren)
- Helpt alleen als de groepen goed vergelijkbaar zijn
Overige onderzoeksvormen
- Cross-sectioneel onderzoek: de risicofactor en uitkomst meten op hetzelfde moment → nooit oorzaak en gevolg (bijv. BMI en aantal keer gevallen)
- Case report: beschrijving van één of enkele patiënten
- Case serie: beschrijving van een groepje patiënten (bijv. dat veel mensen na lang vliegen trombose hebben)
Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- In dit college worden enkele essentiële empidemiologische begrippen besproken
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alle onderwerpen in dit college worden ook behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Voor het tentamen is het belangrijk met de epidemiologische begrippen te kunnen rekenen
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Soorten klinisch onderzoek
Er zijn veel soorten klinisch onderzoek:
- Predictie/voorspellend: diagnostisch en prognostisch onderzoek
- Causaal/oorzakelijk: etiologisch of therapeutisch onderzoek
- Transversaal/cross-sectioneel/dwarsdoorsnede: diagnostisch onderzoek
- Longitudinaal/follow-up: prognostisch/etiologisch/therapeutisch onderzoek
- Er wordt door de tijd heen gekeken
- Observationeel: diagnostisch, prognostisch en etiologisch onderzoek
- Dit is niet manipuleren, maar kijken naar wat er gebeurt
- Experimenteel: gerandomiseerd/therapeutisch onderzoek
Soorten klinische vragen
Er zijn veel soorten klinische vragen:
- Diagnostiek: welke ziekte heeft mijn patiënt?
- Prognose (predictie): hoe is het verloop van de ziekte?
- Etiologie (oorzaak): wat zijn de oorzaken van de ziekte?
- Therapie: is er een behandeling voor de ziekte?
Diagnostiek
Enkele belangrijke begrippen zijn:
- Sensitiviteit: percentage zieken die een positieve test hebben
- Specificiteit: percentage niet-zieken die een negatieve test hebben
- Positief voorspellende waarde: percentage test-positieven die ziek zijn
- Een hoge sensitiviteit en specificiteit kunnen een lage PVW geven: dit is vaak het geval bij lage prevalente (zeldzame) aandoeningen
- Negatief voorspellende waarde: percentage test-negatieven die niet ziek zijn
- LR (likelihood ratio): verhouding van het percentage met een zekere testuitslag onder de zieken gedeeld door het percentage met dezelfde uitslag onder de niet-zieken → (ziekte ja & test ja)/(test ja & ziekte nee)
- Nomogram: weergave van de a priori kans, de LR en de a posteriori kans → als 2 van de 3 bekend zijn kan de onbekende worden afgelezen
Prognose
Enkele belangrijke begrippen zijn:
- Cumulatieve incidentie (CI): aantal nieuwe gevallen/totaal aantal aan het begin
- Incidentiecijfer: aantal nieuwe gevallen/totale persoonstijd “at risk” (bijv. 91/persoonsjaren)
- Relatief risico (RR): proportie van de zieken die doodgaan/proportie van de niet-zieken die doodgaan
- Odds ratio (OR): een verhouding van 2 “odds”
- Dood/kans op niet-dood
- Aantal dood/aantal niet-dood
- Persoonstijd: de tijd dat een persoon in een onderzoek zit
- Kaplan-meier survivalcurve: geeft de overleving van een populatie weer
Behandeling
Enkele belangrijke begrippen zijn:
- Hazard: risico op het event
- Hazard ratio: hazard in “exposed”/hazard in “non-exposed”
- HR is net als RR een verhouding van twee incidentiecijfers
- Risicoverschil (RV): beide risico’s uitrekenen en van elkaar aftrekken
- Number needed tot treat (NNT): 1/RV
- Number needed to harm (NNH): negatieve versie van de NNT, soms nodig om risico’s tegen elkaar af te wegen
Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- In dit college worden de basisbegrippen voor hypothesetoetsing uitgelegd
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alle onderwerpen in dit college worden ook behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Voor het tentamen is het belangrijk met de epidemiologische begrippen te kunnen rekenen
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Stappenplan statistisch toetsen
Het stappenplan voor statistisch toetsen verloopt als volgt:
- Nulhypothese (h0): veronderstelling over de populatie
- Toetsstatistiek: het criterium waarop we de steekproef met de veronderstelde populatie vergelijken → hoezeer de steekproef afwijkt van h0
- Het verschil tussen twee kansen (P) of metingen
- Verdeling van de toetsstatistiek: verdeling in typische steekproeven als h0 waar is
- Verwerpen van de h0: gebeurt als de toetsstatistiek tot de 5% meest extreme waarden van de verdeling behoort
Nulhypothese
De nulhypothese (h0) is een veronderstelling over de populatie. Het tegenovergestelde van de nulhypothese is de alternatieve hypothese (ha). Statistisch toetsen heeft als doel “weten” hoe je een resultaat moet interpreteren. Er zijn twee mogelijke uitkomsten:
- Verwerpen van de nulhypothese → het in onwaarschijnlijk dat de nulhypothese waar is
- Niet verwerpen van de nulhypothese → het zou kunnen dat de nulhypothese waar is
Het is hierbij belangrijk om rekening te houden met falsificeren en de theorie van Popper.
Toetsstatistiek
Toetsstatistiek is dus het criterium waarop we de steekproef met de veronderstelde populatie vergelijken. Voorbeeld:
- De h0: 49% van de populatie is vrouw
- Resultaten uit de steekproef: 64% is vrouw
- Toetsstatistiek: 0,15 (verschil)
In de statistiek is een afspraak gemaakt over de 2,5% grootste en kleinste waarden: deze waarden worden “extreem” genoemd. De waarde (0,15) uit het voorbeeld wordt als extreem beschouwd. Daaruit is de conclusie dat h0 onwaarschijnlijk is → wordt verworpen. De alternatieve hypothese klopt dus.
P-waarde
De P-waarde is het percentage van de verdeling V dat extremer is dan de gevonden waarde van V:
- P-waarde < 5% → h0 wordt verworpen
- P-waarde > 5% → h0 wordt niet verworpen
Deze 5% is willekeurig: er kunnen ook grenzen zijn met 1%, 10% of 0,1%.
Interpretatie van de P-waarde
De P-waarde is een maat van verbazing over de data voor iemand die in de h0 gelooft: “de kans dat een willekeurige steekproef onder h0 minstens zo extreem is als de onze”:
- Kleine P-waarde → grote verbazing
- Als h0 waar is zou deze data heel uitzonderlijk zijn
- Het is onwaarschijnlijk dat h0 waar is → wordt verworpen
- Grote P-waarde → weinig verbazing
- Deze data passen prima bij h0
- H0 zou waar kunnen zijn → wordt geaccepteerd
- Dit is echter geen bewijs dat h0 waar is
Type I en type II fouten
H0 wordt verworpen als het onwaarschijnlijk is, niet als het onmogelijk is. Hierbij kunnen fouten ontstaan:
- Type I fout: h0 wordt verworpen als h0 waar is
- De kans op een type I fout is maximaal 5%
- Type II fout: h0 wordt niet verworpen als h0 niet waar is
- Power: 1 – de kans op een type II fout = de kans dat het lukt om h0 te verwerpen als hij niet waar is
Wald-betrouwbaarheidsintervallen
Een betrouwbaarheidsinterval (BI) bevat alle waarden die niet te onwaarschijnlijk zijn. Een eenvoudige manier om een BI te maken is een wald-betrouwbaarheidsinterval:
- Nodig: een schatter en een s.e.
- De s.e. kan uitgerekend worden als je de schatter invult in de formule → de Wald-BI zit dan tussen schatter -1,96 x s.e. en schatter +1,96 x s.e.
- Achtergrond: centrale limietstelling
Hoorcollege 8 Welke statistische toets?
Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- In dit college worden de verschillende statistische toetsen besproken
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alle onderwerpen in dit college worden ook behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Voor het tentamen is het belangrijk met de epidemiologische begrippen te kunnen rekenen
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Overzicht
Er zijn verschillende statistische analysemethoden:
| Determinant |
Uitkomst | | 1 groep | 2 groepen | > 2 groepen |
| | gepaard | ongepaard | ongepaard |
Parametrisch (gemiddelde) | t-toets voor één steekproef | Gepaarde t-toets | Ongepaarde t-toets | ANOVA F-toets |
Niet-parametrisch (mediaan) | Tekentoets | Wilcoxon rangtekentoets | Mann-Whitney toets | Kruskall-Wallis toets |
Proporties | Binomiale toets | McNemar’s toets | Chi-kwadraat toets | Chi-kwadraat toets |
Numeriek of proporties?
- Numeriek
- Parametrische toetsen
- Nulhypothese in termen van gemiddelde
- Meer vatbaar voor uitbijters
- Niet-parametrische toetsen
- Nulhypothese in termen van de mediaan
- Bruikbaar als er veel uitbijters zijn
- Voorbeeld: zijn mannen zwaarder dan vrouwen?
- Categorische data
- Toetsen voor proporties (zoveel procent heeft iets, zoveel procent heeft iets niet)
- Voorbeeld: zijn er meer mannen met overgewicht dan vrouwen met overgewicht?
Eén steekproef
Toetsen voor één steekproef worden gebruikt als de determinant één groep is. De toetsen voor één steekproef worden vergeleken met een vooraf gegeven waarde, bijvoorbeeld:
- H0: het percentage vrouwen is gelijk aan 49%
- H0: het gemiddelde behandeleffect is 0
Bij proporties wordt er gebruik gemaakt van de binomiale toets.
Gepaarde data
Toetsen voor gepaarde data worden gebruikt bij 2 gepaarde groepen. Er is 2x gemeten en iedere meting in de 2esteekproef hoort bij precies 1 meting uit de 1e, bijvoorbeeld:
- Een voor- en een nameting van een patiënt
- Per proefpersoon is één oog behandeld met medicijn en het andere met placebo
- Iedere patiënt heeft zijn partner meegenomen als controle
Bij gepaarde data zijn de twee steekproeven altijd even groot.
Ongepaarde data
Toetsen voor ongepaarde data worden gebruik bij 2 ongepaarde groepen → er is 2x gemeten, maar in verschillende groepen, bijvoorbeeld:
- Eén groep patiënten krijgt medicijnen, een andere groep krijgt placebo
- Mannen versus vrouwen
- Cases versus controles
De twee steekproeven kunnen even groot zijn, maar kunnen ook in omvang verschillen.
Meer steekproeven
Toetsen voor meer steekproeven worden gebruikt als er meer dan 2x gemeten is in verschillende groepen, bijvoorbeeld:
- Verschillende groepen krijgen verschillende doses van een medicijn
- Vergelijking van 3 of meer behandelmethoden
Steekproeven kunnen ongelijke grootte hebben. Meer gepaarde steekproeven bestaan ook, maar worden in dit blok niet behandeld.
Eenzijdig of tweezijdig
Bij de nulhypothese is het gemiddeld behandeleffect 0. Een alternatieve hypothese kan op twee verschillende manieren getoetst worden:
- Eenzijdig
- Gemiddeld behandeleffect > 0
- Blind voor negatieve behandeleffecten
- Tweezijdig
- Gemiddeld behandeleffect ≠ 0 (dus groter of kleiner)
- Afspraak: gebruik altijd een tweezijdige toets
Specifieke toetsen
T-toets voor één steekproef
H0 = de gemiddelde lengte van de bewoners is 1,65m
Gepaarde t-toets
- H0 = gewicht van verpleeghuispatiënten is tussen de 1e en de 2e meting gemiddeld stabiel
- Twee metingen per patiënt → het verschil per patiënt wordt gemeten
- Verschil per patiënt = gewichtstoename
- G0 = gemiddelde gewichtstoename = 0
- Het verschil tussen de metingen is een 1 steekproef t-toets
Een gepaarde t-toets is dus een 1 steekproef t-toets op het verschil tussen de metingen.
Ongepaarde t-toets
- H0 = mannen en vrouwen hebben gemiddeld hetzelfde Hb-gehalte
- Een ongepaarde t-toets heeft 2 varianten
- Students toets bij gelijke spreiding
- Welch toets bij ongelijke spreiding
- De Welch toets moet altijd gebruikt worden, tenzij je gelijke varianties kunt aannemen (bijv. vanwege randomisatie)
Niet-parametrische toetsen
- Werken in het gebruik bijna hetzelfde als t-toetsen → verschil: er is geen betrouwbaarheidsinterval omdat de medianen worden gebruikt
- H0 = het gewicht van verpleeghuispatiënten is tussen de eerste en tweede meting in de mediaan stabiel
- Wilcoxon rankrekentoets: gaat over gepaarde tweevoudige steekproeven
- H0 = mannen en vrouwen hebben in de mediaan hetzelfde Hb
- Mann-Whitney toets: gaat over ongepaarde tweevoudige steekproeven → de P-waarde wordt vergeleken met 0,05: als deze kleiner is wordt h0 verworpen, als deze groter is wordt h0 niet verworpen
ANOVA f-toets
- Wordt gebruikt bij meer dan twee ongepaarde steekproeven
- H0 = het resultaat van alle steekproeven is gelijk
- Het gemiddelde behandeleffect is hetzelfde voor verschillende doses van een medicijn
- Alternatief: er zijn tenminste 2 doses die een verschillend behandeleffect hebben
- Verwerpen van h0 betekent niet dat alle doses verschillend zijn
- Wanneer h0 wordt verworpen houdt het in dat er minstens twee resultaten van de steekproeven verschillen (niet allemaal!)
Binomiale toets
- Eén steekproef wordt vergeleken met een verwachting
- Een test van proporties: wel of niet → geen geleide schaal
- Wordt gebruikt bij categorische data
- Bijv. h0 = het percentage vrouwen in de verpleeghuispopulatie is 49%
Chi-kwadraat toets
- Vergelijken van populaties
- Proporties, meerdere ongepaarde steekproeven
- Er zijn twee manieren om dezelfde h0 te beschrijven:
- H0 = het percentage COPD-patiënten is bij mannelijke en vrouwelijke verpleeghuispatiënten gelijk
- H0 = het percentage mannen is onder COPD en niet-COPD-patiënten gelijk
Er zijn verschillende toetsen met technische verschillen. De Fisher exact test is altijd goed om te gebruiken.
McNemar toets
- Voor gepaarde categorische data
- H0 = het percentage verpleeghuispatiënten dat antidepressiva krijgt is in de 1e en 2e meting gelijk
- Er is een ander soort kruistabel nodig
De informatie bij deze toets zit in de switchers (bijv. mensen die van mening gewisseld zijn of over zijn gelopen).
Algemene informatie
- Welke onderwerpen worden behandeld in het hoorcollege?
- In dit college wordt besproken wat er tijdens (het opstellen van) een experiment mis kan gaan
- Welke onderwerpen worden besproken die niet worden behandeld in de literatuur?
- Alle onderwerpen in dit college worden ook behandeld in de literatuur
- Welke recente ontwikkelingen in het vakgebied worden besproken?
- Er zijn geen recente ontwikkelingen besproken
- Welke opmerkingen worden er tijdens het college gedaan door de docent met betrekking tot het tentamen?
- Voor het tentamen is het belangrijk met de epidemiologische begrippen te kunnen rekenen
- Welke vragen worden behandeld die gesteld kunnen worden op het tentamen?
- Er zijn geen mogelijke vragen behandeld
Meten
Bij meten kan je te maken krijgen met:
- Biologische variatie
- Tussen personen
- Binnen personen (24-uurs variatie)
- Meetfout
De precisie bepaalt de reproduceerbaarheid → er zijn weinig random fouten. De validiteit zegt iets over het meten van de juiste informatie → er zijn weinig systematische fouten.
Random fouten
De ernst van random fouten wordt bepaald door de grootte van de steekproef:
- Heeft grote gevolgen voor een individu
- Heeft kleine gevolgen voor een groep → middelt uit
- Het gemiddelde is goed
- De standaarddeviatie is te groot
Bij random fouten zijn de s.e. en de BI te groot. Er zijn meer mensen nodig voor dezelfde power. Om om te gaan met random fouten kan je een aantal dingen doen:
- Standaardiseren (instructie, procedures)
- Herhaald meten bij dezelfde persoon
- Meer vragen stellen (synoniemen)
- Bijv. een tentamen, IQ-test, vragenlijst
- Meer mensen in het onderzoek opnemen
Systematische fouten
Bij een systematische fout wordt ergens structureel naast gezeten. Of een systematische fout erg is, is afhankelijk van het doel van de meting:
- Classificeren/onderscheiden (diagnose/prognose)
- Evalueren van de verandering
Precisie en validiteit
Bij het meten wordt er een onderscheid gemaakt tussen:
- Precisie: reproduceerbaarheid àweinig random fouten
- Validiteit: meten wat je wilt meten àweinig systematische fouten
Bias
Een bias is een systematische fout → kleine validiteit. Een bias heeft een aantal eigenschappen:
- Fundamentele onvergelijkbaarheid
- Kan in alle onderzoeksopzetten voorkomen
- Het is belangrijk te bekijken waar de bias zit
- Kan opgelost worden door preventie
- De richting van het effect kan soms ingeschat worden
Er zijn twee hoofdvormen van een bias:
- Selectiebias
- Probleem t.g.v. selectie van onvergelijkbare groepen (bijv. een verkeerde controlegroep bij een case-control study)
- Informatiebias
- Probleem t.g.v. onvergelijkbare informatieverzameling (bijv. het liegen over bepaalde informatie over de controle en indexgroep)
- De meeste vormen van informatiebias leiden tot misclassificatie van een determinant of de uitkomst
- Non-differentiële misclassificatie → verdunning van het effect
- Differentiële misclassificatie → effect kan alle kanten op
Confounding
Met confounding wordt bedoeld dat er een probleem ontstaat t.g.v. vertekening door een andere risicofactor. “To confound” betekend “to mix something up with something else”. Het ene effect wordt dus verward met het andere effect. Een confounder kan, in tegenstelling tot andere vormen van bias, tijdens de studie nog gecorrigeerd worden.
De 3 eigenschappen van een confounder zijn:
- Andere risicofactor voor de uitkomst (effect op de uitkomst)
- Ongelijk verdeeld over categorieën van de bestudeerde risicofactor (effect op de determinant)
- Niet een causaal gevolg van de bestudeerde risicofactor (niet in het causale pad)
Twee voorbeelden:
- Grijs haar leidt tot sterfte: hier is leeftijd de confounder
- Wanneer je kijkt naar leeftijd en sterfte is grijs haar geen confounder!
- IJs eten leidt tot verdrinken: hier is zomer de confounder (er wordt meer ijs gegeten en meer gezwommen)
- Associatie tussen BMI en sterfte
- Leeftijd is een confounder
- Ras is een confounder
- Bloeddruk is geen confounder, maar ligt op het causale pad
Er is dus voorkennis nodig om te beslissen of:
- Iets een onafhankelijke risicofactor is
- Iets samen zou kunnen hangen met de bestudeerde factor
- Iets niet in het causale pad ligt
De data kunnen je dus niet vertellen of iets een confounder is → laten associaties zien, maar geen richting van het effect.
Add new contribution