Samenvatting bij Architectuur klinisch wetenschappelijk onderwijs (AKWO) - Geneeskunde - UU (2014-2015)
Uitwerking colleges en behandeling verplichte stof. Gebaseerd op 2014-2015
HC 1 – Introductie Klinisch wetenschappelijk onderzoek
CVA
De definitie die door de Nederlandse vereniging voor Neurologie (NVN) wordt gegeven voor beroerte luidt als volgt: “Onder een beroerte (ook wel cerebrovasculair accident (CVA) genoemd) wordt verstaan: plotseling optredende verschijnselen van een focale stoornis in de hersenen waarvoor geen andere oorzaak aanwezig is dan een vasculaire stoornis.” Er kan een verdere onderverdeling worden gemaakt tussen een herseninfarct, intracerebrale bloeding, SAB en TIA.
Op 1 januari 2011 waren er naar schatting in Nederland 174.400 mensen met een beroerte: 90.900 mannen en 83.500 vrouwen. De incidentie van beroerte zonder TIA’s wordt geschat op 2 to 3 per 1000 personen per jaar. In 80% van de gevallen was hierbij sprake van een herseninfarct. Voor de TIA’s ligt de incidentie tussen de 1,5 tot 2 per 1000 personen per jaar.
Diagnostiek
De eerste stap in de diagnostiek van een CVA is het afnemen van de anamnese en het doen van lichamelijk onderzoek, waarbij gelet wordt op de symptomen passend bij de verschillende soorten beroertes. Zo past bij een herseninfarct een beeld van acute focale uitval, met bijvoorbeeld een scheef-hangende mond, parese in de arm en afasie. Welke uitvalverschijnselen er zijn hangt af van de plaats van het infarct in de hersenen. Bij een intracerebrale bloeding is er ook sprake van acute focale uitval, vaak met hoofdpijn en bewustzijnsdaling. Bewustzijnsdaling komt bij een herseninfarct minder vaak voor. Bij een subarachnoïdale bloeding past een beeld van acute hele ernstige hoofdpijn en soms bewustzijnsdaling. Als er sprake is van een TIA, kunnen dezelfde symptomen optreden als bij een herseninfarct, maar bij een TIA verdwijnen de symptomen over het algemeen binnen een uur.
Om het onderscheidt te kunnen maken tussen de verschillende vormen van een CVA is medische beeldvorming nodig. De diagnostische testen die hiervoor worden gebruikt zijn CT en MRI. Het belangrijkste onderzoek is de CT-scan. Dit komt doordat CT een hele snelle methode is en logistiek handiger dan MRI. Met een CT kan in de acute fase snel het onderscheid worden gemaakt tussen een bloeding en een infarct, omdat de bloedingen goed zichtbaar worden. Voor het aantonen van een infarct is de MIR meer gevoelig.
Etiologie
Een CVA ontstaat door een vasculaire stoornis in de hersenen. Dit kan verschillende oorzaken hebben zoals malformaties, trauma en stollingsstoornissen. Meestal ontstaat een CVA doordat de kwaliteit van de binnenwand van bloedvaten slecht is. Er ontstaat artherosclerose in de vaten. Risicofactoren die daar voor zorgen zijn ouderdom, hypertensie, hypercholesterolemie, diabetes, obesitas, roken, mannelijk geslacht, CVA’s in de familie, orale anticonceptiva, hormonale substitutietherapie of bijvoorbeeld een aangeboren afwijking aan de vaten. Als oorzaak van een bloeding kun je ook denken aan een tumor, een fistel of een amyloïde angiopathie (mutatie in het amyloïd eiwit).
Drie risicofactoren die specifiek het risico op een CVA verhogen zijn atriumfibrilleren, een eerder doorgemaakt TIA/infarct en een carotisstenose. Een beschermende factor is matige alcoholconsumptie(tot 2 glazen wijn per dag). Maar als het alcoholgebruik hoger is stijgt het risico op een CVA sterk.
Natuurlijk beloop
Herseninfarct: 25% van de patiënten met een herseninfarct overlijdt in de eerste maand na het begin van de klachten. 20% blijft matig tot ernstig gehandicapt, 35% behoudt geringe restverschijnselen en 20% hersteld volledig. Het herstel is het meest uitgesproken in de eerste maand en neemt na de derde maand sterk af. Van de patiënten die het herseninfarct overleven is slechts 30-40% na 3 jaar nog in leven. De prognose is onder andere afhankelijk van de leeftijd van de patiënt, de ernst en de plaats van het infarct en de comorbiditeit. Een gevaarlijke complicatie die kan optreden na het herseninfarct is inklemming als gevolg van zwelling van het infarct. Voornamelijk patiënten met een groot infarct vormen hier een risicogroep voor. Andere complicaties die kunnen optreden zijn infecties, voornamelijk pneumonie, en cardiale complicaties.
TIA: De klachten van een TIA verdwijnen in 75% van de patiënten binnen een uur. Patiënten beoordelen zichzelf meestal als ´geheel hersteld´, terwijl familieleden vaak nog milde, vaak cognitieve, restverschijnselen bemerken. Complicaties die kunnen optreden zijn vasculaire complicaties zoals een herseninfarct of hartinfarct. In de eerste vijf jaar na het optreden van een TIA, ontwikkelt 30% van de patiënten een herseninfarct en 5% een hartinfarct. Het risico op dergelijke complicaties neemt toe bij toenemende leeftijd, het mannelijk geslacht, een toenemend aantal aanvallen en bij aanwezigheid van diabetes mellitus, angina pectoris of claudicatio intermittens.
Subarachnoïdale bloeding: De mortaliteit bij een subarachnoïdale bloeding is 50%. 10% van de patiënten overlijdt al voordat zij het ziekenhuis bereiken. Patiënten die de bloeding hebben overleefd, zullen in de volgende 4 tot 18 maanden verbeteren. 75% van de patiënten die herstellen blijven last hebben van psychosociale en neurologische problemen en rapporteren een verminderde kwaliteit van leven. Een belangrijke complicatie die kan optreden is een recidiefbloeding. Dit treedt, bij geen behandeling, bij 40% van de patiënten in de eerste vier weken op. Er is nog niet veel bekend over de frequentie waarmee dit op langere termijn voorkomt. Andere complicaties die kunnen optreden zijn secundaire cerebrale ischemie en hydrocefalus .
Intracerebrale bloeding: De mortaliteit bij een intracerebrale bloeding ligt rond de 45%. De prognose wordt sterk bepaald door de grootte en de plaats van de bloeding. Als de patiënt de eerste twee dagen na het optreden van de bloeding overleeft, is de prognose vergelijkbaar met een patiënt met een herseninfarct. Uiteindelijk zullen 12-38% van de patiënten weer onafhankelijk kunnen functioneren. Complicaties die kunnen optreden zijn inklemming door oedeemvorming, hydrocefalus en infecties.
Behandeling
Ischemische CVA: Een ischemische CVA-patiënt wordt allereerst opgenomen op een stroke-unit en daarna start behandeling in 2 fases. In de acute fase wordt gestart met trombolytica (rt-PA en aspirine). De rt-PA moet binnen 4,5 uur na het ontstaan van het infarct worden gestart. Deze therapie heeft een gunstig effect op de prognose en het herstel van de patiënt. Een nadeel is dat deze trombolyse behandeling een verhoogd risico geeft op bloedingen. Na deze behandeling start de herstelfase. Deze fase bestaat uit mobilisatie m.b.v. fysiotherapie en revalidatie.13
TIA: De behandeling bij het optreden van een TIA bestaat uit levenslange therapie met acetylsalicylzuur en dipyridamol (antistolling). Voordeel is dat deze therapie werkt als secundaire preventie voor de patiënt, het nadeel is dat de therapie bijwerkingen van de antistolling geeft.
Intracraniële bloeding: Bij een intracraniële bloeding moet allereerst de stolling bevorderd worden. Als er inklemming ontstaat, kan dit operatief verholpen worden. Als de intracraniele bloeding door een aneurysma is ontstaan, wordt deze chirurgisch behandeld.
Subarachnoidale bloeding: Een subarachnoïdale bloeding ontstaat vaak door een aneurysma. Aneurysmata worden chirurgisch behandeld. Er zijn twee chirurgische technieken. Bij de eerste wordt er gecoild: een spiraaltje wordt in het aneurysma gebracht en deze zorgt voor stolling. Bij de tweede wordt er geclipt: een klem wordt via het schedeldak op de hals van het aneurysma gezet.
Preventie
Primaire preventie voor CVA bestaat uit het beperken van de risicofactoren die kunnen leiden tot een CVA (bijv. hypertensie, dyslipidemie, diabetes).
Secundaire preventie bestaat uit een niet-medicamenteus en een medicamenteus deel.
Het niet-medicamenteuze deel bestaat uit het behandelen van de risicofactoren die een recidief beroerte kunnen veroorzaken (bijv. roken, overgewicht, overmatig alcoholgebruik).
Het medicamenteuze deel van secundaire preventie na een ischemische CVA of een TIA is een levenslange behandeling met verscheidene medicatie: antistolling, cholesterolverlagers en antihypertensiva. Na een hemorragische CVA bestaat de secundaire preventie uit alleen antihypertensiva.
HC 2 – Diagnostisch onderzoek
In de praktijk begint diagnostiek altijd met een patiënt met een klacht of symptoom. Een voorbeeld: een kind van 2 jaar komt met de ouders op de EHBO, het kind heeft hoofdpijn en nekstijfheid.
Meningitis is een mogelijke oorzaak, waaraan moet worden gedacht vanwege de ernst van het ziektebeeld Echter, ook andere ziekten kunnen dit beeld geven. Meningitis is gevaarlijk en moet snel gediagnosticeerd kunnen worden.
De redenen waarom men een diagnose stelt:
· Het is de basis van medisch handelen.
· Het bepaalt de behandelingskeuze.
· Het zegt iets over de prognose.
De differentiaal diagnose (DD) die kan worden opgesteld bij deze casus is als volgt:
· Bacteriële meningitis (BM).
· Virale meningitis.
· Pneumonie.
· KNO infectie.
· Overig (bijvoorbeeld een myalgie).
Na opstellen van de differentiaal diagnose, worden testen uitgevoerd om de waarschijnlijkste/gevaarlijkste diagnose aan te tonen of uit te sluiten. In dit geval gaat men testen op bacteriële meningitis, mede vanwege de mogelijke fatale afloop als deze diagnose gemist wordt. Stel nu dat 20% van alle kinderen op de EHBO met nekstijfheid BM heeft. 20% geeft de prevalentie, ook wel de voorafkans, aan: 20% met ziekte in die populatie. De vooraf-kans ofwel de prior-kans is een kans die bepaalt wordt voordat men extra gegevens gaat verzamelen uit diagnostische testen. Er zijn twee dingen mogelijk:
<
p>· De prior-kans is te laag om te behandelen (<100%).
· De prior-kans is te hoog om naar huis te sturen (>0%).
Met elk ingezette test, reduceer je onzekerheid over de diagnose, dit wordt diagnostiek genoemd. De beste test bij verdenking op een bacteriële meningitis is een lumbaalpunctie. Dit is een invasieve, kostbare test en het kost tijd voordat de uitslag bekend is. Daarom wordt deze test in de praktijk liever niet uitgevoerd. Het wordt wel aangeduid als ‘gouden standaard’. Dit is een term die aangeeft dat een bepaalde methode voor een bepaald ziektebeeld de beste methode is om de ziekte aan te tonen of uit te sluiten. Deze test is echter nog niet foutloos, daarom noemt men het liever de referentiestandaard. Het is een test die niet bij iedereen afgenomen wordt, dit vanwege de volgende redenen:
· Onethisch: te belastend of risicovol.
· Inefficiënt: tijdrovend of te duur.
De vraag is of men kan vaststellen of een ziekte aanwezig is, zonder de referentiestandaard toe te passen. Dit is natuurlijk wat er gedaan wordt in de praktijk: men gaat informatie verzamelen. Wat er gedaan wordt:
· Anamnese.
· Lichamelijk onderzoek.
· Simpele lab testen.
· Beeldvorming.
· Etc.
Het diagnostisch proces in de praktijk is een stapsgewijs proces; er kan geen enkele diagnose worden gesteld o.b.v. één test. De kans op ziekte na de gegeven testuitslagen is de achterafkans ofwel de posterior-kans. Hoe groter het verschil tussen de prior- en posterior kans, hoe beter de diagnostische waarde van de testen. Het liefste wilt men 0 of 100% kans op ziekte bereiken, zodat men de ziekte met zekerheid kan aantonen of uisluiten. Dit is echter moeilijk te bereiken. In de casus leidt het onderzoek tot een posterior kans van 10%. Stel dat er nog meer onderzoek wordt gedaan: bloedonderzoek (CRP, leukco’s, BSE, infectieparameters). Dit kan dan als volgende stap worden toegevoegd aan de informatie die men al heeft, totdat de posterior kans de 0% benaderd.
Een ideaal diagnostisch proces is een proces waarbij eenvoudige testuitslagen de posterior kans naar 0 of 100% brengen, zonder de referentiestandaard gebruikt te hoeven hebben. Meestal test de arts door tot voldoende zekerheid is verkregen (nadering tot 0 of 100%). Dit hangt ook af van de prognose van de ziekte indien deze onbehandeld blijft, en de risico’s en kosten van het behandelen. Er kan nagedacht worden over de grenzen waarbij men wel of niet behandeld of de patiënt wel of niet naar huis stuurt Positieve testuitslagen zijn uitslagen waarmee zo’n zekerheid wordt bereikt dat je boven de grens uitkomt. Een negatieve testuitslag is een uitslag die leidt tot het overschrijden van de ondergrens.
Samenvatting:
· Diagnosticeren in de praktijk houdt het schatten van een kans op aanwezigheid van ziekte op basis van testuitslagen van de patiënt in.
· We doen niet alle mogelijke testen omdat dit belastend is (voor patiënt en budget), omdat dit overbodig is (verschillende testuitslagen geven dezelfde informatie) en omdat in de praktijk bovendien vaak meer getest wordt dan nodig.
Het draait erom welke test nodig is om tot een juiste diagnose te komen. Deze vraag kunnen we met behulp van diagnostisch onderzoek beantwoorden. Door de praktijk te volgen kan worden ingeschat welke testen daadwerkelijk bijdragen aan de diagnostiek van een bepaalde ziekte. Hier komen dan een aantal elementen naar voren:
· Vraagstelling. Hoe scherper en beter de vraagstelling in het begin van het onderzoek is, hoe makkelijker het is om keuzes te maken in de opzet van het onderzoek. Een voorbeeld: met welke eenvoudige, veilige en goedkope testen kan de kans op aan- of afwezigheid van ziekte geschat worden? Wat zijn de determinanten van aan- of afwezigheid van ziekte? De determinant-uitkomst relatie is de kans op ziekte als functie van testuitslagen. De uitkomst is de kans op ziekte in procenten en de testuitslagen zijn de determinanten. Men probeert iets te zeggen over aan- of afwezigheid van ziekte. Men wil zo goed mogelijk in kaart brengen wat de relatie is tussen de testresultaten en de uitkomst.
· Domein. Dit is de groep patiënten of mensen die men gaat onderzoeken. Het kan gezien worden als de vraag voor wie de resultaten van het onderzoek straks moeten gelden. Dit is dus eigenlijk het type patiënt met een bepaald symptoom/klacht en de setting (EHBO/huisarts, etc). De setting is belangrijk, omdat een waarde van bijvoorbeeld CRP anders kan zijn bij de huisarts dan op de IC, omdat hier altijd ernstiger patiënten komen
· Onderzoekspopulatie. Dit is een steekproef uit het domein.
· Determinant(en). Dit zijn te onderzoeken test(en). Diagnostische determinanten zijn alle mogelijke belangrijke testen in een bepaalde domein. De vraagstelling is hier belangrijk. Hoe de determinanten bepaald worden is natuurlijk ook van belang.
o Zonder kennis (geblindeerd) van de uitkomst. Wanneer de ziekte al bekend is op het moment dat er een test gedaan wordt, dan kan dit het diagnostisch proces beïnvloeden. Op deze manier wordt de praktijk natuurlijk niet meer gevolgd.
o De zelfde methode in onderzoek en praktijk, er mag dus nooit preciezer gemeten worden dan in de praktijk gedaan wordt (overschatting van de informatiewinst).
· Eindpunt. Dit is de uitkomst, bijvoorbeeld aan- of afwezigheid van ziekte. Hierbij wordt de praktijk wat minder gevolgd.
o De beoordeling moet blind zijn voor de determinanten.
o De best mogelijke test die de praktijk leent moet gebruikt worden.
· Onderzoeksontwerp. Dit is het design. Er zijn verschillende typen onderzoek:
o Observationeel onderzoek. Dit houdt in dat er geen manipulatie van determinanten is. Voorbeeld: in de trial gaat het lot bepalen wie wel of niet de behandeling gaat krijgen. Bij observationeel onderzoek krijgt iedereen alle testen.
o Descriptief onderzoek. Dit houdt niet-causaal in, er wordt niet gezocht naar een oorzakelijk verband. Als de determinant maar voorspelt. Het gaat om determinant-uitkomst relatie. Verder wordt vaak gezien dat er meer dan 1 determinant is, de diagnose wordt immers ook bijna nooit aan de hand van 1 test bepaald.
o Cross-sectioneel onderzoek (dwarsdoorsnede). Dit houdt in dat determinanten en uitkomst op ‘hetzelfde’ moment bepaald worden. Men wilt hierbij niks zeggen over later, het gaat om een momentopname (er is geen tijdsdementie). Het afnemen van de testen moet in het onderzoek dan ook zo dicht mogelijk bij elkaar liggen.
o Data-analyse, interpretatie + rapportage.
Casus:
· Welke testen dragen bij aan de kans-inschatting op aan- of afwezigheid van BM bij kinderen met nekstijfheid op de EHBO?
· Oftewel: wat zijn de determinanten van aan- of afwezigheid van ziekte.
Data-analyse vindt plaats na verzameling van de data per patiënt. De waarde van de determinanten (testuitslagen) en de diagnostische uitkomst (referentietest aan- of afwezigheid van ziekte) wordt bepaald. Data-analyse bestaat uit drie stappen:
· Schatten van de a priori kans (zonder testuitslagen).
· Vergelijk de voorspellende waarden van elke testuitslag apart met de referentie (=univariaat). Alleen de determinanten die univariaat de uitkomst voorspellen, worden meegenomen in de multivariate analyse.
· Vergelijk een combinatie van testuitslagen met de referentie (=multivariaat), dit gaat via een model. Op deze manier wordt overlap in informatie weg gefilterd.
o Conform volgorde in de praktijk: de testen moeten in dezelfde volgorde worden uitgevoerd als in de praktijk.
o Bepaal toegevoegde waarde van de testuitslag aan reeds verzamelde (voorafgaande) testuitslagen.
2 bij 2 tabellen lezen:
| Ziekte + | Ziekte - |
Determinant + | A = terecht positief | B =fout positief |
Determinant - | C = fout negatief | D = terecht negatief |
Sensitiviteit = A/A+C = kans op ziekte bij positieve test
Specificiteit = D/B+D = kans op negatieve test bij niet-zieken.
Positief voorspellende waarde: A/A+B = kans op ziekte indien positieve test
Negatief voorspellende waarde: D/C+D = kans op niet-ziekte indien negatieve test
Opdracht 1
Deze oefening is gebaseerd op het volgende onderzoek: Draaisma JMTh, Lemmen van RJ, Jong AAM de, Doesburg W. Temperatuurmeting bij kinderen: met de trommelvlies-infraroodmeter en de rectale kwikthermometer even goede resultaten op de spoedeisendehulp-afdeling. Ned tijdschr Geneesk 1997;141:938-941, en is een goed voorbeeld van zogenaamd testonderzoek. In testonderzoek worden de testeigenschappen van twee diagnostische testen vergeleken. Dit soort onderzoek geeft geen antwoord op de vraag wat de additionele waarde is van de test voor het stellen van een diagnose.
De onderzoeksvraag was, of met behulp van een nieuwe trommelvlies-infraroodmeter accuraat de aanwezigheid van koorts kan worden gesteld bij kinderen jonger dan 11 jaar. In dit onderzoek werden in totaal 213 kinderen jonger dan 11 jaar gezien op een afdeling spoedeisende hulp van een algemeen ziekenhuis. Bij alle kinderen werd de temperatuur gemeten met de conventionele rectale kwikthermometer (RKT) en de nieuwe trommelvlies-infraroodmeter (TIM). De RKT werd als gouden standaard beschouwd en koorts werd voor beide methoden gedefinieerd als een afgelezen temperatuur hoger dan 38oC. Het gemiddelde verschil tussen de temperatuur gemeten met de TIM en RKT was nihil. Bij 96 kinderen werd volgens de gouden standaard koorts geconstateerd. Volgens de TIM waren er 86 kinderen met koorts van wie ook 77 koorts hadden volgens de RKT.
1. Formuleer de onderzoeksvraag in termen van determinant en uitkomst relatie. Wat is het domein?
Kan met de TIM koorts worden vastgesteld?
a. Determinant: te onderzoeken test = trommelvliesinfraroodmeter (TIM).
b. Uitkomst: koorts vastgesteld met rectale kwikthermometer.
c. Domein: kinderen in tweede/derde lijn (EHBO) ziekenhuis.
2. Bereken de sensitiviteit en specificiteit van de TIM.
a. Sensitiviteit: true positive/(true positive + false negative). Kans TIM+ indien RKT+ = 77/96 = 80%.
b. Specificiteit: kans TIM– indien RKT- = 108/117 = 92%.
3. Bereken de positief en negatief predictieve waarde van de TIM.
a. Positieve voorspellende waarde: hoeveel kinderen met koorts volgens TIM hebben ook koorts volgens referentiestandaard: kans RKT+ indien TIM+ = 77/86=90%.
b. Negatief voorspellende waarde: kans RKT- indien TIM- = 108/127 = 85%.
Kans op ziekte bij negatieve testuitslag ß vooraf kans à kans op ziekte bij positieve uitkomst
15% (100-85%) ß 45% à 90%
4. Wat verwacht u van de predictieve waarden als deze nieuwe thermometer in de huisartsenpraktijk wordt toegepast?
Stel de vooraf kans op koorts in de huisartsenpraktijk is lager, bijv. 20% (X/213=0,2 à X=43). Hierbij blijven sensitiviteit en specificiteit gelijk, deze getallen hebben namelijk betrekking op testeigenschappen. Positief en negatief voorspellende waarde is echter afhankelijk van de populatie.
Met behulp van de uitgerekende sensitiviteit (0,8) en specificiteit (0,92) kunnen nieuwe waarden worden berekend. (A/43 = 0,8 à A=34), (D/170=0,92 à D=156).
Hierbij blijkt dat VW+ lager wordt (34/48=71%) en VW- wordt hoger (156/164=95%). Op het moment dat je naar situaties gaat waarbij de prevalentie van de ziekte heel laag is, heb je minder aan een positief testresultaat omdat het vaak iemand is uit de grote groep van mensen die de ziekte niet hebben. Met een hoge negatief voorspellende waarden kunnen testen worden gebruikt om een ernstige ziekte uit te sluiten.
5. Wat zijn de overwegingen in termen van predictieve waarden voor toepassing van de TIM in de huisartsenpraktijk?
In de huisartsenpraktijk is een onterecht doorverwezen of behandeld kind minder erg dan een onterechte geruststelling van de ouders. Vooral de negatief predictieve waarde moet dus hoog genoeg zijn.
Vervolg college
Vaak zijn er meerdere testen die men wilt combineren en dan in relatie wil brengen tot aan- of afwezigheid van ziekte. Stel dat men een functie wil van geslacht, leeftijd, koorts en pijn. Elk van deze testen geeft aanvullende informatie, maar er zal ook gedeeltelijk overlappende informatie zijn. CRP en koorts zijn voorbeelden. CRP zegt iets over infectie (het is verhoogd bij infectie), terwijl ook koorts een waarde geeft voor het voorspellen van een infectieziekte. Gecombineerd geven deze testen natuurlijk gedeeltelijk overlappende informatie. Daarom is er een statistisch model nodig om deze testen te combineren. Met behulp van een mulitvariate analyse wordt de overlap in informatie weg gefilterd. De 4 testen worden gecombineerd tot 1 nieuwe test, een soort super test. De testen geven allerlei individuele uitslagen en deze worden gecombineerd in een statistisch model.
Als men vervolgensiets wil zeggen over hoe goed de samengestelde test is, dan kan een ROC curve gemaakt worden. Op de y-as staat de sensitiviteit, op de x-as de 1 min de specificiteit. De testbatterij wordt weergeven als een predictieregel (formule), die is samengesteld uit de multivariate analyse. Op de curve kan gezien worden dat voor ieder afkappunt (drempelwaarde) een specificiteit en sensitiviteit is bepaald. Wanneer de sensitiviteit 0 is en de specificiteit 100%, houdt dit in dat alle testuitslagen negatief zijn (dus wanneer het afkappunt heel hoog ligt). Wanneer iedereen een positieve test gegeven is (dus wanneer het afkappunt heel laag ligt), dan is de specificiteit 0 en dan is de sensitiviteit 100%. Wanneer sensitiviteit en specificiteit beide 100% zijn, is er een perfecte test met een afkapwaarde die perfect onderscheid maakt tussen zieken en niet-zieken. De grafiek die hierbij verschijnt heeft een AUC van 1. De slechtste test vormt een diagonale curve met een AUC van 0,5. Dit staat gelijk aan een dubbeltje op gooien. De meeste testen, weergeven in een predictieregel (formule) liggen tussen deze waarden in.
Het kwantificeren van toegevoegde waarde van aanvullende testen aan eerdere testen kan met behulp van ROC-curves. Hierbij worden twee predictieregels (formules) opgesteld. Een formule die de oude testbatterij weergeeft en een formule die de oudere testbatterij met de nieuwe test bevat. Beide ROC-curves worden getekend en vervolgens kan de verandering in AUC gekwantificeerd worden. Wanneer de AUC toeneemt na toevoegen van de nieuwe test, is de test van toegevoegde diagnostische waarden De AUC zegt niet direct iets over individuele patiënten en is dus niet direct toepasbaar. Beslissingen over welk model beter is dan het andere leiden tot een goed toepasbaar model.
Rapportage:
· Vraagstelling.
· Onderzoeksopzet.
o Onderzoekspopulatie, setting, determinanten, uitkomst, ontwerp.
· Resultaten.
o Voorspellende waarden (nieuwe) test en/of ROC
· Vraagstelling.
· Onderzoeksopzet.
o Onderzoekspopulatie, setting, determinanten, uitkomst, ontwerp.
· Resultaten.
o Voorspellende waarden (nieuwe) test en/of ROC curve.
o ROC curve is een combinatie van testen.
o Toegevoegde waarde nieuwe test kan worden bepaald met een ROC curve.
De rapportage is een verslaglegging van alle keuzes die je al eerder hebt gemaakt in je onderzoek.
Oefening 2
Deze oefening is gebaseerd op het volgende onderzoek:
Barenys M, Abad A, Pons JM, Moreno V, Rota R, Granados A, Admetlla M, Pique JM. Scoring system has better discriminative value than Helicobacter pylori testing in patients with dyspepsia in a setting with high prevalence of infection. Eur J Gastroenterol Hepatol. 2000;12:1257-82.
Een internist verbonden aan een perifeer ziekenhuis krijgt een vrouw van 50 jaar op de polikliniek gastroenterologie verwezen in verband met borende pijn in het epigastrium. De klachten bestaan al enkele maanden, zijn vooral ’s nachts aanwezig en worden tijdelijk minder na het eten. Haar moeder had iets dergelijks gehad met details ontbreken. De verdere anamnese vermeldt geen bijzonderheden. Alcoholgebruik: minimaal. Roken: neen. Medicatie: gemiddeld 3 maal per week ibuprofen (een NSAID) voor haar knieklachten. De internist denkt aan een zweer van de maag of de 12-vingerige darm (ulcus pepticum). Opgeleid in een moderne ‘Evidence-Based-Medicine’ omgeving besluit de internist een diagnostische score te gebruiken om de patiënt als hoog of laag ulcus risico te kunnen classificeren. Dit heeft immers de consequentie van respectievelijk wel of geen endoscopie. De diagnostische score die de internist wil gebruiken is opgebouwd uit anamnestische gegeven en werd in de vorm van een tabel gepresenteerd:
Indicator | Punten |
Leeftijd > 40 jaar | 1 |
Mannelijk geslacht | 1 |
Alcoholgebruik > 30 gram/dag | 1 |
Roken > 10 sigaretten per dag | 1 |
NSAID gebruik > 2 doses/week | 2 |
Episodische pijn in epigastrium | 1 |
Pijn neemt af na eten | 2 |
Eerdere ulcus diagnose | 2 |
De score is de som van de punten. De positief predictieve waarde bij score groter of gelijk aan 3 is 57% en de negatief predictieve waarde is 89% (score
1. Bovenstaande tabel is het resultaat van een diagnostisch wetenschappelijk onderzoek. Hoe zou dat onderzoek eruit hebben gezien (ontwerp, uitkomst, determinanten)?
Het gaat om dwarsdoorsnede onderzoek bij patiënten verdacht voor een maag- of dunnedwarmzweer. Bij alle patiënten worden anamnestische gegevens verzameld. Bij alle patiënten werd een gastroscopie gedaan. Onafhankelijke diagnostische waarde van anamnestische factoren (determinant) voor de diagnostiek van ulcus (uitkomst: gastroscopie) werden berekend.
a. Ontwerp: crosssectioneel onderzoek, observationeel, descriptief.
b. Uitkomst: aan- of afwezigheid van peptisch ulcus.
c. Determinanten: gegevens anamnese: leeftijd, geslacht, alcohol, roken, NSAID gebruik, episodische pijn, pijn afnemend na eten, eerdere ulcus diagnose.
2. De internist, die inmiddels een kopie van deze tabel uit de bureaulade heeft getrokken merkt dat het gegeven ‘episodische pijn’ van de patiënt nog ontbreekt. Hij vraagt hiernaar en krijgt een ontkennend antwoord. Tot welk domein behoort deze patiënte?
Volwassenen met maagklachten verwezen naar een polikliniek voor gastroenterologie van een perifeer ziekenhuis.
3. Wat is de score van de patiënte en wat is haar risico op peptisch ulcus? Neem daarbij aan dat het domein van de patiënte overeenkomst met dat van de patiënten waardoor de anamnestische score bedoeld is.
Haar score is 5 waardoor de positief predicitieve waarde 57% is en de negatief predictieve waarde 89%.
4. Wat is uw bezwaar tegen deze wijze van presenteren van een gedichotomiseerde (= in tweeën gedeelde) score?
Iedereen boven dat afkappunt heeft hetzelfde risico (en idem onder het afkappunt). Dit is natuurlijk niet reëel en de score verliest daardoor precisie. Liever predictieve waarden voor score-categorieën en predicitieve waarden voor enkele afkappunten.
5. De internist gebruikt deze score en handelt naar bevinden. Tijdens het golfen bespreekt hij de patiënte met een collega die stelt dat een C14-ureum-ademtest op de H.Pylori veel informatiever is. Hij zegt dat de sensitiviteit van deze test 80% en de specificiteit 85% is voor ulcuslijden. Bereken met behulp van een kruistabel en een denkbeeldige populatie van 100 patiënten uit bovengenoemd domein de positief en negatief predictieve waarde van de ademtest. Neem hierbij aan dat de voorafkans op een ulcus in dit domein ook 25% is.
De voorafkans is 25%, dus 25 patiënten hebben daadwerkelijk een ulcus.
| Ulcus | geen ulcus |
Ademtest+ | 20 | 11 |
Ademtest- | 5 | 64 |
VW+ = 20/31 = 65%
VW- = 64/69 = 93%
6. Wat vindt u van de diagnostische waarde van de ademtest op H.Pylori vergeleken met de anamnestische score? Waarom is de vraag welke van de twee ‘testen’ de voorkeur heeft niet de klinisch relevante vraag? Welke is deze vraag dan wel?
Predictieve waarden zijn iets gunstiger dus hebben de voorkeur. Maar het gaat niet om een geïsoleerde prediciteve waarde maar om toegevoegde diagnostische waarde gegeven de resultaten van de anamnestische score. De anamnestische gegevens zijn makkelijker te verkrijgen dan een ademtest. Het gaat er dus om wat een ademtest nog kan toevoegen, aangezien je natuurlijk sowieso een anamnese afneemt. Het kan zijn dat de aanvullende waarde niet groot is. Klinisch relevante vraag: Voegt de ademtest iets toe aan de bestaande anamnestische score?
7. Hoe zou u de ‘klinisch relevante vraag’ genoemd bij vraag 5 kunnen onderzoeken? Vermeld ook de determinant-uitkomst relatie(s).
Doe bij een populatie uit het domein de anamnestische score en de ademtest. Doe vervolgens een referentietest (endoscopie) bij iedereen. Vergelijk de volgende determinant-uitkomst relaties:
a. P(ulcus) = f (leeftijd, geslacht, anamnese, …).
b. P (ulcus) = f (leeftijd, geslacht, anamnese,…, ademtest).
Vergelijk vervolgens de toegevoegde waarde van de ademtest via een ROC curve.
8. In het onderzoek waarin de score werd beschreven is ook de toegevoegde waarde van de ademtest onderzocht. De toegevoegde waarde bleek nihil. Hoe is dit te verklaren?
Ademtest bevat voor een deel dezelfde informatie als de anamnestische score.
9. Is het in een onderzoek naar de toegevoegde waarde van de ademtest noodzakelijk (voor de validiteit) dat de beoordelaar van de ademtest niet op de hoogte is van het resultaat van de anamnestische score? Zo ja, waarom?
Het liefst niet, maar als in de praktijk de beoordelaar op de hoogte is van de gegevens in de score dan moet dat in het onderzoek ook gebeuren.
Oefening 3
Patiënten in de huisartspraktijk met symptomen die kunnen duiden op een myocardinfarct (MI) worden doorverwezen voor additionele diagnostiek. Echter, slechts een deel van de doorverwezen patiënten blijkt een MI te hebben. De leeftijd van de patiënt kan gebruikt worden als ‘test’ of een MI waarschijnlijk is. In de tabel op blz. 48 van het blokboek wordt de leeftijd weergegeven van 100 patiënten met een verdenking op een MI met de daadwerkelijke aanwezigheid of afwezigheid van een MI.
1. Bereken de sensitiviteit en specificiteit bij het doorverwijzen van patiënten die 65 jaar zijn of ouder.
| MI+ | MI- |
Test+ | 17 | 41 |
Test- | 4 | 38 |
Sens = 17/21 = 0,81
Spec = 38/79 = 0,48.
FP = 1- spec = 0,52.
2. Bereken de sensitiviteit en specificiteit bij het doorverwijzen van patiënten bij meerdere afkappunten, namelijk:
a. Van 50 jaar of ouder.
| MI+ | MI- |
Test+ | 20 | 60 |
Test- | 1 | 19 |
Sens: 20/21 = 0,95.
Spec: 19/79 = 0.25.
b. Van 60 jaar of ouder.
| MI+ | MI- |
Test+ | 19 | 47 |
Test- | 2 | 29 |
Sens = 0.90.
Spec = 0.41.
c. Van 70 jaar of ouder.
| MI+ | MI- |
Test+ | 17 | 36 |
Test- | 4 | 43 |
Sens = 0,81
Spec = 0,54
d. Van 80 jaar of ouder.
| MI+ | MI- |
Test+ | 12 | 19 |
Test- | 8 | 61 |
Sens = 0.57
Spec = 0.89
En zet deze in een ROC curve (y-as is sensitviteit = terecht positief, x-as = 1-specificiteit = vals positief).
Een ROC curve wordt gemaakt door allerlei afkappunten in te plotten.
Samenvatting:
· Diagnostiek in de praktijk.
o Onzekerheid reduceren.
o Bepaalt prognose & bepaalt beleid.
· Diagnostisch onderzoek.
· Opzet:
o Observationeel.
o Descriptief.
o Cross-sectioneel:
§ Gelijktijdige bepaling determinant en uitkomst (referentie standaard).
o Altijd onderzoek naar > 1 determinant.
· Uitvoer:
o Bepaling determinanten als in praktijk.
o Bepaling ziektestatus & determinant status met wederzijds blinderen.
· Analyse:
o Univariaat (per determinant).
o Multivariaat: combinatie van testuitslagen in relatie tot uitkomst.
§ Eindpunt = f (combinatie van determinanten).
§ Toegevoegde waarde bepalen; minst belastende testen eerst analyseren (conform praktijk).
· Rapportage:
o Met name toegevoegde waarde van de test.
HC 3 – Prognostisch onderzoek
Prognostisch onderzoek is het onderzoek naar het beloop van een ziekte. Bij prognostisch onderzoek gaan we ervanuit dat de diagnose die gesteld is, juist is. Een voorbeeld:
Een man van 65 heeft net een hartinfarct gehad. U neemt anamnese af, doet lichamelijk onderzoek en voert verschillende tests uit. U behandelt hem met o.a. streptokinase. Zijn ‘high sensitive C-Reactive-Protein’ is verhoogd. Belangrijke vragen die de patiënt beantwoordt wil hebben: Wat is de kans dat ik binnen 30 dagen overlijdt?
Het gaat bij prognostisch onderzoek om het inschatten van een kans, en de prognostiek kans is een alles of niets verschijnsel: wel/geen leven na een bepaalde tijd of wel/geen recidief na een bepaalde tijd.
De patiënt is natuurlijk niet geïnteresseerd in de determinanten, maar wel in de uitkomst.
Definitie van prognose: het beloop van een ziekte. In prognostisch onderzoek ga je na welke determinanten het beloop van een ziekte voorspellen. Het is de bedoeling door dit onderzoek betrouwbare informatie te verkrijgen over de toekomst. Kennis hiervan is voor zowel de patiënt als de arts van belang. In het onderzoek zit dus een tijdsdimensie, in tegenstelling tot in diagnostisch onderzoek.
Vanuit de arts gezien is de prognose belangrijk om de behandeling op af te stemmen: curatief, preventief of palliatief bijvoorbeeld. Een patiënt kan er bijvoorbeeld zo slecht aan toe zijn dat je een bepaalde behandeling liever niet meer geeft, maar liever een palliatieve behandeling start. Welke factoren voorspellend zijn voor een slechte uitkomst valt onder prognostisch onderzoek. Als men ziekenhuizen wilt vergelijken moet men ook rekening houden met verschillen in prognostische factoren. Het perspectief van de arts en patiënt zijn het belangrijkste.
Uitkomsten in prognostisch onderzoek:
· Niet: relatieve risico’s, odds ratio’s, gemiddelde 5-jaars overlevingen.
· Wel: individuele schattingen van absolute kansen op sterfte, ziekte, recidief, goede kwaliteit van leven. Dus een schatting aangepast aan de individuele patiënt. Een patiënt met veel risicofactoren, heeft een hogere kans om te overlijden i.t.t. de kans van een jong iemand. Het gaat dus om schattingen, maar aangepast aan het individu. Er zijn allerlei uitkomsten die belangrijk zijn voor medisch onderzoek, recidief, kwaliteit van leven, etc.
Een uitkomst moet relevant zijn voor de patiënt, maar ook voor de arts. Het moet concreet zijn, je moet je er iets bij voor kunnen stellen. Bloedspiegels zijn heel duidelijk, maar niet relevant voor de patiënt. Wat we wel willen is bijvoorbeeld pijn of dagelijks functioneren.
Samengevat het doel van prognostisch onderzoek: het met een beperkt aantal eenvoudige, veilige en niet te dure testen (determinanten c.q. gegevens) schatten van absolute kans op een bepaald beloop en bepaalde uitkomst.
Prognose in de praktijk begint bij de patiënt met de ziekte. Er wordt een schatting gemaakt van het verwachte beloop van de ziekte.
Voorbeeld: wat is de kans dat een kind van 2 jaar met een bacteriële meningitis:
· Doodgaat aan de ziekte
· Complicaties krijgt
· Beperkingen overhoudt?
We kennen als uitkomsten ‘gunstig’ of ‘ongunstig’ toe. Er zijn ook prognostische modellen waarin de uitkomst meer verfijnd wordt: waarbij er meerdere categorieën zijn waarin een patiënt terecht kan komen.
De prognose van de patiënt wordt bepaald aan de hand van scoringssystemen, ook wel prognostische modellen of predictieregels. Voorbeeld van een dergelijk scoresysteem is bijvoorbeeld de APGAR score bij pasgeborenen.
Om een scoringssysteem te ontwikkelen is wetenschappelijk onderzoek nodig, epidemiologisch onderzoek. En wel prognostisch onderzoek. Met behulp van de gegevens uit het onderzoek wordt een regressiemodel opgesteld. De kern van een regressiemodel is y=a+bx. X staat voor risicofactor, a is het intercept, de basiskans, b staat voor het gewicht van een bepaalde risicofactor en y is de kans van de patiënt. Uiteindelijk kom je tot een score voor die unieke patiënt.
Het nadeel van zo’n scoringssysteem is dat je altijd uitgaat van een beperkt aantal karakteristieken. Een heleboel andere unieke patiëntinformatie moet je achterwege laten. Aan de andere kant is dit een voordeel omdat het scoresysteem anders in de praktijk niet meer hanteerbaar zou zijn. Het voordeel is dus dat je een regel hebt met betrekkelijk weinig informatie (wel kernachtige variabelen) op basis waarvan je een goede inschatting kan maken van de prognose. Als arts laat je misschien je eigen ervaringen meewegen in prognostische inschattingen. Zo’n predictieregel is gebaseerd op regels in een computer, en dus objectief.
Voorbeeld 1
Kind met meningitis (zie ook HC2 – diagnostisch onderzoek). Welke factoren voorspellen neurologische complicaties of sterfte na bacteriële meningitis?
Sterfte of leven met ernstige complicaties in de gehele groep bedraagt 15% in de eerste 6 maanden.
Mogelijke predictoren (veel hogere of veel lagere sterfte):
· Mannelijk geslacht: 20%. Dit betekent dat kinderen van het vrouwelijk geslacht een gunstigere uitkomst hebben.
· Atypische convulsies: 30%.
· Hogere temperatuur: 10%. Dit blijkt dus een beschermende factor te zijn. De kans om binnen een half jaar te overlijden of ernstige neurologische complicaties over te houden blijkt lager te zijn.
· Streptococcus pneumoniae: 40%.
· Neisseria meningitidis: 20%.
Er wordt gesproken van mogelijke predictoren omdat je er rekening mee moet houden dat de ene factor deels bepaald kan worden door een andere: overlap aan informatie. Misschien speelt geslacht wel helemaal geen rol. Predictoren die in de univariate analyse (bovenstaande getallen) belangrijk lijken te zijn, kunnen hierdoor in de multivariate analyse geheel wegvallen. De verklaring hiervoor is dus dat je in de multivariate analyse compenseerd voor overlap aan informatie.
In een multivariate analyse wordt gecorrigeerd voor overlap aan informatie.
In multivariate modellen worden punten (gewichten) toegekend aan bepaalde risicofactoren. Met behulp van deze gewichten kan een regressievergelijking worden opgesteld:
Y = gewicht1 x determinant1 + gewicht2 x determinant2 + enz.
De relatie tussen de totale score en de kans binnen 6 maanden een neurologische complicatie te krijgen of komen te overlijden na een bacteriële meningitis wordt bepaald.
Oefening 1
Over de afgelopen decennia hebben talloze patiënten in de wereld een Björk-Shiley hartklepprothese ontvangen. Nu blijkt uit een studie dat er een kleine kans bestaat dat deze klep breekt. Als dat gebeurt, moet de patiënt acuut geopereerd worden, anders sterft hij/zij aan de klepbreuk. De sterfte onder patiënten met een klepbreuk is rond de 70%. In de studie is ook een predictiemodel ontwikkeld om voor iedere patiënt de kans op klepbreuk te bepalen. Men zou uit voorzorg bij iedereen met een Björk-Shiley hartklep deze klepprothese kunnen vervangen; echter het vervangen van een hartklep brengt ook risico’s met zich mee. Om dus een goede afweging te maken of de klepprothese al dan niet vervangen moet worden, is naast de kans op een klepbreuk ook een voorspelling op sterfte na vervanging van een hartklepprothese nodig.
U wordt gevraagd een onderzoek naar zo’n predictiemodel voor het risico van hartklepvervanging op te zetten.
1. Wat is de onderzoeksvraag?
Welke factoren voorspellen de 30 dagen sterfte na een kunstklepvervanging?
2. Wat zijn domein, determinant, en uitkomst van de studie?
a. Domein: patiënten met een Björk-Shiley prothese (die klepvervanging ondergaan).
b. Determinant: alle voorspellende factoren.
Voorbeeld: leeftijd, type klep die vervangen moet worden, endocarditis, linker ventrikel functie, eerdere HVZ, emergency, aorta vervanging en tricuspidalis vervanging.
c. Uitkomst: Sterfte binnen 30 dagen na operatie
Een soortgelijke studie is al eens gedaan. Zie tabel 1 op blz. 52 in blokboek.
3. Wat is de 30 dagen sterfte voor de gehele groep patiënten?
6,8%. Je berekend een gewogen gemiddelde. Er moet gekeken worden naar de gehele groep, hiervan zijn er een aantal overleden en deze deel je op het totale aantal van de groep.Een van de mogelijke berekeningen is: (1122x0,046+800x0.074+341x0.126)/(1122+800+341)x100=6,8%
4. Hoe groot is de kans dat iemand die met spoed wordt geopereerd in de eerste 30 dagen na hartklepvervanging sterft?
Op basis van de eerste tabel 37,3% kans. (direct uit de tabel te halen)
5. Wat zijn de sterkste voorspellers van 30 dagen sterfte na hartklepvervanging?
Hoge mortaliteitscijfers worden gezien bij: dubbele klep vervanging, endocarditis, slechte linker ventrikel functie, spoedoperatie en aortic root replacement.
6. Denkt u dat deze factoren ieder een onafhankelijke rol hebben? Leg uit waarom wel/niet.
Nee. Deze factoren zijn afkomstig uit het univariate model. Er is dus nog niet gecorrigeerd voor overlap aan informatie. Sommige risicofactoren gaan in de praktijk vaak samen: bijvoorbeeld endocarditis en spoedoperatie. Deze overlap aan informatie word er bij de multivariate analyse uit gehaald.
7. Bereken de kans op 30 dagen sterfte bij het vervangen van de klepprothese voor de volgende patiënten:
a. Man, 65 jaar, slechte linker ventrikel functie en coronair lijden met een aortaklepprothese.
1+3+2 = 6 → 15%.
b. Vrouw, 45 jaar, met een mitraalklepprothese.
-1+2=1 → 3,2%.
Vervolg college
De onderzoeksvraagstelling in prognostisch onderzoek sluit altijd aan bij de praktijk. Met een beperkt aantal eenvoudige, veilige en niet te dure testen (determinanten c.q. gegevens) wordt de absolute kans op een bepaald beloop en een bepaalde uitkomst geschat. Het domein en de onderzoekspopulatie zijn begrippen die vergelijkbaar zijn met die bij diagnostisch onderzoek. Het domein geeft aan in welke groep mensen de resultaten van het onderzoek wilt toepassen. De studiepopulatie geeft een steekproef aan uit het domein, dit moet representatief zijn. De determinanten zijn mogelijke voorspellende factoren als patiëntkenmerken, uitslagen van testen of keuzen van behandelingen (mogelijke scenario’s). De uitkomst de absolute kans op bijvoorbeeld sterfte, ziekte, recidief of goede kwaliteit van leven.
Het design van prognostisch onderzoek verschilt van dat van diagnostisch onderzoek. Het betreft namelijk een cohort-onderzoek. Een cohort is een groep die gevolgd wordt in de tijd (longitudinaal). De expositie is aanwezig voor de uitkomst. Determinanten leiden tot een uitkomst. Het onderzoek is observationeel en descriptief. Meestal zijn er meer dan 1 determinanten betrokken. Prognostisch onderzoek is ook puur observationeel onderzoek, er wordt geen factor gemanipuleerd.
Belangrijk bij het uitvoeren van een prognostische studie:
· Selectie van potentiële predictoren.
o Dit kan uit kennis, literatuur.
· Beperken van loss-to-follow-up.
· Beperken van missings.
· Voldoende groot onderzoek.
o Minstens 10 events per potentiële predictor.
o Beperkt aantal predictoren (scores).
Benodigde beschikbare data per patiënt:
· Determinanten.
· Beloop/uitkomst.
Men analyseert de data en wil tot een soort samenvatting komen, dit wordt uiteindelijk een scoringssysteem. Data analyse bestaat uit een aantal stappen:
· Beschrijven van de relatie determinant-uitkomst.
· Univariate analyse determinant-uitkomst relatie en eventueel selectie van predictoren (p
· Multivariate analyse waarbij predictoren samen in model opgenomen zijn.
o Onafhankelijke invloed van predictoren.
o Stapsgewijs toevoegen van predictoren.
o ROC curve. (toont de toegevoegde waarde van een setje voorspellers)
· Omzetten statistisch model naar risico score met bijbehorende kansen.
Vaak wordt het effect van een factor minder wanneer je corrigeert voor een andere, omdat ze soms samen gaan (bijv. Roken en dieet). In een model moet dus voor factoren gecorrigeerd worden.
Een rapportage is een tabel waarin per kandidaat variabele kan worden afgelezen en een ROC analyse waarin de toegevoegde waarde van een setje voorspellers te zien is.
Oefening 2
Bij het kiezen van een behandeling speelt de prognose van de patiënt ook een belangrijke rol. Daar gaat deze oefening over.
Casus
Een man van 60 jaar, die reeds driemaal een hartinfarct heeft gehad, krijgt ‘snachts plotseling een onaangenaam gevoel achter zijn borstbeen. Hij ervaart dit als pijnlijk en drukkend en voelt zich misselijk, zweterig en duizelig. De patiënt wordt met de ambulance naar het ziekenhuis gebracht. Onderweg maakt het ambulance personeel een 12-afleidingen elektrocardiogram (ECG), waarop de totale ST elevatie 1.5 milivolt (mV) is en de QRS duur 130 miliseconden. Zowel deze uitslag als het klinisch beeld duiden op acute myocard ischemie. Op basis van de ECG bevindingen blijkt het om een infarct van de voorwand te gaan.
De dienstdoende cardioloog staat voor de afweging of de patiënt een behandeling met trombolyse moet ondergaan. Het is bekend dat trombolyse (het oplossen van de thrombus die het infarct veroorzaakt) de mate van verdere infarcering van het hartweefsel kan beperken. Het kan echter ook tot bloedingen leiden. Om deze afweging goed te kunnen maken heeft de cardioloog inzicht nodig in de prognose van de patiënt, met en zonder trombolyse behandeling.
U wordt gevraagd hiervoor een prognostisch model te ontwikkelen.
1. Wat is de onderzoeksvraag?
Is trombolyse een mogelijke voorspeller voor de overleving van patiënten die op de SEH komen met een acuut myocardinfarct?
2. Wat zijn onderzoeksontwerp, domein, determinant, en uitkomst van uw studie?
a. Onderzoeksontwerp: cohortstudie. (observationeel, descriptief)
b. Domein: patiënten met een acuut myocardinfarct op SEH.
c. Determinanten: eerder doorgemaakt MI, ST-elevatie, leeftijd, locatie van het infarct, trombolyse al dan niet geven.
d. Uitkomst: Sterfte binnen 3 jaar ja of nee.
Een van de manieren om een prognostisch model te ontwikkelen is door gebruik te maken van bestaande data. Op de volgende bladzijde vindt u de lange termijn resultaten uit een gerandomiseerde trial waarin 533 patiënten met een doorgemaakt hartinfarct tussen 1981 en 1985 werden gerandomiseerd naar behandeling met trombolyse (d.m.v. streptokinase) of zonder trombolyse. De tabel geeft aan welke determinanten voorspellende waarde hadden voor de uitkomst. Voor iedere variabele ziet u de regressie-coëfficient en de odds ratio.
3.
a. Wat betekent het woord ‘onafhankelijke’ in de titel van de tabel?
Onafhankelijk betekent niet verstoord door, of niet afhankelijk van, andere prognostische factoren. Oftewel: gecorrigeerd voor overlap aan informatie.
b. Waar is de odds ratio een schatting voor?
De OR is een schatting voor het risico bij mensen met de determinant t.o.v. mensen zonder de determinant. Het is een verhouding tussen kansen.
c. Wat betekent de term ‘gecorrigeerde OR’?
De gecorrigeerde OR is de OR rekening houdend met de verdeling van andere prognostische factoren.
d. Wat is de interpretatie van de gecorrigeerde OR van leeftijd > 55 jaar? Mensen met een leeftijd boven de 55 jaar hebben 1,57 x grotere odds op sterfte dan mensen met een leeftijd van 55 jaar of jonger.
De gecorrigeerde regressie-coëfficient is gewicht van een factor.
Aan de hand van de regressie-coëfficienten kan men voor iedere patiënt met een acuut myocardinfarct zijn kans op sterfte binnen drie jaar uitrekenen via de volgende formule:
kans=11+e-[-1.99+1.02*X1+0.61*X2+0.45*X3+-0.60*X4]
Voor een vrouwelijke patiënt van 60 jaar met een eerste onderwand infarct en ST-elevatie van 1 mV is deze kans gelijk aan (X1=0, X2=0, X3=1 en X4=1) 0.11.
4. Bereken aan de hand van de tabel de 3-jarige sterftekans voor de patiënt uit de casus.
X1 = eerder doorgemaakt myocardinfarct. Dit heeft hij. 1 punt
X2 = ST-elevatie > 1.2 mV heeft hij (1.5). 1 punt
X3 = Leeftijd > 55 jaar. Dit heeft hij (60 jaar). 1 punt
X4 = Inferieure infarct locatie. Dit heeft hij niet, hij heeft aan de voorwand. 0 punten.
Uit de berekening komt 52%.
5. Wat zegt de odds ratio van 0.67 over het effect van behandeling met trombolyse?
Dat men een odds heeft van 0,67 maal zo groot op sterfte wanneer behandeld met trombolyse. Dit is dus een negatieve kans, en werkt dus beschermend.
ln0,67 is een p-waarde. Dit is 0,4.
6. Wat wordt de 3-jaarssteftekans voor de patiënt uit de casus wanneer u zou trombolyseren? Wanneer u dit vergelijkt met de sterftekans zonder behandeling, zou u als cardioloog deze patiënt dan trombolyseren? Waarom wel/niet?
Opnieuw invullen in de vergelijking geeft nu een kans van 0,42%. Er is dus een risicoreductie. Er is nog verder onderzoek nodig naar eventuele risico’s van trombolyse, maar op basis van dit resultaat lijkt de behandeling voordelig.
Overeenkomsten prognostiek en diagnostiek:
· Gaat over individuele kans op uitkomst
· Direct gerelateerd aan de patiëntenzorg
· Onderzoek in en comform aan de dagelijkse praktijk
· Observationeel en descriptief onderzoek
· > 1 determinant
· Op zoek naar de minst belastende meest efficiënte testen
· Kijkt naar een combinatie van testuitslagen
Verschillen prognostiek en diagnostiek
· Diagnostisch onderzoek is cross-sectioneel, prognostisch onderzoek is longitudinaal
· Bij diagnostisch onderzoek wordt de derminant en de uitkomst gelijktijdig gemeten. Bij prognostisch onderzoek wordt de determinant aan het begin gemeten en de uitkomst in de toekomst.
COO 1 – Pubmed
De volgende informatie is afkomstig van http://ubugeneeskunde.wordpress.com/onderwijs/gnk/akwo/.
Weergave van de resultaten
Pubmed toont standaard de resultaten als summary met 20 tegelijk. De meest recente artikelen staan bovenaan. Via het menu ‘display settings’ kan worden aangeven hoeveel resultaten men wilt zien. Hoe meer resultaten Pubmed laat zien, hoe minder tijd men verliest door van scherm te wisselen. Ook het ‘format’ van de resultaten kunnen in dit menu worden aangepast. Dit kan ook allemaal voor een individuele treffer.
MeSH termen
Elke referentie in Pubmed krijgt trefwoorden toegewezen. Dit proces wordt ‘indexering’ genoemd. Deze trefwoorden staan bekend als MeSH-termen, dit staat voor Medical Subject Headings. Wanneer je via display settings sorteert op auteursnaam of titel komen de treffers die reeds geïndexeerd zijn bovenaan te staan. Wanneer je een treffer geslecteerd hebt en je klikt op het menu ‘publication types, MeSH terms, substances’, kun je zien welke trefwoorden aan deze treffer zijn toegekend.
MeSH database
De MeSH database is een aparte databank voor MeSH-termen. Hierin staan alle MeSH-termen die in PubMed als treffer gebruikt kunnen worden. Deze database kan rechts onderin het beginscherm van PubMed gevonden worden, onder het kopje ‘more resources’. Het is belangrijk je te realiseren dat je hierbij niet zoekt in de databank met artikelen, maar in de databank met trefwoorden. De MeSH-termen zijn georganiseerd in een boomstructuur waarin een bepaalde MeSH-term in verschillende ‘bomen’ kan voorkomen. De informatie in de MeSH database kan gebruikt worden om een zoekactie te verfijnen. Soms kunnen er synoniemen gevonden worden, of ideeën om een zoekactie te verfijnen of uit te breiden. Vanuit de MeSH database kan ook direct gezocht worden in PubMed m.b.v. de PubMed search builder. Er zitten nadelen aan het zoeken met MeSH-termen, ten eerste wordt de MeSH-database elk jaar aangepast, er worden dan MeSH-termen toegevoegd en verwijderd. Aan reeds geïndexeerde artikelen wordt dan echter niet automatisch ook een nieuwe MeSH-term toegekend, deze artikelen worden dus niet gevonden bij het zoeken op de nieuwe MeSH-term. Check dus altijd of dit voor jouw MeSH term het geval is. Zo ja, zoek dan ook op de oude MeSH term. Een ander nadeel is dat aan de meest recente artikelen nog geen indextermen zijn toegekend. Ook deze artikelen worden dus gemist bij het zoeken op MeSH-termen. Deze worden wel gevonden wanneer men zoekt op bijvoorbeeld Title-Abstract.
Automatic Term Mapping
PubMed zet ingevoerde zoektermen zo mogelijk automatisch om naar MeSH termen, dit wordt automatic term mapping genoemd. Vervolgens zoekt PubMed zowel op de ingevoerde zoekterm, als op de overeenkomstige MeSH-term. Om te controleren wat er gebeurd met de zoekterm die je gebruikt, kun je kijken naar ‘search details’. Hierin kunnen aanpassingen gemaakt worden.
Zoeken in velden
Er kan gezocht worden op auteursnaam (au), tijdschrifttitel (ta) en titel/abstract (tiab). De veldnaam kan tussen vierkante haken achter de zoekterm gezet worden. Hiervoor kan ook gebruik worden gemaakt van de search builder in de advanced search. M.b.v. AND, OR en NOT kan aangegeven worden hoe termen met eerder toegevoegde zoektermen gecombineerd moeten worden.
Truncatie en aanhalingstekens
Met behulp van een asterisk (*) kunnen termen met een andere uitgang of alternatieve spelling opgepikt worden. Als er meer dan 600 woorden of woordcombinaties worden gevonden, geeft PubMed een waarschuwing, dan worden niet alle variaties meegenomen in de zoekactie. De zoekterm moet dan worden aangepast, bijvoorbeeld door een langere woordstam in te voeren of zelf woordvarianten in te voeren.
Aanhalingstekens kunnen gebruikt worden als een zoekterm uit meer dan 1 woord bestaat, hiermee wordt voorkomen dat PubMed de woorden ook los van elkaar zoekt. Een paar aandachtspunten voor het werken met PubMed zijn:
· PubMed herkent alleen dubbele aanhalingstekens, dus ‘’.
· Bij gebruik van truncatie of aanhanlingstekens worden de zoektermen niet automatisch meer omgezet naar MeSH termen.
· Combineer nooit truncatie en aanhalingstekens.
Zoektermen combineren
In PubMed kunnen zoektermen gecombineerd worden m.b.v. AND, OR en NOT. Bij AND zoekt PubMed naar beide termen in één artikel, bij OR zoekt PubMed naar artikelen waarin één van beide termen, of allebei, voorkomen en bij NOT zoekt PubMed naar artikelen waarin de eerste term wel, maar de tweede term niet voorkomt. Ter illustratie (http://ubugeneeskunde.wordpress.com/2010/08/11/pubmed-3-3/):
Bij gebruik van meer dan 2 zoektermen kunnen haakjes gebruikt worden.
Search history
Bij uitgebreide zoekacties wordt gebruik van haakjes ingewikkeld, waardoor men beter kan zoeken met afzonderlijke zoektermen en deze later kan combineren. Hiervoor kan gebruik worden gemaakt van de functie search history bij Advanced search. Hier kan een lijst gevonden worden met alle zoekacties die in dezelfde sessie zijn uitgevoerd. M.b.v. preview kan gezien worden hoeveel treffers een gecombineerde zoekactie oplevert.
Limits
M.b.v. de functie limits kan de zoekactie (na uitvoering) verder ingeperkt worden. De zoekactie kan dan bijvoorbeeld beperkt worden tot bepaalde soorten publicaties, leeftijdsgroep, of belangrijkste tijdschriften. Nadeel is dat er al snel een te sterkte inperking van de zoekresultaten optreedt. De Limits zijn bovendien gebaseerd op MeSH-termen, waardoor recente artikelen gemist kunnen worden. De limits blijven gelden, tot ze verwijderd worden.
Zoekfilters
Dit kan m.b.v. clinical queries die in het beginscherm van PubMed ingesteld kunnen worden. Hier kan gezocht worden m.b.v. 3 verschillende filters: clinical study categories, systematic reviews en medical genetics. Bij de clinical study categories kan worden aangegeven binnen welk domein men wil zoeken (etiologie, diagnose, therapie, prognose, etc.). Ook kan worden aangegeven of de zoekactie sensitief moet zijn (‘broad’) of specifiek (‘narrow’). Het filter voor systematic reviews zoekt naar systematic reviews. Review: een overzichtsartikel dat niet per se evidence-based is, systematic review: een overzicht van primaire onderzoeksartikelen waarbij gebruik wordt gemaakt van expliciete en reproduceerbare methoden. Systematic reviews (in PubMed) zijn dat deel van de 20 miljoen treffers in PubMed dat voldoet aan het door NLM opgestelde filter.
Filters zijn handig omdat ze op een snelle manier de zoekresultaten inperken, ze zijn echter gebaseerd op het denkwerk van anderen en het is dus maar de vraag of ze optimaal zijn voor een specifieke zoekvraag.
Een bekend artikel terugvinden
Dit kan m.b.v. de optie single citation matcher in het beginscherm van PubMed, onder PubMed Tools. Hierin kunnen gegevens ingevoerd worden van de publicatie.
Related citations
Dit blok zijn artikelen over hetzelfde onderwerp, vaak ook van meer recente datum, als het artikel wat je bekijkt. Standaard worden 5 artikelen getoond, en via de link See all kunnen ook meerdere artikelen bekeken worden.
Citatiezoeken
Via Web of Science en SCOPUS kan men opzoeken hoe vaak een bepaald artikel geciteerd is in andere artikelen (times cited). Door op het getal te klikken kan men zien door welke (recentere) artikel dit artikel is aangehaald en dus over hetzelfde onderwerp gaan. In SCOPUS worden vaak een groter aantal citaties gevonden dan in Web of Science, dit komt omdat SCOPUS een meer medische dekking heeft.
Bewaren van zoekresultaten en zoekgeschiedenis
Het is verstandig om zoekgeschiedenis te bewaren omdat men dan later kan verantwoorden hoe men aan zoekresultaten is gekomen. De informatie kan bewaard worden in de search history via de print-screen functie van de browser of gekopieerd worden naar een tekstbestand. Met de RSS functie kan een RSS-feed van de zoekactie gegenereerd worden en met de Save Search functie kan de zoekactie opgeslagen worden in een MyNCBI-account. Met een dergelijke account kan de zoekactie in een later stadium nog eens herhaald worden of kan men zichzelf laten attenderen op nieuwe artikelen over het onderwerp. Om artikelen tijdelijk op te slaan (8 uur) kan men op send to klikken en dan bewaren in Clipboard. Om de zoekactie permanent op te slaan, kan deze bewaard worden in MyNCBI (via send to naar collections).
Literatuurmanagementprogramma’s
Zoekresultaten kunnen geëxporteerd worden naar een programma voor literatuurmanagement. De referenties staan dan overizichtelijk bij elkaar, ze kunnen geordend en ontdubbeld worden, en bij het schrijven van een artikel kunnen eenvoudig citaties ingevoegd worden en een literatuurlijst aangemaakt worden. De universiteit ondersteunt RefWorks en EndNoteWeb:
· RefWorks. Om hiervan gebruik te maken moet men eerst een account aanmaken. Informatie voor gebruik van RefWorks kan gevonden worden in de Universiteitsbibliotheek.
· EndNoteWeb. Dit programma is onderdeel van ISI Web of Knowledge, ook Web of Science is hier onderdeel van. Men kan er toegang tot krijgen via Web of Science. Ook hiervoor moet eerst een account aangemaakt worden.
HC 4 – Etiologisch onderzoek
Etiologisch onderzoek
Hier onderzoekt men nog steeds hoe een determinant samenhangt met de uitkomst, alleen kijkt men nu naar het oorzakelijke verband. Men wilt weten of de determinant verantwoordelijk is of beschermend werkt e.d. voor de opgetreden uitkomst. Dit is anders dan in de diagnostiek en prognostiek, daar zoekt men geen oorzakelijk verband.
Kenmerken etiologisch onderzoek
De onderzoeksvraag bij etiologisch onderzoek luidt als volgt: is er een relatie tussen een determinant (risicofactor) en een ziekte-uitkomst? Kenmerken van etiologisch onderzoek zijn:
- Verklarend onderzoek.
o Dit i.t.t. descriptief onderzoek.
- Het wil causaliteit aantonen (oorzaak-gevolg-relatie).
- Oorzaak komt voor gevolg. Men wilt bij etiologisch onderzoek dat de oorzaak voor het gevolg komt. In sommige onderzoeken is het lastig dit uit elkaar te houden. Stel dat men op zoek is naar cannabis gebruik en het krijgen van schizofrenie in de vorm van een cross-sectioneel onderzoek onder mensen rond de 30 jaar. Er wordt gevraagd aan deze mensen of zij schizofrenie hebben en daarna wordt het gebruik van cannabis bevraagd. Een gevaar in dit type opzet is dat schizofrenie ook tot een groter cannabis gebruik kan leiden (dus dat de relatie andersom is).
o Blootstelling aan de determinant treedt op voordat de ziekte-uitkomst is opgetreden.
- Determinant-uitkomst relatie wordt niet door andere factoren verklaard.
Onderzoeksopzet
Er zijn verschillende onderzoeksopzetten: Het mooiste om een oorzakelijk verband te onderzoeken is experimenteel.
- Experimenteel. Dit is de mooiste optie om een oorzakelijk verband te onderzoeken. Blootstelling aan de determinant is door de onderzoeker toegewezen. Op het moment dat men het lot laat beslissen wie A of B gaat gebruiken zullen de groepen op elkaar lijken. Voordeel is dat iedereen gelijke blootstelling heeft en dat de andere factoren gelijk gehouden kunnen worden.
- Observationeel. Blootstelling aan de determinant wordt niet door de onderzoeker toegewezen. In dit college wordt verder alleen ingegaan op observationeel onderzoek.
Er kunnen verschillende designs gebruikt worden (beide observationeel):
- Cohortonderzoek. Dit is eigenlijk het meest natuurlijke onderzoeksdesign wat men zich kan voorstellen bij een oorzakelijke vraagstelling. Er wordt gekeken naar mensen die de ziekte nog niet hebben. Deze mensen worden voor een bepaalde tijd gevolgd, waarbij wordt vastgelegd wie blootgesteld wordt aan de determinant (bijvoorbeeld roken). Omdat er bij de blootstelling begonnen wordt, moet er gewacht worden tot er een uitkomst optreedt, hierom wordt het ook wel follow-up onderzoek genoemd. De definitie van cohortonderzoek luidt als volgt: ‘Onderzoek waarin personen op basis van hun blootstelling aan een determinant en vrij van de ziekte-uitkomst bij aanvang van het onderzoek in de tijd gevolgd worden om het optreden van de ziekte-uitkomst vast te stellen.’
Er wordt een cohort gemaakt van mensen die de ziekte nog niet hebben gehad (om beïnvloeding door andere factoren te voorkomen), en dan wordt gekeken wie wel of niet blootgesteld wordt aan een bepaalde factor (de determinant). Daarna wordt gekeken wie de uitkomst wel of niet krijgt. Een voorbeeld is de Framingham Heart Study. Bij 5200 personen tussen de 30 en 62 jaar werd gekeken naar risicofactoren voor hart- en vaatziekten (HVZ). Deze factoren werden elke 2 jaar opnieuw gemeten. Men was o.a. geïnteresseerd in een hoge bloeddruk. Het onderzoek loopt nog steeds. Wanneer de determinant en de uitkomst gemeten zijn, kan een 2 bij 2 tabel worden opgesteld. De vraag is, wat de kans is op een myocardinfarct (MI), gegeven dat iemand hypertensie heeft. Dit is gelijk aan a/(a+b). Uiteraard kan dit ook gedaan worden voor het risico zonder determinant: c/(c+d). Een belangrijke maat om dan te vergelijken of het een verhoogd risico geeft is het relatief risico (de twee risico’s op elkaar delen). Wanneer er geen verband is, is het relatief risico (RR) 1. Wanneer het hoger wordt houdt dit in dat mensen met hypertensie vaker een MI hebben dan mensen zonder hypertensie.
-
| MI+ | MI- |
Hypertensie+ | a | b |
Hypertensie- | c | d |
RR = (a/(a+b))/(c/(c+d))
o Hoe kom je aan je cohort?
§ Geografisch (framingham heart study). Groep mensen nemen die in een bepaald gebied wonen.
§ Geboortecohort (britisch 1946 birth cohort). groep mensen nemen die in een bepaald jaar geboren zijn.
§ Dynamisch cohort (Leidsche Rijn). Er kunnen mensen in en uit de studie gaan.
§ Occupational cohort (Whitehall study). Op het moment dat je bijvoorbeeld weet dat het om asbest blootstelling gaat, dat je kunt kijken naar mensen in een bepaalde beroepsgroep.
o Hoe kom je aan de ziekte-uitkomst?
§ Na een bepaald tijdsinterval vragenlijst toesturen of uitnodigen voor interview of medisch onderzoek.
§ Via medische dossiers of registraties ziekte-uitkomsten vastleggen.
- Patiënt-controle onderzoek. Dit wordt ook wel case-control onderzoek genoemd. Men begint hierbij eigenlijk aan het eind. Er wordt begonnen met de mensen die de ziekte hebben (de cases) en we vergelijken deze met mensen die de ziekte niet hebben (de controles), er wordt dan teruggevraagd naar de determinanten. De definitie luidt als volgt: ‘onderzoek waarin patiënten met de ziekte-uitkomst en een controlegroep zonder ziekte-uitkomst geselecteerd worden en vastgesteld wordt hoeveel mensen in beide groepen tevoren blootgesteld zijn geweest aan de determinant.
Er wordt dus gestart met de uitkomsten van cases en controles, dan wordt er teruggevraagd naar determinanten. Deze methode is efficiënter: het kost minder tijd omdat het op één moment uitgezocht kan worden. Er hoeft niet gewacht te worden tot de cases ontstaan, mensen hoeven dus niet tientallen jaren gevolgd te worden maar er wordt gewoon gekeken naar de uitkomst: mensen met een myocardinfarct. In die zin is het een eenvoudig onderzoek om praktisch uit te voeren. De uitspraken die men aan het eind van het onderzoek wil doen zijn hetzelfde. Er zitten voor- en nadelen aan beide manieren. Het case-control onderzoek kan efficiënter, eenvoudiger en sneller dan het cohort-onderzoek. Het is vooral handig bij onderzoeken naar een zeldzame uitkomst. Ook bij het casecontrole onderzoek kan na het meten van de determinant en de uitkomst een 2 bij 2 tabel worden opgesteld.
| Uitkomst+ | Uitkomst- |
Determinant+ | a | b |
Determinant - | c | d |
De verhouding tussen de twee kolommen in de 2 bij 2 tabel is door de onderzoeker zelf bepaald, doordat hij zelf de onderzoekpopulatie heeft vastgesteld zonder en met de uitkomst. Hierdoor kan er geen relatief risico berekend worden. Een maat die wel berekend kan worden is de odds. Een odds is de reciproke van de kans (dus de kans/1-kans)
Odds op blootstelling = (a/(a+c))/(1-(a/(a+c))) = a/c
Odds op geen blootstelling = (b/(b+d))/(1-(b/(b+d))) = b/d
Odds ratio = (a/c)/(b/d) = (axd)/(bxc) = (a/b)/(c/d)
Bij een zeldzame ziekte benaderd de odds ratio het relatieve risico. Het relatieve risico bereken je met de formule (a/(a+b))/(c/(c+d).Bij een zeldzame ziekte zullen a en c beide ongeveer gelijk zijn aan 0. Zowel het relatieve risico als de odss ratio worden dan bepaald door b/d.
o Hoe kom je aan je patiënten?
§ Deze ga je natuurlijk daar zoeken waar je ze gemakkelijk kan vangen: huisarts, ziekenhuis, kankerregistratie, etc. Hier zit meestal een duidelijk startpunt in. Met controles ben je veel vrijer om uit te kiezen in eerste instantie.
o Hoe kom je aan je controlegroep?
§ Huisarts, ziekenhuis, algemene bevolking, etc. Toch is het hier ook van belang heel zorgvuldig om te gaan met de selectie. Op het moment dat je ze zodanig kiest dat blootstelling anders is dan in de patiëntengroep kun je later in de problemen komen. Je wilt dus heel graag dat de patiënten en controles uit dezelfde ‘bron’ populatie komen. Als er door de keuze van de controles een bepaald verband wordt ingebracht die er niet hoort te zitten heb je een probleem.
o Hoe kom je aan de determinanten? Je zit dus vast omdat je moet gaan navragen en uitzoeken hoe het zat met de determinanten.
§ Interview met de deelnemer zelf.
§ Interview met proxy.
§ Medisch dossier.
Samenvattend:
- Het cohortonderzoek loopt parallel aan de relatie determinant à uitkomst. Dit in tegenstelling tot het moment waarop we gaan kijken naar patiënt-controle onderzoek of case-control onderzoek.
- Patiënt-controle onderzoek is een totaal ander begin dan cohort-onderzoek maar op zoek naar dezelfde relatie.
Een voorbeeld is de ziekte van Creutzfeldt-Jakob (CJ). Dit is een snelle, progressieve vorm van dementie die opeens ontstond. Het is een ernstig ziektebeeld en er was veel ongerustheid over de oorzaak hiervan. In de jaren ’90 werd in Europa een nieuwe variant ontdekt van Creutzfeldt-Jakob na een epidemie van de gekke-koeien ziekte. Men vroeg zich af of rundvlees de oorzaak was. De onderzoeksvraag zou hier kunnen zijn: is het eten van rundvlees een oorzakelijke factor in het ontstaan van CJ? Hebben mensen die meer vlees eten een hoger risico op het ontstaan van CJ? Er kan hier het beste case-control onderzoek gedaan worden omdat de ziekte vrijwel niet meer voorkomt waardoor cohort-onderzoek niet echt praktisch is. Het grote voordeel van een case-control design is dat cases opgespoord kunnen worden en dat er een controlegroep gekozen kan worden. Daarna wordt gekeken hoeveel rundvlees men heeft gegeten. Het probleem hierbij is dat mensen het niet meer weten (dementie of overleden), dus dan moet er met de partners gepraat worden. Na het verzamelen van de gegevens ontstaat weer een 2 bij 2 tabel:
| CJD+ | CJD- |
Rundvlees + | 90 | 160 |
Rundvlees - | 10 | 40 |
In deze studie-opzet kan echter het relatief risico niet goed bepaald worden. Stel dat er 100 cases verzameld worden, daaraan wordt dan gevraagd hoe het met de consumptie van rundvlees is. Stel dan 90 op de 100 mensen rundvlees hebben gebruikt in de CJ-groep. Voor deze informatie moet al veel moeite gedaan worden via partners, vragenlijsten, etc. Dan wordt er een controlegroep gemaakt, hiervoor worden ongeveer 200 controles verzameld. De groep controles groter maken heeft niet zoveel zin om de precisie te verhogen. Dit omdat er een grens is van nauwkeurigheid die gehandhaaft wordt bij de cases. Het probleem zit dan in de 100. De enige manier om de nauwkeurigheid dan te vergroten is door het aantal van de cases te vergroten. Stel dat de controles een mooie afspiegeling zijn van rundvleeseten in Nederland (idealiter is dit het geval), dan hebben bijvoorbeeld 80% van de mensen rundvlees gegeten. Het relatief risico wordt dan als volgt berekend: (90/250)/(10/50). Dit kan eigenlijk niet meer direct uitgerekend worden omdat er informatie verloren gaat aangezien het geen cohort onderzoek betreft. Wanneer er sprake is van case-control onderzoek werkt men daarom met odds-ratio’s (OR). Deze zegt eigenlijk: kijk naar de odds op blootstelling onder de cases. Stel je voor dat 2 van de 5 mensen ziek worden, dan is het risico op ziekte 2/5. Druk je dit uit in odds, dan geeft men dit aan als 2 versus 3. Er zitten allerlei voordelen aan zo’n odds ratio, hij is op verschillende manieren uit te rekenen. Op het moment dat er geen samenhang zit, ontstaat er een odds ratio van 1. In die zin heeft het dezelfde soort interpretatie: hoe hoger hoe meer rundvlees er wordt gegeten onder de cases.
Drie vormen van vertekening
Termen die worden gebruikt zijn:
- Validiteit. Afwezigheid van systematische fouten in opzet, uitvoering of data-analyse van het onderzoek.
- Bias. Mate van verstoring van de determinant – uitkomstrelatie als gevolg van systematische fouten. Dit leidt tot een verminderde validiteit. Er zijn drie typen bias in etiologisch onderzoek:
o Selectiebias.
§ Definitie: vertekening van de determinant-uitkomst relatie als gevolg van systematische fouten bij de selectie van onderzoeksdeelnemers (case en/of controles). De determinant-uitkomst relatie is anders voor hen die wel en die niet deelnemen. Er gaat iets mis bij de keuze van de cases en controles waardoor er een afwijkende odds ratio gevonden gaat worden.
§ Voorbeeld1: pilgebruik en kans op DVT. Patiënten: vrouwen met een DVT opgenomen in het ziekenhuis, controles: gezonde vrouwen tussen 25-45 jaar. Patiënten bleken vaker de pil te slikken, deze zou de oorzaak kunnen zijn van DVT. Een selectiebias kan hierin een rol spelen.
· Zodra er aanwijzingen zijn dat een bepaalde blootstelling leidt tot een bepaalde ziekte, kun je zien dat artsen hier ook naar gaan handelen. Vrouwen met DVT klachten die de pil slikken zullen vaker doorverwezen worden dan zij die de pil niet slikken. Door deze selectieve doorverwijzing zullen pilgebruiksters meer kans hebben om als case in het onderzoek te komen en zal effect van pil op DVT overschat worden.
§ Voorbeeld 2: population-based versus hospital-based onderzoek. Op welke manier zou selectie bias een rol kunnen spelen? Hiermee wordt bedoeld dat onderzoek wordt gedaan alleen in het ziekenhuis, omdat dit makkelijker is.
· In het ziekenhuis komen comorbiditeit en ongezonde leefstijl vaker voor dan in de bevolking. De relatie tussen roken en kanker kan bijvoorbeeld onderschat worden door overrepresentatie van controles die roken.
§ Voorbeeld 3: sterftecijfers zijn vaak lager bij mensen die een baan hebben dan sterftecijfers in de algemene bevolking, doordat mensen die werken gezonder zijn dan mensen die niet werken (‘healthy worker effect’). Er heeft dan al een soort zelf-selectie plaatsgevonden.
De voorbeelden tot nu toe golden voor patiënt-controle onderzoek. In cohort onderzoek zijn deze voorbeelden geen issue, omdat ziekte nog niet is opgetreden bij meting van de determinant. Uitval uit het onderzoek (loss to follow-up) kan wel tot een selectiebias leiden. Dit is vervelend omdat de groep kleiner wordt, maar je bent ook bang dat er een selectieve groep uitvalt en je daardoor een belangrijke groep mist. Bij cohort onderzoek weet je nog niks over wie wel of niet het event gaat krijgen, dus selectie daarvan inbrengen door misschien specifieke mensen met een determinant te selecteren, is buitengewoon moeilijk. In principe weet je dat nog niet. Daarom spelen dit soort problemen veel minder tot niet bij cohort onderzoek.
o Informatiebias.
§ Definitie: vertekening van de determinant-uitkomst relatie als gevolg van systematische fouten bij de meting van de determinant en/of uitkomst.
§ Voorbeelden:
· Misclassificatie van determinant.
o Zelfrapportage accurater bij cases dan bij controles (of juist andersom).
· Misclassificatie van uitkomst.
o Ziekte wordt misschien beter gediagnosticeerd bij mensen met de determinant.
o Dit komt ook voor bij cohort-onderzoek. Zodra je de determinant weet zou je nadrukkelijker kunnen zoeken bij bepaalde mensen dan bij andere mensen. Dit probeer je altijd zoveel mogelijk te voorkomen, maar het kan voorkomen.
o Confounding.
§ De determinant – ziekte uitkomst relatie wordt verstoord door het effect van een andere factor (de confounder; ‘mixing of effects’). Dit gevaar loop je bij ieder observationeel onderzoek. Mensen kiezen voor een bepaalde blootstelling, maar misschien zijn andere factoren daardoor ook anders. Hier moet rekening mee worden gehouden of hier moet misschien voor gecorrigeerd worden.
§ Voorbeeld: vroeger dacht men dat een 5e kind op rij een verhoogde kans had op Down-syndroom, maar toen had men nog geen rekening gehouden met de leeftijd van de moeder. Dus vroeger dacht men dat kinderen die later in rij geboren zijn een hoger risico hebben op het syndroom van Down. De leeftijd van de moeder heeft ook een relatie met de kans op Down-syndroom. Uiteraard lopen die twee zaken door elkaar. Als je als vierde kind geboren bent, heb je een oudere moeder dan dat je het 2e kind bent.
De confounder is de determinant van de ziekte-uitkomst en is geassocieerd met de determinant. De confounder is geen factor in de causale keten.
Wat doe je tegen bias?
- Confounding: kan niet voorkomen worden.
o Meten en in data-analyse voor corrigeren.
- Informatie-bias: voorkomen tijdens de opzet.
o Ziektestatus blind voor determinantstatus.
o Medische dossiers i.p.v. zelfrapportage.
o Zelfde manier van rapporteren cases en controles.
- Selectie-bias: voorkomen tijdens opzet.
o Controles selecteren onafhankelijk van determinantstatus.
o Goede definitie van source populatie.
Voor en nadelen van cohort en patiënt-controle (PC) onderzoek
Voor en nadelen van cohortonderzoek:
- Voordelen:
o Oorzaak wordt voor gevolg gemeten.
o Weinig gevoelig voor selectie- en informatiebias.
o Geschikt bij zeldzame determinant.
o Kan meerdere uitkomsten bestuderen.
- Nadelen:
o Selectieve uitval/loss to follow-up.
o Duur en tijdrovend.
o Niet geschikt bij zeldzame uitkomst.
Voor en nadelen van patiënt-controle onderzoek:
- Voordelen:
o Efficiënt en relatief goedkoop.
o Geschikt bij zeldzame uitkomst.
o Kan meerdere determinanten bestuderen.
- Nadelen:
o Oorzaak wordt na gevolg gemeten.
o Zeer gevoelig voor selectie- en informatiebias.
o Niet geschikt om meerdere uitkomsten te bestuderen.
Oefening 1
Op 18 oktober 1995 verraste de Britse Committee on Safety of Medicines (CSM) de wereld met de aankondiging dat 3e-generatie anticonceptiepillen meer kans gaven op het ontstaan van veneuze trombose in vergelijking met de wat oudere 2e-generatiepillen. Het CSM stelde voor om 3e-generatiepillen niet langer voor te schrijven als eerste keuze bij jonge vrouwen. Deze aankondiging was gebasseerd op 3, toen nog niet gepubliceerde onderzoeken en wekte veel protest en onrust.
Vele artsen hadden moeite met het bericht: het zou immers toch zo kunnen zijn dat er systematische vertekening zat in het epidemiologisch onderzoek, en bovendien was geen enkel plausibel biologisch mechanisme bekend. De mededeling stond bovendien haaks op wat de industrie wilde omdat volgens haar 3e generatie anticonceptiepillen juist beter waren dan 2e eneratie wat betreft het optreden van HVZ.
In 1997 werd een biologisch mechanisme ter verklaring van het verhoogde risico voorgesteld: bij een nieuwe proefopzet voor het bepalen van resistentie tegen geactiveerd proteïne C (APC) vond men hogere waarden bij vrouwen die de 3e-generatie pil gebruikten. Ook een aantal andere stollings-afwijkingen bleken net iets minder uitgesproken bij de 2e-generatiepil. In 1999 waren er 13 gepubliceerde patiënt-controle en cohort-onderzoeken met gegevens over de kans op veneuze trombose bij de verschillende soorten contraceptiva; in 10 van deze onderzoekingen vindt men een verhoogd risico van de 3e-generatiepreparaten en in 3 onderzoekingen relatieve risico’s van ongeveer 1.
Ondertussen zijn de verschillende partijen het nog steeds niet met elkaar eens. Zo wordt anno 1999 in het leerboek ‘Clinical Gynecologic Endocrinology and Infertility’ van Speroff, Glass and Kase na een uitgebreide discussie van alle relevante literatuur op pagina 888 geschreven dat:
‘..The apparent differences associated with the new progestins, it is now apparent, were duet o the marketing and preferential prescribing of new products, which influenced the characteristics of the patients for whom the new products were prescribed’.
En in het farmacotherapeutisch kompas 2000/2001 is de 2e-generatiepil het anticonceptiemiddel van 1e keus vanwege het ‘… lager risico op veneuze trombose … 2e generatiepillen zijn bovendien goedkoper dan 3e-generatie pillen’.
1. Benoem de drie componenten (domein, expositie en uitkomst) van de klinisch epidemiologische vraagstelling van bovenstaand probleem.
a. Domein: vrouwen in de vruchtbare leeftijd die nog geen diepe veneuze trombose hebben gehad
b. Determinant: 3-generatie pil t.o.v. 2e generatiepil.
c. Expositie: 3e generatie anticonceptiepil.
d. Uitkomst: eerste geval van diepe veneuze trombose.
2. Welke studieopzet (design) zou u gebruiken om deze vraag te beantwoorden, en waarom?
Patiënt-controle onderzoek omdat het een etiologische vraag betreft over een zeldzame aandoening (bijwerking). Het is niet handig om nu vrouwen te gaan volgen in de tijd omdat het niet regelmatig voorkomt, maar redelijk zeldzaam is. De reden om m.b.v. patiënt-controle onderzoek uit te voeren is vanwege de zeldzaamheid. Cohort-onderzoeken worden anders erg grote projecten.
3. Zijn er nog andere mogelijkheden?
a. Cohort-onderzoek.
b. Gerandomiseerde trial.
Nadeel is dat er in beide gevallen veel vrouwen nodig zijn.
Oefening 2
Deze oefening is gebaseerd op het volgende onderzoek: Key TJ, Sharp GB, Appleby PN, Beral V, Goodman MT, Soda M, Mabuchi K. Soya foods and breast cancer risk: a prospective study in Hiroshima and Nagasaki, Japan. Br J Cancer 1999;81:1248-56.
De kans op borstkanker is verhoogd bij een hoge blootstelling aan endogene en exogene oestrogenen (vrouwelijke geslachtshormonen). Sojavoeding is rijk aan stoffen, die een structuur hebben die erg lijkt op oestrogenen. Deze stoffen heten phyto-estrogenen, en ze hebben zowel een zwak oestrogeen als een zwak anti-oestrogeen werking. Dit heeft geleid tot de hypothese dat een hoge consumptie van phyto-estrogenen door interactie met het oestrogeenmetabolisme de kans op borstkanker zou kunnen beïnvloeden.
De onderzoeksvraag van deze studie is of het eten van sojavoeding de kans op borstkanker verlaagt. Soja wordt traditioneel veel gegeten in Aziatische landen. Omdat er markante verschillen in het voorkomen van borstkanker bestaan tussen Westerse (hogere incidentie) en Aziatische landen wordt al vele jaren gezocht naar een verklaring hiervoor. Waarschijnlijk spelen leef- en voedingsgewoonten een belangrijke rol. Het eten van de traditionele Oosterse gerechten rijk aan soja en sojaproducten (miso, tofu) zou de kans op borstkanker kunnen verlagen en de oorzaak kunnen zijn van de lage incidentiecijfers die in Aziatische landen gezien worden.
Het onderzoek, dat in dit artikel is beschreven, werd uitgevoerd in het cohort van de zogenaamde ‘Life Span Study’, een cohort vrouwen in Hiroshima en Nagasaki, Japan. Een eerder onderzoek in ditzelfde cohort heeft laten zien dat blootstelling aan radioactieve straling de kans op borstkanker verhoogt. Voor de studie in dit artikel maakten de onderzoekers gebruik van voedings-vragenlijsten, die tussen 1969 en 1981 door 34 759 vrouwen uit dit cohort werden ingevuld. Van de vrouwen werd bijgehouden – tot 1993 – bij wie borstkanker was opgetreden. 427 keer werd borstkanker gediagnosticeerd in een totaal van 488 989 persoonsjaren ‘follow-up’.
De resultaten zagen er als volgt uit:
Tofu | Aantal gevallen | Persoonsjaren | Relatieve risico |
Geen tofu | 37 | 52 793 |
|
139 | 164 476 |
| |
2-4/week | 199 | 219 025 |
|
>=5/week | 52 | 52 695 |
|
1. Benoem de determinant, de uitkomst en het domein van de klinisch epidemiologische vraagstelling.
a. Determinant: Consumptie van soja (producten).
b. Uitkomst: (nieuwe gevallen van) borstkanker.
c. Domein: vrouwen (at risk voor borstkanker).
2. Wat is het (absolute) risico op borstkanker voor de hele populatie? En wat is het (absolute) risico op borstkanker voor vrouwen die een hoge tofu consumptie hebben?
a. Risico gehele bevolking: (37+139+199+52)/(52793+164476+219025+52695)x100000= 87.3 per 100.000 persoonsjaren
b. Risico bij hoge tofu consumptie: 52/52 695 = 98,7 per 100.000 persoonsjaren.
3. Wat voor type onderzoek is het beschreven onderzoek (etiologisch, diagnostisch, prognostisch, therapeutisch)? Bestaat er kans op ‘confounding’ in het beschreven onderzoek? Noem een mogelijke ‘confounder’ in dit onderzoek.
Het betreft een etiologische onderzoeksvraag. Leeftijd is een mogelijke confounder omdat tofu eters over het algemeen ouder zijn, en een hogere leeftijd geeft een hogere kans op borstkanker.
Een confounder moet een risicofactor zijn voor de uitkomst waarin je geïnteresseerd bent.
4. Wat is het onderzoeksontwerp (design) van het beschreven onderzoek (follow-up, patiënt controle, gerandomiseerd). De onderzoeksvraag zou ook door middel van een patiënt controle onderzoek onderzocht kunnen worden. Omschrijf voor dezelfde onderzoeksvraag hoe een patiënt controle onderzoek eruit ziet. Wat zou een mogelijk probleem kunnen zijn?
Het betreft een cohort onderzoek. Een andere mogelijkheid is patiënt-controle onderzoek. Bij een patiënt-controle onderzoek zou men patiënten met borstkanker vergeleken moeten worden met een steekproef uit het domein. Voor beide groepen wordt dan informatie over tofu consumptie verzameld, bijvoorbeeld via een vragenlijst of een interview. Een probleem is de informatie (recall) bias.
HC 5 – Frequentie en associatiematen
Frequentie: hoe tel je.
Associatiematen: vergelijken van tellingen om te kijken of er verschillen zijn.
Er zijn twee typen frequentiematen:
- Iemand heeft de ziekte al: prevalentie. Dan tel je dus wie een ziekte heeft op een bepaald moement.Prevalentie = het aantal zieken / totale populatie
- Iemand krijgt de ziekte in de toekomst: incidentie. Dan tel je dus wie iets krijgt (nieuwe gevallen).
Stel u ziet een patiënt met symptomen die mogelijk wijzen op veneuze trombose. Hierbij is de onderzoeksvraag: Wat is de kans op veneuze trombose gegeven de onderzoeken/testen? Dit is een vraag naar de prevalentie. Bij prevalentie ga je op een bepaald moment kijken wie iets heeft en wie niet. Dit doe je eigenlijk ook bij diagnostiek; wie heeft de aandoening wel en wie niet. Prevalentie zit tussen de 0 en 1 (of 1-100 bij percentages). Je kan kijken naar de prevalentie vooraf, maar ook na bepaalde testen.
Prevalentie studies:
- Cross-sectionele studies.
o Determinant en ziekte op hetzelfde moment gemeten.
- Prevalentie.
o Aantal personen met de ziekte op een bepaald moment.
- Prevalentie (%).
o Aantal zieken/totale populatie x 100.
Voorbeelden van prevalentie:
- 50% van de mensen met de verdenking op longkanker had een laesie op de X-thorax.
- In een huisartsenpopulatie van 2500 personen, hadden er 50 astma.
- 30% van de Nederlanders rookt.
De interpretatie/relevantie van de prevalentie:.
- Kwantificatie ziektehoeveelheid: a priori kans.
- Public health planning.
Soms is het niet nuttig om de prevalentie te bepalen.
Issues:
- Non-response
o Prevalentie van MI : de meeste mensen overlijden meteen na een MI, waardoor de prevalentie (momentopname) laag is.
o Prevalentie van dementie: dementie is vaak een langdurende ziekte, waardoor de prevalentie erg hoog is.
- Selectieve mortaliteit. Dit geeft aan dat de mortaliteit geassocieerd is met bepaalde karakteristieken, zoals de leeftijd.
Stel u ziet een patiënt met gediagnosticeerde borstkanker, die vraagt naar haar prognose. De onderzoeksvraag is hier dan: wat is de kans dat ik binnen 5 jaar dood gaat/een recidief krijg? Nu hebben we met incidentie te maken. Het gaat om het aantal nieuwe gevallen. Er zijn twee typen incidentie:
- Cumulatieve incidentie.
Dit geeft een kans weer: de kans tussen 0-1 om een ziekte/complicatie te krijgen in een bepaalde tijdsperiode. Het aantal nieuwe patiënten / de populatie at risk.
o Voorbeelden:
§ 5-jaars incidentie op een tweede MI.
§ 10-jaars overleving bij vrouwen met borstkanker.
§ 1-jaars risico op een fractuur bij osteoporotische vrouwen.
- Incidentie dichtheid.
Hierbij wordt het aantal nieuwe gevallen afgezet tegenover het aantal persoonsjaren waarin je mensen aan het volgen bent. Je kan hierbij iets meer rekening houden met mensen die uit het onderzoek verdwijnen, waardoor je niet iedereen meer precies 2 of 5 jaar volgt bijvoorbeeld. Dus: het aantal nieuwe ziektegevallen in de populatie gedeeld door de observatietijd. Je kan zien dat dit geen getal wordt tussen 0 en 1.
Cumulatieve incidentie komt heel vaak voor uit een cohort, dus een groep mensen die je gaat volgen gedurende een bepaalde tijdsperiode:
- Groep personen met dezelfde kenmerken.
- Alle deelnemers hebben hetzelfde beginpunt (start cohort).
o Baseline kan echter wel in de tijd verschillen.
- Alle deelnemers worden gedurende een bepaalde tijd vervolgd.
De formule die vervolgens geldt: Het aantal nieuwe patiënten / de populatie at risk.
In een cohort kunnen we echter vaak niet iedereen de vastgestelde tijdsperiode volgen (door sterfte of loss to follow up bijvoorbeeld). Dit is de reden dat er ook wel gebruik wordt gemaakt van persoonsjaren. Hierbij tel je het totaal aantal jaren dat je elk persoon in de studie hebt gevolg bij elkaar op. Vervolgens kan de incidentie dichtheid (densiteit) worden berekend. ID = aantal nieuwe patiënten / persoonsjaren van de populatie at risk. De incidentie dichtheid wordt niet uitgedrukt als een percentage of getal tussen 0-1, maar bijvoorbeeld als ……. Gevallen per 1000 persoonsjaren.
Stel u ziet een patiënt met longkanker, die vraagt naar de mogelijke oorzaak. Dit is etiologisch onderzoek, de onderzoeksvraag is dan: is roken een risicofactor voor longkanker? Dan kom je in de situatie dat we twee groepen krijgen: mensen die roken en mensen die niet roken. Binnen elke groep kunnen dan stellingen worden gedaan. Je wilt kijken of ze van elkaar verschillen, dan komen er associatiematen in beeld. Laten we aannemen dat we dit etiologisch onderzoek gaan doen in een cohort-studie. We beginnen dan met het samenstellen van een cohort en daarbinnen de determinant vast te stellen (roken – niet-roken). Daarna wordt gekeken wat nou de incidentie is voor iedere groep. Deze kan weer op verschillende manieren worden uitgerekend: cumulatieve incidentie of incidentie dichtheid. De hypothese is dat de incidentie hoger is voor de rokers. Stel dat we gebruik maken van de incidentiedichtheid, dan krijgen we een twee bij twee tabel.
| Ziekte + | Ziekte - |
|
Determinant + |
|
| Totaal PY D+ |
Determinant - |
|
| Totaal PY D- |
PY = person years.
Een van de associatiematen is het relatief risico: delen van de incidentiedichtheden op elkaar, om iets te kunnen zeggen over hoeveel hoger dit ligt t.o.v. niet-rokers.
RR = (a/PYD+)/(c/PYD-)
Wat je ook zou kunnen doen is rechtstreeks de twee risico’s van elkaar af te trekken om het risicoverschil te bepalen. Dit absolute verschil is heel bepalend wanneer je misschien door wilt rekenen: wat zou er gebeuren wanneer Nederland stopt met roken? Wat voor daling kan dan verwacht worden in het aantal gevallen met longkanker? Dit kan zowel berekend worden met cumulatieve incidentie en incidentie dichtheid.
Stel we doen patiënt-controle onderzoek, dit begint juist aan de andere kant: bij de uitkomst. Een onderzoeksvraag kan dan zijn: verhoogt roken het risico op longkanker. Zowel onder de cases als de controles wordt dan gekeken wat de frequentie van de determinant is (in dit geval roken) en dit vergeleken.
Hier kan ook een twee-bij-twee-tabel van gemaakt worden en een relatief risico uitgerekend worden. Dit is echter niet correct bij een case-control studie. Dit omdat cases en controls in gelijke aantallen worden geïncludeerd, waardoor veel meer cases worden ingesloten dan er in werkelijkheid zijn. Wat we wel kunnen doen is de odds ratio (OR) berekenen. Dit zijn de odds op het voorkomen van de determinant bij de cases (a/c) vergeleken met de odds op blootstelling bij een niet-longkanker patiënt (b/d). Dit is een associatiemaat die gebruikt kan worden en waarbij heel duidelijk is wanneer er samenhang is (bij 1 niet, bij lager of hoger dan 1 wel een associatie).
Op het moment dat je een cohort-onderzoek doet, kun je relatieve risico’s en een odds ratio uitrekenen. Een relatief risico heeft altijd de voorkeur omdat het makkelijker te interpreteren is. Bij case-control onderzoek kan alleen de OR goed uitgerekend worden.
Er is samenhang tussen het relatief risico en de OR, ze lijken vaak op elkaar. Maar de waarden van OR en RR zijn alleen vergelijkbaar wanneer de ziekte waarin je geïnteresseerd bent relatief zeldzaam is. Op dat moment zijn OR en RR vrijwel gelijk. Maar het is altijd zo dat de OR iets extremer is dan de RR. Hoeveel meer hij erboven ligt, hangt af van hoe zeldzaam de uitkomst is.
Meestal worden case-control studies gedaan wanneer de aandoening zeldzaam is. Gelukkig doen we dus vrijwel alleen case-control studies in die situaties, omdat dan het voordeel van deze opzet het meest groot is.
Stel u ziet een patiënt met een verhoogde bloeddruk, die u wilt behandelen met bloeddruk verlagende middelen. Hij vraagt naar de effectiviteit van deze behandeling op de prognose. Onderzoeksvraag: verlaagt behandeling de kans op HVZ?
Dit kan met een interventiestudie (RCT): schat de incidentie dichtheid (of CI) voor iedere groep. Prior: ID (incidentie densiteit) behandelen
Samenvatting frequentie en associatiematen
Frequentie | Associatie |
Prevalantie | Relatief risico - Rate ratio - Risico ratio |
Incidentie - Cumulatieve - Densiteit | Odds ratio |
| Risico verschil |
Begrippen:
- Betrouwbaarheid. Dit is een begrip wat niet gebruikt moet worden, het is een leken begrip wat staat voor het karakter van een persoon. Iemand is wel of niet te vertrouwen.
- Validiteit. Dit staat voor afwezigheid van systematische fouten en bias (vertekening).
o Interne validiteit
o externe validiteit
- Precisie (of nauwkeurigheid). Dit staat voor de afwezigheid van toevalsfouten (ook wel random error) en is afhankelijk van:
o Standaardisatie van metingen.
o Aantallen:
§ Personen.
§ (herhaalde) observaties/metingen.
- Uitkomstmaten
o Diagnostiek: prevalentie (absoluut risico), posterior kans, Sensitiviteit, Specificiteit, VW+, VW-, OR, AUC.
o Prognostiek: incidentie (absoluut risico), OR, AUC.
o Etiologie: incidentie (absoluut risico), RR, OR.
o Interventie: incidentie (absoluut risico), RR, RD, mean difference, NNT.
- Effect schatter. Een enkele effect schatter, bijvoorbeeld RR=1,5 of RR=1,0, geeft niet voldoende informatie omdat het niks zegt over de precisie (nauwkeurigheid).
- P-waarden versus betrouwbaarheidsintervallen. Deze waarden geven informatie over de validiteit van een studie.
o P-waarde. Dit is de kans dat de gevonden associatie of nog extremer optreedt, gegeven dat de nulhypothese juist is. De P-waarde wordt vergeleken met a (arbitrair, maar meestal is a 5%). Stel dat uit een onderzoek een RR van 1,5 komt, hoe belangrijk is dit dan? De P waarde zegt hier iets over. Als deze waarde kleiner is dan 0,005, dan noem je het statistisch significant. Hoe groot is de kans dat de RR 1,5 is. Wanneer deze kans klein is, dan betekent het dat je hier waarde aan mag hechten. P-waarden zeggen dus iets over statistische significantie (dit is iets anders dan klinische relevantie) en zijn afhankelijk van de omvang van het effect en de omvang van de onderzoekspopulatie (dus de nauwkeurigheid van het onderzoek).
o Betrouwbaarheidsinterval. Het interval heeft een 95% kans om de ware populatieparameter (bv. de ware OR in je domein) te bevatten. Stel dat je bij 100 personen de bloeddruk meet, en je berekend het gemiddelde uit het onderzoek, dan kijk je waar dit terecht komt. Het betrouwbaarheidsinterval geeft dus iets weer over hoe nauwkeurig je de bloeddruk hebt kunnen meten. Het geeft puur iets aan over de nauwkeurigheid van de meting. Bij meerdere patiënten vergroot je de nauwkeurigheid en wordt het betrouwbaarheidsinterval kleiner. Het betrouwbaarheidsinterval is een objectieve indruk van omvang van het effect van de precisie van de effectschatter.
Voorbeelden P-waarden en betrouwbaarheidsinterval:
- Voorbeeld 1: Amerikaanse studie naar afvallen van obese mensen. De interventies zijn: een half uur per dag sporten + eetadvies, of alleen een half uur sporten. Aantallen: 2 keer 10.000 mensen. Het is gerandomiseerd onderzoek, beide groepen hadden een BMI van 30. De interventie werd toegepast en er werd gemeten hoe het met het BMI ging. Aan het eind van het onderzoek stond vast hoe groot de BMI was. De p-waarde van het onderzoek werd heel duidelijk aangegeven. De kans om dit verschil te vinden onder de nul-hypothese (beide behandelingen zijn even goed) was
- Voorbeeld 2: soortgelijke studie in Engeland, nu met 2 keer 50 mensen. BMI vooraf: groep 1 (28,5) en groep 2 (28.4). Het BMI achteraf: 23.5 resp. 25.5 voor groep 1 resp. Groep 2. De p-waarde is 0,15. Deze heeft geen statistische significantie, dit heeft alles te maken met het hele kleine onderzoek wat je gedaan hebt.
Dit maakt de interpretatie lastig. Je moet je altijd beducht zijn om goed op te letten wat er aan de hand is als je een p-waarde leest. Paradoxale resultaten zijn mogelijk:
- Significant effect, maar niet klinisch relevant.
- Klinisch relevant, maar niet significant.
Op het moment dat je van een associatiemaat het betrouwbaarheidsinterval uitrekent, gelden de volgende regels:
- Als het betrouwbaarheidsinterval van OR/RR de 1 niet omvat, dan is de P waarde kleiner dan 0,05.
- Als het betrouwbaarheidsinterval van mean difference/risk difference de 0 niet omvat, dan is de P waarde kleiner dan 0,05.
Dit betekent eigenlijk dat op het moment dat je de associatiematen uitrekent, dat er niet zoveel waarde zit in een p-waarde. Het geeft aan hoe krachtig de associatie is, hoe groot de omvang van het effect is en met het 95% BI zeg je ook nog iets over hoe nauwkeurig het is.
P-waarden en BI geven iets weer over de rol van toeval in een onderzoek en zeggen niks over alle problemen die je nog kan hebben met confounding en bias, etc. Dus ze geven geen informatie over validiteit van de studie.
Conclusie: nooit alleen naar p-waarden kijken, maar ook naar effect schattingen. Effect schattingen altijd presenteren met betrouwbaarheidsintervallen.
Oefening 1
1. Uit gegevens van het Transitie project in Nederland komt naar voren dat jaarlijks van de 1000 mannen er 19 een tonsilitis acuta krijgen, terwijl voor vrouwen dit 23 bedraagt.
a. Wat is het domein?
Nederlanders (mannen en vrouwen) in de huisartspraktijk.
b. Welke tijdsperiode betreft het?
Een jaar.
c. Welke frequentiemaat betreft het hier?
Incidentie: hier zijn echt nieuwe gevallen gepeild. Dit is een vorm van cumulatieve incidentie (wordt in percentage uitgedrukt).
d. Wat is de kans op tonsilitis acuta voor mannen per jaar gebaseerd op bovenstaande gegevens?
19/1000 = 1,9%.
2. Bij 3-10% van de kinderen in de algemene huisartspraktijk komt astma voor.
a. Wat is het domein?
Kinderen in de algemene huisartspraktijk.
b. Welke tijdsperiode betreft het?
één moment: cross-sectioneel. Er wordt geprobeerd in kaart te brengen hoe het op dat specifieke moment is in de huisartsenpraktijk.
c. Welke frequentiemaat betreft het hier?
Prevalentie. Dit wordt ook wel punt-prevalentie genoemd.
3. De kans op een mammacarcinoom gedurende het leven bedraagt 10%.
a. Wat is het domein?
Vrouwen.
b. Welke tijdsperiode betreft het?
Het leven.
c. Welke frequentiemaat betreft het hier?
Cumulatieve incidentie.
4. Bij 9% van mannen van 55-59 jaar is er sprake van wervelinzakkingen. Voor vrouwen bedraagt dit 10%.
a. Wat is de kans op aanwezigheid van wervelinzakking bij mannen in deze leeftijdsgroep?
9%.
b. Wat is het domein?
mannen en vrouwen tussen de 55-59 jaar.
c. Welke tijdsperiode betreft het?
Bepaald moment.
d. Welke frequentiemaat betreft het hier?
(punt) prevalentie.
5. In een interventieonderzoek naar het effect van hormoon suppletie na de overgang op het ontstaan van fracturen wordt een gunstig resultaat gevonden van toediening.
a. Wat is het domein?
Postmenopauzale vrouwen.
b. Welke tijdsperiode betreft het?
Follow-up duur van de studie.
c. Welke frequentiemaat betreft het hier?
Cumulatieve incidentie.
Oefening 2
Uit het ERGO onderzoek onder 55-jarige mannen en vrouwen is het verband onderzocht tussen roken en het optreden van hart- en vaatziekten. De 7685 personen zijn gescreend en vervolgens gedurende 5 jaar vervolgd. Hieronder zijn de gegevens in tabelvorm weergegeven. Bereken voor het verband tussen roken en het optreden van hart- en vaatziekten:
1. Wat is het domein?
Mannen en vrouwen van 55-jarige leeftijd.
2. Welke tijdsperiode betreft het hier?
5 jaar.
3. Welke frequentiemaat betreft het hier?
Incidentie (cumulatief).
4. Welke maten van verband kunnen we hier berekenen?
Relatief risico en odds ratio want je doet een cohort studie. Maar een OR is minder goed als de RR ook berekend kan worden. Ook risico-verschil kan worden uitgerekend.
5. Bereken deze associatiematen en leg in woorden uit wat ze betekenen.
RR = (41/(41+1695))/(107/(107+5842)) = 1,31.
OR = (41/107)/(1695/5842) = 1,32. Rokers hebben een 1,3 x zo grote kans op HVZ als niet-rokers.
Risicoverschil: (41/1736) – (107/5949) = 0,024 – 0,018 = 0,006. Rokers hebben een 5-jaars risico op HVZ dat 0,6% meer is dan dat van niet-rokers.
Rookt nu | HVZ-ziekte | Totaal | |
| Ja | Nee |
|
Ja | 41 | 1695 | 1736 |
Nee | 107 | 5842 | 5949 |
Totaal | 148 | 7537 | 7685 |
Oefening 3
Deze oefening is gebaseerd op het volgende onderzoek:
Van Duijn CM, Tanja TA, Haaxma R, Schulte W, Saan RJ, Lameris AJ, Antonides-Hendriks G, Hofman A. Head trama and the risk of Alzheimers’s disease. Am J Epidemiol. 1992;135:775-82.
Een studie naar hoofdtrauma als mogelijke oorzaak van de ziekte van Alzheimer liet de volgende resultaten zien. Van de 198 incidente cases met de ziekte van Alzheimer, hadden er 33 ernstig hoofdletsel in de anamnese. Van de 198 populatie-controles, die waren gematcht voor leeftijd en geslacht, hadden er 31 hoofdletsel in de anamnese.
1. Wat voor onderzoeksdesign is hier toegepast?
Patiënt-controle onderzoek: case-control studie.
2. Wat is de determinant?
Hoofdletsel.
3. Wat is het domein?
Bevolking, immers de uitkomst van het onderzoek geldt voor dit domein in de toekomst.
4. Wat is de uitkomst?
De ziekte van Alzheimer.
5. Welke associatiemaat kun je hier berekenen?
Alleen de odds-ratio want je hebt te maken met patiënt-controle onderzoek.
6. Bereken deze.
(33/165)/(31/167) = 0,2/0,18562874 = 1,11.
| Alzheimer+ | Alzheimer- |
Hoofdletsel + | 33 | 31 |
Hoofdletsel - | 165 | 167 |
HC 6 – Interventieonderzoek
Interventieonderzoek is een kwantitatieve meting van effecten van therapie of preventieve maatregelen. Het is experimenteel: de onderzoeker bepaalt wie de therapie krijgt en wie niet. Het woord interventie is heel breed, zelfs de organisatie van de gezondheidszorg is een voorbeeld van interventie. Men is zo actief bezig dat het in de richting gaat van een oorzakelijk onderzoek. Men wil weten dat het echt de interventie is waardoor patiënten beter worden. Het is geen descriptief onderzoek, maar hier willen we heel nadrukkelijk de samenhang bekijken maar met een oorzakelijke bril.
Een voorbeeld: Lotens, een nieuwe bloeddrukverlager. Mevrouw Jansen heeft een hoge bloeddruk, vervolgens wordt 6 weken Lotens voorgeschreven. De uitkomst is de bloeddruk. We gebruiken dit als uitkomst, maar het is een soort intermediaire uitkomst. We gebruiken dan dus iets wat sneller waargenomen kan worden in zo’n onderzoek als maat voor HVZ. Het is dus een indirecte uitkomst. Uiteindelijk blijkt dat de bloeddruk gedurende de 6 weken gedaald is. Dit wordt echter niet per se verklaard door de werking van het geneesmiddel. Mogelijke verklaringen voor het gevonden effect:
- Regressie naar het gemiddelde. Bloeddruk heeft een natuurlijke variatie binnen een persoon, er zijn allerlei redenen waarom de bloeddruk een beetje fluctueert. Op het moment dat je patiënten gaat insluiten in je onderzoek wanneer ze boven een bepaalde waarde uitkomen (bv. > 160 mmHg systolisch), kan je mensen meenemen die toevallig net een wat hogere waarde hebben. De kans is dan heel erg groot dat wanneer je hem de volgende keer meet, dat zij dan een lagere waarde heeft. Zodra er dan een tweede meting gedaan wordt, zal regressie naar het gemiddelde gezien worden. Dit gebeurd elke keer als mensen worden ingesloten op basis van criteria die fluctueren. Er is een centripetale beweging van gegevens in het vervolg van metingen. Het is een gevolg van variabiliteit, ‘the doctor’s friend’. De oplossing is: meer metingen of een controle groep.
- Natuurlijk beloop/prognose van ziekte. Onafhankelijk van behandeling kan de bloeddruk veranderen over de tijd en deze verandering kan verschillen tussen mensen.
- Externe effecten. Deze effecten komen erbij naast het effect waar men specifiek geïnteresseerd in is.
o Geïnduceerde effecten: gedragsveranderingen als gevolg van behandeling van hoge bloeddruk met Lotens, bijvoorbeeld eet- en drinkpatroon, lichamelijke activiteit, etc.
o Placebo-effect
- Vertekende waarneming/waarnemingsfouten. Op het moment dat je als arts heel erg gelooft in de werking van het geneesmiddel, kan dit misschien de waarneming wat vertroebelen. Dit wordt ook wel ‘informatie bias’ genoemd. Dit kan optreden bij patiënten, behandelaars en fabrikanten. Deze kunnen verwachtingen hebben van het effect van Lotens. Deze verwachtingen kunnen invloed hebben op bv. rapportage van patiënten of metingen door behandelaars. Resultaat is vertekende waarneming.
- Werkelijk effect geneesmiddel.
Er lopen een aantal dingen door het onderzoek wat ons parten kan spelen: natuurlijk beloop/regressie naar het gemiddelde (NB), externe effecten (EE) en waarneemfouten (WF). Om uiteindelijk alleen de werkzaamheid van het geneesmiddel te testen, moeten er maatregelen worden genomen. Allereerst: een controlegroep die het geneesmiddel niet krijgt. Op deze manier kunnen cases en controls met elkaar vergeleken worden, dan krijg je al een betere benadering van wat dee therapeutische werking is. Belangrijk is dat NB, EE en WF bij cases en controls vergelijkbaar zijn.
Als we vergelijkbaarheid willen over het natuurlijk beloop, dan moeten de groepen hetzelfde zijn qua prognose. Dus zonder behandeling zouden we dezelfde uitkomst moeten zien in de beide groepen. Vergelijkbaarheid van populaties is hetzelfde als vergelijkbaarheid van de prognose. De voorkeur van patiënt of arts moeten worden uitgeschakeld. Opties:
- Selectie of matching.
- Meten en in analyse controleren en corrigeren voor prognostische indicatoren.
- Randomisatie
Door middel van randomisatie worden cases en controls willekeurig samengesteld. Op deze manier wordt de verdeling van de groepen compleet aan het toeval overgelaten. De groepen worden hierdoor vergelijkbaar op bekende en onbekende factoren. Met selectie/matching kan alleen worden gecontroleerd op bekende beïnvloedende factoren.
In een trial is de determinant een medicijn en de uitkomst is bijvoorbeeld de bloeddruk. Wat je wil voorkomen is dat er ergens confounding optreedt. Op het moment dat er ergens een confounder zit met een positieve of negatieve relatie tot de uitkomst, kan alles verstoord worden. Ook in een trial (RCT) zijn er potentiele confounders, maar door de randomisatie hoop je dat al die confounders min of meer gelijk verdeeld zitten. In het observationeel onderzoek kunnen confounders wel een rol spelen.
Het doel van randomisatie is dat het ervoor moet zorgen dat de te vergelijken groepen gemiddeld dezelfde baseline kans op verandering in de bloeddruk hebben (prognose, natuurlijk beloop). Vergelijkbaar maken van index en referentiegroepen t.a.v. alle bekende en onbekende factoren die de bloeddruk kunnen beïnvloeden. Je hebt wel voldoende groepsgrootte nodig om randomisatie zijn werk te kunnen laten doen. Anders speelt de rol van toeval nog een te grote rol, deze rol wordt kleiner bij een grote groep. Er zitten ook nadelen aan dit soort onderzoek (cross-over design):
- Je krijgt allerlei tijdseffecten, patiënten keren vaak na behandeling niet terug naar de oorspronkelijke situatie.
Na het randomiseren is het nog steeds geen goede afspiegeling. Externe effecten kunnen ook nog misgaan. Maatregelen om te voorkomen dat de externe effecten in ieder geval niet verschillend zullen zijn:
- Randomiseren. Proberende gedurende het onderzoek te verschillen te beperken door de patiënt willekeurig in een groep in te delen.
- Placebo of gesimuleerde behandeling in de referentiegroep.
- Blinderen (zowel patiënt als arts).
Verder moeten de waarneemfouten niet systematisch van elkaar komen te verschillen. Wat we hiervoor kunnen bedenken, is:
- Protocolleren, systematiseren. Hoe meer je kan protocolleren, hoe minder snel er subjectieve verschillen ontstaan.
- Placebo.
- Blinderen (single, double, triple). Dit in de zin dat je de waarnemer blindeert. Dit is makkelijker wanneer er al een echt geblindeerd onderzoek is. Dan kan het namelijk door dezelfde arts gedaan worden, anders niet. Hier wordt dus alleen de uitkomst geblindeerd. Dit lukt soms ook in observationeel onderzoek. Single: alleen patiënt, double: ook arts, triple: degene die analyse doet of nog iemand anders ook geblindeerd.
De noodzaak van blinderen hangt ook af van de interpreteerbaarheid van de uitkomst.
Verschillende doelen: verklaren vs. Pragmatisme.
o Verklarend. Belang in een enkel aspect van hoge bloeddruk behandeling, bv. Lotens. Men is alleen geïnteresseerd in de werking van het geneesmiddel.
o Pragmatisch. Belang in strategie (procedure met alles wat erbij hoort) voor hoge bloeddruk behandeling, bv. Combinatie van medicijnen met leefregels en afvallen, inclusief geïnduceerde effecten. Men is geïntereseerd in de gehele interventie, zoals deze ook in de praktijk plaats vindt. Blindering is hier veel moeilijker, en misschien ook wel veel minder van belang. Er gebeuren zoveel verschillende dingen dat maskeren van de behandeling moeilijk is. Het is wel moeilijker te achterhalen welk deel nou precies verantwoordelijk is voor het resultaat.
Voor de analyse is het van belang dat de groepen vergelijkbaar zijn. Door randomisatie zijn de groepen aan het begin van de studie vergelijkbaar, maar is dit aan het eind van de studie nog steeds zo? Randomisatie is een krachtige manier om het probleem van verschillen in natuurlijk beloop op te lossen. Dit principe moet niet teniet gedaan worden in de analyse! Je wil patiënten in vergelijkbare groepen zoveel mogelijk in stand houden. Dit is het ‘intention to treat’: eens lid van een cohort, altijd lid van dat cohort. Dit is in tegenstelling tot analyse van alleen die patiënten die daadwerkelijk de behandeling kregen (per treatment of on protocol analyse). Loss to follow up kan hierdoor invloed hebben op de uitkomst. Het probleem is dat mensen de behandeling stoppen vanwege een reden. De behandeling werkt wel of juist niet, mensen kunnen ziek zijn of juist niet. Redenen kunnen verband houden met de occurence relatie: geneesmiddel en uitkomst. Probleem: we weten niet waarom men stopt. Resultaat: mogelijk vertekenend, bias.
Keuze studie eindpunten: Men heeft een intuïtieve voorkeur voor ‘harde’ klinische maten, maar er is een groeiende onderkenning van het belang van de patiënt voorkeur in het beoordelen van keuzen. Vaak zijn er onduidelijke keuzen van eindpunten en onduidelijke validiteit van gekozen eindpunten.
Nadelen van een RCT:
o Er zitten grenzen aan generaliseerbaarheid (selectie van studiepopulatie).
o Budget (RCT is duur).
o Duurt lang (RCT is prospectief).
o Aantal patiënten (veel patiënten nodig voor randomisatie).
o Ethische dilemma’s (o.a. equipoise).
Een RCT kan alleen uitgevoerd worden wanneer men helemaal niet weet wat het effect van het geneesmiddel is. In het geval dat men weet dat er een positief effect is, is het ethisch onverantwoord om de controle groep deze behandeling niet aan te bieden. Wanneer men weet dat er een negatief effect is, is het ethisch onverantwoord om de behandeling aan patiënten aan te bieden.
Alternatieven voor experimenteel onderzoek: vergelijkend niet-experimenteel onderzoek in de vorm van een cohort studies/case control studie. Nadelen:
o Niet inherent minder valide, maar veel moeilijker te ontwerpen en uit te voeren en daarom veel gevoeliger voor bias.
o In vergelijkend niet-experimenteel onderzoek bestaat een grote kans op onvergelijkbaarheid van juist die drie componenten die in een RCT zo goed worden opgelost.
Grootte van trials. De studiegroep grootte moet goed worden ingeschat. Meer is niet altijd beter.
Rapportage.
o Deel 1 laat de groepen zien, met name de prognostische factoren in index en referentie groep. Laat zien of randomisatie gelukt is.
o Deel 2 laat interventie effecten zien. Verschil in groepsgemiddelden, verschil in groepsproporties. Ook relatieve risico’s (reductie), risico verschil en NNT(1/risicoverschil).
o Flowchart: ook loss to follow up laten zien!
De prognose beïnvloedt de kans om aan een bepaalde interventie toegewezen te worden. Bijvoorbeeld:
- Observationele studie naar effectiviteit van vaccinaties.
- Observationele studie naar effect van antihypertensiva.
Confounding by indication: onderzoek naar het effect van anti-hypertensiva onder 793 Nederlandse hypertensieve vrouwen, die meer dan 10 jaar werden gevolgd. Ruwe en geadjusteerde rate ratios voor fatale cardiovasculaire ziekten werden in behandelde vrouwen vergeleken met onbehandelde vrouwen. Bij observationeel onderzoek zit altijd confounding op indicatie, artsen geven patiënten wel of niet het middel.
Het benodigde aantal patiënten is altijd iets waar je iets over probeert te zeggen.
- Sample size berekening:
o Alchemie van de statistiek.
o Echter: voorafschatting informatiegehalte (precisie) van een onderzoek op basis van omvang is belangrijk.
o Sample size berekening geeft een globale indruk.
o Als de studie kwaliteit onvoldoende is: optimale omvang 0.
o Meer patiënten geven niet noodzakelijkerwijs meer informatie.
Conslusies:
- Voor evaluatie van effecten van therapie is vergelijking noodzakelijk.
- In trials zijn zeer effectieve methoden ontwikkeld om vergelijkbaarheid van natuurlijk beloop, externe effecten en informatie te verhogen à randomiseren, blinderen en placebo.
- De concepten en principes van een trial staan model voor niet-experimenteel onderzoek.
Oefening
Deze oefening is gebaseerd op het volgende onderzoek: Kalliomäki M, Saliminen S, Arvilommi H, Kero P, Koskinen P, Isolauri E. Probiotics in primary prevetion of atopic disease: a randomised placebo-controlled trial. Lancet 2001;357:1076-79.
Het is een goed voorbeeld van een primaire preventie trial waarbij men met een specifieke interventie probeert het risico op ontstaan van ziekte te verminderen. Het onderzoek is gebaseerd op eerdere waarnemingen passend bij de zogenaamde hygiëne hypothese. Kinderen die op heel jonge leeftijd veel infecties doormaakten hadden een kleinere kans op het ontwikkelen van atopische ziekten (atopisch eczeem, allergische rhinitis, astma) dan kinderen die minder infecties doormaakten.
1. Formuleer de vraagstelling (domein, determinant, uitkomst).
Hebben kinderen van moeders uit hoog risico-families (domein) een lager 2-jaars risico op atopische ziekten (uitkomst) als zij voor en na de zwangerschap worden blootgesteld aan een probioticum dan aan placebo (determinant)?
a. Domein: kinderen van zwangere vrouwen met een eerstegraads familielid lijdend aan atopische ziekte.
b. Determinant: toediening van lactobacillus rhamnosus.
c. Uitkomst: Atopische ziekte bij kinderen van moeders uit hoog-risico families.
2. Zie tabel: beargumenteer of het doel van de randomisatie is bereikt?
Iets vaker atopie en roken in placebo gezinnen, iets vaker huisdieren en detecteerbaar IgE in Lactobacillus. Op deze vlakken zijn de groepen niet echt vergelijkbaar. Mogelijk is de randomisatie niet goed gelukt, vanwege een te kleine groepsgrootte.
Verdeling van familiegeschiedenis en geboortekarakteristieken na randomisatie zijn te zien in de tabel in het blokboek op blz. 59.
Op blz. 60 in het blokboek staat het ‘trial profiel’ met aantal gerandomiseerde moeders, aantallen die uitvielen (lost to follow-up) en aantallen die analyseerbaar waren (complete follow-up). 5 van de 14 uitvallers in de placebogroep vielen uit na 6 maanden follow-up en in de Lactobacillus groep waren dat er 4 van de 13. Geen van de uitvallers had een atopie diagnose voor uitval.
3. Wat was de kans van een pasgeborene uit een hoog-risico familie om in de eerste 2 levensjaren een atopische ziekte te krijgen onder Lactobacillus behandeling?
15/64 =23%. De afvallers trek je ervan af.
4. Wat was de kans van een pasgeborene uit een hoog-risico familie om in de eerste 2 levensjaren een atopische ziekte te krijgen onder placebo behandeling?
31/68 = 46%. De afvallers trek je ervan af.
5. Wat is het relatieve risico?
| Atopie+ | Atopie- |
Lactobacillus+ | 15 | 49 |
Lactobacillus- | 31 | 68 |
Relatieve risico: (a/(a+b))/(c/(c+d)) = (15/64)/(31/68)= 0,51.
6. Wat is het 95% betrouwbaarheidsinterval behorend bij dit relatieve risico?
95% BI = 0.31 tot 0.85.
E ln0.51+/-1.96V[49/15x64+37/31x68)
Dit wil zeggen dat het 95% zeker is dat de echte waarden tussen 0,31 en 0,85 ligt. Ofwel: de 95% betrouwbaarheidsinterval geeft een range van waarden die mogelijk zouden kunnen zijn bij de nulhypothese.
| Ziekte | |||
Determinant |
| Ja | Nee | Totaal |
Ja | A1 | B1 | N1 | |
Nee | A0 | B0 | N0 |
Het 95% betrouwbaarheidsinterval van het relatieve risico is bij benadering:
1. Waarom berekent men dit interval?
Vanwege nauwkeurigheid/precisie. Het betrouwbaarheidsinterval (bhi) zegt iets over de precisie van de effectschatting. Een 95% bhi heeft een 95% kans om de werkelijke, onbekende populatie parameter te bevatten (RR, OR, gemiddelde, …).
2. Kan dit resultaat (deels) verklaard worden door verschillen tussen de groepen na randomisatie? Of door de loss to follow-up? Beargumenteer.
Wanneer de randomisatie is mislukt kan de waarden afwijken doordat determinanten in de groepen verschillend waren. Loss to follow up kan de waarden beïnvloeden, omdat je niet weet of de uitgevallen patiënten uiteindelijk atopische ziekte hebben gekregen.
3. Welke conclusie kan op basis van deze resultaten worden getrokken?
Pre- en postnataal gebruik van Lactobacillus bij hoog risico kinderen lijkt het ontstaan van vroege atopie te voorkomen. Er zit geen 1 in het interval, waardoor dit interval als statisch significant wordt gezien.
HC 7 – Statistiek
De statistiek houdt zich onder andere bezig met de methodologie: hoe wordt een studie opgezet? Voor een groot deel kan de statistiek worden opgesplitst in beschrijvende statistiek en toetsende statistiek. Het beschrijvende deel van de statistiek beschrijft de resultaten van een steekproef, Denk hierbij aan het gemiddelde, de modus en de mediaan. Ook de variantie, standaard deviatie, histogrammen, staafdiagrammen, correlatiecoëfficiënt, relatief risico en odds ratio zijn maten binnen de beschrijvende statistiek. Het toetsende deel van de statistiek beschrijft wat een steekproef zegt over de gehele populatie. Hier horen betrouwbaarheidsintervallen bij, maar ook statistische proeven. Immers, de data van een steekproef moeten een weerspiegeling zijn van een hele populatie. Men wilt onderzoeken in hoeverre dit zo is en of het dus generaliseerbaar is.
Een parameter in een steekproef hoort bij een gemiddelde (parameter) in de populatie. Meestal is deze waarde onbekend en wilt men deze schatten m.b.v. de gemiddelde waarde in een steekproef. Griekse letters worden gebruikt als gemiddelde waarde van een populatie en latijnse letters voor gemiddelde waarden in de steekproef. Het onderzoek is optimaal betrouwbaar als de waarden van deze letters gelijk zijn aan elkaar.
μ = gemiddelde in de populatie
σ = standaard deviatie in de populatie
ẋ = gemiddelde in de steekproef
s = standaard deviatie in de steekproef
Een steekproef wordt beschreven met getallen, dit zijn locatiematen:
- Het rekenkundig gemiddelde: alle waarden bij elkaar opgeteld en gedeeld door het totaal aantal waarden.
o Bij symmetrische verdelingen (normale verdeling) heeft een gemiddelde de voorkeur. Hier zijn namelijk makkelijker berekeningen mee uit te voeren.
- De mediaan: de middelste waarneming na een rangschikking. Bij een even aantal is er geen middelste waarde, dan wordt vaak het gemiddelde genomen van de twee middelste waardes.
o Bij uitschieters in de meetresultaten heeft de mediaan de voorkeur; bijvoorbeeld bij een rechts-scheefverdeling of een links-scheefverdeling. Dan ligt de mediaan in het midden van de data, maar de gemiddelde waarde wordt omhoog resp. omlaag getrokken. Dan is de mediaan een betere locatiemaat om te bepalen waar het middelpunt van de data ligt.
- Modus: de waarneming met de hoogste frequentie. Het rekenkundig gemiddelde en de mediaan zijn lokatiematen die het meest gebruikt worden. De modus is heel belangrijk bij de verkiezingen, de partij met de modus mag de premier leveren. Bij categoriale waarden is een modus vaak handig.
Het middelpunt van de data hebben is handig, maar wat ook handig is, is een spreidingsmaat. Een gemiddelde waarde met weinig spreiding is immers anders dan een gemiddelde waarde uit data met veel spreiding. Spreidingsmaten geven aan hoe dicht de waarnemingen bij elkaar liggen. Voorbeelden zijn:
- De standaarddeviatie. De standaarddeviatie is een maat van spreiding op dezelfde schaal als de oorspronkelijke meting. We gebruiken deze als we de gemiddelde waarde gebruiken als locatiemaat.
- De interkwartielafstand (IQR). Deze maat wordt gebruikt wanneer de mediaan als lokatiemaat wordt gebruikt. Kwartielen splitsen de data in 4 gelijke stukken. Het eerste kwartiel (Q1) ligt precies in het midden tussen de laagste waarde en de mediaan. Het derde kwartiel (Q3) ligt precies tussen de mediaan en de hoogste waarde. Om de interkwartielafstand te berekenen worden deze waarden van elkaar afgetrokken (Q3-Q1). Deze waarde zegt dus eigenlijk welke waarden zich in de middelste 50% van de data bevinden.
Het is niet mogelijk voor elke variabele een gemiddelde te berekenen. De gemiddelde bloeddruk kan bijvoorbeeld wel berekend worden, maar de gemiddelde bloedgroep niet. Het meetniveau is heel belangrijk. Er zijn verschillende meetniveaus:
- Nominaal (voorbeeld: geslacht, etniciteit, bloedgroep). Hier is geen gemiddelde van te nemen. De variabele kan worden onderverdeeld in aparte categorieën. Er zit geen ordening in deze categorieën: mannen zijn niet hoger of lager dan vrouwen.
- Ordinaal (voorbeeld: opleidingsniveau, beoordeling). De variabele kan worden onderverdeeld in aparte categorieën. Hier zit wel een ordening in, maar de afstand tussen de categorieën hoeft niet perse gelijk te zijn.
- Interval (voorbeeld: aantallen, temperatuur Co).
- Ratio (voorbeeld: aantallen, lengte, gewicht, temperatuur K).
o Het liefst neemt men interval en ratio samen: numeriek. Dit houdt in dat het interval tussen de categorieën gelijk is. Er kunnen verhoudingen gemaakt worden, dit zijn numerieke variabelen.
Waarden kunnen continu of discreet zijn. Een waarde is continu wanneer het theoretisch mogelijk is om tussen twee waarden een derde waarde te vinden. Een voorbeeld is temperatuur. Wanneer je een temperatuur van 37 C en 38 graden C hebt gevonden is het theoretisch mogelijk om ook een waarde van 17,5 te vinden. Een waarde is discreet wanneer er maar een beperkt aantal mogelijkheden voor de waarde zijn. Een voorbeeld is bloeddruk. Je kunt hier alleen bloedgroep A, B AB en O als waarden vinden:
- Ordinaal, interval en ratio kunnen continu of discreet zijn.
- Nominale variabelen zijn altijd discreet.
Lengte is continu en numeriek. Hierbij kan dan een gemiddelde waarden worden berekend met een standaarddeviatie. Echter er kan ook een mediaan worden gegeven met een interkwartielafstand. De keuze hangt af van de verdeling van de waarden. Bij een symmetrische verdeling, ofwel een normale verdeling, gaat de voorkeur uit naar een gemiddelde met standaarddeviatie. Of een verdeling symmetrisch is of niet, kan goed worden gezien aan histogrammen (staafdiagram) en boxplots.
Een boxspot geeft een streepje in het midden bij de mediaan, een streep onderaan (Q1) en een streep bovenaan (Q3) (alles daartussen betreft 50% van de waarden) en dan zijn er nog twee staarten, een omhoog en een omlaag, die de range van de rest van de waarden aangeven. Als de afstanden tussen Q1 en de mediaan en Q2 en de mediaan ongeveer gelijk zijn en de staarten even lang, is er sprake van een symmetrische verdeling.
Het uiterlijk van een histogram is enigszins te manipuleren door de categorieën aan te passen. Een Boxplot is niet te manipuleren en blijft dus altijd hetzelfde eruit zien.
Geslacht en bloedgroep zijn nominale variabelen, hier kan niet zoveel mee gedaan worden. Vaak wordt een tabel gemaakt met aantal en percentage.
Er kunnen natuurlijk ook meerdere variabelen tegelijk worden beoordeeld. In dit college wordt de relatie tussen twee dichotome variabelen besproken. Dichotoom houdt wel/niet in. Bijvoorbeeld de relatie tussen leeftijd en hypertensie. De waarden moeten dan dichotoom worden gemaakt: leeftijd wordt geclassificeerd als oud wanneer gelijk aan of boven de 50, en jong wanneer onder de 50, hypertensie wanneer bloeddruk groter of gelijk aan 140 en geen hypertensie wanneer bloeddruk lager dan 140. Door te dichotomiseren kan veel nauwkeurigheid en informatie verloren gaan, dit wordt in de praktijk toch gedaan, omdat het vaak makkelijker is.
Met de twee dichotome variabelen kan een 2 bij 2 tabel worden gemaakt. Een relatief risico is een verhouding van kansen: de kans dat men hypertensie heeft gegeven dat men oud is, gedeeld door de kans dat men hypertensie heeft gegeven dat men jong is. Ook kan er een odds ratio (OR) worden uitgerekend op basis van de 2 bij 2 tabel. Dit is ook een verhouding, maar dan op basis van odds. Dus de odds dat men hypertensie heeft gegeven dat men oud is, gedeeld door de odds op hypertensie gegeven dat men jong is. De OR kan erg afwijken van het relatief risico. Bij een kleinere prevalentie benaderd de OR het RR, bij een hogere prevalentie valt de OR eigenlijk altijd hoger uit. Een OR moet gebruikt worden bij analyse manieren, daar komen soms alleen ORs uit.
Kansvariabelen
Een kansvariabele X is een grootheid waarvan de uitkomst van het toeval afhankelijk is. Een voorbeeld: we zijn geïnteresseerd in de lengte van personen. We weten niet (althans voordat de steekproef getrokken is) welke uitkomsten we krijgen; de uitkomsten hangen af van het toeval. Wel kunnen we ons het volgende afvragen:
- Hoe ziet de verdeling van X eruit? Symmetrisch of scheef?
- Wat mag ik, gemiddeld genomen, verwachten?
- Hoe zit het met de spreiding?
Kansvariabelen kunnen allerlei verschillende vormen aannemen. De normale verdeling is afhankelijk van de gemiddelde waarde en een standaarddeviatie. Er zijn vele mogelijkheden aan normale verdelingen:
- Normale verdeling: symmetrisch.
- Gamma verdeling: rechts-scheve verdeling. Veel labwaardes zijn begrenst aan de onderkant (0) maar er zijn wel hogere uitschieters.
- Binomiale verdeling. Stel dat er een steekproef wordt genomen met 10 mensen en de kans op ziekte is 30%. Dan beschrijft het de kans hoeveel van die zieke mensen in de steekproef terecht komen. Af en toe kan het voorkomen dat het helemaal 0 is of alle 10, maar dit zou niet zo vaak voorkomen want het is niet zo waarschijnlijk.
Het steekproefgemiddelde is een kansvariabele die van het toeval afhangt. Stel dat er 100 mensen deelnemen aan een steekproef en we meten de systolische bloeddruk. Het steekproefgemiddelde zegt ons niet alleen iets over deze 100 mensen, maar ook iets over de populatie waaruit de steekproef getrokken is. Nemen we, zeg, 25 maal een steekproef van 100 mensen uit deze populatie, dan krijgen we niet 25 keer hetzelfde steekproefgemiddelde. Wel krijgen we telkens waarden die rond dezelfde waarde schommelen.
Die schommeling kan beschreven worden met een maat van precisie: de standaardfout. Dit is een getal wat uitdrukt hoe precies er gemeten is, hoeveel variatie er is tussen de steekproefgemiddelden. De standaardfout is simpelweg de standaarddeviatie in de populatie gedeeld door de wortel uit de steekproefgrootte. Dit geeft informatie over de nauwkeurigheid van het gemiddelde in de steekproef t.o.v. het populatiegemiddelde.
Het standaardaardfout kan gebruikt worden om betrouwbaarheidsintervallen voor het populatiegemiddelde te construeren. Vroeger werden heel veel medische studies gedaan onder bijvoorbeeld gezonde mannen tussen de 40 en de 49 jaar. Op die manier ontstaat er een wat homogenere populatie en dus minder spreiding tussen de mensen in de populatie. Dit betekent echter wel dat de conclusies alleen gelden voor een selecte groep mensen. De standaardfout kan ons helpen een betrouwbaarheidsinterval uit te rekenen. Ook kan het ons helpen bij toetsen. Voor een toevalsvariabele X geldt:
Als X een normale verdeling volgt met bekende standaardafwijking, dan wordt het 95%-betrouwbaarheidsinterval voor m gegeven door een formule:
Stel: we vonden in onze steekproef van 100 mensen een gemiddelde van 141.2 en we weten dat de standaarddeviatie 10 is. Het betrouwbaarheidsinterval houdt in dat er 95% kans is dat het interval m bevat (dus het ware populatie gemiddelde). Er zijn ook betrouwbaarheidsintervallen voor:
- m uit een normale verdeling met onbekende variantie.
- Variantie.
- Mediaan.
- OR, RR, etc.
De formules kunnen dus anders zijn maar de interpretatie blijft gelijk.
Stel dat we een schatting voor een OR hebben van 4,39. Het 95% bhi was dan 1.8885 ≤ OR ≥ 10.233. De OR ligt dus sowieso boven de 1; het kan dus niet door het toeval komen dat hypertensie meer bij ouderen voorkomt. Toch is dit bhi vrij breed. Dit komt doordat er maar weinig mensen zijn meegenomen in de studie en ook doordat er gedichotomiseerd is. Hierdoor kunnen data verloren gaan en is de meting minder nauwkeurig. Maar op basis van het bhi kunnen we al de conclusie trekken dat er verschillen zijn.
Statistische toetsen
Bij statistische toetsen wordt er gekeken naar de steekproef en wordt de theorie gebruikt om iets te zeggen over de populatie. Bij een 2 bij 2 tabel gebruiken we de Chi-kwadraat toets om tot een conclusie te komen. In ons voorbeeld geldt OR=4,39. Als er geen relatie zou zijn, dan zou moeten gelden OR=1. Waarschijnlijk zal nooit OR=1 gevonden worden, ook al is er geen relatie. Dit omdat de populatie onderling verschilt. De vraag is nu of de gevonden statting sterk afwijkt van OR=1 en of dit een toevallige bevinding is.
Bij een statistische toets gaan we bepaalde stappen volgen. We gaan een beslissing maken op basis van wat we zien in onze steekproef en wat we verwachten op basis van de nulhypothese. Deze wordt eigenlijk opgesteld om hem hopelijk te verwerpen. De nulhypothese zeg namelijk dat er geen verband isDit doen we omdat OR=1, een heel specifiek geval is die gebruikt kan worden om een toetsing uit te rekenen. Er zijn vele alternatieve hypotheses die we niet allemaal kunnen uitrekenen. Daarom wordt er een nulhypothese opgesteld waarbij ervan uit wordt gegaan dat deze klopt, hieraan kan dan gerekend worden. Onder de nulhypothese is de verdeling van de toetsingsgrootheid namelijk bekend en daarmee is ook bekend wat je van de toetsingsgrootheid mag verwachten als de nulhypothese waar is.
Stappen in het toetsen zijn:
- De nulhypothese, alternatieve hypothese en type I fout worden vastgesteld.
o Voorbeeld:
§ Nulhypothese: er is geen relatie, geen afhankelijkheid. Hypertensie is onafhankelijk van de leeftijd, OR=1.
§ Alternatieve hypothese: er is wel een afhankelijkheid (leeftijd hoger dan 50 jaar geeft vaker hypertensie).
§ Type 1 fout, α = 0,05
- De toetsingsgrootheid (T) wordt berekend.
o Voorbeeld:
§ Dit wordt gedaan uitgaande van de bewering dat de nulhypothese waar is. Dan zou verwacht worden dat 55% geen hypertensie heeft (zowel jonge als oude mensen) en dat 45% hypertensie heeft (zowel jonge als oude mensen). Dan zou verwacht worden dat 31 mensen geen hypertensie zouden hebben en 25 wel hypertensie. Deze verwachtte aantallen worden tussen haakjes in de tabel gezet. Om dit pleit te beslechten berekenen we de volgende toetsingsgrootheid: 12.33. Als een nulhypothese helemaal waar is en de steekproef een perfecte weergave van de populatie is, moet de toetsingsgrootheid 0 zijn. Echter, niet elke steekproef is perfect, dus meestal komt er een waarde rond de 1 uit. Om de nulhypothese als waar aan te nemen wil men dus een lagere toetsingsgrootheid.
Formule:
- De verdeling van T wordt vastgesteld en er wordt een overschrijdingskans berekend.
o Als de nulhypothese waar is, volgt de toetsingsgrootheid T een x2 verdeling; deze verdeling wordt vastgelegd door het aantal vrijheidsgraden:
§ Als in een tabel de randtotalen gegeven zijn, dan kun je niet zomaar getallen in de cellen zetten. Je vrijheid wordt in een zekere zin beperkt.
§ In een 2x2 tabel met gegeven randtotalen kun je nog één getal vrij kiezen (mits kleiner dan kolom- en rijtotaal uiteraard). De rest loopt dan vast en kun je niet meer kiezen, dus het aantal vrijheidsgraden voor de 2x2 tabel is 1.
§ Hoe groter de tabel, hoe meer afwijkingen bij elkaar opgeteld worden en hoe minder vreemd het is dat er uit x een grote waarde uitkomt. Bij 1 vrijheidsgraad is de kans dat de toetsingsgrootte >4 is heel onwaarschijnlijk. Als de H0 klopt dan volgt de toetsingsgrootheid de chi-tabel met de bijbehorende vrijheidsgraad. Meestal liggen ze tussen 0 en 2.
o De overschrijdingskans kan ons vertellen wat de kans is dat de toetsingsgrootheid een bepaalde waarde heeft als de nulhypothese waar is. Dit wordt ook wel de p-waarde genoemd. Deze is heel erg klein. Dit wil zeggen dat de kans dat we een waarde hebben van 12,33 wanneer H0 echt waar is bijvoorbeeld 0,0004 is. Als de nulhypothese waar is, dan is de kans dat we zo’n extreem resultaat zouden krijgen heel erg klein.
- Er wordt een conclusie getrokken.
o Bij een betrouwbaarheidsdrempel van 5% verwerpen we de nulhypothese. Trek deze conclusie in normaal Nederlands: we vinden wel/geen bewijs voor een relatie tussen leeftijd en bloeddruk. De kans dat we een extreme waarde vinden bij kloppen van de nulhypothese is heel erg klein, en kleiner dan van tevoren opgesteld. Dus de nulhypothese wordt hier verworpen. Hij is niet per definitie onwaar, het kan immers ook door toeval komen. Het kan zijn dat we aselect een rare steekproef hebben getrokken, alleen die kans is heel erg klein. Er is in dit geval bewijs gevonden voor een relatie tussen leeftijd en bloeddruk (nulhypothese is immers verworpen).
Er kunnen twee soorten fouten gemaakt worden bij een statistische toets:
- Type 1: ten onrechte verwerping van de nulhypothese. Deze wil je van tevoren vaststellen: meestal a=0,005.
- Type 2: ten onrechte handhaving van de nulhypothese. Dit hangt (deels) van de steekproefgrootte af.
Toetsen:
- Ander soort data à andere toets.
o Continue uitkomst:
§ Verschil in gemiddelden: t-toets, ANOVA.
§ Mate van relatie: toets op correlatie, regressie.
o Tellingen (aantal keer naar EHBO): poisson.
o Tijd tot overlijden (of een ander ‘event’): survival.
- Procedure blijft het hetzelfde;
o H0, H1 en a vaststellen.
o Toetsingsgrootheid (T) berekenen.
o Verdeling van T vastleggen, overschrijdingskans berekenen.
o Conclusie trekken.
HC 8 – Statistiek
Er zijn verschillende meetniveaus van variabelen:
- Nominale variabelen = aparte categorieën zonder volgorde.
- Ordinale variabelen = aparte categorieën met vaste volgorde.
- Intervallen/Ratio = numeriek, te meten.
- Ratio.
Er zijn continue en discrete variabelen.
- Continue: tussen twee waarden kan theoretisch een andere waarden worden gevonden
- Discreet: Er bestaan geen tussenliggende waarden, bijvoorbeeld alleen 1 en 2 (niet 1.5)
Deze statistiek les gaat in op de continue variabelen en interval/ratio data.
Er wordt gekeken naar de relatie tussen leeftijd en bloeddruk Als eerste moet worden bepaald naar wat voor relatie er wordt gezocht, lineair, kwadratisch, etc.? Bij het zoeken naar een relatie tussen twee continue variabelen is het handig om een spreidingsdiagram te maken. Op deze manier kan de relatie worden afgeleid.
Bij de relatie tussen leeftijd en bloeddruk lijkt het om een lineair verband te gaan. Bij een lineaire lijn zijn er een aantal mogelijkheden:
- Lineaire regressie. Dit wordt gedaan wanneer men een lineair verband vermoedt. Met deze methode wordt de relatie tussen X en Y geschat d.m.v. een lijn door de puntenwolk. Er geldt: y=a+bx. De ‘beste’ lijn noemt men de regressielijn. In dit voorbeeld geldt: y=103,65 + 0,49x. 0,49 is de richtingscoëfficiënt. Deze houdt hier in hoeveel de bloeddruk per jaar omhoog gaat. De 103,65 geeft een startpunt aan (de bloeddruk bij een leeftijd van 0). Dit getal stelt onze lijn vast in de ruimte en past bij de gegevens. Dit heeft in principe geen interpretatie maar maakt het wel mogelijk voorspellingen te maken. We hebben gegevens tussen de leeftijden van 20 en 80. Daarbuiten kan niks gezegd worden over de relatie tussen leeftijd en bloeddruk. Dus buiten de range van de gegevens mogen eigenlijk geen voorspellingen worden gedaan.
Lineaire regressie wordt vaak gebruikt bij afhankelijkheid: de x- en y-variabele kunnen niet met elkaar gewisseld worden. In dit voorbeeld gaat dit eigenlijk niet op.
- Correlatie. Er kan een situatie zijn waar twee variabelen duidelijk samenhangen, maar het maakt eigenlijk niet uit welke de x is en welke de y is. Dan wordt sneller correlatie gebruikt, dit is een maat van samenhang tussen twee continue variabelen. De correlatiecoëfficiënt is een maat voor lineaire samenhang tussen x en y. Er geldt:
r is dimensieloos. De noemer schaalt terug naar de spreiding in zowel de x- als de y-richting. Daardoor krijgen we iets wat tussen de -1 en de +1 valt. -1 is perfecte correlatie negatief en +1 is perfecte correlatie positief (alle punten liggen precies op één lijn). Hoe dichter de waarde van r bij -1 of 1 ligt, hoe sterker het verband is. De correlatie is een maat voor hoe dicht de punten tot de lijn komen: hoeveel spreiding er rondom de lijn is. Hoe meer spreiding rondom de lijn, hoe zwakker de correlatie. Een correlatie is geen helling en de helling is geen correlatie. Ze hangen wel met elkaar samen, maar het is niet hetzelfde. Helling heeft namelijk een dimensie, een correlatie zegt iets over hoe sterk het verband is. Een nadeel van correlatie is dat het alleen lineaire verbanden ziet. Dat is de reden dat er altijd eerst naar een plaatje gekeken moet worden. Soms is er geen verband tussen x en y, maar op het moment dat er rekening wordt gehouden met een derde variabele (z) dan kan er wel een verband worden gezien tussen x en y. Dit principe wordt ook wel confounding genoemd.
r2 is een maat voor de hoeveelheid variantie verklaard door de regressielijn.
Correlatie en regressie gelden in principe alleen voor de lineaire verbanden en in een ander verband kunnen ze niet meteen worden toegepast.
De T-toets
Dit kan worden toegepast bij een continue (ratio/interval) uitkomstmaat (bv.: bloeddruk, gewicht, BMI), Wanneer de uitkomst (ongeveer) normaal is verdeeld. Er zijn twee t-toetsen: voor 1 of 2 groepen (populaties). In de praktijk wordt de T-toets voor 1 groep niet veel gebruikt, maar het geeft een mooi opstapje voor een t-toets voor twee groepen.
Stel dat men wilt weten of Nederlanders te zwaar zijn. Er wordt dan gekeken of de BMI in de populatie gemiddeld hoger is dan 25. Daarboven is immers sprake van overgewicht. Er wordt een steekproef genomen uit de Nederlandse populatie van 30 mensen en van iedere persoon wordt het BMI bepaald. Er wordt verondersteld dat het BMI redelijk wordt beschreven door een normale verdeling. De resultaten van de steekproef geven aan dat het gemiddelde op 25,8 ligt en dat de standaardafwijking 3.1 betreft. De vraag is of het steekproefgemiddelde te sterk afwijkt van 25. Deze vraag kan worden beantwoord met een statistische toets:
- Stap 1: hypotheses en type I fout vaststellen.
o De hypotheses zijn:
§ H0=m ≤ 25. De nulhypothese stelt dat het gemiddelde BMI onder de 25 ligt (geen overgewicht).
§ H1= m > 25. De alternatieve hypothese stelt dat het gemiddelde BMI boven de 25 ligt (overgewicht).
o a = 0,05.
o Let op: het is een eenzijdige toets. We kijken bij H1 alleen naar waarden boven de 25 (niet hoger en lager dan 25).
- Stap 2: de toetsingsgrootheid berekenen. Om deze vraag te beantwoorden kunnen we onze steekproefresultaten in de volgende toetsingsgrootheid in te vullen:
Dit levert een waarde van 1,41 op.
- Stap 3:
o De verdeling van de toetsingsgrootheid vaststellen. De theorie zegt dat de toetsingsgrootheid T in dit geval een t-verdeling heeft met n-1 vrijheidsgraden. De toetsingsgrootheid hangen af van vrijheidsgraden. Hoe kleiner het aantal vrijheidsgraden, hoe platter het bovenste deel van de grafiek en hoe breder de staart. Hoe kleiner de steekproef, hoe minder vreemd het is dat men verder van de nulhypothese vandaan komt. Hoe groter de steekproef, hoe meer het lijkt op een standaard normale verdeling.
o Wanneer de verdeling van de toetsingsgrootheid hebben bepaald, kan de overschrijdingskans voor T=1,41 worden uitgerekend. . De overschrijdingskans is: 0.084. de overschrijdingskans moet kleiner zijn dan 0.05 om de nulhypothese te verwerpen, dit mag in dit geval dus niet.
- Stap 4: conclusie trekken. Er is geen bewijs gevonden dat het BMI in onze steekproef statistisch significant hoger is dan 25, of: we hebben geen bewijs gevonden dat BMI in onze steekproef statistisch significant hoger is dan 25.
Er kan ook een tweezijdige toets worden gedaan. Stel we toeten de nulhypothese van m=25, tegen H1: m ≠ 25. Dit noemen we tweezijdig testen (hoger en lager dan Ho). Nu zijn grote afwijkingen in beide richtingen een aanwijzing dat H0 niet aannemelijk is. We berekenen dan de volgende overschrijdingskansen in positieve en negatieve richting: twee keer 0,084. De som van beide wordt de (tweezijdige) overschrijdingskans genoemd à p=0.168. Bij tweezijdige toetsing krijg je altijd een grotere overschrijdingskans.
Er kan ook een betrouwbaarheidsinterval gemaakt worden. De aanname is dat het BMI normaal verdeeld is met gemiddeld m en variantie σ2. Het 95% betrouwbaarheidsinterval voor m bij onbekende variantie kan worden berekend aan de hand van de volgende formule:
Sigma is onbekend en wordt geschat m.b.v. de standaarddeviatie uit de steekproef. a hangt af van de t-verdeling, in dit geval geldt a=2.045. Invullen van de formule levert een betrouwbaarheidsinterval van 24,64 ≤ m ≤ 26,96. Dit interval is een range van aannemelijke waarden in het populatiegemiddelde en een range van nulhypothesen die niet verworpen worden. De vraag is nu of de nulhypothese m=25 verworpen moet worden. De waarde ligt binnen het betrouwbaarheidsinterval, met lagere en hogere waarden. De nulhypothese kan daarom niet verworpen worden.
Stel dat we nu de T-toets van twee populaties moeten doen. We willen onderzoeken of de bloeddruk van mannen verschilt van die van vrouwen. Er worden 50 mannen en 60 vrouwen van gelijke leeftijd geselecteerd. De gemiddelden van beide groepen wordt vergeleken door het verschil tussen de populaties (mannen en vrouwen) te beschouwen. Naast het verschil in gemiddelden is ook de spreiding in data van belang. Net als bij de steekproef moet rekening worden gehouden met de variatie tussen de mensen om iets met zekerheid te kunnen zeggen. De spreiding gaat meetellen.
Naast het verschil in gemiddelden zal ook de spreiding een rol moeten spelen in onze beslissing. De t-toets voor twee steekproeven houdt hier rekening mee. Voorwaarden zijn:
- De uitkomsten zijn onafhankelijke trekkingen uit normale verdelingen.
- De varianties van de 2 steekproeven zijn (ongeveer) gelijk.
Als aan beide voorwaarden voldaan wordt mag de T-toets gebruikt worden om het verschil in hypotheses te bekijken. De nulhypothese is dat het verschil tussen mannen en vrouwen 0 is. De alternatieve hypothese luidt dat het verschil niet 0 is. Er wordt a=0,05 gehanteerd. Stel dat er een verschil van -4,1 gevonden wordt en SPSS geeft een 95% bhi van -4,7 tot -3,5. De nulhypothese kan dan op basis van deze gegevens verworpen worden, omdat 0 geen waarschijnlijke waarde is. Mannen hebben gemiddeld een waarde van de bloeddruk die 4,1 mmHg hoger ligt dan die van vrouwen. De 0 ligt niet in het bhi, dus de H0 zal verworpen worden.
Er is sprake van confounding op het moment dat er een derde variabele is die gerelateerd is aan de uitkomsten en de determinanten en die de relatie tussen deze twee beïnvloed. We gaan stratificeren naar de confounder en kijken binnen de straten van die confounder. Het doel is uiteindelijk een conclusie te trekken voor de hele groep op basis van de gestratificeerde gegevens.
Wanneer we kijken naar de relatie tussen leeftijd en hypertensie wordt een OR gevonden van 4,4 (ongestratificeerd: dus iedereen op één hoop). Het geslacht is dus gerelateerd aan een uitkomst en aan een determinant. Wanneer we hier geen rekening mee houden, kan er een vertekend beeld ontstaan. Er worden gestratificeerde tabellen gemaakt (voor mannen en vrouwen). We spreken van een confounder wanneer na stratificatie beide waarden (OR/RR) naar beneden of boven gaan. Bij een confounder kunnen we de Mantel-Heanszel procedure toepassen, zodat we een overal OR/RR voor vrouwen en mannen kunnen berekenen.
(voor stratum i)
Hier komt in ons voorbeeld een OR van 3,99 uit. Er zit een verschil tussen de oude en de nieuwe OR, dit komt omdat de confounding is weggewerkt. Dit zit ergens tussen de OR van de mannen en die van de vrouwen omdat het een gewogen gemiddelde is. Op het moment dat er na stratificatie een andere relatie wordt gezien voor mannen en/of vrouwen, dan heeft het weinig zin om dit weer uit te middelen omdat het waarschijnlijk ging om confounding.
De Mantel-Henszel procedure kan gedaan worden m.b.v. ORs in SPSS, maar niet met het RR in SPSS. SPSS geeft een homogeniteitstoets. Deze geeft een p-waarde voor de vraag of ORs heel erg van elkaar afwijken of niet. Wanneer de p waarde van de homogeniteitstoets kleiner is dan 0,05, heeft het zin om de MH-procedure uit te voeren.
Als er gestratificeerd wordt, en de ORs gaan beide naar beneden of omhoog, gaat het waarschijnlijk om confounding. Maar als ze verschillende kanten op veranderen kan er een probleem optreden. Dit betekent iets anders; namelijk dat het geen confounder betreft, maar een effect modifier. Het risico voor beide groepen is dan verschillend.
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
Medische wetenschappen: geneeskunde bundel 2 - vintage notes en bullets
- Samenvatting bij Architectuur klinisch wetenschappelijk onderwijs (AKWO) - Geneeskunde - UU (2014-2015)
- Samenvatting bij Medical Humanities (MH 1) - Geneeskunde - UU - Week 1 t/m 4 (2012-2013)
- Samenvatting bij Medical Humanities (MH 2) - Geneeskunde - UU - Week 1 t/m 4 (2014-2015)
- Samenvatting bij Medical Humanities (MH 1) - Geneeskunde - UU - Week 1 t/m 4 (2014-2015)
- Samenvatting bij de colleges (GNK & Maatschappij - Sociale Geneeskunde) - UU
- BulletPoint samenvatting bij Medical Humanities (MH 1) - Geneeskunde - UU - Week 1 t/m 4 (2014-2015)
- Bullet point samenvatting AKWO (Architectuur van Klinisch Wetenschappelijk Onderwijs)
- Notes bij Vraagstukken in de praktijk - UL
- Notes bij Academische Wetenschappelijke Vorming - Jaar 2 - Geneeskunde - UL - Aanvulling (2013-2014)
- Study Notes bij Academische Wetenschappelijke Vorming - Jaar 1 - Geneeskunde UL (2016-2017)
- Study Notes bij Academische Wetenschappelijke Vorming - Jaar 2 - Geneeskunde UL - Deel 1 (2013-2014)
- Study Notes bij Lijn Beroepsvorming (LBV) - Jaar 1 - Geneeskunde UL
- Study Notes bij Lijn Beroepsvorming (LBV) - Jaar 3 - Geneeskunde UL (2014-2015)
- Study Notes bij Academische Wetenschappelijke Vorming - Jaar 2 - Geneeskunde UL (2014-2015)
- Collegeaantekeningen academische en wetenschappelijke vorming
- Aanvulling collegeaantekeningen week 3 Wetenschappelijke Vorming
- Medische wetenschappen: algemene geneeskunde bundel
Contributions: posts
Spotlight: topics
Medische wetenschappen: geneeskunde bundel 2 - vintage notes en bullets
Algemeen medisch studiemateriaal omtrent het leren dokteren, opdoen van academische vaardigheden, beroepscompetenties, etc.
Online access to all summaries, study notes en practice exams
- Check out: Register with JoHo WorldSupporter: starting page (EN)
- Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)
How and why use WorldSupporter.org for your summaries and study assistance?
- For free use of many of the summaries and study aids provided or collected by your fellow students.
- For free use of many of the lecture and study group notes, exam questions and practice questions.
- For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
- For compiling your own materials and contributions with relevant study help
- For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, notes and practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
- Use the summaries home pages for your study or field of study
- Use the check and search pages for summaries and study aids by field of study, subject or faculty
- Use and follow your (study) organization
- by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
- this option is only available through partner organizations
- Check or follow authors or other WorldSupporters
- Use the menu above each page to go to the main theme pages for summaries
- Theme pages can be found for international studies as well as Dutch studies
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
- Check out: Why and how to add a WorldSupporter contributions
- JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
- Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Quicklinks to fields of study for summaries and study assistance
Main summaries home pages:
- Business organization and economics - Communication and marketing -International relations and international organizations - IT, logistics and technology - Law and administration - Leisure, sports and tourism - Medicine and healthcare - Pedagogy and educational science - Psychology and behavioral sciences - Society, culture and arts - Statistics and research
- Summaries: the best textbooks summarized per field of study
- Summaries: the best scientific articles summarized per field of study
- Summaries: the best definitions, descriptions and lists of terms per field of study
- Exams: home page for exams, exam tips and study tips
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
- Studies: Bedrijfskunde en economie, communicatie en marketing, geneeskunde en gezondheidszorg, internationale studies en betrekkingen, IT, Logistiek en technologie, maatschappij, cultuur en sociale studies, pedagogiek en onderwijskunde, rechten en bestuurskunde, statistiek, onderzoeksmethoden en SPSS
- Studie instellingen: Maatschappij: ISW in Utrecht - Pedagogiek: Groningen, Leiden , Utrecht - Psychologie: Amsterdam, Leiden, Nijmegen, Twente, Utrecht - Recht: Arresten en jurisprudentie, Groningen, Leiden
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
2476 |
Add new contribution