Samenvatting bij Praktische Onderzoeksvaardigheden - Geneeskunde - oud - UL

Deze samenvatting is gebaseerd op het oude Geneeskunde curriculum van de Universiteit Leiden, studiejaar 2014-2015.

Thema 1: Ethische aspecten van klinisch wetenschappelijk onderzoek
Thema 2: Vragenlijstonderzoek
Thema 3: Kwaliteit van leven
Thema 4: Opzet van studie, bias en confounding
Thema 5: Pragmatisch en economisch onderzoek
Thema 6: Statistiek
Thema 7: Verantwoord onderzoek
Collegeaantekeningen
HC Inleiding (maandag 5 januari 2015)
HC Vraagstelling en opzet van onderzoek (maandag 5 januari 2015)
HC Regulering en medisch ethische toetsing van wetenschappelijk onderzoek met mensen (maandag 5 januari 2015)
HC Studieprotocol (dinsdag 6 januari 2015)
HC Laboratoriumonderzoek (dinsdag 7 januari 2015)
HC Bias en confounding (dinsdag 6 januari 2015)
HC Onderzoek met gegevens uit registraties (dinsdag 6 januari 2015)
HC Zoeken naar literatuur deel 1 en 2 (woensdag 07 januari 2015)
HC Vragenlijst onderzoek (woensdag 7 januari 2015)
HC Kwaliteit van leven; beschrijving en waardering (woensdag 7 januari 2015)
RC Kwaliteit van leven; beschrijving en waarderen (donderdag 8 januari 2015)
HC Meten en reproduceerbaarheid (donderdag 8 januari 2015)
HC Pragmatisch en economisch onderzoek (donderdag 8 januari 2015)
HC Statistiek bij onderzoek deel 1 (donderdag 8 januari 2015)
HC Statistiek bij onderzoek deel 2 (donderdag 8 januari 2015)
HC Statistiek, survival, confounding deel 1
HC Statistiek, survival, confounding deel 2
HC Verantwoord onderzoek doen
HC Schrijven verslag
HC Problemen interpretatie
Responsiecollege

Thema 1: Ethische aspecten van klinisch wetenschappelijk onderzoek

Een wetenschappelijke theorie wordt getest door uitvoering van een experiment waarbij hypothesen worden getoetst. Indien de hypothese steeds wordt bevestigd, is de theorie wetenschappelijk onderbouwd.

Experimenteren met proefpersonen

Een experiment brengt onzekerheid met zich mee of het wel het beoogde resultaat geeft en mogelijk ook risico’s. Veel experimenten hebben weinig voordeel voor de patiënt, en zijn zelfs risicovol. Om deze reden brengt het gebruik van proefpersonen ethische zorgen met zich mee.

Het op grote schaal uitvoeren van medische experimenten vindt zijn oorsprong in de late 19e eeuw, toen het denkbeeld van de pathofysiologie in verschillenden organen en weefsels opkwam. Experimenten werden uitgevoerd zonder rekening te houden met de schade hierdoor veroorzaakte het lijden voor de mensen die meededen. In 1900 werd voor het eerst afgesproken dat bij het uitvoeren van een experiment de directeur van de instelling goedkeuring moest geven voor het onderzoek en dat minderjarigen en wilsonbekwame personen niet mogen participeren in het onderzoek.

Onder andere in de tweede wereldoorlog zijn in nazi-Duitsland veel medische experimenten uitgevoerd, waarbij gevangen vaak het leven lieten of extreem lijden hebben moeten doormaken. Als gevolg van deze gruwelijkheden is de Neurenbergcode opgesteld. Deze code bestaat uit 10 richtlijnen waaraan een medisch experiment moet voldoen. De belangrijkste richtlijn is vrijwillige toestemming voor deelname aan het onderzoek.

In 1964 werd de Helsinki declaration opgesteld. Hierin werden sommige regels van de Neurenbergcode enigszins afgezwakt. In deze code is er ook ruimte voor onderzoek met kinderen, mensen met (ver)minder(de) mentale capaciteit en bewustelozen. De Helsinki declaration heeft meer invloed gehad op de uitoefening van het medische beroep dan de code van Neurenberg. Commissies gebruiken deze declaratie bij beoordeling of een onderzoek wel of niet uitgevoerd mag worden.

In de jaren ’60 en ’70 zijn in de VS en de meeste West-Europese landen ethische commissies opgesteld. Deze commissies bekijken onderzoeksvoorstellen en bepalen of ze ethisch zijn of niet. Verwerping door een ethische commissie heeft gevolgen voor de financiering en publicatie van het onderzoek.

Daarnaast is het belangrijk een grotere ethische awareness te creëren onder de beroepsgroep van onderzoekers. De samenstelling en de eisen die per land aan de commissie gesteld worden zijn verschillend per land.

Ethische aspecten van experimenteren met proefpersonen

Er zijn drie typen ethische aspecten die een rol spelen bij dit onderwerp:

De beoordeling van voordelen, risico’s en schade voor de proefpersoon
Het respecteren van de autonomie van proefpersonen
Verdeling van lasten en het gebruik van voordelen

De mogelijke schade die aan proefpersonen van medisch onderzoek wordt toegebracht wordt gerechtvaardigd door de voordelen die het onderzoek kan opleveren voor een grotere groep mensen. (patiënten). N.B De ethische beoordeling van experimentele procedures betreft meer dan alleen dit punt.

Therapeutische versus niet-therapeutische experimenten

Therapeutische experimenten kunnen zowel mogelijke voordelen als mogelijke schade voor de proefpersoon zelf tot gevolg hebben. Mensen kunnen zelf de overweging maken of de voordelen zwaarder wegen dan de nadelen. Bij niet-therapeutische experimenten zijn de voordelen niet voor de proefpersoon zelf. Denk hierbij aan gerandomiseerd onderzoek met een placebogroep. Onderzoeken worden gekarakteriseerd als therapeutisch/niet-therapeutisch op basis van het bestemde effect op een bepaald subject. Bij een therapeutisch onderzoek heeft de proefpersoon mogelijk baat bij interventie, echter bij een niet-therapeutisch onderzoek gaat het om het werkingsmechanisme of invloed op het lichaam van de proefpersoon waarbij de belangen van de proefpersoon niet op de voorgrond staan. Dezelfde procedure kan bovendien bij de ene persoon een therapeutisch effect hebben en bij de ander een niet-therapeutisch effect.

Mensen die gevraagd worden om te participeren in onderzoek zijn vaak kwetsbaar. Dit komt vaak door de ziekte die ze hebben en omdat ze vaak afhankelijk zijn van hun behandelaar. Exploitatie en vrijwilligheid liggen op deze manier dicht bij elkaar. Bij dit soort onderzoeken is het zeer belangrijk dat mensen vrijwillig instemmen en niet op welke manier dan ook dwang ondervinden. Alle mogelijke nadelen moeten worden besproken, zodat mensen een afgewogen keuze kunnen maken. Dit wordt informed consent genoemd. Informed consent waarborgt:

Autonomie van het individu
Beschermt de (mogelijke) deelnemers.
Voor de onderzoekers is het een methode van zelfcontrole.
Bevordering van rationele besluitvorming
Bescherming tegen fraude.

Bij onderzoeken met placebo’s kunnen de proefpersonen niet zelf kiezen of zij therapeutisch behandeld worden of niet. Consent moet vrijwillig en informed zijn. Bij informed consent moet de proefpersoon op de hoogte gesteld worden van alle informatie over een onderzoek die voor hem nodig is om te kunnen besluiten al dan niet in te stemmen met deelname aan het onderzoek. Het gebruik van gevangenen bij medische experimenten is altijd controversieel. Ze bevinden zich in een omgeving waarbij sommige rechten niet gelden (onder andere de vrijheid weg te gaan) en waar ze zich in een ondergeschikte positie bevinden ten opzichte van de gevangenisbewaarders. Vrijwillig consent wordt dus niet als zodanig beschouwd.

De compensatie voor de risico’s, met bijvoorbeeld geldmiddelen, mag nooit zo hoog zijn, dat dit de enige reden voor deelname is voor de proefpersonen. Geldmiddelen kunnen de vrijwilligheid van deelname dus sterk beïnvloeden. Mensen die een verminderd vermogen hebben om een goede overweging te maken van de voor- en nadelen op basis van de gegeven informatie moeten uitgesloten worden van deelname aan onderzoek. Het gaat dan met name om kinderen, verstandelijk gehandicapten en mensen onder invloed van drugs, barende vrouwen en extreme pijnlijders. Deelname is dan alleen mogelijk als de risico’s verwaarloosbaar klein zijn. Oneerlijke verdeling van risico’s en voordelen kan ontstaan wanneer de risico’s bij een andere groep mensen terecht komen dan de voordelen dat doen. Bijvoorbeeld: experimenten worden uitgevoerd bij mensen in ontwikkelingslanden, terwijl de medicijnen voornamelijk in de rijke landen beschikbaar zullen komen. Mogen de onderzoeksresultaten van onethisch onderzoek worden gebruikt door anderen? Hier is veel discussie over geweest en er zijn zowel voor- als tegenargumenten te verzinnen.

Bescherming bij medisch-wetenschappelijk onderzoek

Niemand mag aan medische of wetenschappelijke experimenten worden onderworpen zonder daarvoor in vrijheid toestemming te hebben gegeven. Ook het recht op lichamelijke integriteit, dat in de Grondwet is opgenomen, houdt verband met experimenten.

WMO: Wet Medisch-wetenschappelijk Onderzoek

Na de tweede wereldoorlog is de code van Neurenberg opgesteld. In 1964 is aan de hand van die code de verklaring van Helsinki opgesteld. In deze verklaring wordt de code van Neurenberg praktisch toepasbaar gemaakt. De aanbevelingen van de declaratie van Helsinki (1964) zijn als richtsnoer genomen bij het opstellen van de wet medisch-wetenschappelijk onderzoek (WMO). Deze wet heeft het doel mensen te beschermen die participeren aan wetenschappelijk onderzoek.

Hierbij wordt bepaald dat voor elk medisch onderzoek met proefpersonen een positief oordeel van een erkende toetsingscommissie (of de Centrale Commissie Mensgebonden Onderzoek, CCMO) behoeft, alvorens het mag worden uitgevoerd.

Toestemming wordt alleen gegeven wanneer:

Van het onderzoek nieuwe medische inzichten verwacht kunnen worden die niet zonder proefpersoon of via een minder ingrijpend onderzoek verkregen kunnen worden.
Het belang van het onderzoek in redelijke verhouding staat tot de bezwaren en risico’s voor de proefpersoon.
Een eventuele vergoeding voor deelname de proefpersoon niet al te zeer beïnvloed heeft.
Duidelijk in het protocol staat aangegeven in hoeverre het onderzoek de proefpersoon ten goede kan komen.
Het onderzoek methodologisch verantwoord is opgezet, onder deskundige leiding wordt uitgevoerd en ook voor het overige aan redelijk te stellen eisen voldoet.

WMO onderscheidt vier soorten onderzoeken:

Observationeel onderzoek – vastleggen van waarnemingen
Non-invasief onderzoek
Invasief onderzoek – lichaam wordt binnengedrongen of weefsel wordt beschadigd
Interventieonderzoek – effect van interventie op proefpersoon wordt getoetst

Bij toestemming geven onderscheidt WMO 3 groepen:

Mensen die in staat zijn zelf toestemming te geven
Mensen die geacht worden nooit toestemming te geven – wilsonbekwame personen
Mensen die tijdelijk geen toestemming kunnen geven - minderjarigen

Volgens de WMO moet een proefpersoon zowel schriftelijk als mondeling ingelicht worden over de aspecten van het onderzoek. Bij minderjarigen of minder bekwame proefpersonen wordt de voorlichting hierop aangepast. Er moet door de onderzoeker altijd gecontroleerd worden of de proefpersoon de informatie begrepen heeft en daarna vult de proefpersoon, wanneer deze besluit mee te doen, een schriftelijke toestemmingsverklaring in. Wanneer in een noodsituatie geen toestemming gegeven kan worden, mag indien deelname ten goede kan komen aan de proefpersoon toestemming gegeven worden de patiënt te laten deelnemen. Experimentele behandelingen als redmiddel worden niet beschouwd als medisch-wetenschappelijk onderzoek want het verbeteren van de gezondheidstoestand van de patiënt is het primaire doel.

De WMO verbiedt onderzoek met wilsonbekwame of minderjarigen tenzij:

Het therapeutisch onderzoek betreft/het de proefpersoon ten goede kan komen.
Niet-therapeutisch groepsgebonden onderzoek kan alleen gedaan worden in deze groep personen. De risico’s dienen verwaarloosbaar te zijn.

Volgens de WMO moet een verzekering afgesloten worden die schade dekt die veroorzaakt is door het onderzoek. Een andere regel betreft dat er een onafhankelijke, niet bij het onderzoek betrokken, arts aangewezen moet zijn bij het onderzoek.

Met de komst van de WMO is CCMO ontworpen. Taken van de CCMO zijn onder andere: erkennen van METC’s en hier toezicht op houden, richtlijnen vaststellen en beroepsinstanties. Bepaalde onderzoeksaanvragen worden alleen door CCMO getoetst:

Gentherapie
Onderzoek met verslavende middelen
Vaccinonderzoek
Onderzoek naar celtherapie
Onderzoek naar xenotransplantatie
Embryo-onderzoek
Niet-therapeutisch onderzoek minderjarigen/wilsonbekwame personen.

Sinds 2006 is in de WMO de EU-richtlijn Good Clinical Practice (GCP) geïmplementeerd. Dit heeft vooral invloed op geneesmiddelenonderzoek. Onderzoek naar geneesmiddelen moet inhoudelijk getoetst worden door een METC en er moet een verklaring van geen bezwaar worden afgegeven door de CCMO. Informatie over de onderzoeksmedicatie moet geleverd worden aan de METC via een investigational medicinal product dossier (IMPD). Hierin staat informatie over de bijwerkingen, samenstelling, kwaliteit etc.

Wetenschappelijk onderzoek van het menselijk materiaal

Er wordt onderscheid gemaakt in twee soorten groepen menselijk materiaal:

Restmateriaal: materiaal afgenomen in het kader van reguliere patiëntenzorg. Dit valt onder de WGBO. Anoniem restmateriaal mag gebruik worden voor onderzoek.
Materiaal speciaal afgenomen voor onderzoek. Dit valt onder de WMO.

De Neurenberg code

In deze code zijn de volgende punten opgenomen:

Vrijwillige toestemming van proefpersonen is absoluut essentieel.
Het experiment moet nuttige resultaten opleveren voor de maatschappij, die niet via andere weg verkregen kunnen worden.
Het experiment moet gebaseerd zijn op de resultaten van dierexperimenten en kennis van de ziekte.
Resultaten die tijdens het onderzoek verzameld worden rechtvaardigen het uitvoeren van het experiment.
Het experiment moet zo ontworpen zijn dat onnodig lichamelijk en geestelijk lijden (of schade) vermeden wordt.
Er mag geen experiment worden uitgevoerd waarbij kans bestaat op overlijden of onomkeerbare handicaps van de proefpersonen.
De mate van risico dat wordt gelopen mag nooit groter zijn dan het klinisch belang van de uitkomsten.
Er moet een goede voorbereiding vooraf gaan aan het experiment om de proefpersonen te beschermen.
Het experiment moet worden uitgevoerd door deskundige onderzoekers.
De proefpersoon moet op elk moment de vrijheid hebben om zich terug te trekken uit het onderzoek.
De onderzoeker moet op elk moment het experiment kunnen stopzetten wanneer blijkt dat voortzetting van het experiment kan leiden tot schade, handicaps of overlijden van de proefpersoon.

Declaration of Helsinki

In deze verklaring wordt de Code van Neurenberg door the WMA uitgewerkt en vertaald in praktische regels om een richtlijn te bieden voor artsen en andere medische wetenschappers met betrekking tot ethische principes bij het uitvoeren van onderzoek met mensen.

Het is de plicht van een arts om het leven, de gezondheid, de privacy en de waardigheid van proefpersonen te waarborgen.
Medisch onderzoek met proefpersonen moet gebaseerd zijn op kennis van het probleem en dierexperimenten.
Elk experiment moet een duidelijk protocol hebben, dat is goedgekeurd door een medisch ethische commissie.
Onderzoekers moeten bekwaam en deskundig zijn.
Voor aanvang van de studie moeten de risico’s en voordelen tegen elkaar afgewogen worden.
Wanneer de risico’s zwaarder wegen dan de voordelen moet het onderzoek stopgezet worden.
Het experiment moet nuttige resultaten opleveren.
Proefpersonen moeten goed voorgelicht zijn en vrijwillig deelnemen (informed consent). Proefpersonen mogen zich niet in een afhankelijke positie van de onderzoeker bevinden.
De integriteit van de proefpersonen moet gewaarborgd worden.
Bij mensen die niet het vermogen hebben de voor- en nadelen goed af te wegen, moet wettelijk toestemming worden gegeven.
Aan het eind van de studie moet elke proefpersoon de kans krijgen alsnog behandeld worden met de best bewezen therapie.

Ethische aspecten van experimenteren met proefpersonen

Er zijn drie typen ethische aspecten die een rol spelen bij dit onderwerp:

De beoordeling van voordelen, risico’s en schade voor de proefpersoon
Het respecteren van de autonomie van proefpersonen
Verdeling van lasten en het gebruik van voordelen

Therapeutische versus niet-therapeutische experimenten

Autonomie van het individu
Beschermt de (mogelijke) deelnemers.
Voor de onderzoekers is het een methode van zelfcontrole.
Bevordering van rationele besluitvorming
Bescherming tegen fraude.

Bescherming bij medisch-wetenschappelijk onderzoek

WMO: Wet Medisch-wetenschappelijk Onderzoek

De medisch ethische toetsingscommissie (METC) of de centrale commissie mensgebonden onderzoek (CCMO) moet toestemming geven voor het uitvoeren van onderzoek met mensen. Zij toetsen onder andere het onderzoeksprotocol. Hierbij wordt bepaald dat voor elk medisch onderzoek met proefpersonen een positief oordeel van een erkende toetsingscommissie (of de Centrale Commissie Mensgebonden Onderzoek, CCMO) behoeft, alvorens het mag worden uitgevoerd. Toestemming wordt alleen gegeven wanneer:

Van het onderzoek nieuwe medische inzichten verwacht kunnen worden die niet zonder proefpersoon of via een minder ingrijpend onderzoek verkregen kunnen worden.
Het belang van het onderzoek in redelijke verhouding staat tot de bezwaren en risico’s voor de proefpersoon.
Een eventuele vergoeding voor deelname de proefpersoon niet al te zeer beïnvloed heeft.
Duidelijk in het protocol staat aangegeven in hoeverre het onderzoek de proefpersoon ten goede kan komen.
Het onderzoek methodologisch verantwoord is opgezet, onder deskundige leiding wordt uitgevoerd en ook voor het overige aan redelijk te stellen eisen voldoet.

WMO onderscheidt vier soorten onderzoeken:

Observationeel onderzoek – vastleggen van waarnemingen
Non-invasief onderzoek
Invasief onderzoek – lichaam wordt binnengedrongen of weefsel wordt beschadigd
Interventieonderzoek – effect van interventie op proefpersoon wordt getoetst

Bij toestemming geven onderscheidt WMO 3 groepen:

Mensen die in staat zijn zelf toestemming te geven
Mensen die geacht worden nooit toestemming te geven – wilsonbekwame personen
Mensen die tijdelijk geen toestemming kunnen geven - minderjarigen

De WMO verbiedt onderzoek met wilsonbekwame of minderjarigen tenzij:

Het therapeutisch onderzoek betreft/het de proefpersoon ten goede kan komen.
Niet-therapeutisch groepsgebonden onderzoek kan alleen gedaan worden in deze groep personen. De risico’s dienen verwaarloosbaar te zijn.

Gentherapie
Onderzoek met verslavende middelen
Vaccinonderzoek
Onderzoek naar celtherapie
Onderzoek naar xenotransplantatie
Embryo-onderzoek
Niet-therapeutisch onderzoek minderjarigen/wilsonbekwame personen.

Wetenschappelijk onderzoek van het menselijk materiaal

Er wordt onderscheid gemaakt in twee soorten groepen menselijk materiaal:

Restmateriaal: materiaal afgenomen in het kader van reguliere patiëntenzorg. Dit valt onder de WGBO. Anoniem restmateriaal mag gebruik worden voor onderzoek.
Materiaal speciaal afgenomen voor onderzoek. Dit valt onder de WMO.

De Neurenberg code

In deze code zijn de volgende punten opgenomen:

Vrijwillige toestemming van proefpersonen is absoluut essentieel.
Het experiment moet nuttige resultaten opleveren voor de maatschappij, die niet via andere weg verkregen kunnen worden.
Het experiment moet gebaseerd zijn op de resultaten van dierexperimenten en kennis van de ziekte.
Resultaten die tijdens het onderzoek verzameld worden rechtvaardigen het uitvoeren van het experiment.
Het experiment moet zo ontworpen zijn dat onnodig lichamelijk en geestelijk lijden (of schade) vermeden wordt.
Er mag geen experiment worden uitgevoerd waarbij kans bestaat op overlijden of onomkeerbare handicaps van de proefpersonen.
De mate van risico dat wordt gelopen mag nooit groter zijn dan het klinisch belang van de uitkomsten.
Er moet een goede voorbereiding vooraf gaan aan het experiment om de proefpersonen te beschermen.
Het experiment moet worden uitgevoerd door deskundige onderzoekers.
De proefpersoon moet op elk moment de vrijheid hebben om zich terug te trekken uit het onderzoek.
De onderzoeker moet op elk moment het experiment kunnen stopzetten wanneer blijkt dat voortzetting van het experiment kan leiden tot schade, handicaps of overlijden van de proefpersoon.

Declaratie of Helsinki

Het is de plicht van een arts om het leven, de gezondheid, de privacy en de waardigheid van proefpersonen te waarborgen.
Medisch onderzoek met proefpersonen moet gebaseerd zijn op kennis van het probleem en dierexperimenten.
Elk experiment moet een duidelijk protocol hebben, dat is goedgekeurd door een medisch ethische commissie.
Onderzoekers moeten bekwaam en deskundig zijn.
Voor aanvang van de studie moeten de risico’s en voordelen tegen elkaar afgewogen worden.
Wanneer de risico’s zwaarder wegen dan de voordelen moet het onderzoek stopgezet worden.
Het experiment moet nuttige resultaten opleveren.
Proefpersonen moeten goed voorgelicht zijn en vrijwillig deelnemen (informed consent). Proefpersonen mogen zich niet in een afhankelijke positie van de onderzoeker bevinden.
De integriteit van de proefpersonen moet gewaarborgd worden.
Bij mensen die niet het vermogen hebben de voor- en nadelen goed af te wegen, moet wettelijk toestemming worden gegeven.
Aan het eind van de studie moet elke proefpersoon de kans krijgen alsnog behandeld worden met de best bewezen therapie.

Thema 2: Vragenlijstonderzoek

Artikel “Selecting, designing, and developing your questionnaire”, Boynton + e-extra’s

Vragenlijsten geven objectieve informatie over de kennis, ideeën, gedrag en houdingen van mensen. Ze kunnen gebruikt worden als het enige onderzoeksinstrument, of onderdeel uitmaken van een uitgebreider onderzoek. Omdat er geen strikte eisen aan vragenlijsten worden gesteld komen fouten regelmatig voor. Hierdoor ontstaan slechte data, misleidende conclusies en verkeerde aanbevelingen. Het ontwerpen van een vragenlijst is moeilijker dan het lijkt.

Welke informatie wil je verzamelen?

Stel van tevoren doelen op en denk na over de praktische kant van het onderzoek. Als je onbekend bent op het terrein van onderzoek, vergaar dan meer informatie voordat je de vragenlijst opstelt. Ga na of de lijst toepasbaar is en of de lijst genoeg of teveel vragen bevat. Zorg dat de vragenlijst geschikt is voor het beantwoorden van de onderzoeksvraag. Gebruik zo mogelijk een al bestaande vragenlijst. Dit bespaart tijd en hiermee kun je de uitkomsten vergelijken met een eerdere studie. Daarnaast is het gemakkelijker om je artikel gepubliceerd te krijgen. Is er geen vragenlijst beschikbaar, dan kun je proberen andere bestaande vragenlijsten te combineren in jouw vragenlijst.

De deelnemers van het onderzoek moeten in staat zijn betekenisvolle antwoorden te geven (voornamelijk fysieke, mentale, sociale en taalvaardigheden zijn hierbij belangrijk). De vragenlijst moet valide en betrouwbaar zijn: het moet daadwerkelijk meten waar het voor is ontworpen. Een lijst ontworpen in een ander land, andere tijd of andere (culturele) context is vaak niet (meer) valide in de groep die jij bestudeerd. Een goede vragenlijst is zo ontworpen dat iedereen de vragen op dezelfde manier interpreteert. Zo niet, dan kun je uitkomsten tussen verschillende studies niet vergelijken.

Er zijn vele manieren waarop je vragen (en antwoorden) kunt presenteren (open, gesloten, verschillende formats). Bij gesloten vragen mag niet gebruik worden gemaakt van de woorden frequent en regelmatig omdat frequent een schaal bevat en regelmatig slechts een patroon. Daarnaast moeten ook de volgende woorden vermeden worden; vaak, meestal, veel, sommige, zelden. Gesloten vragen zorgen ervoor dat de data snel kunnen worden verzameld, maar er zijn minder antwoordmogelijkheden.

Vakjes aankruisen: het voordeel hiervan is dat het makkelijk te begrijpen en snel in te vullen is.
Cijferschalen: maakt onderscheid tussen positieve/negatieve houding en differentieert daarbinnen.
Visueel analoge schaal: zeer precies. Data moeten omgevormd worden voor analyse.
Symbolen: gelijk aan cijferschalen, maar voor kinderen gemakkelijker te interpreteren.
Open vragen: Moeilijk om statistisch te analyseren.
Bij vragen met antwoordcategorieën moeten alle mogelijke antwoorden vermeld worden. Daarnaast mogen de antwoorden niet overlappen.
Open tekstvakken kunnen een nuttige toevoeging zijn wanneer deelnemers hun antwoorden (op gesloten vragen) willen uitleggen.

Bij het gebruik van open vragen moet van tevoren bedacht worden hoe deze gegevens geanalyseerd gaan worden. Deel niet slechts de vragenlijst uit, zorg ook voor een introductie. Hou vragen kort en concreet (

Voor- en nadelen van open en gesloten vragen

Gesloten vragen

Voordelen: gemakkelijk en snel in te vullen; mensen hoeven zelf geen antwoord te verzinnen; respons is vaak duidelijk en compleet; gemakkelijk voor statistische analyse; sociaal minder geaccepteerde antwoorden kunnen als optie gegeven worden.
Nadelen: niet alle deelnemers zullen de manier van beantwoorden begrijpen (bijvoorbeeld een schaalverdeling); mensen kunnen “zomaar” iets invullen; mensen kunnen per ongeluk het verkeerde vakje aankruisen; er is geen mogelijkheid tot eigen inbreng.

Open vragen

Voordelen: mogelijkheid tot vrije expressie en creativiteit; je krijgt antwoorden die je van tevoren nooit zou hebben bedacht; mensen kunnen zoveel invullen als ze willen.
Nadelen: invullen duurt langer, verwerking is tijdrovend; codering en interpretatie is nodig; handschriften zijn soms moeilijk leesbaar (verlies van data).

Artikel “Administering, analyzing, and reporting your questionnaire” Boynton

Als je een vragenlijst hebt moet je deze eerst testen op mensen die representatief zijn voor je onderzoeksgroep. Ga na of alles duidelijk is en wat eventueel verbeterd dient te worden en neem hier ook de tijd voor. Bij dataverzameling is het van groot belang dat de privacy in acht wordt genomen. Anonimiseer gegevens en voeg een code toe die gelinked is aan de patiëntengegevens, welke ergens veilig zijn opgeborgen. Zorg voor een duidelijke strategie voor verspreiding en afname van de vragenlijst. Het is beter om weinig vragenlijsten te hebben die goed ingevuld zijn, dan veel vragenlijsten die foutief/incompleet zijn ingevuld. Bepaal ook welke statistische analyse je uit wilt voeren op je onderzoeksresultaten.

Tips om de respons te verhogen:

Vragenlijst is duidelijk en simpel (ook wat betreft lay-out)
Geef mensen iets terug voor de moeite (verloot bijvoorbeeld een prijs)
Onderzoek is goed getest
Persoonlijke uitnodiging
Uitleg over het doel van het onderzoek
Iemand aanwezig die eventueel extra uitleg kan geven en de enquêtes ophaalt
Bij enquêtes over de post: voeg een gefrankeerde, geadresseerde envelop toe
Geef deelnemers het gevoel dat hun deelname belangrijk is
Stel de tekst zo op dat mensen hun aandacht erbij houden
Indien gepast, de vragenlijst elektronisch afnemen
Hou de vragenlijst beknopt

Een manier om afwijzing en niet-volledig invullen te voorkomen is door strikte exclusiecriteria op te stellen. Mensen die de enquête niet invullen zijn net zo belangrijk als mensen die het wel invullen. Probeer ook van deze mensen achtergrondinformatie te verkrijgen. Het is onjuist om groepen die moeilijk te bereiken zijn systematisch te excluderen. Voer de onderzoeksresultaten in een elektronische database (bijvoorbeeld SPSS). Doe dit al gedurende het onderzoek zodat je niet achteraf een berg werk hebt.

Het schrijven van een artikel

Methode: beschrijf je in- en exclusiecriteria en de invloed daarvan op de uitkomsten. Ook data van patiënten die niet aan het onderzoek wilden deelnemen moeten vermeld worden.

Onderbouw de statistische analyse die uitgevoerd is.

Resultaten: geef antwoord op je onderzoeksvraag. Maak een selectie van onderzoeksresultaten die je wilt vermelden. Wees niet bang niet-significante resultaten te vermelden.

Discussie: verwijs terug naar je resultaten en leg uit wat de resultaten voor betekenis hebben. Erken de eventuele beperkingen van de studie. Vragenlijsten zijn nooit helemaal objectief omdat psychische, emotionele en sociale factoren altijd van invloed zijn. De vragenlijst betekent iets anders voor de onderzoeker dan voor de deelnemer. Daarnaast kan er bias optreden doordat er verschil bestaat tussen de mensen die de enquête wel en niet invullen.

Thema 3: Kwaliteit van leven

Artikel: Assessment of post-stroke quality of life in cost-effectiveness studies: The usefulness of the Barthel Index and the EuroQoL-5D (van Exel et all.)

Een kosten-effectiviteitsanalyse onderzoekt de waarde van geld bij een interventie in de gezondheidszorg door het onderzoeken van verschil tussen totale kosten en het effect van de twee verschillende mogelijke interventies. In deze analyse wordt gezondheidseffect uitgedrukt in quality adjusted life years (QALYs), wat een mate is voor het, gecorrigeerd voor kwaliteit van leven, aantal resterende levensjaren. EQ-5D wordt vaak als instrument gebruikt om QALY te meten, en benadert de gezondheidsgerelateerde kwaliteit van leven (HRQoL). Een van de belangrijkste problemen met HRQoL metingen zoals de EQ-5D in een populatie met patiënten die een infarct hebben gehad, is dat het een zelfreportage betreft. In dit onderzoek wordt onderzocht of de EQ-5D scores berekend kunnen worden uit scores op de Barthel index. De Barthel Index (BI) is een functionele schaal.

Health Related Quality of Life (HRQoL) kan op verschillende manieren gemeten worden en wordt gebruikt in onderzoek naar de beste behandelingsstrategie en in de kliniek ter indicatie van de eigen beoordeling van de toestand van de patiënt en het beleid dat hieruit kan volgen. Het is tevens van belang bij het opstellen van kosten-effectiviteitsanalyses.

De Barthel Index (BI) zou als vervanging/aanvulling gebruikt kunnen worden bij het bepalen van de HRQoL, wanneer er ontbrekende waarden van de EQoL-5D zijn. Deze waarden willen wel eens ontbreken bij bijvoorbeeld de acute fase van een beroerte of een hele ernstige beroerte. De EQ-5D-lijst wordt gebruikt om QALY’s te meten en het ontbreken van waarden kan bijvoorbeeld ontstaan doordat de patiënt niet in staat is de lijst volledig of naar waarheid in te vullen. Hierbij kan dan beter een non-generiek HRQoL-instrument worden gebruikt, zoals de BI. Bij de BI wordt dan gebruik gemaakt van een Proxy.

De EQ-5D beslaat de volgende aspecten: mobiliteit, zelfzorg, dagelijkse activiteiten, pijn en angst/depressie. Per aspect zijn er drie niveaus van beperkingen aan te geven: geen beperking, lichte beperking of extreme beperking. Het betreft een self-report instrument met als resultaat een generieke waarde tussen 0 en 1 (1 staat gelijk aan perfecte gezondheid).

In de Barthel Index wordt het algemeen dagelijks functioneren, de ADL, gemeten met als resultaat een numerieke waarde tussen 0 en 20 (20 is onafhankelijk). Het is een registratie van wat de patiënt doet en niet wat de patiënt zou kunnen doen met als doel de mate van afhankelijkheid vast te stellen. Vaak wordt dit via een informatiebron als familie of verpleging verkregen. Bewusteloze patiënten scoren op alle items een 0.

Er wordt gescoord op de volgende punten: incontinentie darmen, incontinentie blaas, uiterlijke verzorging, toiletgebruik, eten, transfers, mobiliteit, aankleden/uitkleden, traplopen, baden en douchen.

Bij patiënten met een beroerte is er bij de EQ-5D sprake van discriminerende validiteit. Nadeel van de BI is het zogenaamde plafondeffect waardoor de test alleen geschikt is voor gebruik tijdens de eerste 6 maanden na een CVA. Conclusie is dat de BI-score gebruikt kan worden om HRQoL te benaderen indien er missende waarden bestaan in de EQ-5D.

Artikel: agreement between patient and proxy assessments of health-related quality of life after stroke using the EQ-5D and health utilities index. (Pickard et al.)

Wanneer patiënten beperkt zijn om een zelfbeoordeling uit te voeren in verband met health related quality of life (HRQoL) door bijvoorbeeld een beroerte kan informatie verkregen worden via proxies. In dit onderzoek wordt de waarde van de proxy bekeken bij de EQ-5D en de HUI3. Als proxy wordt een familielid, verzorger of vriend genomen. De follow-up bedraagt zes maanden.

Proxy en patiënt kwamen het meest overeen bij observeerbare punten van de HRQoL en minder goed overeen bij subjectieve aspecten van de HRQoL gemeten bij begin/baseline. Proxies lieten een tendens zien dat ze meer problemen rapporteerden dan de patiënt zelf op de EQ-5D bij zes maanden voor pijn, angst/depressie en zelfzorg. De gegevens van de proxy verkregen bij zes maanden na een beroerte zijn betrouwbaarder dan de gegevens verkregen bij twee weken na een beroerte. Een patiënt-proxy evaluatie heeft meer overeenkomsten wanneer ze vanaf één maand na de beroerte worden afgenomen. Sequentiële proxy evaluaties om verandering in score te verkrijgen worden niet aangeraden maar moeten worden afgewogen tegen alternatieve als in kaart brengen van klinische evaluatie.

In sommige gevallen is het lastig een duidelijk beeld te krijgen van de toestand van de patiënt, omdat deze zelf niet in staat is dit te beoordelen of deze beoordeling te uiten. Hiervoor worden dan zogenaamde proxies (naasten) ingezet, die dezelfde soort vragenlijsten krijgen voorgezet om deze in te vullen voor de patiënt. In dit artikel is onderzoek gedaan naar de betrouwbaarheid van deze methode en dit werd toegespitst op de instrumenten EQ-5D en HUI3.

In de EQ-VAS zijn de scores van patiënten en proxies gelijk, maar bij de EQ-index scoren patiënten hoger dan proxies. Dit kan worden verklaard door acceptatie van de situatie of door sociaal wenselijk gedrag te willen vertonen. Daarnaast is de tijd die verstreken is niet gerelateerd aan verschillen tussen patiënten en proxies. Daarnaast zijn proxies beter in staat om functionele beperkingen te kwalificeren, maar de psychosociale beperkingen worden beter beoordeeld door de patiëntengroep.

De EQ-5D en de HUI zijn instrumenten die al langere tijd gebruikt worden en in dit onderzoek werd, net als in eerdere onderzoeken, bewezen dat deze instrumenten dezelfde resultaten geven. De EQ-5D is eenvoudiger voor proxies om in te vullen dan de HUI, maar mist onderdelen die belangrijk zijn op het gebied van beroertes, zoals spraak en cognitie. Bij proxies geven de zogenaamde community preferenced-based summary scores (EQ-5D index, HUI) van HRQoL instrumenten een betrouwbaarder beeld dan de directe preferenced-based summary scores (EQ-VAS).

Thema 4: Opzet van studie, bias en confounding

Hoofdstuk 3: ‘Risico op ziekte’

De epidemiologie bestudeert frequenties van ziekte om inzicht te krijgen in eigenschappen of gebeurtenissen die deze frequenties beïnvloeden. Deze eigenschappen of gebeurtenissen worden determinanten genoemd. De epidemiologie heeft uiteindelijk tot doel het begrijpen van de omgevende werkelijkheid in termen van mechanisme, van oorzaak en gevolg. De causale determinant: een event is een oorzaak van ziekte als we denken dat het beïnvloeden ervan de frequentie van de ziekte zou doen wijzigen. Er zijn ook niet-causale determinanten: bijvoorbeeld leeftijd en geslacht zijn wel determinanten van frequenties, maar geen oorzaak van de ziekte. Determinanten van ziekte worden ook wel risico-indicatoren, of, als het om causale determinanten gaat, risicofactoren genoemd. Een risico is een kans, op meestal een niet gewenste gebeurtenis. In een groep individuen is het geen risico, maar frequentie.

Verhouding van risico’s

Absoluut risico: risico’s geschat uit ziektefrequenties noemt men absolute risico’s.

Relatief risico (RR): het quotiënt van twee absolute risico’s. Bijvoorbeeld de frequentie van longkanker bij rokers (R1) gedeeld door de frequentie van longkanker bij niet rokers (R0)

RR = R1/R0

Risicoverschil (RV): het verschil in ziektefrequentie tussen blootgestelde (rokers) (R1) en niet-blootgestelde (niet-rokers) (R0)

RV = R1 - R0

Attributief risico (AR): geeft aan welke fractie van het risico van blootgestelde te wijten is aan de blootstelling zelf. AR is een rechtstreekse functie van het Relatief Risico. Als men het effect van meerdere determinanten afzonderlijk berekent, kan de som van de verschillende AR groter worden dan 100%.

AR = (R1 - R0)/R1

Populatie Attributief Risico (PAR): is een andere vorm van het AR. Het geeft aan welk aandeel van de ziekte, aanwezig in de totale populatie, te wijten is aan een bepaalde blootstelling. Het is een functie van het RR en de prevalentie van blootstelling. R = het risico in de totale populatie. R0 = het risico bij niet-blootgestelde.

PAR = (R – R0)/R

Numbers Needed to Treat (NNT): geeft aan hoeveel patiënten men moet behandelen

voordat één patiënt baat heeft bij de behandeling. Dit is het omgekeerde van het risicoverschil. Dit is het aantal patiënten dat men zou moeten behandelen om één patiënt te vrijwaren van een ongewenste afloop van de ziekte. Het wordt veel gebruikt bij een kosten-baten analyse, omdat men onmiddellijk ziet hoeveel patiënten er behandeld moeten worden om bepaalde voordelen of nadelen van therapie te bewerkstelligen.

NNT = 1/RV

Menselijke pathologie neemt toe met de leeftijd, wat maakt dat RR en RV een ander verloop met de tijd kennen.

Het relatief risico is een wetenschappelijke associatiemaat. Het geeft aan hoe sterk een determinant en een ziekte met elkaar in verband staan. Het is een goede maat voor het verband tussen determinant en ziekte, maar geeft niet goed aan hoe problemen in de bevolking aangepakt moeten worden.

RR = 1: Wanneer het risico op ziekte niet wordt beïnvloed door de bestudeerde determinant.

RR >1: Als de ziektefrequentie toeneemt in aanwezigheid van de determinant. De determinant is dan causaal.

Het attributief risico is een maat voor de maatschappelijke gezondheidszorg. Het geeft aan hoeveel extra ziekte er door de determinant ontstaat.

Effectmodificatie (= interactie): een samenhang tussen twee determinanten. Het effect van een determinant verschilt in aan- of afwezigheid van een andere determinant.

Synergie: er bestaat een groter effect doordat de twee factoren samen voorkomen en elkaar versterken.

Antagonisme: er bestaat een kleiner effect doordat de twee factoren samen voorkomen en elkaar tegenwerken.

Uitingen over prognose kunnen alleen gegeven worden als het gezamenlijk effect van alle determinanten kan worden bepaald.

Hoofdstuk 6: ‘Opzet van onderzoek’

In de epidemiologie worden determinanten opgespoord die de frequentie van het optreden van een ziekte beïnvloeden. Determinanten zijn fenomenen die aan de ziekte voorafgaan. De determinant is een potentiële oorzaak, waarna gekeken kan worden naar de gevolgen op de ziektefrequentie.

Om te testen wat de invloed van determinanten is op ziekten kunnen onderzoeken opgezet worden waarbij twee groepen onderscheiden worden:

Een groep waarin het fenomeen aanwezig is
Een andere groep waarin het fenomeen niet aanwezig is

Door alle andere omstandigheden gelijk te houden, kan bepaald worden wat de invloed is van het fenomeen op het vóórkomen van de ziekte. Er zijn drie soorten onderzoeken die op deze manier determinanten kunnen testen:

Follow-up (Cohort) onderzoek: vervolgonderzoek.
- Prospectief: observationeel of experimenteel
- Retrospectief: observationeel
Case control (patiënt controle) onderzoek
Cross-sectional (dwarsdoorsnede) onderzoek

Follow up onderzoek

Een type onderzoek dat nauwkeurig het verloop van determinant (oorzaak) naar ziekte (gevolg) volgt. Er worden twee groepen mensen samengesteld. De ene groep is/wordt blootgesteld aan de determinant (indexgroep), de andere groep niet (controlegroep). Door de groepen in de tijd te vervolgen en de frequentie van ziekte te noteren, kan na verloop van tijd nagegaan worden of de frequentie in de blootgestelde groep hoger is. Onder de nulhypothese dat er geen effect is van de determinant op het optreden van de ziekte, is de frequentie van ziekte in de index- en controlegroep gelijk. Uit de frequentie van het optreden van ziekte (= absoluut risico) kunnen relatieve risico’s, risicoverschillen en attributieve risico’s worden berekend.

Er zijn twee soorten follow-up onderzoek:

Prospectief onderzoek: de follow-up periode begint op het moment dat het onderzoek begint. De onderzoeker wordt samen met de patiënten oud.
- Voordeel: je kunt het onderzoek zo specifiek mogelijk maken.
- Nadelen; het onderzoek is tijdrovend en inefficiënt (grote investering aan tijd, geld en mankracht).
Retrospectief onderzoek: de onderzoeker bepaalt twee groepen mensen uit het verleden, en kijkt hoeveel ziekte er op dit moment is ontstaan.
- Voordelen: grote groepen in het verleden kunnen worden geïdentificeerd en tot het heden worden vervolgd over lange tijdsperioden. Het onderzoek is snel en efficiënt.
- Nadeel: het verlies aan detailinformatie en betrouwbaarheid.

Er zijn drie manieren om een index- en een referentiegroep samen te stellen:

Selectie: bij zeldzame blootstellingen zullen de patiënten zorgvuldig geselecteerd moeten worden. Dit kan zowel pro- als retrospectief worden opgezet.
Natuurlijke gegevenheid: hierbij kan gebruik worden gemaakt van een natuurlijk verdeelde risicofactor: bijvoorbeeld roken of hoog cholesterol. Dit kan zowel pro- als retrospectief worden opgezet.
Randomisatie: het op toevalsbasis indelen van mensen in een index- en controlegroep. Vervolgens wordt de ene groep actief blootgesteld. Wordt veelal gebruikt om de effecten van preventieve of curatieve geneeskunde op het ontstaan en/of verloop van de ziekte na te gaan. Per definitie zijn alle verschillen tussen index- en referentiegroep onmiddellijk na de randomisatie ontstaan door toeval. Een gerandomiseerd onderzoek kan alleen prospectief worden opgezet. Het voordeel van randomisatie is dat men verwacht dat gemiddeld alle andere bekende en onbekende determinanten van het optreden en/of verloop van de ziekte gelijk verdeeld zullen zijn over de groepen.

Fouten bij berekening van resultaten bij follow-up onderzoek:

Deelnemers aan het onderzoek zijn aan het begin niet vrij van de te onderzoeken ziekte.
De overleving van patiënten moet bij retrospectief onderzoek worden gerekend vanaf het moment dat de diagnose is gesteld en niet vanaf de eerste symptomen (er zijn ook patiënten met symptomen waarbij de diagnose nooit gesteld zal worden).
Onvolledige follow-up: patiënten maken het onderzoek niet af: of het gaat heel erg goed, ofwel heel erg slecht. Onderzoekers laten vervolgens deze patiënten uit het onderzoek, maar er moet juist gekeken worden naar de reden van afwezigheid bij follow-up.

Case control onderzoek

Dit onderzoek is het omgekeerde van het follow-up onderzoek. Men gaat na of personen die de ziekte hebben gekregen (en personen die de ziekte niet hebben gekregen), in het verleden zijn blootgesteld aan een bepaalde determinant. Het onderzoek gaat achteruit in de tijd (determinant gezocht na bekende uitkomst), terwijl het bij follow-up altijd vooruit gaat in de tijd (uitkomst gezocht na bekende determinant). Voorbeeld: Tijdens een anamnese wordt deze vorm van ‘onderzoek’ gebruikt.

De resultaten van het onderzoek worden gemeten aan de hand van frequentie van determinanten. Men verwacht dat als een potentieel ziekmakende factor niets met de onderzochte ziekte te maken heeft, de frequentie van voorkomen van de determinant in de index- en controlegroep gelijk is. Andersom, als de bestudeerde factor werkelijk ziekmakend is, verwachten we deze meer frequent in de patiëntengroep. Indien de factor beschermend is, nemen we aan dat die minder frequent in de patiëntengroep zal voorkomen.

Uit de resultaten van case control onderzoek kunnen nooit exacte berekeningen van relatieve risico’s, risicoverschillen etc. worden gemaakt. Wel kunnen er hiervoor benaderingen worden gevonden. De Odds-Ratio kan wel direct uit de onderzoeksresultaten worden berekend.

	Cases	Controles
Expositie	A	Z
Geen expositie	B	Y

De Odds-ratio is als volgt te berekenen: (A / B) / (Z / Y) = (A x Y) / (Z x B)

Samenstellen Cases en Controles: je kunt op drie manieren aan de cases voor het onderzoek komen:

Incidente cases: nieuw ontstane ziekten in een populatie. Dit heeft als voordeel dat de ziekte nog geen/weinig invloed gehad heeft op het gedrag van de persoon, waardoor het verleden nog goed bestudeerd kan worden (bijvoorbeeld: herinnering intact)
Prevalente cases: verzameling van een op een bepaald ogenblik bestaande ziektegevallen. Hierbij gaat het om een menging van nieuwe en reeds langer bestaande ziektegevallen. Voordeel is het verzamelen van een groot aantal ziektegevallen in een korte tijd. Nadeel is dat de karakteristieken van de nieuwe gevallen verschillend kunnen zijn in vergelijking met de chronische gevallen.
Cumulatieve cases: ziektegevallen die in de loop der tijd zijn ontstaan in een vooraf gedefinieerd cohort.

Het samenstellen van een controlegroep bij case control is veel lastiger. Keuze van de controlegroep kan door middel van:

Een steekproef uit de populatie aan het begin van de follow-up periode (exposure Odds-ratio rechtstreeks gelijk aan het RR)
Matching (Odds-ratio wordt identiek aan verhouding van twee incidentiecijfers).

Voordeel van patiënten-controlegroep is de eenvoud, gemakkelijke bereikbaarheid en uniforme hoge kwaliteit van informatie. Ook de in- en exclusiecriteria zijn vaak moeilijk te bepalen bij dit type onderzoek. De criteria moeten gelijk zijn voor de cases en controles.

Het dwarsdoorsnede onderzoek

Dit onderzoek kent geen tijdsverloop. Het gaat om prevalente ziektegevallen: ziektegevallen die op een bepaald moment in de tijd aanwezig zijn. Je kunt zelf kiezen of je het onderzoek als follow-up (uitgaande van expositie) onderzoek of case-control onderzoek laat analyseren. De controlegroep is de rest van de onderzochte populatie bij wie de ziekte niet is gevonden. Het grote nadeel aan het onderzoek is dat er nooit selectie heeft kunnen plaatsvinden van de onderzoekspopulatie. Ook zijn de zeer grote onderzoeksinspanningen een nadeel. Screeningsonderzoeken naar vroege stadia en voorstadia van ziekte zijn steeds dwarsdoorsnede-onderzoek. Retrospectief follow-up onderzoek en case-control onderzoek zijn vrijwel identiek.

Hoofdstuk 8: ‘Experimenteel onderzoek’

Experimenteel onderzoek is hetzelfde als prospectief follow-up onderzoek, waarin de indeling tussen index- en referentiegroep op toevalsbasis gebeurt (randomisatie).

Experiment: manipulatie van de werkelijkheid met het doel iets over deze werkelijkheid te leren. Meestal het vergelijken van twee kunstmatige tegengestelde omstandigheden. Experimenteel onderzoek is het belangrijkste onderzoek in de medische wereld, meestal met als doel evaluatie van therapie.

Trial: experimenteel onderzoek. Het onderzoek is prospectief omdat er een manipulatie wordt uitgevoerd om te zien welk effect dit heeft. Vaak is dit een medische interventie, waarbij men het resultaat bekijkt in termen van ziektefrequentie of een karakteristiek die nauw verbonden is met het voorkomen van ziekte.

Controlled: er wordt gebruik gemaakt van een controlegroep om te kunnen bepalen of dat wat waargenomen wordt, verschilt van wat men spontaan zou kunnen verwachten. Controlegroep is bij medische interventie belangrijk om 'regression to the mean' uit te sluiten.

Randomisatie: het op toevalsbasis indelen van mensen in de interventie- en controlegroep (= aselecte toewijzing). Het is een procedure bedoeld om selectie en zelfselectie tegen te gaan. Mensen worden ingedeeld door middel van randomisatie om vergelijkbaarheid tussen de groepen te creëren op blind toeval. De groepen zijn dan gemiddeld hetzelfde. De randomisatie maakt het mogelijk te accepteren dat er onder de nulhypothese een symmetrische, klokvormige verdeling van afwijkingen is ten opzichte van het werkelijke gemiddelde dat tot stand is gekomen (= normale verdeling).

Hoe groter de groep mensen, hoe beter vergelijkbaar ze zijn en ook hoe smaller de normale verdeling (klokvorm) is.

Blinderen

Blindering wordt toegepast om verschillen in evaluatie of behandeling tussen interventie- en controle groep te voorkomen. Single blind: degene die evalueert weet niet welke interventie de patiënten krijgen. De persoon die evalueert kan de patiënt zijn, maar ook iemand anders. Dubbelblind: Zowel de patiënt als de behandelend arts weten niet of de patiënt het medicijn of de placebo krijgt toegediend. De respons op therapie is afhankelijk van:

Natuurlijk verloop (NV)
Subjectiviteit van de patiënt (SP)
Subjectiviteit van de arts (SA)
Farmacologisch effect (FE)
Respons Interventiegroep (Ri) = NVi + SPi + SAi + Fai
Respons Controlegroep (Rc) = NVc + SPc + SAc + FAc
Totale effect = Ri – Rc

Totale effect is gelijk aan het FE wanneer het NV (door creëren vergelijkbaarheid) en subjectiviteit (door blindering) in beide groepen hetzelfde is.

Ethische overwegingen

Experimenteel onderzoek gaat in tegen een fundamenteel punt van de geneeskunde, namelijk patiënten naar het beste inzicht en vermogen behandelen. De patiënt gaat ervan uit dat dit optimaal bij de arts aanwezig is.

Bij gerandomiseerd onderzoek gebeurt het vaak dat een aantal patiënten onmiddellijk na de randomisatie verdwijnen omdat hun toestand achteruit gaat en andere therapie dringend geïndiceerd is of omdat zij overlijden. Deze patiënten moeten wel in de analyse worden meegenomen, omdat er anders (statistisch gezien) onvergelijkbaarheid wordt gecreëerd.

Interim analyse: Interim analyse is het stopzetten van de trial en het tussentijds bekijken van de resultaten. Bij elke studie is een commissie ingesteld die toezicht houdt of de ene groep het niet veel beter doet dan de andere. Zo ja, dan wordt het onderzoek stopgezet. Als vroeg in een trial veel bijwerkingen door de nieuwe therapie optreden zal men geneigd zijn te stoppen, maar als blijkt dat de nieuwe therapie voordelen heeft, zal men enige tijd doorgaan.

Intention to treat: Alle patiënten worden geanalyseerd in de groep waarin zij gerandomiseerd zijn. Dit is om te voorkomen dat door het uitvallen van patiënten uit het onderzoek, ongelijkheid tussen de groepen gecreëerd kan worden. Vroege afhakers of overledenen worden hier dus ook in meegenomen. Dus ook patiënten die van groep gewisseld zijn, worden meegenomen in de groep waar ze oorspronkelijk zijn ingedeeld.

Onderscheidingsvermogen: de kans om statistische significantie te bereiken wanneer de alternatieve hypothese inderdaad juist is.

Patiëntaantallen: Hoe groter de patiëntaantallen in het onderzoek, hoe groter de kans om statistische significantie te bereiken, omdat naarmate n groter wordt de standaardfout kleiner wordt. N=I-trail: één patiënt die afwisselend op en af medicatie wordt gegeven (schema bepaald door randomisatie). De conclusies hieruit gelden echter slechts voor die ene patiënt.

Telefonische randomisatie: de arts die een patiënt wilt aanmelden die in aanmerking zou kunnen komen voor het onderzoek, moet een centraal telefoonnummer bellen, de onderzoeksgegevens en gecodeerde identificatie van de patiënt opgeven, waarna hem wordt meegedeeld wat de therapie zal zijn. Wanneer na randomisatie onvergelijkbaarheid tussen de groepen is ontstaan, komt de vraag hoe en of men hiervoor moet corrigeren.

Clinical trials zijn van beperkte betekenis voor het ontdekken van bijwerkingen, de patiëntenaantallen zijn meestal te klein en de duur van de therapie te kort om weinig frequente bijwerkingen te ontdekken. Voor het bestuderen van bijwerkingen kan niet-experimenteel epidemiologisch onderzoek worden ingezet.

Hoofdstuk 9: ‘Precisie en validiteit in epidemiologisch onderzoek’

Bij een meting moet altijd gekeken worden naar de reproduceerbaarheid (precisie) en de validiteit (juistheid). Gebrek aan precisie = Toevalsfouten. Gebrek aan validiteit = Bias/systematische fouten. Precisie: bij herhaling komt hetzelfde resultaat eruit. Door de onderzoeksgroep te vergroten wordt de precisie (reproduceerbaarheid) van het onderzoek ook groter. Standaardfout: gemiddelde ‘fout’ ten opzichte van het gemiddelde van alle onderzoekingen. Als de aantallen patiënten en controles per onderzoek groot zijn, dan is de toevalsvariatie in het relatief risico klein, terwijl kleine onderzoeken zeer afwijkende waarden kunnen opleveren.

Indexgroep (follow-up)/cases (case-control): blootgestelden en referentiegroep (follow-up)/non-cases (case-control): niet-blootgestelden. Wanneer de indexgroep groot is, is er een even grote controlegroep nodig. Maar wanneer de indexgroep klein is, is er een 3-4x grotere controlegroep nodig. De ideale grootte van de indexgroep volgt uit richtlijnen voor berekeningen van het statistische onderscheidingsvermogen. Het hangt af van de statistische power, maar ook van maatschappelijke noodzaak tot het inwinnen van bepaalde informatie en de ernst van de situatie wanneer geen informatie voorhanden is.

Er zijn twee soorten validiteit te onderscheiden:

Externe validiteit wil zeggen dat de resultaten ook toe te passen zijn op personen die niet bij het onderzoek zijn betrokken. Onderzoek doen in meerdere subgroepen geeft meer externe validiteit dan een landelijk gemiddelde. De externe validiteit ligt bij de lezer van het onderzoek. Hij moet het onderzoek toepassen op patiënten in de praktijk
Interne validiteit wil zeggen dat het resultaat klopt voor de onderzochte personen. De interne validiteit heeft te maken met de opzet en is dus een zaak van de onderzoeker zelf.

Soorten bias:

Selectie-bias. Dit geeft een vertekende uitslag door een verkeerde selectie, het ontstaat wanneer bij één van de te vergelijken groepen door de aard van de patiëntenselectie meer of minder expositie of meer of minder ziekte voorkomt. Het komt vooral voor bij case-controle onderzoek, maar ook bij follow-up onderzoek.
Referral bias/verwijzingsbias.
Diagnostic suspicion bias: betrokken worden bij het onderzoek door een bekende hoge expositie met vermoeden op hoge ziektefrequentie. Dit treedt vooral op bij follow-up studies.
Informatie-bias. Dit gebeurt als de gegevensverzameling tussen indexgroep en controlegroep verschillend is. Voor een case-controle onderzoek geldt dat de bias ontstaat door verschil in informatiewinning over de expositie tussen de cases en controles en bij follow-up onderzoek verschilt de informatie over de ziektefrequentie tussen de verschillende groepen. Voorbeelden van informatie-bias zijn:
- Observer-bias. De waarnemer evalueert de cases anders dan de controlegroep. Mogelijke oplossing: blindering of vragenlijsten laten invullen door patiënt zelf (dus geen waarnemer hebben).
- Recall-bias. Dat kan bijvoorbeeld als de cases zich meer herinneren dan de controles. Oplossing: de gegevens eerder verzamelen zodat beide groepen zich nog evenveel herinneren (niet altijd mogelijk), verzamelen gegevens uit externe bronnen (onder andere ziekenhuisdossiers).
Response-bias. Als sommige groepen beter responderen dan anderen of als de respons gebonden is aan de mate van expositie. De kwaliteit van de gegevens verschilt dan tussen de controles en de cases.
Confounding-bias. Dit is het verwarren van het effect van een determinant met dat van een ander. Dit is niet te wijten aan menselijke onnauwkeurigheden, maar aan het probleem zelf. Om confounding te voorkomen wordt gerandomiseerd. Zo zijn de overige effecten gelijk verdeeld over de groepen en hebben dus daardoor geen effect op het te onderzoeken effect, omdat het verschil tussen de groepen gemeten wordt. Als dit niet mogelijk is zoals bij klinisch en epidemiologisch onderzoek dan gebruikt men restrictie, matching en/of statistische aanpassing.

Restrictie: Wordt door de onderzoeker zelf uitgevoerd (aan het begin van het onderzoek) als de verstorende factor bekend is en goed te meten zoals leeftijd of geslacht. Men kan de onderzoekspopulatie/controlegroep aanpassen zodat deze vergelijkbaar(der) zijn.

Matching: Hierbij maakt men de controlepersoon voor relevant geachte kenmerken gelijk aan de overeenkomstige case. Nadeel is dat niet op alle kenmerken gematcht kan worden. Ook kan de matchingsprocedure niet efficiënt zijn of het kan zijn dat er door de matching een andere statistische analyse nodig is. Dit wordt uitgevoerd aan het begin van het onderzoek.

Statistische aanpassing. Dit gebeurt na het beëindigen van het onderzoek tijdens de

analyse. Via herweging (door middel van berekening van het gewogen gemiddelde) worden de verdelingen in beide groepen gelijk getrokken.

Een confounder is een factor die bekend moet zijn om ervoor te kunnen corrigeren. Sommige variabelen maken een deel uit van de causale keten (een gevolg van de expositie).

Geen enkele onderzoeksopzet is vrij van bias door verstorende variabelen. Case control onderzoek, observationeel onderzoek en dwarsdoorsnede onderzoek zijn allemaal op dezelfde wijze onderhevig aan dezelfde verstorende variabelen.

Multivariaat: meerdere risicofactoren zijn determinanten met onderlinge samenwerking. Hier moet correctie uitgevoerd worden op niet-individuele risicofactoren. Echter, als alle bekende risicofactoren worden samengebracht in één score en worden opgeteld, zullen de effecten elkaar meestal opheffen.

Hoofdstuk 10: ‘Meten in epidemiologisch onderzoek’

De precisie van een bepaalde uitkomst wordt bepaald door het aantal metingen/aantal personen. Meting in epidemiologisch onderzoek is erop gericht de systemische fout zo klein mogelijk te maken en de toevalsfout in ieder geval te kwantificeren en zo mogelijk te verkleinen. De precisie van waarneming aan een patiënt wordt bepaald door intrinsieke en biologische variatie en meetfouten.

Regression to the mean

Regressie naar het gemiddelde is dat waarden kunnen schommelen en dat als er een ‘hogere’ waarde gevonden wordt de kans groot is dat deze de volgende keer weer lager is. Voorbeeld: Je gooit met een dobbelsteen 6. De kans dat je bij je tweede worp lager gooit is 5/6. Je tweede worp zal dan ook dichter bij het gemiddelde liggen. Dus de kans dat iemand die erg ziek is weer beter wordt, is groter dan dat iemand nog slechter wordt. Deze verbetering heeft dan dus niets te maken met de eventuele medicatie die iemand gebruikt, maar is een natuurlijk beloop (een schijnbaar effect).

Het doel van experimentele studies is het werkelijke effect te meten. Werkelijk effect = gemeten effect – schijnbaar effect. Dit schijnbare effect kan gemeten worden met behulp van een placebogroep.

Samengevat is regressie naar het gemiddelde het gevolg van variatie in de karakteristiek die gemeten wordt en het maakt niet uit of deze variatie wordt veroorzaakt door intrinsieke schommelingen of door meetfouten. Het verschijnsel van regressie naar het gemiddelde treedt zeer vaak op in de praktijk.

Non-differentiële of ‘random’ misclassificatie

Dit is wanneer fouten worden gemaakt bij de meting van een determinant of bij de indeling van een persoon. Deze fouten zijn niet systematisch. Bij een follow-up studie kan dit een verschil in incidentie opleveren, bij een case-controle studie kan dit een verandering van het relatief risico opleveren. Ook kunnen fouten rond de verstorende variabele optreden, waardoor onvoldoende correctie voor de betreffende verstorende variabele kan worden uitgevoerd. Deze non-differentiële misclassificatie kan ervoor zorgen dat minder sterke relaties (RR 1-2) niet worden gevonden.

Verzameling van gegevens

Dit kan gedaan worden bij bestaande bronnen (patiëntendossier, speciaal registers van ziekte of overlijden) of nieuw verzameld (vragen aan patiënt), maar vaak is dit een mengvorm. Bestaande bronnen over determinanten zijn zeldzamer, maar er wordt zoveel mogelijk gebruik gemaakt van eerder vastgelegde gegevens over determinanten.

Opnieuw verzamelen: anamnestisch (auto- of heteroanamnese), vragenlijsten, postenquêtes. Hierbij geldt dat de interne validiteit tussen determinant en ziekte moet worden gegarandeerd. Dit wordt gedaan door symmetrie bij de verzameling van gegevens en blindering. Daarnaast moet men voor het waarborgen van de validiteit een zo hoog mogelijke response-rate bereiken. De non-respons hangt vaak samen met de gezondheidstoestand van de proefpersoon, hierdoor ontstaat selectiebias. Voor vergroting van de nauwkeurigheid van de metingen is training van de personen die de metingen moeten verrichten van groot belang. Controle van de kwaliteit van gegevens tijdens het onderzoek is hiervoor nodig.

E-learning bias & confounding

In epidemiologisch onderzoek is men geïnteresseerd in de associatie tussen een blootstelling en een uitkomst. Wanneer er een associatie wordt gevonden moet men zich afvragen of deze associatie echt waar is (causaal) of veroorzaakt door toeval, bias of confounding. Bias: fout van de onderzoeker bij het opzetten en uitvoeren van een epidemiologisch onderzoek. Confounding: geen fout, het is simpelweg aanwezig. Hiermee dient rekening te worden gehouden in de opzet of analyse van het onderzoek. Het ene effect wordt verward met het andere effect. Een confounder is geassocieerd met de uitkomst en de blootstelling, maar het is geen gevolg van de blootstelling (niet in het causale pad).

Thema 5: Pragmatisch en economisch onderzoek

Artikel: Dwalingen in de methodologie. XII. Pragmatische en pathofysiologische trials: een kwestie van vraagstelling. (Algra en van der Graaf)

Het perspectief van de onderzoeker is van essentieel belang bij invulling van de onderzoeksopzet. Pragmatisch onderzoek (doeltreffendheid): heeft als doel vragen uit de dagelijkse praktijk op te lossen. Pragmatisch onderzoek wordt meestal pas verricht wanneer in pathofysiologisch onderzoek aanwijzingen zijn verkregen dat een behandeling werkzaam is. Pathofysiologisch onderzoek (werkzaamheid): richt zich op de werkingsmechanismen van de behandeling.

Belangrijkste verschillen tussen deze trials:

Vraagstelling:

Pathofysiologische trial: Toepasbaarheid in de praktijk. Er wordt bijvoorbeeld onderzocht hoe een nieuwe behandeling werkt.
Pragmatische trial: Hoe moet iemand met deze aandoening behandeld worden?

Patiënten:

Pathofysiologische trial: sterke selectie. Er is een homogene groep patiënten nodig, waartussen de verschillen zo klein mogelijk zijn; een soort van laboratoriumsituatie.
Pragmatische trial: weinig selectie

Behandeling en blindering: zijn nauw met elkaar verbonden in een trial.

Pathofysiologische trial: de behandeling is zuiver gericht op de pathofysiologie. De verschillen tussen de twee groepen moeten zo klein mogelijk zijn, want anders kan het verschil tussen de twee groepen niet met zekerheid aan het geneesmiddel worden toegeschreven. Het onderzoek wordt dubbelblind uitgevoerd.
Pragmatische trial: men bestudeert de werking van de gehele behandelstrategie en niet alleen het pathofysiologische mechanisme. Laat enige vrijheid van handelen toe binnen elk van de armen van de trial (mits men zich houdt aan tevoren afgesproken intenties), zoals dit ook in de praktijk gebeurd. De studie is vaak open, dus er is geen sprake van blindering.]

Uitkomsten: blinde beoordeling (zonder kennis van de behandeling) van de resultaten is van belang bij beide vormen van onderzoek.

Pathofysiologische trial: gericht op pathofysiologisch inzicht. Er wordt vaak gebruik gemaakt van surrogaateindpunten (= proxy-eindpunten = intermediaire uitkomsten). Dit zijn maten waarbij men ervan uit mag gaan dat ze een duidelijke samenhang kennen met het optreden van de echte klinische eindpunten.
Pragmatische trial: laat zich ook hier leiden door de dagelijkse praktijk, gericht op perspectief van de patiënten.

Analyse:

Pathofysiologische trial: naast intention-to-treat ook een on-treatment analysis om ‘verontreinigingen’ buiten te sluiten: patiënten die achteraf niet aan de inclusiecriteria blijken te voldoen, of patiënten die de geplande behandeling niet ondergingen, worden uit de analyse gelaten.
Pragmatische trial: intention-to-treat analysis, dat houdt in dat een patiënt die is ingedeeld in een bepaalde behandelgroep bij die groep wordt meegeteld, ongeacht of de behandeling is gerealiseerd. Dit bijvoorbeeld bij het hebben van een andere aandoening dan gedacht, stoppen van medicatie, kiezen voor een andere behandeling etc. Dit, omdat het in de dagelijkse praktijk ook voorkomt en men deze juist wil evalueren.

Artikel: Dwalingen in de methodologie. XXV. Uitkomstmaten, surrogaateindpunten en intermediaire maten. (M. Boers).

Handelen in de geneeskunde is gericht op het verminderen van ziektelast van de patiënt, nu of in de toekomst. De uitkomst van ziekte, en dus ook het resultaat van klinisch onderzoek, is het best uit te drukken in ziektelast of verandering daarin. Veel onderzoek is gespitst op evaluatie en prognose van ziekte.

Prognostisch onderzoek: doel is het voorspellen van toekomstige ziektelast door het onderscheiden van ziektecategorieën (classificatie) of het onderscheiden van determinanten.
Evaluatief onderzoek: richt zich op het meten van verandering in ziektelast in de tijd, al dan niet als gevolg van een interventie.
(Evaluatief) Interventie onderzoek: er wordt onderzocht of een interventie een verandering in de ziektelast of gezondheidstoestand kan veroorzaken, of dit kan voorkomen.

Ziektelast wordt verdeeld in vijf domeinen:

Discomfort – Ongemak
Disability – Beperking/handicap
Dollar cost – Kosten
Drug-toxicity – Bijwerkingen
Death - Sterfte

Uitkomstmaten: maat die ziektelast meet, meten van het eindpunt. De keuze van de uitkomstmaat bepalen is in belangrijke mate de complexiteit van het onderzoek en de relevantie van de resultaten. Deze keuze moet een zorgvuldige afweging zijn. Generieke maten: meet alle domeinen van een begrip (bijvoorbeeld ziektelast), bijvoorbeeld SF-36. Utiliteit: de gehele gezondheidstoestand wordt samengevat in een waardering. Het getal bevindt zich tussen 0 (dood) en 1 (perfect gezond). Specifieke maten: meet slechts één domein (of een deel hiervan) van een begrip. Surrogaateindpunten of intermediaire maten: meten niet de echte uitkomst maar dat wat aan die uitkomst voorafgaat. Intermediaire maten zijn relatief gemakkelijk te meten omdat ze vaak of snel te bestuderen zijn. De waarde van deze maat hangt af van het verband dat deze met de uitkomst heeft. Men spreekt van een surrogaateindpunt als het een sterk verband betreft. Het is van belang om bij het gebruik van surrogaateindpunten het einddoel niet uit het oog te verliezen.

Geschiktheid van maten: hangt af van de volgende kenmerken:

Waarheid: meet het instrument wat het moet meten, zonder vertekening, en zijn de resultaten relevant? Hierbij zijn van belang; begripsvaliditeit en inhoudsvaliditeit.
Onderscheidend vermogen: kan de maat onderscheid maken tussen situaties die klinisch van belang zijn?

Het gaat hier om een adequate signaal-ruisverhouding, waarbij reproduceerbaarheid van belang is, maar ook het vermogen om het signaal op te pikken dat voor de situatie van belang is.

Toepasbaarheid: is de maat geschikt om te gebruiken bij deze onderzoeksopzet, gegeven de beperkingen in tijd, geld en interpreteerbaarheid? Toepasbaarheid is bepalend voor de haalbaarheid.

De keuze van de uitkomstmaat bepaalt in belangrijke mate de complexiteit van onderzoek en de relevantie van de resultaten.

Thema 6: Statistiek

Topic 11: Betrouwbaarheidsintervallen

Na het nemen van een steekproef uit een populatie wordt de standaardfout bepaald om de precisie van de schatting te bepalen. Echter het beste is om een betrouwbaarheidsinterval te bepalen aan de hand van verdeling van de steekproef.

Betrouwbaarheidsintervallen (CI) voor het gemiddelde

Normale verdeling: Wanneer er sprake is van een grote populatie, kan je er vanuit gaan dat de spreiding van waarden normaal/gemiddeld is. De CI betekent hier dat 95% van de waarde die gevonden zijn binnen dit interval liggen. Betrouwbaarheidsinterval is dus het interval waarbinnen het populatiegemiddelde ligt. CI is afhankelijk van de standaarddeviatie van de gemiddelde populatie. Dit wordt 'standard error of the mean' (deviatie van het gemiddelde in de populatie) oftewel SEM genoemd. SEM kan je berekenen uit de SD:

SEM = SD / √n. Waarbij SD de standaard deviatie is en n de populatiegrootte

CI = Xgem – 1,96 x SEM tot Xgem + 1,96 x SEM

T-verdeling: Wanneer de variatie in de populatie onbekend is of wanneer de verzamelde data niet normaal verdeeld is, kunnen we de normale verdeling niet gebruiken. De formule is dan:

Xgem – t0,05 x SEM tot Xgem + t0,05 x SEM.

T0,05 bereken je als volgt: N - 1 = geeft het aantal vrijheidsgraden. Waarbij n = populatiegrootte. In appendix 2 achter in het boek staat een tabel. Hierbij zoek je onder het kopje T0,05 naar het aantal vrijheidgraden. Hierbij hoort een waarde. Dit vul je in de formule in bij T0,05.

Betrouwbaarheidintervallen (CI) bij proporties:

Van de volgende methode om CI te berekenen wordt gebruikt bij binominale verdeling.

Geschatte gemiddelde (p) = r/n. Hierbij is r het aantal individuen met het te onderzoeken 'karakter'. n is de populatiegrootte

Standaard deviatie = √(p(1-p)/n)

CI = p- [1,96 x √(p(1-p)/n)] tot p+ [1,96 x √(p(1-p)/n)]

De breedte van het betrouwbaarheidsinterval hangt af van de grootte van de standaardfout, wat afhankelijk is van de steekproefgrootte. Betrouwbaarheidsinterval geeft verder een inschatting van waarde van de resultaten voor de kliniek.

Topic 17: Hypothesen testen

Het testen van hypothesen gebeurt in vijf stappen:

Stel een nulhypothese (H0) en een alternatieve hypothese (H1) op
Verzamel informatie uit een steekproef
Bereken de waarde van de test statistieken voor H0
Vergelijk de waarde van de test statistieken met waarden van H0
Interpreteer de P-waarden en resultaten

H0 = De nulhypothese veronderstelt altijd dat er geen effect optreedt (het verschil in gemiddelden is 0)

H1 = De alternatieve hypothese beweert dat de nulhypothese onjuist is en komt dichter bij de theorie die men wilt onderzoeken.

Wanneer er geen richting aan het effect wordt gegeven is de test two-tailed. Je test laat dan zowel zien of er een positief of een negatief effect optreedt. Wanneer je naar één richting test heet het een one-tailed test (zeldzaam – als richting van effect gespecificeerd is in H1).

Na het verzamelen van informatie wordt de P-waarde berekend: deze wordt berekend alsof de H0 waar is. Er zijn twee mogelijke uitkomsten:

Significante resultaten wanneer P
Geen significante resultaten wanneer P> 0,05. Dit betekent dat de nulhypothese noch de alternatieve hypothese waar zijn. Beide is nog mogelijk. De nulhypothese wordt daarom niet verworpen.

Deze methode van nulhypothese is een parametrische test. Wanneer de gevonden data het niet toelaten om deze test te gebruiken, kan je gebruik maken van niet-parametrische testen. Dit is meestal het geval bij kleine populatieaantallen of bij categorische uitkomsten.

Soms wil je aantonen dat een bepaalde behandeling evengoed is als de bestaande behandeling. Hierbij is

H0: er is verschil tussen beide behandelingen
H1: er is geen verschil tussen beide behandelingen

Zo kan je aantonen dat wanneer er significantie is er geen verschil bestaat tussen beide behandelingen. De keuze welk statistische test gebruikt wordt, hangt af van het ‘design’ van de studie, het type variabelen en verdeling van verzamelde data.

Topic 18: Errors in hypothesis testing

Je moet een keuze maken tussen het verwerpen of het niet-verwerpen van de H0-hypothese. Men verwerpt H0 niet, tenzij er sterke aanwijzingen zijn. Soms wordt de verkeerde beslissing genomen omdat niet alle informatie aanwezig is.

Type 1 error α: H0 onterecht verwerpen – verwerpen terwijl het waar is. De kans hierop is α. Meestal is dit 0,05. De kans dat je H0 ten onrechte verwerpt is dus 0,05.
Type 2 error β : H0 onterecht niet verwerpen – niet verwerpen terwijl het fout is. Dit is afhankelijk van de power (1-β) van de test.

De power van een voorgestelde test is van belang, omdat pas als er een goede kans bestaat op het ontdekken van een klinisch relevant verschil, de studie doorgezet moet worden. Om een goede test met voldoende power te kunnen waarborgen moet de test minimaal een power van 80% hebben: de volgende factoren hebben invloed op de power:

Sample size: power vergroot door vergrote sample size
Variabiliteit observaties: power neemt toe als de variabiliteit afneemt.
Effect dat je zou weten meten: de power moet groter zijn bij grotere effecten. De test heeft dan een grotere kans op het ontdekken van groter effect dan een klein effect
Significantie: de power is groter wanneer de significantie groter is. Er is meer power nodig om een significantie van 0,01 te vinden dan nodig is voor een significantie van 0,05.

Topic 36: Sample size calculations

Om de ideale steekproefgrootte te berekenen, moet je een idee hebben over de te verwachten resultaten. Een te kleine studie geeft inadequate power, een te grote studie is tijdverspillend/duur/onethisch. De ideale steekproefgrootte houdt een balans in het maken van Type I en II fout. Specificeer aan het begin van het onderzoek:

Power: minimaal 80% nodig
Significantieniveau: meestal 0,05
Variabiliteit van de observaties/SD in het geval van numerieke variabelen
Kleinste klinisch relevante effect

Deze informatie is meestal te halen uit eerdere studie die gedaan zijn of door middel van een pilot studie.

Voor de ongepaarde t-test en de chi-kwadraat test wordt Lehr's formula gebruikt om de sample size met een power van 80% en tweezijdig significantie niveau van 0.05 te berekenen.

De algemene formule voor sample size met power van 80% = 16/(standardized difference)2

De algemene formule voor sample size met power van 90% = 21/(standardized difference)2

De standardized difference moet je berekenen aan de hand van welke test je gaat gebruiken.

Ongepaarde T-toets: gebruik je bij ongepaarde numerieke data. SD = δ / σ. Hierbij is δ het verschil dat je zeker wil meten en σ de standaarddeviatie.

Gepaarde T-toets: gebruik je bij gepaarde numerieke data. SD = 2δ / σd. Hierbij is δ het verschil dat je zeker wil meten en σ de standaarddeviatie van de verschillende resultaten (meestal uit een pilotstudie gehaald).

Chi-kwadraat test: wordt gebruikt bij ongepaarde categorische data. SD = P1 – P2 / √Pgem(1-Pgem). Hierbij is P1 – P2 het te detecteren klinisch relevant verschil. Pgem is het gemiddelde van P1 en P2.

Vaak wil je hierna nog je sample size aanpakken zodat je wat zekerheid inbouwt om toch het verschil te kunnen meten. Het kan namelijk zijn dat je personen verliest bij follow-up of dat je groepen niet even groot zijn en er dus een te kleine groep bij zit.

Topic 37: Presenting results

Bij het presenteren van resultaten van een studie op papier moet de presentatie genoeg informatie bevatten zodat de lezer kan begrijpen wat er gedaan/uitgevoerd is. De kunst is het samenvatten van belangrijke gegevens van de analyse in grafieken en tabellen (houd het simpel, geef niet te veel informatie dat maakt het alleen maar verwarrender meestal).

Resultaten hypothesetest: hypotheses, testen, vermelden of er sprake is van one- of two tailed. Ook de exacte P-waarde en niet alleen > 0,05, samen met de betrouwbaarheidsintervallen.

Resultaten regressie-analyse: duidelijk vermelden wat de afhankelijke variabele en wat de onafhankelijke variabele betrof. Geef schattingen van alle coëfficiënten in het model. En laat alle resultaten van de testen zien (P-waarde, betrouwbaarheidintervallen).

Vergeet niet om het ‘design’ van de studie te omschrijven, noch de waarde van onderliggende assumpties, relevante omschrijvende statistieken, teststatistieken en p-waarden.

Topic 39: Assessing agreement

Meten van variabiliteit en fouten

Een biologische variabele die wordt gemeten op ieder aantal individuen zal altijd een bepaalde variabiliteit geven. Als metingen verschillen tussen individuen heet dit een inter-individuele variatie. Als de variatie binnen dezelfde persoon zit heet het een intra-individuele variatie. Veel van deze variatie ontstaat vanwege verschillen in geassocieerde factoren als genetica, omgeving, leefstijl factoren.

Meetvariabiliteit is het type variabiliteit die bijvoorbeeld ontstaat bij het meten van bloeddruk die verschilt per persoon door verschil in geslacht, leeftijd, gewicht, tijdstip van de dag etc.

Een meetfout ontstaat als er een verschil is tussen het geobserveerde (gemeten) waardes en de werkelijke waardes van een variabele. Er bestaat 2 soorten meetfouten:

Systematisch: alle metingen worden op dezelfde manier beïnvloed (over of onderschat)
Ra ndom: een fout die per toeval ontstaat en meestal wordt uitgebalanceerd door andere random fouten.

Betrouwbaarheid:

Reproduceerbaarheid: produceren de twee technieken dezelfde resultaten
Herhaalbaarheid: kan een observer dezelfde resultaten verkrijgen wanneer deze dezelfde studie uitvoert in dezelfde omstandigheden.

De methode van analyse hangt af of de variabele categoriaal of numeriek is. Categorische variabelen: Indien er twee onafhankelijke observaties van data bestaan van één onderzoek, wilt men weten in hoeverre ze van elkaar verschillend. De resultaten worden gepresenteerd in een 2-way tabel van frequenties. Hierbij worden de waarden van twee observers vergeleken. De overeenkomstige frequenties die verwacht worden, worden berekend door:

Cohen’s Kappa

P0-Pe en κ = 1-Pe (P0 = som van de geobserveerde frequenties langs de diagonaal/totaal geobserveerde frequentie. Pe = som van de verwachte frequenties langs de diagonaal/totaal geobserveerde frequentie)

Hierbij is van belang: bij K=1 is er een perfecte overeenstemming tussen de twee observeerders, bij K=0 is de overeenstemming niet beter dan verwacht door toeval.

Armzalig bij κ≤ 0,20
Gering bij 0,21 ≤κ≤ 0,40
Echt bij 0,41 ≤κ≤ 0,60
Substantieel bij 0,61 ≤κ≤ 0,80
Goed bij κ> 0,80

De kappa is afhankelijk van de hoeveelheid categorieën en de prevalentie van de conditie. Er kan dus niet makkelijk vergeleken worden tussen de kappa van de ene studie en de kappa van de andere studie.

Numerieke variabelen

Als het gemiddelde verschil tussen gedupliceerde metingen 0 is, dan is er geen systematisch verschil tussen de resultaten. Er is dus geen sprake van bias. De geschatte SD van de verschillen (Sd) geeft een meting van overeenstemming voor het individu. British Standards Institution Repeatability Coëfficiënt = 2 x Sd.

Index van betrouwbaarheid wordt gebruikt om reproduceerbaarheid en herhaalbaarheid te meten = ICC: Intraclass Correlatie Coëfficiënt. Hierbij lopen de waarden van 0 (geen overeenstemming) tot 1 (perfecte overeenstemming). We kunnen geen ICC van verschillende studies met elkaar vergelijken, omdat ICC afhankelijk is van de eigenschappen van de data.

Topic 44: Survival analyse

Survival data worden gekarakteriseerd door de duur voor een patiënt om het eindpunt te bereiken. Data kunnen verder ook gecensord zijn. Soms kunnen de standaardmethoden van analyse misleidende resultaten geven door gecensureerde data. Dit is data die zijn weggelaten in het onderzoek, maar wel meegenomen zouden moeten worden. Bijvoorbeeld: wanneer een patiënt uit een studie is gestapt, weet je niet of die patiënt het eindpunt bereikt heeft of niet. Dit is een vorm van 'right-censored'. 'left-censored' is dat follow-up nog niet begonnen is tot na de baselinedate.

Presenteren van survival data:

Voor elke patiënt een horizontale lijn tekenen van begin van de studie tot het einde van de follow up. Aan het einde maak je duidelijk of de patiënt het eindpunt bereikt heeft of niet (censored). Dit geeft alleen geen samenvatting van de gevonden data.

Survivalcurves: meestal de Kaplan Meier curve. Dit laat de cumulatieve waarschijnlijkheid zien van een individu die het eindpunt niet bereikt = survival probability. De lijn wordt getekend als een lijn die begint bij 100 en steeds een stap naar beneden daalt wanneer iemand het eindpunt bereikt heeft. Vaak wordt overleving samengevat op een bepaald moment van de curve.

Er kan ook een gemiddelde tijd berekend worden. Dit is de tijd waarop 50% van de individuen het eindpunt hebben bereikt. Vergelijken van survivaldata: er kan berekend worden of er significante verschillen zijn tussen verschillende groepen door:

Log-rank test: non-parametrische test met een nulhypothese dat er geen verschil in overleving is tussen de groepen. Deze test vergelijkt data op alle tijdstippen van de survivalcurve. Hiermee kan echter niet meer dan één factor tegelijkertijd vergeleken worden.
Regressiemodellen: hiermee kan de relatie tussen één of meerdere factoren vergeleken worden ten opzichte van de survival, op elk moment van de curve.

Thema 7: Verantwoord onderzoek

Wetenschappelijke integriteit in het LUMC: Voordat een onderzoek mag worden uitgevoerd moet de kwaliteit beoordeeld worden en moet het onderzoek medisch-ethisch getoetst worden aan wet- en regelgeving. Octrooien en toepassingen leiden tot verbeterde gezondheidszorg en/of impulsen voor de economie.

Landelijk Overleg Wetenschappelijke Intregiteit (LOWI): gedragscode. Beschrijving van ongewenst gedrag van wetenschappers. Hiernaast bestaat ook de Nederlandse Gedragscode. Wetenschapsbeoefening, hierbij ligt de nadruk op gewenst gedrag en morele kwalificaties.

LUMC gaat uit van:

Respect voor patiënten, gezonde proefpersonen en proefdieren, collega’s, ondergeschikten en leidinggevenden.
Zorgvuldigheid: hiermee valt of staat de wetenschappelijke waarde van onderzoeksresultaten.
Onbevooroordeelde houding: de integere wetenschapper doet op een evenwichtige wijze recht aan alle belangen en belanghebbende partijen. Belangen van patiënten en proefpersonen wegen altijd zwaarder dan de andere belangen.
Verantwoordelijkheid: Dit in voorbereiding, uitvoering en rapportage van het onderzoek. Dit vereist een hoog kennis- en vaardigheidsniveau maar ook kennis van de grenzen van eigen deskundigheid.

Er kan belangenverstrengeling ontstaan wanneer er persoonlijk financieel belang van de onderzoeker in patenten is of door bezit van aandelen in een firma. Deze persoonlijke belangen moeten opgeheven worden wanneer deze verbonden zijn met de studie. Het WMO geeft een richtlijn voor de aan de proefpersonen te betalen vergoeding, daarnaast moet volgens deze wet een proefpersonenverzekering worden afgesloten.

Contracten met externe financiers: er moet een goed contract opgesteld worden met de geldgever. In het contract moet een beschrijving van het project of onderzoek opgenomen zijn. Er is altijd een inspanningsverplichting (resultaatverplichting kan niet!). Onafhankelijke publicatie van de onderzoeksresultaten is een essentieel recht van de onderzoeker. Vaak wordt door commerciële bedrijven een gunstbetoon gegeven aan artsen, onderzoekers, organisatoren en docenten. Hierop moet worden ingegaan met zorgvuldige belangenafwegingen omdat bij onevenwichtige besluiten het risico bestaat dat belangenverstrengeling zich voordoet. Medewerkers zijn altijd zelf verantwoordelijk voor de belangenafweging.

Opzet en uitvoering van wetenschappelijk onderzoek:

Doelstellingen: reële formulering, waardoor geen valse verwachtingen worden gewekt (voornamelijk bij onderzoek met proefpersonen). :
Uitvoering: met planmatigheid, verantwoordelijkheid en inspanning. Privacy van proefpersonen moet worden gerespecteerd en bewaakt.
Patiënten-participatie: open uitnodigende houding ter attentie van patiëntproefpersonen die willen meepraten en meedenken over het onderzoek
Publicatie: essentieel voor wetenschappelijke vooruitgang, ongeacht de uitkomst van het onderzoek. Auteurschap is gebaseerd op een substantiële bijdrage aan het onderzoek en het manuscript (gespecificeerd in kwaliteit en kwantiteit).

Publiciteit over zelf verricht onderzoek dient altijd via het Dictoraat Communicatie van het LUMC te verlopen. Voortijdige publiciteit over het onderzoek dat als publicatie is aangeboden aan een wetenschappelijk tijdschrift is ongewenst, de sancties zijn dan ook streng. Bij publicatie moet informatie worden gegeven over de financiering van het onderzoek, dit kan verdachtmakingen van of toespelingen op partijdigheid voorkomen.

Plagiaat: het zonder adequate bronvermelding overnemen van andermans werk en ideeën. Zorgvuldige bronvermelding doet recht aan het werk van anderen. Ten aanzien van verwijzing naar eigen werk is terughoudendheid geboden.

Bij wet- en regelgeving worden de volgende toepassingsgebieden onderscheiden:

Onderzoek met patiënten en gezonde proefpersonen: de wetenschapper is zowel onderzoeker als behandelaar, dit brengt specifieke taken en verantwoordelijkheden met zich mee waar een spanningsveld tussen kan ontstaan. Meestal is voor dit soort onderzoek vooraf toestemming nodig van de Commissie Medische Ethiek (CME).
Declaration of Helsinki: basisdocument voor bescherming van proefpersonen in medisch wetenschappelijk onderzoek.
Wet Medisch Wetenschappelijk Onderzoek (WMO): heeft betrekking op wetenschappelijk onderzoek waarbij personen aan handelingen worden onderworpen of hen gedragsregels worden opgelegd. Er wordt in deze wet onderscheid gemaakt tussen wilsbekwame en wilsonbekwame personen. Elk onderzoeksvoorstel moet vooraf door een erkende Medisch Ethische Toetsingscommissie (METC) zijn goedgekeurd.
ICH Good clinical practice richtlijn: WMO schrijft voor dat de voorbereiding van een onderzoek aan deze richtlijnen moet voldoen.
International Ethical Guidelines for Biomedical Research involving Humans Subjects: hoe ethische principes op een effectieve wijze in praktijk kunnen worden toegepast.
Nederlands Trialregister: van Dutch Cochrane Centre, bedoeld om mogelijke publicatiebias te identificeren en nadelige effecten hiervan te reduceren. Het registreren van klinische trials wordt steeds belangrijker.
Richtlijn van de stichting Code Geneesmiddelen Reclame (CGR).
Gedragscodes met betrekking tot verzet van wilsonbekwamen; signalen moeten op de juiste manier worden geïnterpreteerd.
Patiënten-participatie: actieve rol van patiënten bij het voorbereiden, uitvoeren en evalueren van wetenschappelijk onderzoek kan relevant zijn en dit komt dan ook steeds meer in ontwikkeling. Participatie betekent ook investering, zowel van onderzoekers als van patiënten of hun vertegenwoordigers.
Onderzoek met humaan lichaamsmateriaal en patiëntengegevens: hiervoor gelden andere regels omdat patiënten hier geen last of hinder van ondervinden. Onderzoek met anoniem opgeslagen lichaamsmateriaal is toegestaan, tenzij bezwaar is gemaakt door de persoon waarvan het afkomstig is. Materiaal dat herleidbaar is mag pas worden gebruikt na geïnformeerde toestemming.
Wet Geneeskundige Behandelingsovereenkomst (WGBO): deze bepaalt dat een hulpverlener gegevens over eigen patiënten mag gebruik voor onderzoek zonder toestemming (bij verstrekking patiëntengegevens is wel toestemming vereist).
Gedragscode gezondheidsonderzoek met lichaamsmateriaal: voor gebruik van lichaamsmateriaal dat in eerste instantie voor een ander doel is afgenomen.
Wet handelingen met geslachtscellen en embryo’s: embryowet bepaalt dat onderzoek met restembryo’s vooraf beoordeeld moet worden door CCMO, hetzelfde geldt voor onderzoek met geslachtscellen.
Wet bescherming patiëntgegevens (WBP): ter bescherming van privacy van burgers.
Gedragscode gezondheidsonderzoek met gegevens: regels voor het beschermen van rechten van deelnemers bij gegevensonderzoek.

Onderzoek met dieren:

De wet op de Dierproeven (WOD): verantwoord gebruik van proefdieren en reductie van het aantal proefdieren. Dit bestaat uit het 3-V principe; Vervanging, Vermindering, Verfijning.
Dierexperimenten Commissie (DEC): moet elk vergunning houdend instituut hebben. Indien er alternatieven bestaan is het verboden gebruik te maken van proefdieren, daarom moet het ontwikkelen van alternatieven altijd in de aandacht blijven staan. Indien gebruik gemaakt wordt van proefdieren, moet hun welzijn zo min mogelijk worden geschaad.
Laboratoriumonderzoek

Publiceren: Internationale commissies en de ethiek van het wetenschappelijk publiceren:

Consort richtlijnen: kwaliteit van verslaglegging van klinische trails bevorderen.
Standards for Reporting of Diagnostic Accuracy.
CCMO-statement publicatiebeleid
Nevenwerkzaamheden: deze zijn toegestaan, mits aan bepaalde voorwaarden is voldaan.
CAO Universitaire Medische Centra

Collegeaantekeningen

HC Inleiding (maandag 5 januari 2015)

Doelstelling van het blok Praktische Onderzoeksvaardigheden:

een voorbereiding op de wetenschapsstage leidt tot betere stages,
kennis van methodologie van onderzoek,
praktische onderzoeksvaardigheden.

Wat gaan we leren dit blok?

Opzet van een onderzoek
Formuleren vraagstelling, ethiek , wetgeving
Protocol/ onderzoeksplan
Bias en confounding
Literatuur zoeken
Verschillende soorten onderzoek: labonderzoek, vragenlijstonderzoek, registratieonderzoek, pragmatisch onderzoek, kwaliteit van leven en economisch onderzoek
Analyse en interpretatie van onderzoeksresultaten
Metingen
Uitvoeren van het onderzoek
Opslaan van gegevens
Statistische analyse van gegevens
Het interpreteren van resultaten
Schrijven en presenteren van onderzoeksaanvraag
Uitvoeren van statistische analyse
Praktische vaardigheden

Toetsing:
Week 2 van dit blok eindigd met een theoretische deeltoets: 40 MC, voorbeeldvragen op BB. Leerstof uit blokboek. Open boek tentamen: artikelen, aantekeningen, grafische rekenmachine, geen oude deeltoetsen

Wetenschapsaanvraag: WG 2,u schrijft een wetenschapsaanvraag over eigen onderzoek of aan de hand van 2 artikelen. Eerste versie een dag voor de WG inleveren per email, in WG krijg je feedback en hierna kun je de aanvraag verbeteren en de uiteindelijke aanvraag eind van het blok inleveren.

Theoretische deeltoets van 2,5 uur: 35%. Het bestaat uit ongeveer 40MC vragen, open boek tentamen: boeken, artikelen, aantekeningen, grafische rekenmachine. De leerstof en voorbeeldvragen staan in het blokboek en op blackboard.
Onderzoeksaanvraag opdracht: 30%
Statistiek opdracht: 35%
Keuzeonderwerp: actieve deelname

HC Vraagstelling en opzet van onderzoek (maandag 5 januari 2015)

Een publicatie is een toevoeging aan de totale literatuur over het onderwerp en vormt daarmee de terugkoppeling dat het systeem tot een cyclus maakt. Een volgende persoon gaat hier vaak weer verder mee. Goed ondezoek heeft zijn basis in een goede vraagstelling. De vaste opbouw van ieder wetenschappelijk artikel is als volgt:

Inleiding met daarin de probleemstelling en literatuur.
Vraagstelling
Methode met daarin methode en dataverzameling.
Resultaten met daarin analyse
Discussie waarin de interpretatie vermeld wordt.

Deze opbouw is het logische vervolg van de empirische cyclus van een onderzoek. Elk onderzoek doorloopt een empirische cyclus ( = draaiboek onderzoek):

Probleemstelling
Literatuur raadplegen over het onderwerp
Vraagstelling
Methode
Dataverzameling
Analyse
Interpretatie van de resultaten
Publicatie

De basis van een goed artikel begint dus met een idee. Vervolgens vindt de theoretisch uitwerking plaats waar een vraagstelling uit volgt. Uit de praktische uitwerking volgt dan de onderzoeksopzet.

Een begin van onderzoek ontstaat vaak doordat er vraag is vanuit de klinische zorg, vanuit eigen observatie, een hiaat (=gat) in de kennis, vanuit eigen ervaring, een onverwachte bevinding in eerder onderzoek, iemand leest wat en gaat daar wat mee doen, observatie in eerder onderzoek of overheidsvraag naar gezondheidsrisico’s.

Van idee naar vraagstelling:

Aanscherpen: precies, concreet en duidelijk, beperkt, wetenschappelijk, onderzoekbaar, relevant. Inperken om een heel precieze en concrete vraagstelling te hebben waardoor het onderzoekbaar is en de conclusie duidelijker wordt.

Wetenschappelijk en onderzoekbaar: bijvoorbeeld: bestaat God? Hier is geen methode voor om dit te onderzoeken. Het is een filosofische kwestie. Helpt bidden? Ja, dit is te onderzoeken.

In de epidemiologie moet een vraagstelling de volgende drie aspecten bevatten: blootstelling/ determinant (risicofactor, interventie, etc) die leidt tot een bepaalde uitkomst binnen een bepaald domein (categorie, patientengroep, sekse, etc)

Bij de gang van vraagstelling naar opzet is het belangrijk te achterhalen welke aanvulling van kennis van etiologie / prognose / therapie nodig is, welke tabel (2 x2) of figuur nodig is en welke opzet volgt daaruit? Het is heel belangrijk om het mechanisme van determinant op uitkomst goed te begrijpen en integreren in het onderzoek. Verder is het definieren van determinanten cruciaal: als sporten gezond is moet gedefinieerd worden hoeveel van welke soort sport dan gezond is.

Voor de vraagstelling moet een optimale onderzoeksopzet gevonden worden. Research designs in de epidemiologie:

Cohort (of follow-up) onderzoek: je hebt 2 groepen, waarvan 1 groep is blootgesteld en de andere groep niet. Beide groepen volg je over de tijd en je kijkt hoeveel er ziek worden. Hiermee kun je bereken:

Absoluut risico: cumulatieve incidentie (incidence risk: nieuwe gevallen / totaal aantal mensen. Nadeel hiervan is dat niet iedereen even lang met de studie meedoet.
Incidentiecijfer (incidence rate): nieuwe gevallen / totaal x gevolgde tijd. Hierbij wordt een cijfer gegeven aan de bijdrage per individu aan de studie.

Relatief risico: incidentiecijfers op elkaar delen (rate rato) of cumulatieve incidenties op elkaar delen (risk ratio).

Therapeutisch onderzoek wordt gerandomiseerd gedaan.

Analysetechnieken: kaplan-Meier overlevingscurves (van risk ratios en rate ratios) en cox regressie analyse (van rate ratios)

Cohort studie versus RCT:

RCT: experiment: Blootstelling wordt door toeval (random) toegewezen.
Cohort: observationeel: blootstelling ligt vast, is al bepaald door patiënt of omstandigheden

Cohortstudie versus case control studie:

Cohort: blootstelling leidt tot ziekte
Case controle: ziekte ontstaat door onbekende blootstelling (achteraf bekijken of de zieken blootgesteld zijn)

Odds: verhouding van kansen dat de gebeurtenis plaatsvindt en dat de gebeurtenis niet plaatsvindt. Als het optreden van een gebeurtenis 3x zo waarschijnlijk is als niet optreden, dan zijn de odds 3 tegen 1. De kans van optreden is in dit geval ¾.
Kans = met / alle
Odds = met / niet = p / (1-p)

Relatief risico: incidentiecijfer blootgesteld / incidentiecijfer niet blootgesteld

In een case control onderzoek worden de odds ratio berekend als een relatief risico.

Case control onderzoek

Verzamel cases
Stel blootstelling vast (wel/niet)
verzamel controles
Stel blootstelling vast
Bereken odds ratio, wat dan hetzelfde is als het relatief risico.
Analysetechnieken: logistische regressie.

(Contra)-indicaties cohort onderzoek:

Voordeel is dat je het absoluut risico (en relatief risico) kunt bereken.
Meting voor de uitkomst
Inefficiënt, grote cohorten nodig

(Vontra)- indicaties case-control onderzoek:

Makkelijk om relatief risico te krijgen. Je hebt alleen geen absoluut risico (incidentie)
Meting na de uitkomst (post-hoc fenomenen), de relatie kan dan andersom causaal zijn.
Kortdurende blootstelling

Meestal keuze voor case-control onderzoek tenzij:

je het absolute risico wilt weten
de blootstelling heel zeldzaam is
je zeker wilt zijn dat de blootstelling voor de ziekte is gemeten
je een behandeling wilt onderzoeken (dan is een RCT de studieopzet)

1/4500 absoluut risico trombose. Vliegen 2-3 keer hoger risico. Risicofactoren: lang/klein, dik, pilgebruiksters, genetisch. Preventie niet bekend.

HC Regulering en medisch ethische toetsing van wetenschappelijk onderzoek met mensen (maandag 5 januari 2015)

1747: Scheurbuik. De eerste RCT met 12 scheurbuikpatiënten simultaan in 6 groepen, behandeling met respectievelijk cider, vitriool, azijn, zeewater, citrusfruit en nootmuskaat. Citrusfruit behandeling was overduidelijk beter en dit was de eerste aanwijzing dat scheurbuik een vitamine C deficientie is. Er gebeurde niets met het resultaat van dit onderzoek.

In 1900 (Pruisen) werd de eerste ministeriële regeling opgesteld over “proeven met mensen” en “medische experimenten buiten de therapeutische setting”. Dit naar aanleiding van een riskant syfilis experiment uitgevoerd door prof. Albert Neisser met als doel onderzoek naar mogelijkheden tot vaccinatie. De acht jonge vrouwen werden geïnjecteerd met syfilis waarvan 4 intraveneus en 4 subcutaan. Er werd geen voorlichting gegeven of toestemming gevraagd. De vrouwen die intraveneus geïnjecteerd werden kregen daarna syfilis.

Regeling van Pruisen (1900):
Geen medische proeven met minderjarigen en wilsonbekwamen, zonder toestemming van de proefpersoon of zonder adequate info voorafgaand aan toestemming. Nadere bepalingen: alleen met toestemming van leiding van instelling, nauwgezette documentatie dat aan alle voorwaarden is voldaan + documentatie onderzoeksprocedures, deze regeling geldt niet voor curatieve, diagnostische en preventieve gezondheidzorg. Hierin zie je elementen terug die ook heden ten dagen nog gelden!

Casus van Schloendorf: patiënte werd tegen haar wil in geopereerd. Zij ging naar de rechter, die deed de volgende uitspraak: Verenigde Staten, 1914: “Every human being of adult years and sound of mind has a right to determine what shall be done to his own body; and a surgeon who performs an operation without his patient’s consent commits an assault, for which he is liable in damages”.

Hieruit vloeide het toestemmingsbeginsel, in eerste instantie in verband met de behandeling van patiënten, later ook in verband met onderzoek en proefpersonen. De gangbare term hiervoor nu is informed consent.

In Nazi Duitsland (1933-1945) zijn veel medische experimenten op (krijgs)gevangen uitgevoerd. Onder andere hoogte-experimenten, afkoeling, behandeling van vlektyfus, farmacotherapie bij wondinfecties en chirurgische technieken. Echter, ook tijdens de oorlog in Japan vonden proeven op gevangenen en geïnterneerden met o.a. miltvuur, cholera, builenpest, malaria, tyfus, tetanus en gangreen plaats. De artsen die dit hebben gedaan zijn berecht in Neurenberg (23 beklaagden, 7 doodvonnissen, 7 vrijspraken en 9 langdurige vrijheidsstraffen) en Chabarowsk (12 beklaagden, veroordeeld tot 2-25 jaar werkkamp, vrijgelaten 1956). Na de oorlog zijn codes en verklaringen opgesteld: de code van Neurenberg (“The voluntary consent of the human subject is absolutely essential) en de verklaring van Helsinki (1964). Hierbij wordt onderscheid gemaakt tussen therapeutische (mogelijk gezondheidsvoordeel) en niet therapeutisch (nooit gezondheidsvoordeel) onderzoek en tussen onderzoek met patiënten of gezonde vrijwilligers. Er vindt nu ook ethische toetsing door medisch ethische toetsingcommissies plaats bij onderzoek. Ook uitgevers kijken bij publicatie of het onderzoek wel ethisch is.

In de jaren ‘60: Softenon Affaire. Softenon (thalidomide = angiogenese-remmer) werd voorgeschreven aan zwangere vrouwen tegen ochtendmisselijkheid in het eerste trimester van de zwangerschap.

Er werden heel veel gehandicapte kinderen geboren: misvormingen, neurologische schade en afwezigheid van handen en voeten. Dit was het gevolg van het gebruik van softenon. Het was in deze tijd nog mogelijk om geneesmiddelen op de markt te brengen zonder dat er veel onderzoek naar was gedaan. De Softenon affaire luidt het begin van het tijdperk van patiëntgebonden onderzoek, registratie eisen, GCP (good clinical practice) en IRB’s in.

Wetenschappelijk onderzoek met mensen moet wetenschappelijk van belang zijn (deugen, belang, kwalificatie onderzoeker en locatie), medisch ethisch getoetst worden en er moet informed consent gegeven worden. Informed consent is subjectief (volledigheid, begrijpelijkheid, vrijwilligheid) en objectief (mag/wil je zoiets aan iemand vragen?). De eerste belangrijkste ethische eis is een waardevolle wetenschappelijke vraag en een kloppende methodologie. Zonder deze kloppende methodologie is elk klinisch onderzoek onethisch.

Er zijn specifieke wetten gemaakt die tot doel hebben het handelen van professionals te normeren. Specifieke wetten m.b.t. medisch-wetenschappelijk onderzoek zijn:

Wet Medisch wetenschappelijk onderzoek (1998)
Wet Bescherming Persoonsgegevens
Wet Geneeskundige Behandelingsovereenkomst
Wet Bevolkingsonderzoek
Wet op dierproeven
Bepalingen in specifieke wetten.

Ook vanuit de Europese Unie worden steeds meer Europese wetten afgevaardigd ten aanzien van medisch-wetenschappelijk onderzoek. De verklaring van Helsinki is geen apart wet, maar is opgenomen in de Wet Medisch wetenschappelijk onderzoek, onder artikel 3: 'onderzoek voldoet aan overigens daaraan te stellen eisen'.
De WMO definieert wetenschappelijk onderzoek als onderzoek waarvan deel uitmaakt het onderwerpen van personen aan handelingen of het opleggen aan personen van een bepaalde gedragswijze. (Art.1 lid 1 sub b WMO (1998))

Toetsingscriteria WMO:

Voorwaardelijk verbod onderzoek met minderjarigen en wilsonbekwamen (art. 4)
Voorwaardelijk verbod onderzoek met afhankelijke personen (art. 5)
Verbod onderzoek zonder informed consent (art. 6)

Morele problemen in de onderzoeksmethodologie:

Placebo: element van bedrog, informed consent is belangrijk om over het risico van onderbehandeling te informeren.
Randomisatie:
Pre-randomisatie: is uiterst omstreden.
Sham-procedures: blinderen?
Niet-therapeutisch onderzoek met wilsonbekwame: altruisme van proefpersonen, maar niet ethisch met wilsonbekwame proefpersonen.
Trials in ontwikkelingslanden: de beste beschikbare behandeling vs. de in dat land beschikbare behandeling. Zou het geen exploitatie zijn? Of is het juist een goede manier om te investeren in de gezondheidszorg in ontwikkelingslanden?
Ook over non-resultaten moet gepubliceerd worden.
Biobank onderzoek: zonder een bekend doel wordt lichaamsmateriaal verzameld om in de toekomst er wellicht iets mee te kunnen doen voor onderzoek.

Incidenten in NL:

1978: Huize Assisië te Udenhout
1998: Fraude van neuroloog bij geneesmiddelenonderzoek (almelo)
2003: hyperthermie studie UMC utrecht
2006: stamcelonderzoek Med. Spectr. Twente, Enschede
2008: probiotica studie UMC utrecht
2011: fraude bij pijn-onderzoek UMC nijmegen
2011: fraude bij cardiovasculair onderzoek ErasmusMC

Uiteindelijk is de beste bescherming van patiënt en proefpersoon is een integere en gewetensvolle onderzoeker. Met regelingen / wetten / ordeningen op zichzelf is nog niet alles geregeld, je hebt ook mensen nodig die fatsoenlijk zijn.

HC Studieprotocol (dinsdag 6 januari 2015)

Medische research wordt gedaan om de patiënt beter te helpen en meer van de ziekte te snappen. Het is belangrijk voor aanvang van een onderzoek een goed studieprotocol te schrijven. Dit doe je zowel voor jezelf (als houvast; wat ga je doen, waarom; voor je eigen planning en als opstap voor je verslag) alsmede voor anderen (goedkeuring stage- en medisch ethische commissie en evt. voor subsidieaanvraag).

Wet en protocol(richtlijnen bij het uitvoeren van onderzoek):

WOG = Wet op de Geneesmiddelenvoorziening.
GCP = Good clinical practice = afspraak tussen onderzoekers en industrie over onderzoek doen. Dit is niet helemaal wettelijk, maar moet wel toegepast worden: er moet eindeloos geregistreerd worden en overal moet toestemming voor verkregen worden.
WMO: Wet medische Wetenschappelijk Onderzoek.
CCMO: Centrale Commissie voor Medisch Wetenschappelijk Onderzoek
METC: Medisch Ethische Toetsingscommissie
EU: European Directive on Clinical Trials
ICH: International Conference on Harmonisation of Technical Requirements of the Registration of Pharmaceuticals for Human Use.

Hoe schrijf je een protocol?

Wetenschappelijke aspecten
Wetenschap in het protocol
“Hoe verkoop ik mijn idee?” de stagecommissie moet je aanvraag goedkeuren.
Zorg ervoor dat het onderzoek zo in elkaar zit dat je ondanks non-resultateniets kunt vertellen.

Protocol volgorde:

Relevant (brede) problem = Onopgelost dilemma
Hypothese/vraagstelling: volgt uit het relevant probleem en onopgelost dilemma.
Doel: hypothese testen in bepaalde populatie, met bepaalde opzet,
Eindpunten: Wat levert een negatief antwoord op? Wat zeg/ doe je als blijkt dat het antwoord op jouw hypothese negatief is.

Wat moet er worden vermeld in een protocol:

Voor wetenschapspagina zal het een kort protocol zijn (1 pagina), maar voor werkelijk onderzoek vraagt een uitgebreider protocol. In ieder geval moeten de volgende elementen verwerkt worden:

Titel pagina

Samenvatting: zet toon, omschrijft het plaatje waar het om gaat.

Achtergrond/rationele: Dit is een betoog waarin staat waar het idee vandaan komt en waarom het antwoord belangrijk is.

Hypothese/vraagstelling: wat willen we precies weten. Achtergrond/betoog mondt uit in een vraagstelling.

Doel: vaak het toetsen van hypothese, oplossen van het probleem, ligt deels bij hypothese.

Eindpunten beschrijven de optimale uitkomst van de interventie: genezing, minder schoolverzuim, pijnbestrijding. Er is een verschil tussen een middel dat werkt en dat helpt.

Studiepopulatie (proefpersonen): aantal, hoe geselecteerd, in- exclusiecriteria (afhankelijk van over welke groep je uitspraak wil doen), controlegroep, subgroepen

Opzet: wat voor studie wordt gebruikt (Follow-up, Case-control studie) – “design” moet erin

Interventie

Meetmethode: metingen - welke gegevens verzamel je, hoe vaak en wanneer, procedures (SOP) (bijv. onderzoek staand of liggend uitvoeren), variabelen met eenheden, definitie en classificatie over de eindpunten, apparaat met ijking en detectie limiet.

Analyse:

Variabelen: berekening, transformatie, reproduceerbaarheid
Statistiek: welke test, ‘sample-size’ of ‘power’ berekening, missing data, confounders.
De power die je nodig hebt: hoe meer mensen, hoe groter de significatie. Gebruik in de berekening voor de benodigde sample size de aannames (assumptions).

Data management: vastleggen van gegevens (welk programma zou je ervoor gebruiken), logistiek van aanleveren, hoe gaat het de computer in (invoer in computer), kwaliteitscontrole (fouten herkennen), beheer database, back-up!!!

Referenties

Ethische aspecten in geval van klinisch onderzoek: o.a. hoe om toestemming gevraagd wordt. De aanvraag wordt dan beoordeeld door de Medisch Ethische Commissie, hou er rekening mee dat dit ongeveer een maand zal duren en dat er mogelijk wijzigingen gevraagd worden.

Informatie voor leken – van belang, zodat patiënten en patiëntenorganisatie mee kunnen praten.

Appendices: bijlagen. SOP (Standard Operating Procedures) is een draaiboek over bijv. een bepaald onderzoek/meetmethode dat uitgevoerd moet worden tijdens de studie.

Om van onopgelost dilemma naar antwoord te gaan, worden al deze stappen eerst ondergaan.

Er is beschreven dat bij chronische ontsteking kan leiden tot atherosclerose. Er is een samenhang gebleken tussen malnutrutie, inflamatie en atherosclerose. Duidelijk oorzaak-gevolg relatie is onbekend, hierdoor stelt men dat CRP specifiek marker is.
Het doel van studie-hypothese is deze te toetsen:

In de populatie
Met die opzet
En die eindpunten

Voorbeeld eindpunten van de studie:

Primair: belangrijkste eindpunten, zoals CRP gerelateerd aan mortaliteit
Secundair: CRP gerelateerd aan cardiovasculaire ziekten
Tertiair: CRP gerelateerd aan niet-cardiovasculaire ziekten

Het doel is de studie-hypothese te toetsen bij beginnende dialyse patiënten in prospectief cohort onderzoek. Wat levert een negatief antwoord? Er kan veel ruis zitten in verzameling of door een te kleine populatie, waardoor antwoord geen verklaring levert. In dit voordbeeld: Stel dat CRP aan geen enkel eindpunt gerelateerd is (negatieve uitkomst), dan is dat ook een resultaat: CRP is dan meer een marker voor algehele ellende dan een specifieke rol in de ontwikkeling van atherosclerose.

Studiepopulatie

Aantal, hoe geselecteerd, door wie?
Inclusie-(doelgroep van onderzoek, domein van onderzoek) en exclusiecriteria (technisch gezien mogen deze mensen er niet in, omdat er complicaties kan optreden)
Controlegroep, subgroep
Metingen: Hoe vaak en wanneer verzamel je welke gegevens. Procedures. variabelen eenheden. definitie, classificatie. apparaat, ijking, detectielimiet. Kwaliteitscriteria. Referenties.

Hoe zorg je dat data op goede manier verzamelt? = Data management

Vastleggen van gegevens
Logistiek
Invoer in computer
Kwaliteitscontrole – kwaliteit van die gegevens, moet steekproef nemen om dit na te gaan
Beheer databese – er zitten vaak namen van patiënten in, hierdoor moeten de namen niet in data in; echter namen moeten wel ergens terug te vinden zijn, maar deze moet op klinische afdeling blijven en onderzoeker eraan gekoppelde nummers overhoudt.
Backups maken

Analyse
1. Variabelen:

berekening, transformatie (van te voren is het van belang te weten hoe je berekeningen doe)
reproduceerbaarheid

2. Statistiek

welke test bij welke hypothese
sample size of power berekening: hoe vaak je meet is van belang voor het bepalen van verschil. Er zijn minder mensen nodig om een groot verschil te kunnen detecteren.
missing data
confounders

Aanvragen wetenschapsstage (waarop let de stagecommissie):

Schrijf een helder betoog/protocol (probleem, belang, vraagstelling, wat en hoe ga je het doen, haalbaar(aantal patiënten, tijdplanning) – eerste zin is van groot belang).
Onderzoek moet relevant zijn – een artikel kan eruit komen.
Onderzoek moet uitvoerbaar en haalbaar zijn (let op tijdsplanning) – een maand de tijd om te schrijven is niet te veel, twee weken is vrij weinig vooral als het schrijven niet je sterkste kant is.
De vraagstelling moet te beantwoorden zijn – niet te breed beschreven, je moet het toespitsen/inzoomen op één onderdeel.
In werkplan moet je van te voren weten wat je precies wilt gaan verzamelen.

HC Laboratoriumonderzoek (dinsdag 7 januari 2015)

Rol van labonderzoek: doen van bepalingen, vastleggen van mechanismen (hoe werkt het allemaal), nieuwe diagnostiek, nieuwe geneesmiddelen.

Experimentele wetenschappelijke methode(- cyclus):

Experimenten en data verzamelen
Hypothese stellen. Dit kan leiden tot:
Uitgebreid getoetste en algemeen geaccepteerde hypotheses worden wetenschappelijke theorieën(kan met behulp van laboratoriumonderzoek)
Nieuwe hypothese/voorspellingen maken, doe experimenten en verzamel data

Elk antwoord werk een nieuwe vraag, daarom is de cirkel nooit gesloten, maar blijft het een cyclus.

Claude Bernard heeft concept bedacht van constante innerlijke mileu en is vader van wetenschappelijke onderzoek. Hij maakte onderscheid tussen waarnemend en experimenteel onderzoek: waarnemend onderzoek (onderzoeker doet passief metingen zonder in te grijpen in proces dat hij bestudeert) vs. experimenteel onderzoek (actief ingrijpen).

Voorbeeld van een experimenteel onderzoek: trombose en vliegen

Hypothese relatie vliegen en trombose: immobilisatie of bloedstollingactivatie door hypobare hypoxie.
Onderzoek: 75 mensen met inclusiecriteria latenvliegen, in een bioscoop zetten of in het dagelijks leven laten bewegen. Rol van het lab is het uitvoeren van bepalingen zoals TAT: stollingsactivatie meten – deze metingen werd in zelfde personen herhaald in de 3 verschillende omgevingen (vlucht, bioscoop en dagelijks leven). Dit zijn proeven op mensen, echter er mag niet altijd zomaar proeven op mensen.

Proeven kunnen worden uitgevoerd op mensen, jonge volwassenen mannen of dierproeven. Er bestaat tegenstand tegen proeven op dieren. Muizen zijn de meest gebruikte proefdieren. Experimenteel onderzoek wordt vaak uitgevoerd op muizen (vooral omdat ze makkelijk genetisch modificeerbaar zijn). Blastocysten kunnen gebruikt worden om de muizen genetisch te manipuleren. Muteren van een muizengen: gemodificeerde cel injecteren in blastocyst, dan implantatie in de muis waardoor genetische veranderingen in de schijnzwangere muis ontstaan (bijv een andere kleur vacht) die doorgekweekt kan worden in meerdere muizen. Tweede rol van laboratorium is het ontwikkelen van experimentele, nieuwe methodes. Door muizen aan laag zuurstofspanning bloot te stellen, kan bevestigen worden of stollingsactivatie optreedt. Er blijkt uit onderzoek met muizen is dat hypoxie belangrijk is bij stijging fibrine. Hoe dit precies werkt is nog niet duidelijk.

Descartes introduceerde het reductionisme: Complexe systemen is een som van meerdere simpele systemen. Dit is belangrijk in laboratorium onderzoek. Dit leidt onder andere tot verschillende onderzoeksmodellen. Het ‘gecontroleerde experiment’ bestaat uit het verzamelen van resultaten van experimentele en controle groep en het vergelijken en analyseren van deze groepen wat leidt tot een conclusie.

Experiments of Nature = indirect experimenteel onderzoek:

Kenmerkend voor genetisch onderzoek naar multifactoriële ziekten(zoals diabetes, HVZ etc.)
Maakt gebruik van veelvoorkomende DNA-variaties( tussen 2 mensen bestaan er variaties > 1miljoen)
Het speelt een belangrijke rol voor koppeling aan ‘intermediaire’ fenotypen(kleur ogen, kleur haar, haarstructuur)
Vaak uitgevoerd in de vorm van een patiënt-controlegroep(case-control): genetische associatie studie

In laboratorium doen we metingen, methoden(muizen), uitdenken en uitvoeren van experimenten. Het genoom tijdperk leidt tot een oneindige hoeveeleheid experiments in nature. Resultaten kunnen gebruikt worden in het ontwikkelen van nieuwe geneesmiddelen.

HC Bias en confounding (dinsdag 6 januari 2015)

Bias

Het gebrek aan validiteit.

Bias is appels en peren vergelijken. Als je dat doet kan je het ook niet meer goed gelijk krijgen. Daarom moet je een dergelijke vergelijking van te voren proberen uit te sluiten. Validiteit is de systematische afwijking. Het is van belang om onderscheidt te maken met random fout en systematische fout. Een fout door gebrek aan precisie noemen we toevalsfouten. Fouten door gebrek aan validiteit noemen we systematische fouten of ook wel bias.

Onvergelijkbaarheid, waardoor de onderzoeksresultaten niet betrouwbaar zijn. Bias zit in alle designs (Cohort/Follow-up), de enige oplossing is van tevoren bedenken waar het zit (kan zowel in informatiekant als selectiekant zijn), hoe je het kunt voorkomen (van te voren een beter protocol te maken) en richting van effect veelal inschatten (onder- of overschatten). Problemen zijn op grond van validiteit in de schatten:

Selectiebias: probleem t.g.v. selectie onvergelijkbare groepen (bijvoorbeeld appels met peren vergelijken).
Informatiebias: probleem t.g.v. onvergelijkbare informatieverzameling (bijvoorbeeld mensen met longkanker vertellen niet eerlijk dat ze vroeger gerookt hebben, het is geen gestandaardiseerde verzameling van de informatie, er kan bijvoorbeeld een systematisch verschil tussen mannen en vrouwen onstaan in het beantwoorden van deze vraag).
Confounding: probleem t.g.v. vertekening door andere risicofactoren

Bias = onvergelijkbaarheid, zit in alle designs, maar waar zit de bias? De truc is om te zeggen dat het onbekend is welke kant de bias op zou werken, in je voordeel of nadeel? Bias is oplosbaar als er maar voor het onderzoek in acht wordt genomen. De richting van een effect van een uitkomst van een studie is veelal in te schatten. Er kan dan gesteld worden dat het effect door bias is overschat of onderschat.

Een onderschatting zorgt voor een minder sterk effect dan in de werkelijkheid. Een relatief risico van 1 betekent dat er geen relatie is. Bijvoorbeeld bij onderzoek naar verband van grijs haar en sterfte. Nadat de groepen in leeftijd wordt verdeeld blijkt RR=1, terwijl toen groep samen was RR=1,5. Hierdoor kan effect van grijs haar op sterfte geheel worden verklaard door leeftijd. Leeftijd is dus hierbij een confounder.

Bij een follow up onderzoek bestaat vooral gevaar voor selectiebias bij de exposure (bijvoorbeeld rokers willen niet mee doen met onderzoek) en voor informatiebias bij de outcome (bijvoorbeeld alleen hoestende mensen onderzoek je op longkanker).
Bij een case control onderzoek bestaat vooral gevaar voor informatiebias bij de exposure en voor selectiebias bij de outcome (bijvoorbeeld mensen met longkanker willen niet meedoen).

Dus als je begint aan een studie heb je te maken met een selectiebias en tijdens/aan het einde van een studie met informatiebias.

Confounder

Het ene effect vertroebelt andere effect – de interpretatie wordt beïnvloed, dus verwijderen uit analyse.

Een confounder is een additionele risicofactor die van invloed is op de uitkomst
Een confounder is onevenredig verdeeld over de mate van risicofactoren die worden bestudeerd
Een confounder heeft geen causaal effect op de te onderzoeken risicofactor, want ander is het een mechanisme.

Het is belangrijk om voor confounders te corrigeren (bijvoorbeeld door het uitsplitsen van factoren).

Voorbeeld: Leeftijd (C) heeft een verband met grijs haar (E) en leeftijd en grijs haar (E) heeft ook verband met sterfte (D). Leeftijd is daarom een confounder (C) bij onderzoek naar verband tussen grijshaar en sterfte. Indien je naar verband zoekt tussen leeftijd (E) en sterfte (D), is grijs haar geen confounding. Dus een confounder (C) hangt samen met de te onderzoeken risicofactor (E) en beinvloed de uitkomst (D), ook behandeling. Als een additionele risicofactor (C) zich in het causale pad van de te onderzoeken risicofactor (E) bevindt (dus een gevolg van E), dan is het geen confounder. Correctie is dan niet nodig. Leeftijd en geslacht zijn bijna altijd confounders,omdat deze zich niet in het causale pad bevinden.

Uit de data zelf kan je niet opmaken of er sprake is van een confounder, er zijn externe factoren nodig. Om een factor aan te duiden als confounder is achterliggende kennis noodzakelijk, voornamelijk over het volgende:

Is de factor een onafhankelijke risicofactor?
Kan de factor gerelateerd zijn aan de bestudeerde risicofactor (determinant)?
Ligt de factor NIET in het causale verband?

Een confounder is vaak ontdekt in vorig onderzoek.

Wat doe je aan confounding?

Voor aanvang van de studie

Randomisatie (allocate van beide bekende als onbekende confounder – geen selectie bias)
Restrictie: kijken naar een homogene groep, hierdoor geen variatie (bij mensen model), bij voorbeeld alleen een oude populatie
Matching

Na aanvang studie, tijdens de analyse

Stratificatie (analyseseparatie voor alle confounderlevels)
Multivariante analyse (lineaire, logistieke of cox regressie) - per paar of per dag rangschikken. Pas bij deze analyse techniek op voor overcorrectie van de confounders.

Alle strategiën (m.u.z. randomisatie) werken alleen bij bekende confounders. Je kunt dus niet corrigeren voor onbekende confounders. Leeftijd en sekse zijn bijna altijd confounders, indien je dat niet bedenkt blijft het bestaan. Anders moet je randomiseren om die factor weg te werken. Van belang is van te voren oorzaakgevolg te bepalen, zodat correctie voor factoren die geen confounders zijn, krijg je verkeerde conclusie.

HC Onderzoek met gegevens uit registraties (dinsdag 6 januari 2015)

Straks ga je zelf wetenschapstage doen, waarbij je uitkomsten krijg( met de vraag: is dat goed? slecht? veel of weinig?). Hoe maak je optimaal gebruik van data? Waar moet je rekening mee houden met al verzamelde data?

Je kan zelf een studie opzetten en data verzamelen. Je kan als bronnen voor je studie gebruik maken van bestaande registraties. Opzet van studie: maken van studieprotocol/vragenlijst, je kan dan zelf al rekening houden met confounding en bias. Bij bestaande registraties heb je dit minder in de hand. Waarvoor kan je ze dan gebruiken?

Bestaande registraties:

Grote aantallen zijn makkelijk mee te rekenen
Soms niet bruikbaar (ooit voor een ander doel opgezet)
Je hebt er zelf geen invloed op het studieprotocol en vragenlijst
Soorten registraties: www.zorggegevens.nl Hier vind je o.a. onderstaande registraties:

CBS doodsoorzaken statistiek

Op basis van doodsoorzaakformulier, ingevuld door een arts
Compleet: het is wettelijk verplicht voor elk sterfgeval
Er is een check of alle formulieren zijn ingevuld door bevolkingsregister.
Indeling op basis van ICD-10.
Primaire doodsoorzaken betrouwbaar, secundaire oorzaak zijn minder betrouwbaar.
Dit kan gebruikt worden voor onderzoek naar volksgezondheid en follow-up van patiënten.

Landelijke Medische Registratie

Per opname wordt ontslagdiagnose bepaald door codeur, meestal op basis van ontslagbrief – niet alle ziekenhuizen doen er hier aan mee.
Vrij volledige dekking (bijna 100%),
Niet verplicht, daarom geen 100% dekking
Dekking verschilt per ziekenhuis, de codeur moet invullen. Als er geen terugkoppeling tussen codeur en arts zal de ontslagdiagnose die ingevuld wordt, minder betrouwbaar zijn.
Hoofdgroepen diagnoses betrouwbaar, gedetailleerde diagnoses minder
Kan gebruikt worden voor steekproeven, landelijk onderzoek, vergelijking data eigen onderzoek.

Nederlandse kankerregistratie(bekendste ziektespecifieke registraties)

Alle nieuwe maligne tumoren worden door een arts vastgesteld
Vrij compleet (95%), gegevens verzameld en gecodeerd door medewerkers van IKC.
Data vanaf 1989
Geen follow-up, dus geen ziekte-vrije overlevoing
Gebruik oro steekproef, vergelijking met eigen data.

Continue Morbiditeitsregistratie (CMR)

Reden voor contact met huisarts
Representatieve steekproef van huisartsen (1% van de huisartsen registreren dit)
Hiermee kan echter niet altijd wat gezegd worden over de incidentie en prevalentie
CBS gezondheidsenquete
Steekproef (60% respons) – niet representatief voor NL bevolking
Niet representatief steekproef, dit betekend dat het niet een goede dwarsdoorsnede van de bevolking. Dit beperkt je in wat je erover wil zeggen.
Gegevens over ervaren gezondheid, psychische gezondheid, lichamelijke beperkingen, chronische aandoeningen, ongezonde leefgewoonten, medische consumptie

Complicatieregistratie

Per specialisme of ziekenhuisbreed
Meestal klinische patiënten, tijdens opname
Geregistreerd door artsen zelf – hierdoor kan er sprake zijn van onderrapportage..
Gegevens over complicaties in relatie tot medisch handelen, ingedeeld baar aard, lokalisatie, determinanten en ernst. Een complicatie is niet hetzelfde als een incident. Complicatie is een ongewenste uitkomst, incident is een ongewenst proces.

Framing ontstaat doordat je gericht naar bepaalde klachten vraagt, mensen vaker invullen dat ze er last van hebben, waardoor je een overschatting maakt. Bij vergelijkingen moet je rekening houden dat je geen appels met peren vergelijkt, denk aan:

Confounding: zie meer hieronder.

Selectiebias:

Niet-representatieve steekproef: niet alle relevante groepen zijn ingesloten, bijv convenience sample (verkiezing VS kandidaat door telefonisch sample) – geeft vertekening.
Non-response bias: verschil respondenten/non-respondenten, hier heb je alleen last van als er ook daadwerkelijk een verschil in de uitkomst van non-respondenten is.

Informatiebias:

Informatie-bias: a.g.v. directieve vragen, sociale wenselijkheid
Observer-bias: bias a.g.v. observers, bijvoorbeeld nauwkeuriger noteren van bepaalde doodsoorzaken, dan wel onderrapportage (niet met dezelfde mate van nauwkeurigheid noteren).
Recall-bias: verschil in herinnering beïnvloedt door ondergaan van nadelige situatie (bijv patiënt met longkanker herinnert sigaretje eerder, dus juist omdat ze ziek zijn, zijn ze meer geneigd zich iets te herinneren).

Confounding:

Zelf gerelateerd aan uitkomst
Ongelijk verdeeld in groepen die je vergelijkt.

Bij vergelijken van ziekenhuizen moet er rekening gehouden worden met confounding (meer hoogrisico patiënten ongelijk verdeeld) en selectiebias (insturen van verslag); soms ook informatiebias. Registraties worden steeds meer gebruikt om associaties te vinden.

Er zijn drempels voor ziekenhuizen in het uitvoeren van interventies: zit je onder de drempels, dan mag je de interventies niet meer uitvoeren. Ziekenhuizen die veel operaties uitvoeren:

Practice makes perfect: hoe vaker een ingreep wordt verricht, wordt je er beter in
Follow the crowd: wanneer een ziekenhuis heel goed is in het uitvoeren van een ingreep, zullen daar meer mensen (patiënten) heengaan.

De vraag is bestaat er een relatie tussen volume en uitkomst; dat hangt echter van veel factoren.

Voordeel: population based, grote power.

Problemen:

minder controle voor confounding – bestaat echt relatie tussen volume en uitkomst; het hangt namelijk van verschillende factoren
analyse-eenheid: ziekenhuis/chirurg? Wat is hoog-volume?
publicatiebias (als je iets vindt, heb je een grotere kans op publicatie) – er mist veel
longitudinaal versus cross-sectioneel – je kijkt op één moment, het gaat dus meer om vaste verschillen.
zeldzame uitkomsten (sterfte): gemiddelde rates per volume groep (ééntje die het wel goed doet wordt op een hoop gegooid met mindere) zijn mortaliteit en volume iets over de kwaliteit van ziekenhuizen?

De kwaliteit van ziekenhuizen kan op verschillende manieren gemeten worden. Hospital Standardised Mortality Ratio (HSMR). HSMR = (geobserveerd/verwacht)x100. Voldoende correctie voor confounding door patiëntenmix en informatiebias a.g.v. codeervariatie en relevantie voor patiënten zijn vragen die alsnog blijven bestaan.

Patiënten vinden een operatie dat volgens het boekje verloopt (geen complicaties etc.) en ingreepspecifieke informatie een belangrijke factor om te kiezen voor een bepaald ziekenhuis.

Goed gebruik van registratie is van belang voor signaalfunctie. Registratie is handig. Weet wat je doe en hoe je het interpreteert. Echter hou rekening met vertekening. Als bijvoorbeeld alleen een hoog risico groep wordt vergeleken met een rapport van de Inspectie voor Gezondheidszorg geeft confounding. Ook kan het rapport van de IGZ niet helemaal correct zijn. Er treedt hierbij vaak informatie-bias op (ziekenhuizen registeren op andere manieren) en selectiebias ( niet alle ziekenhuizen responderen IGZ).

HC Zoeken naar literatuur deel 1 en 2 (woensdag 07 januari 2015)

Systematisch literatuur zoeken:

formuleer een zoekvraag
oriëntatie en evalueren
sneeuwballen en/of zoeken in databanken evalueren
formuleren zoekvraag.
zorg dat je dit alles goed documenteert.

PICO is handig voor medische vragen:

Patiënten/populatie
Interventie (vaak het nieuwe middel)
Comparison (vaak het al gebruikte middel / gouden standaard / de standaard behandeling)
Outcome

In een databank moet je zoeken per aspect. Begin hier met de PICO en neem daar de meest essentiële aspecten van. Op deze manier heb je meer controle over de strategie. Hierdoor kom je eerder achter het verwachte aantal, mogelijke spelfouten en kan je gemakkelijker een probleem vinden en oplossen. Het is als het ware een controle van de strategie.

Zoekstrategie bouwen:

MeSH term OR vrije tekst.

MeSH-term: systematisch trefwoord, handmatig toegevoegd (NB: nieuwe artikelen nog niet), opzoeken in de MeSH-database en zoekt automatisch ook op onderverdeling. Zoek MeSH-terms altijd op, maak ze niet zelf!

Vrije tekst zijn termen waarmee je zoekt en die geen MeSH term is. Vrije tekst zijn termen met veldcodes als [All Fields], [Tiab] (titel en abstract), [Ti] (titel), [Tw] (oudere term voor All Fields). Deze moeten toegevoegd worden om recente artikelen te vinden. Bovendien is de indexering vaak onvoldoende, bijv. omdat de verkeerde term is gekoppeld aan het artikel.

Combineren van aspecten na zoeken op losse aspecten:

(Aspect 1) AND (aspect 2)

Combineren van aspecten: OR: vereniging (verzameling groter maken), AND; doorsnede (verzameling kleiner maken)

Kopieer je zoekstrategie in een Word document en/of in de standaard zoekstrategie lijst op blackboard via de Walaeus module.

Of het aantal referenties teveel is hangt af van het onderwerp en het doel waar je voor zoekt. Moet je bijvoorbeeld ergens een praatje over houden of een systematic review schrijven? Wanneer moet je de referenties gaan inperken?

wanneer het meer is dan je kan verwerken
diffuus

Inperken kun je doen door specifieker te zoeken. Dit doe je door een extra aspect toe te voegen (AND) of door een Major MeSH-term te gebruiken. Major Mesh terms zijn de Mesh term waar het artikel echt over gaat, er staat tevens een sterretje achter. Limits worden geïmplementeerd d.m.v. MeSH-achtige informatie waardoor alleen geïndexeerde referenties worden gevonden.

Bij gebruik van limits worden dus alle referenties die nog niet geïndexeerd zijn (recente referenties) niet gevonden. Vaak gaan dan wel de meest relevante referenties verloren. Je moet dit niet gebruiken, behalve voor taal en datum.

Strategieën om in te perken bij teveel artikelen:

Major mesh gebruiken met [tiab] of [ti]
Filter: niet additional filters gebruiken want dan valt ook veel recente literatuur weg
Toevoegen extra component
Subheadings

Strategieën om uit te breiden bij te weinig artikelen:

minder componenten
meer zoektermen
andere databanken
Indexed voor Medline betekend dat er Mesh terms toegevoegd zijn aan het artikel.

Als er te weinig artikelen gevonden worden, moet er gezocht worden in andere databanken.

De Pubmed zoekstrategie kan worden hergebruikt voor andere databanken, alleen de trefwoorden en de veldcodes van de vrije tekst moeten worden aangepast. Explodeer indien nodig (pubmed doet dit automatisch, maar andere databanken niet altijd)

Andere databanken:

Embase (meer europeese literatuur en meer farmacologie. Embase heeft een eigen trefwoordensysyeem, subject heading). Alle referenties geïndexeerd. Meer trefwoorden per referentie. Embase is niet gratis, maar kan via Waleus bibliotheek > hiervoor is een eduroam account nodig. Inperken in Embase gaat op dezelfde manier als in Pubmed.
Web of Science: web of science heeft geen systematische trefwoorden. Veel over fundamenteel onderzoek en dierproeven. Verander de 'basic search ' in 'advanced search'. Er zijn geen veldcodes nodig. Het enige wat moet worden ingevuld is TS of TI (topic search/title search).
PsycINFO
CINAHL

Documenten beheren

Met documenten beheren wordt het bewaren van artikelen bedoelt. Gebruik hiervoor een referentiemanagmentprogramma (endnote, mendeley, zotero). Alle referenties kunnen hierin meteen gezet worden, referenties kunnen ontdubbelt worden. Link met oorspronkelijke databank blijft behouden. Ook kan er een koppeling met word worden ingevoegd; invoegen en literatuurlijst generen. Dit bespaart veel werk en tijd!

Via BB studentenhelpdesk zijn deze programma's te downloaden.

Citatieanalyse

Maat voor kwaliteit als onderzoeker. Veel citaten op je artikelen zijn een blijk van hoge kwaliteit artikel.

Statistiek op basis van citatiegegevens
- Impactfactor: vooral in de databank van Web of Science (Journal Citation Report). Een impactfactor is A/B waarbij A het aantal keer dat artikelen gepubliceerd in 2010-2011 werden geciteerd gedurende 2012. B het aantal totale artikelen dat gepubliceerd is in 2011.
- H-index: gaat om aantal publicaties. Kan dus niet lager worden, tenzij een artikel wordt teruggetrokken. De duur van de carrière speelt dus een rol.

Attendering

Dit is een zoekstrategie die je bewaard. Via mail krijg je een melding als er een update is van de artikelen.

Soorten attenderingen

Referenties van tijdschriftartikelen
Inhoudsopgaven van tijdschriften
Citaties
Internet

HC Vragenlijst onderzoek (woensdag 7 januari 2015)

Vragenlijsten kunnen worden gebruikt bij zelf rapportage (selectieve ervaringen van een persoon worden onderzocht). Hierbij kan gevraagd worden naar: affect (gevoelens, emoties), cognitie (ideeën, feiten, meningen, kennis) of gedrag (gewoontes). Er moet gelet worden naar het al enige kennis en verder moet er ook gelet worden op de gevoeligheid van een onderwerp: sommige onderwerpen zijn te direct of gevoelig voor mensen. Een ander aandachtspunt is dat mensen erover nagedacht moeten hebben, kunnen mensen wel een antwoord geven op de vraag.

Soorten vragenlijsten

Short From -36: heeft de voorkeur en meest gebruikt en dekt aspecten - lichamelijk, psychisch en sociaal. Het is echter lang en globaal.
Betreft antwoordcategorieën: voor veel patiënten is het soms moeilijk om vragen te beantwoorden. De generieke vragen aan het eind kan voor patiënten die geen klachten hebben, maar wel ernstige ziekte hebben een dilemma vormen. Fout van de schaal is dat het maar twee onderdelen van het sociaal aspect wordt nagevraagd.
Hospital Anxiety an Depression Scale
WHO-QoL Bref

Hoe selecteer je een vragenlijst? Op basis van onderzoeksvraag domeinen – deze moeten bepaald worden en schalen moeten ontwikkeld worden met representatieve vragen door literatuuronderzoek

Op basis van de onderzoeksvraaag worden domeinen bepaald en daarin schalen met representatieve vragen ontwikkeld.

Aandachtspunten bij het formuleren van vragen:

open versus gesloten vragen
wees concreet, geen vage en onduidelijke formuleringen (duidelijk en helder formulering is van belang!)
een goede vragenlijst is maar op één manier interpretabel.
geen samengestelde, meervoudige vragen (vraag bestaat uit twee delen, als mensen hier me eens zijn weet men niet waar ze wel en niet eens mee zijn). Dit soort vragen dienen opgesplitst te worden.
geen dubbele ontkenningen (moeilijk, want mensen moeten er langer over nadenken)
geen sturende vragen, dit geeft namelijk risico op sociaal wenselijke antwoorden.
volledige en concrete vragen (let op dat ze elkaar niet uitsluiten)
1 of meerkeuze vragen, geef duidelijke instructie bij het invullen. Bij meerkeuze vragen zorg dat de antwoorden elkaar niet overlappen en dat de categorieën alle mogelijke antwoorden omvatten. Is dit niet het geval dan loop je het risico dat mensen zomaar iets invullen of niets invullen. Categorieën: 1-10 en 10-20 moet zijn 1-10 en 11-20.
Ja/nee vragen kunnen beperkend zijn.
Let op de combinatie van vraag en antwoord, deze moet aansluiten. Gebruik dezelfde begrippen in vraag en antwoord.

Nadelen van open vragen:

Lastig om te vergelijken
Moeilijker invoeren en verwerken
Wanneer je statistiek toe wilt passen is het nodig om na afloop de antwoorden (alsnog) te categoriseren.
Soms zijn handschriften onleesbaar

Het aantal antwoordcategorieën hangt af van de soort respondent en wat je wilt weten. Continu visueel analoge schaal met best denkbare – slechtst denkbare. Dichotome schaal, 5- en 7-puntsschaal.
Ja-Nee vragen worden niet erg aangeraden, omdat het vaak geen absolute ja of nee is.

Voorkeur 5-7 puntsschaal i.v.m.:

Betrouwbaarheid: Betrouwbaarheid neemt af met minder aantal categorieën.
Onderscheidend vermogen (7-puntsschaal is daarvoor het maximum)
Invulgemak is groter bij een 5-puntsschaal.

Bij meningsvragen kan men beter een even schaal gebruiken.

Oneven schalen hebben een middencategorie, even schalen dwingen meer tot een antwoord. Het kan wel onprettig zijn. De middencategorie wordt vaak als neutraal gezien, als een soort escape. Geen mening of ‘niet van toepassing’ creëert vaak missende informatie maar voorkomt missende waarden (bijv. bij seksualiteit).

Richting van de vragen:
Om antwoord-tendentie te vermijden is spiegelen een oplossing, het blijkt in het algemeen lastiger

Specifieke patiënttevredenheid meting: patiënten geven niet snel kritiek, dus meer positieve antwoorden op de vragenlijst zetten zodat meer onderscheidend vermogen ontstaat. Bijvoorbeeld: zeer slecht, slecht, niet goed niet slecht, goed, zeer goed, uitstekend.

Vraag niet naar tevredenheid (indien gebruik ter kwaliteitsverbetering wil je weten wat zijn de klachten, zodat je iets kan verbeteren) maar naar specifieke ervaringen en verbeter aspecten. Bijv duur wachttijd, prettig bejegend aan de telefoon of steeds wisselende dokters.

Opzet vragenlijsten:

Let op de volgorde van vragen
niet te veel van de hak op de tak
wees zuinig met filtervragen (zo ja ga naar vraag 23 b; zo nee ga naar vraag 27), dit kan wel makkelijk met internet vragenlijsten.
Verveling vermijden, zorg dat de relevante informatie uit de eerste paar vragen gehaald kan worden, als de vragenlijst te lang is raakt men minder geconcentreerd.
Pilot testen vragenlijst is belangrijk! -
Idealiter: cognitieve interview en kwantitatieve pilot (om opmerkingen op te schrijven)

Bestaande vragenlijsten zijn gevalideerd. Dit valideren kost tijd en geld, dus is het gemakkelijker een al bestaande vragenlijst te gebruiken. Vragenlijsten kan je bijvoorbeeld vinden in PubMed. Je kan op onderwerp, naam auteur of Mesh term zoeken. Vind je een Engelstalige vragenlijst ga dan na of er een Nederlandse versie van de lijst bestaat. Zoek hiernaar in Pubmed of neem contact met de auteur om te achterhalen of de lijst al vertaald is en of je het mag gebruiken. Pubmed (language [LA] of affiliation [AD]) Indien geen Nederlandse versie bestaat moet deze formeel vertaald worden wat tijd en geld kost. Vertalen via forward-backward vertalen: ‘native’ NL-spreker vertaalt naar NL, ‘native’ Engels-spreker vertaalt terug, vergelijking deze en originele Engelse vervolgens discussie en consensus over eindversie.

Normering? Vergelijking met referentiegroepen- hoe scoren ten opzichte van algemene bevolking.Lengte van de vragenlijst? Grote lengte geeft belasting voor respondent.

Ga na hoe het zit met de copyright.

Meeste lijsten geven zogenaamde profielen, dwz opgebouwd uit subschalen.
Voor ieder schaal heb je een aantal vragen (-items). Items operationaliseren construct op net iets andere wijze (vb depressie: opgewekt zijn, somber). Klassieke testtheorie stelt aantal eisen aan dergelijke vragenlijsten.

Eisen aan een vragenlijst:

Betrouwbaarheid (precisie): als hij zonder al te veel ruis kan meten, is de meting herhaalbaar, meet je elke keer dezelfde waarde. Verhouding tot de werkelijke waarde en de ruis daarom heen.
- Vormen van betrouwbaarheid
  - Test-hertest: het te meten concept moet over de tijd stabiel zijn gebleven
  - Interne consistentie (Cronbach’s alpha) is een maat over in hoeverre in een vragenlijst de vragen over een ziekte samenhangen. De vragen moeten correleren. Het wordt ook wel inter-item betrouwbaarheid genoemd. Bij herhaalde meting heb je betere vergelijkbare score. Het gebruikt inter-item correlaties oi te beoaken of items hetzelfde domen meten. Inter-itemcorrelatoe – items moeten hoog correleren met totale schaal. Degene die 0,8 dan wellicht redundantie.
  - Interbeoordelaars: bij het gebruik van proxy. De patiënt kan het zelf niet invullen dus vult een proxy de lijst in. Er moet op dezelfde manier worden gescoord.
Validiteit: wordt het concept gemeten? Meet je wat je wil meten.
- Content validiteit – vraag naar expert. Het is echter niet genoeg.
- Criterium validiteit (vereist gouden standaard)
- Construct validitiet (construct = minitheorie) (wanneer 2 aspecten: welbevinden en tevredenheid samenhangen en er van beide goede vragenlijsten zijn kan je die eventueel combineren)
  - Divergente (meet bijv. geluk), convergente validiteit,
  - Extreme (psychiatrische patiënten vergelijken met bijv studenten) groepen validiteit
Responsiviteit: gevoeligheid voor verandering – lastig want twee moment zijn n=zeker nodig waarbij men zeker weet dat er meetbare verandering optreedt.
- meet het instrument klinische verandering? Het meest gebruikt is Effect Size dit is een maat voor de sterkte van het effect (t.o.v. standaard deviatie). Gemiddelde verandering gerelateerd aan variatie tussen personen bijv. de variatie op baseline) – om toevalsvariatie te berekenen.

Valideren van een vragenlijst
Betekent het bepalen van validiteit en betrouwbaarheid.

Niet ontwikkelde of naar NL vertaalde lijst moet eerst gevalideerd worden. Het valideren betekent het bepalen van de betrouwbaarheid en validiteit (en liefst ook responsiviteit). Dit kan maanden tot jaren duren, vandaar de voorkeur voor reeds in NL gevalideerde lijsten.

Afname vragenlijsten:

in de wachtkamer (onderzoeker aanwezig)
via de post
via internet

Analyse vragenlijst:
Op basis van factor analyse zijn items gergoepeerd die ongeveer hetzelfde meten. Gevolgd door analyse betrouwbaarheid schaal. Daarna is het meestal simpel score optellen. Schaalconstructie o.b.v. factoranaylse: items gegroepeerd die ongeveer hetzelfde meten, gevolgd door analyse betrouwbaarheid schaal: inter-item betrouwbaarheid. Gespiegelde items in de vragenlijst moet je omcoderen om de juiste score uit de vragenlijst te krijgen. QUOTE (Nivel) vraag naar mening over instelling, naar wat persoon belangrijk vindt in leveren van zorg en van het voldoen van verwachtingen van de persoon door de arts.

HC Kwaliteit van leven; beschrijving en waardering (woensdag 7 januari 2015)

PROM: Patient Reported Outcome Measure

PREM: Patient Reported Experience Measure

Kwaliteit van leven is dus een PROM

Waarom willen we de kwaliteit van leven meten?

toename mogelijkheden
bijwerkingen behandeling
vaak beperkte winst t.o.v. bestaande therapieën
mondigheid + autonomie (WGBO): informatiebehoefte
beperkt budget: prioritering

Gezondheid gerelateerde KvL is een uitkomstmaat die de subjectieve perceptie van

het lichamelijk, psychisch en sociaal functioneren omvat. Er zijn meerdere dimensies in de KvL, namelijk het lichamelijk welbevinden (klachten en functioneren), het psychische domein (klachten zoals angst en depressie, maar ook positieve gevoelens) en het sociale domein (interacties en relaties).

De kwaliteit van leven kan op twee manieren worden gemeten:

1. beschrijving (dimensies) > meestal d.m.v. vragenlijsten

2. waardering (globaal: utiliteit) > meestal d.m.v. interview

Beschrijvende metingen van kwaliteit van leven

Om de kwaliteit van leven beschrijvend te meten met behulp van interviews zijn de volgende testen beschikbaar. Dit zijn dus eigenlijk allemaal vragenlijsten om de dimensies van kwaliteit van leven uit te vragen.

Generiek: vergelijkbaarheid, standaardisatie

Medical Outcomes Study (MOS) SF36
Sickness Impact Profile (SIP)

Ziektespecifiek: gevoeliger

EORTC-QLQ30 met modules
Rotterdam Symptom CheckList (RSCL)

Dimensie-specifiek

Pijn (McGill Pain Questionnaire )
Angst, depressie (HADS, Beck (BDI), CES-D, Geriatric DS)
Seksualiteit

Er is een verschil tussen de begrippen betrouwbaarheid en validiteit. Validiteit is meetbaar door bijvoorbeeld een ziekte in stadium 1 en stadium 4 te vergelijken en te kijken of de kwaliteit van leven hiermee overeenkomt.

Hoe kunnen we de dimensies met elkaar vergelijken?

Hiervoor gebruiken we een maat die morbiditeit en levensduur combineert; Quality Adjusted Life Years (QALY) = kwaliteit van leven x lengte van leven

Concreet:

weeg elk additioneel jaar d.m.v. kwaliteitscorrectie
Q voor minder goede gezondheid
tel de gewogen jaren op

Maar het gebruik van QALY's alleen is niet voldoende. QALY's geven vooral een beschrijving van kwaliteit van leven, maar men wil ook waarderingen van de kwaliteit van leven kunnen meten en weergeven. Hiervoor wordt het begrip utiliteit gebruikt.

Utiliteit (=nut)

Utiliteit is een getal tussen 0 en 1 dat de waardering aangeeft die patiënt aan gezondheidstoestand toekent op een continuüm van overleden

(0) tot perfect gezond (1)

Utiliteit gebruikt als kwaliteits-correctie factor Q

Hoe komen we aan utiliteit?

Directe schalen

visueel analoge schaal (VAS)

Utiliteitsmeting

Time Tradeoff (TTO)
Standard Gamble (SG)

De Time Tradeoff en Standard Gamble worden ook wel 'preference-based' utiliteit genoemd. Er moet een afweging worden gemaakt tussen het inleveren van tijd en het accepteren van een risico. De TTO en SG worden bij voorkeur bepaald met een interview. De Visueel analoge schaal wordt 'non-preference—ased' utiliteit genoemd. Bij de VAS wordt geen keuze of afweging gemaakt en is dus strikt genomen geen utiliteit. Het voordeel van VAS is dat deze eenvoudig te verzamelen is. De VAS wordt vaak getransformeerd naar de TTO.

Meestal is de volgorde van de utiliteit vergeleken met kwaliteit van leven als volgt: VAS

De verklaring hiervoor is dat men bij de VAS geen risico loopt en niets hoeft in te leveren en dat bij de TTO geen risico komt kijken. Bij de SG moet men zowel inleven als een risico lopen met elkaar afwegen.

Wat meten die utiliteiten nou precies?

Utiliteit meet dus de waardering van de gezondheidstoestand op een schaal van 0 tot 1. Er worden hierbij twee veronderstellingen gedaan:

Hoe slechter de toestand, hoe meer men bereid is om in te leveren.
Hoe meer men moet inleveren, hoe lager de utiliteit wordt.

RC Kwaliteit van leven; beschrijving en waarderen (donderdag 8 januari 2015)

Utiliteit is de waardering (van 0 tot 1) van een gezondheidstoestand. Veronderstelling; hoe slechter de toestand, hoe meer men wil inleveren. Hierdoor is de VAS geen echt 'utiliteit' omdat hierbij geen afweging hoeft worden gemaakt. De oplossing hiervoor is om de VAS te transformeren naar de TTO. Ook de Standard Gamble (SG) kan worden gebruikt voor het meten van utiliteit. De SG heeft keuze A (bv. het aantal resterende jaren van het leven incontinent) en keuze B. Keuze B is altijd een behandeling waarbij er twee uitkomsten zijn; óf het resterende aantal jaren perfect gezond doorkomen óf overlijden.

De TTO is het aantal jaren dat iemand perfect gezond wilt zijn ten opzichte van een langer leven met een bepaalde ziekte; aantal jaren in perfect gezondheid X vs. het aantal jaren leven met ziekte. Hoe hoger X is, hoe minder erg de aandoening.

Formeel gebruik van QALY's

Macro-niveau: maatschappelijk. Er wordt een economische analyse gemaakt met hierin de kosten per QALY's. De respondenten hiervan zijn de algemene bevolking.
Mesoniveau: ziekenhuis. Het aantal QALY's per behandelstrategie wordt bepaald. Patiënten met ervaring zijn hierbij de respondenten.
Micro-niveau: individueel. De respondenten zijn de patiënten zelf.

Dus op macroniveau wordt de classificatie-analyse bepaalt door de algemene bevolking (generieke classificatie) voor de kosteneffectiviteit analyse. Hiervoor wordt door de patiënt de EQ-5D ingevuld.

De EQ-5D bevat vragen over; mobiliteit, zelfzorg, dagelijkse bezigheden, angst en depressie en pijn.

De HUI bevat vragen over; visus, gehoor, spraak, mobiliteit, gebruik handen, emoties, cognities en pijn. De HUI zou je dus gebruiken om de kwaliteit van leven te meten in patiënten met beroertes.

Artikel van Pickard: 'proxies'

Proxies betekent letterlijk 'naaste'. Als er een proxy wordt gebruikt om een vragenlijst in te vullen, wordt dus aan andere gevraagd een oordeel te vellen over bepaalde gezondheidstoestanden. Proxies blijken beter te werken voor het oordelen voer lichamelijke, observeerbare dimensies, maar werken minder goed bij psychosociale dimensies zoals angst. Een patiënt waardeert zijn eigen gezondheidstoestand bijna altijd beter dan een proxy dat doet. Dit komt doordat een patiënt door coping en adaptatie positiever met zijn ziekte omgaat.

De EQ-5D vragenlijst bestaat eigenlijk uit twee delen:

EQ-VAS: waardering patiënt (eventueel proxy)
EQ-index: waardering algehele bevolking (meestal TTO)

Er zit vaak een verschil in utiliteit tussen deze twee indexen. De algehele bevolking geeft over het algemeen een lagere waardering aan gezondheidstoestand dan de patiënt. De patiënt heeft namelijk door coping en adaptatie beter met zijn ziekte om leren gaan. In de EQ-5D is de gezondheidstoestand IIII het best (dus het meest gezond). Ook de algehele bevolking doet aan cognitieve adaptatie > als de bevolking de ziekte kent, wordt de gezondheidstoestand hoger gewaardeerd in vergelijking met een onbekend ziektebeeld.

Vragenlijsten geven zogenoemde profielen, en zijn dus opgebouwd uit schalen welke weer domeinen meten. Hiermee kan men een factor (domein) analyse doen. Dit betekent dat items die ongeveer hetzelfde meten gegroepeerd worden.

HC Meten en reproduceerbaarheid (donderdag 8 januari 2015)

Reproduceerbaarheid (precisie): de mate waarin bij herhaalde metingen dezelfde uitkomst wordt gevonden. Validiteit: je meet wat je wilt meten. Vaak worden deze begrippen door elkaar heen gebruikt, beide begrippen zijn van belang.

Welke fouten zijn erg? Wat voor soort fouten beïnvloeden de resultaten ongewenst? Dat zijn systematische fouten, die door bijvoorbeeld bias of verkeerde vragen ontstaan. Random fouten zijn meestal ook ongewenst, maar in een grote onderzoeksgroep zal het effect uitmiddelen. Randomfouten zijn dus fouten in de precisie. Deze zijn te voorkomen door; standaardiseren, herhaald meten bij dezelfde persoon, meer vragen te stellen en meer mensen opnemen in het onderzoek. Randomfouten betekenen ook dat er op groepsniveau meer power zal nodig zijn voor het bereiken van statistische significantie. Systemische fouten zijn fouten in de validiteit. Voor het evalueren van een verschil zijn systematische fouten niet erg, maar voor classificeren en onderscheiden zijn deze fouten wel ernstig.

Schalen: structuur van gegevens

Nominaal (een aantal groepen): bijv. ras.
Binair: bijv. geslacht
Ordinaal (rangorde, logische ordening): vaak gradering, bijvoorbeeld dyspneu graad
Dimensioneel (interval): categorieën (eenheden) of continu (lengte, bloeddruk), bijvoorbeeld aantal objecten / kinderen.

Verschil tussen nominaal en ordinaal: Nominaal zijn verschillende categorieën zonder bepaalde ordening. Bij ordinaal zit er ene bepaalde ordening(rangorde) in.

Voorbeeld inflammatie van luchtwegen bij astma:

Meten van ernst van ontstekingsprocessen bij astmapatiënten op een semi-kwantitatieve manier scoren (op ordinale schaal) 0-4 (0 = geen, 1 = weinig, 2 = veel, 3 = zeer veel)

Bv. kijken op biopten naar eosinofielen (wat, waar, hoe, wie, wanneer?). Daarnaast speelt ervaring een belangrijke rol in de betrouwbaarheid van het scoren.

Met categoriale gegevens kan je iets zeggen over de reproduceerbaarheid d.m.v. de Kappa waarde. Dit is een getal 0-1 (perfect = 1), theoretisch gezien mogelijk -1 - + 1. Overeenstemming boven toeval in twee series van metingen van dezelfde.

gegevens = Po-Pe

Verwachte overeenstemming in metingen o.b.v. toeval (expected proportion): Pe. Afhankelijk van eigen metingen (randtotalen). Uit te rekenen door de randtotalen met elkaar te vermenigvuldigen.
Waargenomen overeenstemming (observed proportion) : Po, is te berekenen door de waarden op diagonaal bij elkaar op te tellen.

Kruistabel: perfecte overeenstemming is lijn door de diagonaal.

Maximum haalbaar boven toeval = 1-Po

Kappa = overeenstemming boven toeval / maximum haalbaar boven toeval

Kappa = (Po-Pe) / (1-Po)

Toeval uitrekenen: randvoorwaarden/randtotalen vermenigvuldigen en optellen

Voorbeeld:

0
1
2

0
a
B
c
a + b + c
1
d
E
f
d + e + f
2
g
H
i
g + h + i

a + d + g
b + e + h
c + f + i
Totaal

Verwachte overeenstemming op basis van toeval = [(a + d + g) * (a + b + c)] + [(b + e + h) * (d + e + f)] + [(c + f + i) * (g + h + i)]

Kappa waarde interpretatie: sterkte van overeenstemming:

0-0.2 gering, verwaarloosbaar
0.2-0.4 echt, niet verwaarloosbaar
0.4-0.6 matig, middelmatig
0.6-0.8 substantieel
0.8-1.0 bijna perfect

Dus het liefst heb je een Kappa waarde van 1, want dan is er maximaal reproduceerbaarheid.

Kappa alleen heb je niet zoveel aan, eigenlijk moet hier je het tabelletje bij zien om het te interpreteren. Categoriale gegevens laat je zien in een kruistabel of (gewogen) Kappa waarde. Continue gegevens laat je grafisch zien met een identiteitsplot/Brand-Altman plot. En getalsmatig met Correlatiecoëfficiënt/Intraklasse correlatiecoëfficiënt, limits of agreement (95% betrouwbaarheid)

Overeenstemming in metingen:

Gepaarde T-Test: vergelijkt de gemiddelden tussen meting 1 en meting 2.
Grafisch: identiteitplot, Bland en Altman plot. De Bland en Altman plot: gemiddelde van meting 1 en 2 op de x-as, verschil tussen meting 1 en 2 op de y-as (0 lijn verschil = perfecte overeenstemming). Hierin kan je zien of de spreiding tussen de punten een beetje gelijk is. Hierin kan je ook de lijnen + en - 2x SD zetten, deze geven de grenzen aan waarbinnen 95% van je waarnemingen zitten. Hiermee kun je beoordelen of dit in redelijke range zit met de gehele meet-schaal. Limits of agreement = grensen van overeenkomst.
Getalsmatig: Pearson correlatiecoëfficiënt (r) en Intraklasse CorrelatieCoëfficiënt (ICC, is een variant). De r kijkt in hoeverre de lijn lineair is. De ICC kijkt naar de afwijking van de optimale lijn. De reproduceerbaarheid uitgedrukt in correlatiecoëfficiënt zegt minder dan de Kappa waarde. Dus een correlatie van 0.9 wil niet zeggen dat het ook echt goed reproduceerbaar is. Getallen/grafiek zien en zelf uitrekenen is het beste. Andersom is het ook: een kleine correlatie wil niet zeggen dat de reproduceerbaarheid slecht is: aan alleen het getal kan je dit niet zien, je hebt dan het plaatje/getallen nodig. Als de spreiding van getallen klein is, is de correlatiecoëfficiënt klein.

Samenvatting:

Reproduceerbaarheid gaat om goede standaardisatie van de metingen
Validiteit gaat om goede ijking van de metingen. Beiden zijn van belang voor de interpretatie van klinische gegevens en wetenschappelijke gegevens. Een coëfficiënt verteld slechts een deel van het verhaal, je wilt eigenlijk het tabel (categoriale gegevens) of figuur (continue gegevens) gezien (dit moet je ook rapporteren!)

HC Pragmatisch en economisch onderzoek (donderdag 8 januari 2015)

Spectrum van onderzoek:

Verklarend (pathofysiologisch) onderzoek: hoe werkt het?
Pragmatisch onderzoek: helpt het de patiënt?
Pragmatisch onderzoek omvat ook economisch onderzoek.
Gezondheidseconomisch onderzoek: hoeveel helpt het? Is het z’n geld waard?

Het verschil tussen deze onderzoeken is het type validiteit waar je in geïnteresseerd bent.

Validiteit:

Interne validiteit: interpreteerbaarheid van de resultaten van het onderzoek (rechtvaardigheid conclusies).

Aantoonbare causaliteit
Geen alternatieve verklaringen.
Voldoende steekproefomvang voor statistische significantie.

Externe validiteit: generaliseerbaarheid naar beoogde omstandigheden buiten het onderzoek (naar de dagelijkse praktijk).

Alleen mogelijk indien intern valide
Onderzoek zoveel mogelijk conform dagelijkse praktijk.
Effectiveness in plaats van efficiency (doeltreffendheid in plaats van werkzaamheid).

Statistische efficiëntie: als groepen meer overlappen dan is (ceteris paribus) een

grotere steekproefomvang nodig om een statistisch significant verschil te kunnen aantonen. Dus als de groepen minder van elkaar verschillen (kleinere delta) en/of als de groepen een grotere spreiding hebben (grotere omega) is de statistische efficiëntie groter en zijn kleinere steekproeven nodig.
Meer overlap is slecht voor interne validiteit, omdat de kans groter wordt dat het een random fout is. Er kunnen minder significante conclusies getrokken worden. Hier is wel voor te corrigeren door een grotere steekproef te nemen.

Consequenties voor onderzoeksopzet

Keuze van behandelingen:

Verklarend onderzoek (interne validiteit belangrijk) voor nieuwe behandelingen in vergelijking met placebo of niets doen. Controle op correcte uitvoering door de arts en op compliance van de patiënt vindt plaats.
Pragmatisch onderzoek voor een nieuw beleid in vergelijking met de usual care. Er is geen controle op de uitvoering en compliance, meer overlap (dus slechtere interne validiteit), maar meer toepasbaar in dagelijkse praktijk (dus betere externe validiteit).

Keuze van patiëntengroep:

Verklarend onderzoek: nadruk op interne validiteit. Homogene onderzoekspopulatie met strikte inclusiecriteria, elimineert de alternatieve verklaring voor een eventueel verschil. De populatie met het grootst verwachte effect vergroot de statistische efficiëntie, maar kan ook beperkend zijn omdat het niets over de brede dagelijkse praktijk zegt (bijv. bij een populatie van 'gezonde, niet-rokende 35-jarige mannen' in een onderzoek is niet te vergelijken met de gewone patiënten populatie).
Pragmatisch onderzoek: externe validiteit. Dagelijkse heterogene patiënten uit verschillende centra, bijv. 75-jarigen met comorbiditeit.

Blindering:

Verklarend onderzoek: nadruk op interne validiteit, idealiter dubbelblind omdat kennis van de behandeling het effect kan beïnvloeden.
Bij pragmatisch onderzoek: nadruk op interne en externe validiteit hebben in de praktijk zowel patiënt als arts kennis van de behandeling, dus niet blind. Dubbelblind is ook hier ideaal, maar kan de externe validiteit benadelen dus meestal is het niet blind. Sommige behandelingen zijn belastend (bijv. operatie) en sommige patiënten hebben een aversie tegen medicatie (placebo is dan ook geen optie). Een alternatief voor dubbelblind is in dit geval een geblindeerde waarnemer die de metingen verricht ( = pragmatisch alternatief).

Controlegroep:

Allerlei methoden om de controlegroep te selecteren: cohorten, cross-sectioneel, case-control, voor-na meting, randomisatie, enz.
Patiëntrandomisatie heeft meestal de voorkeur. Het is goed voor de interne validiteit want het voorkomt grote verschillen tussen groepen (causaliteit) en de standaard statistiek is toepasbaar. Randomisatie kan echter slecht zijn voor de externe validiteit: selectieve inclusie is mogelijk door informed consent, en patiënten worden zich bewust van het alternatief (invloed op compliance en uitkomst en rapportage). Hierdoor zou je de effectiviteit van de behandeling van het onderzoek kunnen overschatten.
Pragmatische alternatieven voor randomisatie zijn:
Clusterrandomisatie: randomisatie van patiëntenclusters per arts, per regio etc. en alle patiënten binnen een cluster dezelfde behandeling. Dit is goed voor de externe validiteit want het voorkomt “vervuiling” binnen eenzelfde cluster, maar slecht voor de interne validiteit. Je introduceert verschillende inclusie criteria per cluster (wanneer loting bekend is voor inclusie). Je hebt meer clusters nodig om de variatie tussen artsen te verminderen, er zijn niet genoeg artsen. Voor een onderzoek met huisartsen en hun patientenpopulatie zou een clusterrandomisatie wel kunnen.

Analyse

PP, AT en ITT

Verklarend onderzoek: evaluatie van behandeling met de nadruk op correcte uitvoering en compliance.
Per protocol (PP) analyse: exclusie afwijkende behandeling (protocol violations), exclusie indien achteraf niet voldaan aan inclusie criteria.
As-Treated analyse (AT): groepering volgens behandeling, ongeacht randomisatie
Pragmatisch onderzoek: evaluatie van beleid, inclusief fouten en variatie
Intention To Treat (ITT) analyse: evaluatie volgens randomisatiegroep, zonder exclusie. Dit is goed voor de externe validiteit. Nadeel: slecht voor de interne validiteit, want protocol violations verzwakken het effect.

Uitkomstmaten:

Helpt het? De uitkomstmaten moeten een maat zijn voor de ziektelast, zoals:

Ongemak
Beperkingen
Bijwerkingen
Sterfte
Kosten

De eerste 3 vragen richten zich op de kwaliteit van leven.1+2+3 = kwaliteit van leven – lichamelijk, psychisch en sociaal. Je meet de ziektelast bij de patiënt, dit is subjectief en op langere termijn. Veelal wordt dit gedaan door middel van vragenlijsten (ziektespecifieke vragenlijsten, generieke kwaliteit-van-leven vragenlijsten).

Verklarend: intermediaire uitkomstmaten (surrogaat, proxy, biomarker): metingen van cholesterol, hormonen, bloeddruk, botdichtheid etc. De relatie met de ziektelast is verondersteld maar kan onduidelijk zijn. Resultaten zijn vooral relevant in de vroege stadia van onderzoek.

Voordelen is dat ze gevoeliger zijn voor verschil tussen behandelingen (sluit aan bij aangrijpingspunt van behandeling) en minder beïnvloed door allerlei subjectieve factoren. Statistisch is het efficiënter, makkelijker, objectiever en meer op korte termijn. Nadelen kunnen zijn dat het er het gevaar bestaat dat de relatie met ziektelast toch ontbreekt en dat onverwachte effecten gemist kunnen worden.

Overzicht verschil tussen de twee onderzoeks designs:

Verklarend onderzoek	Pragmatisch onderzoek
Hoe werkt het	Helpt het de patiënt?
Interne validiteit	Interne & externe validiteit
Experimentele setting	Dagelijkse praktijk
Werkzaamheid (efficacy)	Doeltreffendheid (effectiveness)
Evaluatie van behandeling	Evaluatie van beleid
Vergeleken met placebo	Vergeleken met usual care
Controle op correcte uitvoering	Geen controle op correctheid
Controle op compliance	Geen controle op compliance
Homogene patiëntengroep	Heterogene patiëntengroep
Blindering	Geen blindering
Randomisatie	(cluster) randomisatie
Per-protocol analyse	Intention-to-treat analyse
Kortere termijn	Langere termijn
Intermediaire uitkomstmaten	ziektelast

Economisch: Is het z’n geld waard? Kwantificeren van (maatschappelijke) ziektelast.
Kosten: perspectief bepaalt welke kosten meetellen.
Medisch perspectief: primaire interventie en korte en lange termijn effect op andere medische zorg.
Maatschappelijk perspectief: omvat medisch perspectief, patiëntenkosten (reiskosten, mantelzorg, tijdkosten, etc.) en arbeidskosten (verzuim, arbeidsongeschiktheid, etc.)
Ziekenhuisperspectief, afdelingsperspectief, verzekeraar, etc.
Is het z’n geld waard? kwantificeren van (maatschappelijke) ziektelast.
De effectiviteit wordt idealiter gemeten d.m.v. de QALY.
Utiliteit = waardering van het leven (0-100%)
QALY = oppervlakte onder utiliteitscurve / waarde van kwaliteit van leven en lengte van leven.

Meetmomenten:

Verklarend onderzoek: meten op dat moment dat het te verwachten effect maximaal is.
Pragmatisch onderzoek: meten op dat moment van verwacht maximaal verschil. Ziektelast uitkomstmaten worden bekeken op langere termijn.
Economisch onderzoek: langer baat = meer waard, daarom analyse niet op 1 bepaald moment maar over de hele periode waarbij meerdere keren gemeten wordt. Zo weinig mogelijk meten, maar wel vaak genoeg om ook de duur van het verschil te meten. Je meet dan of er baat is, maar ook hoeveel baat er is

Samengevat

Het optimale design hangt af van de onderzoeksvraag:

Hoe werkt het?

Verklarend onderzoek
Intermediaire uitkomstmaten
Interne validiteit
Helpt het de patiënt?
Pragmatisch onderzoek
Ziektelast uitkomstmaten in de dagelijkse praktijk
Balans tussen interne en externe validiteit
Is het z’n geld waard?
Economisch onderzoek (is ook pragmatisch)
Kosten per QALY

HC Statistiek bij onderzoek deel 1 (donderdag 8 januari 2015)

Veel voorkomende kritiekpunten bij stageaanvraag:

Een tijdsplanning ontbreekt.
Patiëntaantallen worden niet genoemd.
Er wordt geen onderbouwing gegeven van de patiëntaantallen.
Let op haalbaarheid van aantal patiënten: instroom, kosten, tijd.
Let op statistische onderbouwing: welke verschillen wil ik detecteren met deze aantallen? En waarom, want sommige verschillen kunnen ook bij toeval bestaan.

Berekening aantallen bij vergelijken van twee groepen:

Wat is de primaire uitkomstmaat? Wat ga je meten en wanneer zeg je dat er een verschil is?
Is de uitkomst numeriek (continue als lengte, gewicht, bloeddruk) of categorisch (ja/nee variabele, ziek/niet ziek, genezen/niet genezen)?
Bij een numerieke uitkomst moet je weten wat de spreiding is. Als bij iedereen de bloeddruk bijv gelijk is, dan is een verschil door een interventie makkelijker te meten, bij veel variatie is dit moelijker. Als binnen de groep veel variatie is, heb je dus een veel grotere groep nodig.
Welk verschil wil je vrij zeker (als het er is!) detecteren? Hoe zeker moet het verschil zijn? 80%? 90%? Als het gaat om een klein verschil zou je meer mensen moeten includeren dan wanneer je zoekt naar een groot verschil.

Een hulpmiddel om het patientenaantal te berekenen staan in het boek. Formules voor de meest voorkomende gevallen staan in Petrie en Sabin topic 33. Power zegt iets over met hoeveel procent zekerheid je het verschil wilt meten. Bij 80% is de power 0.80.

Bij een power van 0.80 is het aantal per groep = 16 / (standardized difference)².
Bij een power van 0.90 is het aantal per groep = 21 / (standardized difference)².

Het gestandaardiseerd verschil / standardized difference (bij numerieke uitkomst):

δ/σ = te detecteren verschil / standaarddeviatie.

VOORBEELD Studie
P = patiënten: Patiënten met 6-12 weken rugklachten, en radiologisch bewezen hernia.
I = interventie: Binnen twee weken opereren
C = controle: Conservatief beleid, afwachten.
O = outcome: RDQS vragenlijst; geeft aan hoe invalide iemand is. Deze score werd meerdere malen gedurende een jaar afgenomen. Outcome wordt vastgesteld na een jaar, er wordt gekeken of er verschil is tussen de twee groepen.

In eerdere studies was de spreiding, de standaarddeviatie, een scoreverschil van 10 punten op de vragenlijst. Een bewezen verschil tussen de groepen van 4 punten als outcome vindt men relevant.

Het gestandaardiseerde verschil is hier 4/10 = 0,4. Als we het verschil met 80% zekerheid willen weten hebben we 16/ 0,4² = 100 personen per groep nodig. Bij een power van 90% is dat 21/ 0,4²= 132 personen per groep.

Steekproefberekening om fracties in twee groepen met binaire variabele te vergelijken

Gaat op dezelfde manier (en met chi-kwadraat test):
Verschil in verwachte fracties in beide groepen p1-p2
Gestandaardiseerd verschil is = (p₁ – p₂) / wortel (p(1-p))

Voorbeeld

P1 = 65% p2 = 77%
Gebruik de chi kwadraat toets om het gestandaardiseerd verschil uit te rekenen. We nemen alfa = 0.05, bij een power van 80% is 16 / (gestandaardiseerd verschil)². Bij two-sided moet je het dubbele patiëntenaantal nemen dat je hebt uitgerekend met de formule voor power.

Wat gebeurt er met de aantallen als:

δ (te detecteren verschil) kleiner wordt: meer mensen nodig. Als je hele kleine verschillen wilt detecteren heb je meer mensen nodig.
σ (standaarddeviatie) kleiner wordt: minder mensen nodig. Als de spreiding kleiner wordt kun je nauwkeuriger iets meten en heb je minder mensen nodig om een verschil te detecteren.
Power groter wordt: meer mensen nodig.

Soms vergelijk je geen groepen, bijvoorbeeld: wat is de sensitiviteit van een nieuwe diagnostische toets? Of: wat is het percentage kinderen met ernstige slaapproblemen? Zeg dan iets over de nauwkeurigheid waarmee je het percentage bepaalt.

Voorbeeld:
Als we verwachten dat de sensitiviteit ongeveer 0.80 is, dan:

De standaardfout van een kans (p) is: se = wortel (p(1-p)/n)

95% betrouwbaarheidsinterval (geeft aan dat je 95% zeker weet dat de échte waarde tussen deze grenzen ligt): (p-1,96 se, p+1,96 se)

Maak tabel voor p = 0.80

N
Se
95% bi
5
0.18
0.45 - 1.15
10
0.13
0.55 - 1.05
50
0.057
0.69 - 0.91
100
0.04
0.72 - 0.88

Dus; als je bij 50 ziekten een geschatte sensitiviteit van 0.8 vindt, dan ligt de werkelijke sensitiviteit met 95% zekerheid tussen 69 en 91 %. Er zijn erg veel mensen nodig om kansen nauwkeurig te schatten.

Keuze uitkomstmaten:

Soms willen mensen in elke studie een 2x2 tabel maken. Bijv een studie naar het effect van een diët. Voor en na het dieët meten hoeveel het gewicht is. Bij discreet kijk je dan alleen na overgewicht ja/nee. Een continue meting zou beter zijn, omdat je dan ook kijkt hoeveel mensen daadwerkelijk afgevallen zijn, ook al hebben ze misschien nog steeds overgewicht. Verschillen in een continue uitkomst zijn nauwkeuriger te meten, dus aantallen zijn kleiner dan bij discrete uitkomst.

Analyseplan

Tijdens de opzet van het onderzoek moet er al een analyseplan worden gemaakt. Hierin worden de onderzoeksvragen op een rij gezet. Bedenk van tevoren met welke methodes je de vraag gaat beantwoorden.

Bij het opzetten van een studie moet je aangeven hoe nauwkeurig en betrouwbaar je metingen zijn. Je moet ook nadenken over uitval, missende gegevens, protocol violations, intention to treat etc. Personen die niet volgens protocol behandeld worden mogen niet weggelaten of vervangen worden door nieuwe personen!

Bij eerder genoemde studie, waar patiënten in controlegroep zijn geloot maar toch geopereerd worden door ernst van de hernia of andere redenen, dan mogen deze personen niet uit het onderzoek worden gehaald. Dit kan d.m.v. intention to treat of met een per protocol analyse. Hier zijn allemaal statistische methodes voor, maar het belangrijkste is dat dit zo veel mogelijk vermeden wordt. Het is belangrijk na te denken voor je met de studie begint hoe mensen zo veel mogelijk volgens protocol behandeld kunnen worden en niet halverwege afhaken.

Opslaan van gegevens:

Opslaan van gegevens kan met Excel, SPSS, Access of andere database programma's. Statistici geven niet de voorkeur aan Excel, omdat dit geen structuur heeft (SPSS wel)..
Nadelen Excel: één kolom kan meerdere soorten gegevens hebben, vermenging van data en metadata (bv. waarden en kolommen), vermenging van data en analyse (observaties en gemiddelde berekening)
Voordeel Excel: mooi om plaatjes in te maken
SPSS: handig voor kleine studies, er zit structuur in. De kolommen zijn de variabelen en de rijen zijn de metingen/proefpersonen.
Access: handig voor grotere studies, waar bijvoorbeeld vaker bij patiënten gemeten wordt. Een of meerdere tabellen, heeft structuur (kolommen zijn variabelen, rijen zijn onderzoekseenheden / cases). Je kunt restricties op data invoeren (>0,

Gouden tips voor de invoer van data:

Voer alleen ruwe data in (lengte en gewicht).
Laat het programma de berekeningen uitvoeren (zoals BMI bij lengte en gewicht).
Bewaar ruwe data als apart bestan en voer bewerkingen uit in een nieuw bestand. Anders kunnen je data overschreven worden.
Documenteer:
Labels voor variabelen en waarden (man/vrouw). Dus 0=man en 1=vrouw bijvoorbeeld.
Check of activiteiten kunnen doorgaan en data duidelijk is voor evt. opvolgers.
In SPSS syntax kun je opslaan welke berekeningen hebt gedaan.
Archiveer:
Versiebeheer: op elk moment kunnen terugvallen op een eerdere situatie.
Op gemarkeerde tijdstippen.
Back-up: tegen calamiteiten, liefst elke dag.
Controleer de gegevens op invoerfouten/typfouten.

HC Statistiek bij onderzoek deel 2 (donderdag 8 januari 2015)

De gegevens zijn verzameld wat nu?

Probeer gevoel voor de data te krijgen:

Bij kleine dataset: kijk naar gegevens zelf.
Bij grotere dataset: vat gegevens samen in getallen / in grafieken

Beschrijving van de gegevens:

Continue variabelen (interval, numeriek): geef maat voor gemiddelde en spreiding (gemiddelde en standaarddeviatie). Als variabele erg scheef/niet-symmetrisch is dan geef je de mediaan met de min. en max. of 75^e en 25^e percentielen.
Categorische variabelen: aantallen, subgroepen en percentages.

Bij het vergelijken van twee groepen moet je kijken naar de soort uitkomst (numeriek of categorisch) en of de gegevens gepaard of niet gepaard zijn. Vervolgens kun je het stroomdiagram achterin het statistiek boek gebruiken om te kijken welke toets gebruikt moet worden.
Dus twee stappen:

uitkomst -> numeriek of categorisch
gepaard of niet gepaard

Toetsen voor niet gepaarde metingen:

Type uitkomst	Vergelijk tussen groepen	Toets
Numeriek (bloeddruk, leeftijd)	Gemiddelden	Ongepaarde t-toets (als verschillen redelijk normaal verdeeld zijn, of grote aantallen) Mann-Whitney toets
Categorisch (ja/nee, ziek/gezond)	Percentages	Chi kwadraat toets Fisher exact (bij kleine aantallen)
Tijd tot gebeurtenis (bijv. overlijden)	Overlevingskrommes	log rank toets

Toetsen bij gepaarde metingen:

Type uitkomst
Toets
Numeriek
- Gepaarde t-toets (als verschillen redelijk normaal verdeeld zijn, of grote aantallen)
- Wilcoxon toets (kan ook bij ongepaard)
Categorisch
- McNemar

Voorbeelden:

Is bij 85-jarigen de bloeddruk van mannen en vrouwen gelijk?
Numeriek, niet gepaard, dus een ongepaarde T-toets (of evt. Mann Whitney toets).
Is het percentage mannen en vrouwen dat rookt gelijkt?
Categorisch, niet gepaard, dus Chi-kwadraattoets
Aantal sigaretten tussen mannen en vrouwen gelijk?
Numeriek, maar scheve verdeling, ongepaard, dus Mann Whitney toets
Heeft behandeling X invloed op het gewicht van een patiënt?
Numeriek, gepaard, dus gepaarde t-test
Koppels van broer/zus, je doet een IQ-test. Is het IQ van mannen hoger?
Numeriek, gepaard, dus gepaarde t toets of Wilocxo toets. Als je hiervoor een ongepaarde t-toets zou doen dan is het minder precies en minder significant.

Bij voorbeeld 1 zie je in de gemiddelden van de bloeddruk onder mannen en vrouwen kleine verschillen. Maar is dit significant? Om deze vraag te beantwoorden gebruik je de statistische toets.

Hypothese toetsen: Je stelt twee hypothesen op:

H₀: geen verschil (geen effect, geen associatie).

H₁: wel een verschil (effect, associatie).

Veronderstel dat H₀ waar is, tenzij H₁is bewezen. Bereken hoe waarschijnlijk het is dat je de geobserveerde verschillen observeert als H₀ waar is. Dit doe je met een statistische test, waarbij je de p-waarde berekent. Als de resultaten erg onwaarschijnlijk zijn onder de nulhyptohese (anders gezegd: de p-waarde is erg klein) dan verwerpen we H₀. Er bestaat dan dus wel een verschil. Grote p-waarde betekend een klein verschil, betekend dat de H₀ niet verworpen kan worden.

P-waarde: kans op geobserveerde verschillen als H₀ waar is. P

Alleen de p-waarde zegt niet veel; Hoe groot is het verschil? Hoe nauwkeurig is het geschat? Is het klinisch relevant? Daarom moet de grootte van het effect en betrouwbaarheidsintervallen rapporteren.

Rapportage van effectschattingen met hun precisie:

Numerieke uitkomsten: vermeld het verschil tussen de 2 groepen in gemiddelden.
Categorische uitkomsten: er bestaan verschillende manieren om het effect te rapporteren zoals risicoverschil, relatief risico en de Odds ratio.
Ook: geef de standaardfout van deze schatting of een 95% betrouwbaarheidsinterval. Het 95% betrouwbaarheidsinterval geeft aan dat in 95 van de 100 studies de echte waarde in dit interval zit.
Als 0 in het betrouwbaarheidsinterval zit, dan betekent dit dat de nulhypothese niet verworpen kan worden (niet significant) want het is mogelijk dat er geen verschil is. De p-waarde is dan ook groter dan 0.05.

Hulpmiddelen (zie slide 55 in PPT voor websites):

Wiki Statistiek (AMC). Hierop staat een schema met wanneer welke toets, je kunt doorklikken waar staat hoe je de toets kunt gebruiken en hoe je dit met SPSS moet doen.
Statistiek om 2x2 tabellen te maken

HC Statistiek, survival, confounding deel 1

Uitkomst: tijdsduur tussen twee gebeurtenissen (begin naar eindpunt). Mogelijke vragen: wat is de verdeling van de overlevingsduren, verschilt de levensverwachting tussen groepen patiënten, wat zijn de determinanten van een bepaalde ziekte?

Probleem is dat niet alle deelnemers het eindpunt van het onderzoek bereiken. (bijv. niet alle rokers overlijden aan longkanker tijdens de onderzoeksduur). Het gemiddelde valt dan niet meer te berekenen. Als proefpersonen het eindpunt niet bereiken, maar niet door overlijden, worden dit gecensureerde waarnemingen genoemd. Individu bereikt het uitpunt niet door uitval (lost to follow up): a.g.v. verhuizing, niet meer op controle komen (het gaat het goed, of juist heel slecht), sterven aan een andere ziekte. Veronderstelling: de reden van censurering is onafhankelijk van de overleving.

Dus niet: patiënt komt niet meer op controle omdat hij te ziek is.

De overlevingsfunctie S(t)

S(t): de kans dat de overlevingstijd groter is dan t. In andere woorden: Overleving = kans dat mensen op tijdstip t nog in leven zijn. Hoe schat je nou die kromme? Dit bereken je d.m.v. de Kaplan-Meier.

Voorbeeld Kaplan Meier:

Patiënten die eindpunten bereiken: 4, 7+, 9, 10, 11+, 12, 20, 20, 25+. + betekent gecensureerd, het weglaten van gecensureerden is niet slim, want je verliest informatie. Van gecensureerde persoon met bijv. overleving 25+ heb je juist veel bruikbare informatie. Je gebruikt gewoon de gegevens tot het moment van uitval van de patiënt. Dit doe je met een Kaplan-Meier kromme..

Tijdstip	Aantal at risk	Aantal overleden	Sterfte risico	overlevingsfractie	Overlevingskans
0	10				1
3	10	1	1/10	9/10	9/10 = 0.9
4	9	1	1/9	8/9	0.9 x 8/9 = 0.8
7	8	0	0	1	0.8
9	7	1	1/7	6/7	0.8 x 6/7 = 0.69
10	6	1	1/6		0,69x5/6=0,57
11	5	0			0,57
12	4	1	¼	¾	0,57x3/4=0,43
20	3	2	2/3	1/3	0,14
25	1				0,14

Van de waarden die je bij de overlevingskans overhoudt kan je een kromme maken: de Kaplan-Meier kromme. Je zet verticale streepjes op de kromme voor gecensureerde metingen.
De schatting / kromme is gebaseerd op 10 observaties, dit is dus niet exact. Voor elk tijdstip kun je de standaardfout (se) berekenen in SPSS en daaruit het 95% betrouwbaarheidsinterval.

95% betrouwbaarheidsinterval = (S(t) – 1,96 x se, S(t) + 1,96 x se)
Bv. op tijdstip 3: S(t) = 0.9, Se = 0.0949
(0.9 – 1.96 x 0.0949, 0.9 + 1.96 x 0.0949 = 0.71 , 1.08, oftewel (0.71, 1)

Het betrouwbaarheidsinterval kan je ook in het figuur van de Kaplan-Meier kromme verwerken. Het berekenen van een mediane overleving: tijdstip waarop 50% nog in leven is en 50% overleden is. Dit kan aan de hand van de kromme. Je kijkt bij de kans op overleven bij 0,5 (50%), hierbij kijk je welk tijdstip erbij hoort.

In dit geval is 50% van de personen overleden op tijdstip 12/na 12 jaar.

De Kaplan Meijer methode kan je gebruiken als

de prognose van de patiënten niet in de tijd verandert (dus patiënt uit 2005 heeft dezelfde prognose als patiënt uit 2010)
de groepsindeling al bij start vaststaat
patienten vanaf het begin vervolgt worden
de tijdstippen waarop de events optreden exact bekend zijn
patiënten die gecensureerd zijn dezelfde prognose hebben als patienten die op datzelfde tijdstip wel in de studie zijn gebleven (onafhankelijke censurering)

Vergelijken twee krommen:

Je kunt ook twee krommen (bijvoorbeeld: twee verschillende therapieën getest in grote groepen) in 1 figuur met elkaar vergelijken. Soms zie je in de grafiek al een duidelijk verschil maar om de significantie van (kleine) verschillen te berekenen gebruik je de Log rank toets: toets om twee overlevingskrommen te vergelijken.

Nulhypothese - H₀: twee krommes zijn gelijk
H_a: twee krommes zijn significant verschillend

Het idee is: Vergelijk de geobserveerde getallen met wat je verwacht als er geen verschil tussen de groepen is (H₀ is waar). Dit geeft een toetsingsgrootheid: X² (en samenhangende p-waarde).

Onder H₀ geeft X² een chi kwadraat verdeling met n-1 vrijheidsgraad (aantal kromme – 1). Als X² te groot is (krommes liggen te ver uit elkaar) en de correspondente p-waarde te klein: verwerpen we H₀. conclusie: verschil tussen de overlevingskromme is statistisch significant.

Maar kijk niet alleen naar de p-waarden. In kleine studies kunnen de verschillen best wel heel groot zijn, maar dan kan je geen harde uitspraken doen. Je moet dus ook kijken naar de grootte van het effect en precisie. Een Kaplan Meijer curve helpt hier wel bij. Ook is er nog een soort samenvatting. Voor de survival data is de effect maat een hazard ratio.

Sterfte risico (hazard)

Het risico om in maand (of jaar/week/dag) i te overlijden als je aan het begin van maand (jaar/week/dag) i nog in leven bent.

H(i) = (S(i-1) – S(i)) / S(i-1)

S(i-1): kans op begin in de maand nog in leven te zijn. S(i): kans om op eind van de maand i nog in leven te zijn.
Bv. S(12) = 0.30 = na een jaar is 30% nog in leven, S(13) = 0.20, dus een maand later is nog maar 20% in leven.
h(13) = (S(12) – S(13)) / S(12) = 0.30 – 0.20 / 0.30 = 0.33
Iemand die na 12 maanden overleefd heeft een kans van 0.33 om in de 13^e maand te overlijden.

Hazards kunnen worden gebruikt om twee krommes te vergelijken en een soort relatief risico te berekenen.

Hazards en overlevingscurve kan je in elkaar omzetten. Van de hazards kan je ook een curve maken, soms geeft dit meer informatie (duidelijker) dan de overlevingscurve.

Hazard ratio: maat voor verschil in hazards tussen twee groepen. Dit doe je door de hazards van de twee groepen op elkaar te delen.

Hazard ratio = hazard groep 1 / hazard groep 2

Uitkomst > 1 betekent dat sterfte in groep 1 groter is
Uitkomst
Uitkomst = 1 betekent dat sterfte gelijk is in beide groepen

Voorbeeld: hazard mannen 0 jaar = 0.047. Hazard vrouw 0 jaar = 0.035. De hazard ratio is dan:

0.047/0.035 = 1.34.

Hazard Ratio = Rate Ratio: gaat over snelheden (hazard curve)
Relatief Risico (Risk Ratio): gaat over kansen (overlevingskromme)

HC Statistiek, survival, confounding deel 2

Het fenomeen confounding betekent dat effecten ongewenst worden vertekend door andere factoren.

Voorbeeld: kwaliteit van leven meten bij twee verschillende groepen die elk een andere manier van dialyse kregen: peritoneaal en hemodialyse.

Na 6 maanden wordt de kwaliteit van leven geevalueerd. De peritoneale dialyse scoorde hier significant hoger op, maar de conclusie is niet dat je dan iedereen maar moet behandelen met peritoneaal dialyse.

Ook in de Kaplan Meijer krommes is te zien dat de peritoneaal dialyse patiënten langer overleefden dan de patiënten die hemodialyse kregen. Het 95% BI is (1.3-2.1). 1 zit dus niet in het betrouwbaarheidsinterval, wat betekent dat peritoneale dialyse een significant betere overleving heeft.

Echter: mensen die peritoneale dialyse krijgen zijn over het algemeen al in een betere conditie. De peritoneaal dialyse wordt vaak thuis gegeven, in tegenstelling tot hemodialyse, die beter gemonitord kan worden in het ziekenhuis. Er zitten nog meer verschillen in de groepen: PD patiënten zijn bij de start van de therapie ook vaak jonger.

Standaard deviatie: verteld de spreiding in de populatie
Standaard fout is een fout in het gemiddelde
Mean difference: gemiddeld verschil tussen de twee groepen

Hazard ratio: als 1 in het betrouwbaarheidsinterval zit, dan is het niet significant. De kans op het ene is bij 1 even groot als de kans op het andere. Als 1 niet in het BI zit, dan is er wel een significant verschil in risico. Je kijkt hier naar 1, omdat het om een risicoratio gaat.
Bij een risicoverschil moet 0 niet in het betrouwbaarheidsinterval zitten, wil het significant zijn.

De vraag is: mag je dit wel concluderen, misschien is er wel sprake van confounding? Voorbeeld: Leeftijd bij vergelijken verschillende vormen van dialyse. Om het werkelijke therapie effect te schatten heb je patiënten nodig met dezelfde startwaarden. Als je na corrigeren voor confounding een verschil vindt, kun je pas echt een conclusie trekken.

Hoe kan je dan het werkelijke effect van de therapie schatten? Je wil patiëntengroepen vergelijken die even oud zijn. Dat kan je doen door te corrigeren.

Corrigeren voor confounding:

Restrictie: neem alleen bepaalde patiënten op in het onderzoek (leeftijd).
Matching: maak paren van patiënten met dezelfde karakteristieken. Een hemodialysepatient en een peritoneaaldialysepatient die even oud zijn, dezelfde karakteristieken en leefwijze hebben etc.
Stratificatie: bereken effect in subgroepen met gelijke karakteristieken en neem het gewogen gemiddelde van de gevonden effecten. Bijvoorbeeld verschillende leeftijdsgroepen maken.
Standaardisatie: bereken in beide groepen wat effecten zouden zijn bij leeftijdsverdeling in een standaardpopulatie. Dus wanneer de ene groep even oud zou zijn als de andere groep
Multipele regressiemodellen

Stratificatie: kijk apart naar de behandelingen voor jonge en oude patiënten. Per subgroep reken je het verschil uit tussen de 2 behandelingen. Hieruit bereken je een gewogen gemiddelde samen met een betrouwbaarheidsinterval. Dit is een vrij grove manier om te corrigeren voor confounding.

Stratificatie in een 2x2 tabel:
Bij het splitsen van de groepen kan je voor beide groepen een odds ratio bereken (1 niet in het BI betekend significant). Hieruit kan je weer een gewogen gemiddelde berekenen. Dit is de Mantel-Haenszel odds ratio: gewogen gemiddelde van odds ratio’s (gepoolde odds ratio).

	Ziek	Gezond
Blootgesteld	A₂	B₂
Niet blootgesteld	C₂	D₂

	Ziek	Gezond
Blootgesteld	A₁	B₁
Niet blootgesteld	C₁	D₁

:

Mantel-Heanszel OR = (a1xd1/n1+a2xd2/n2) / (b1xc1/n1+b2xc2/n2)
n1 = totaal aantal personen groep 1
n2 = totaal aantal personen groep 2

Wanneer er teveel confounders zijn, krijg je heel veel subgroepen bij stratificatie, je kan dan beter gaan werken met regressiemodellen (college week 3).

Matchen: vergelijken van groepen die je matched op verschillende variabelen, cases worden aan passende controle gekoppeld. Bijvoorbeeld partner-studie om omgevingsfactoren als SES, eetpatronen e.d. zo weinig mogelijk te laten meespelen.

Voorbeeld: MEGA studie. Is een case controle studie. Er wordt gekeken op het effect van roken op trombose. Je gaat binnen de paren kijken: is er een relatie tussen roken? (ja/ooit vs nooit) en het optreden van trombose.

Welke statistische toets gebruik je hiervoor? Je wil weten of je cases vaker roken dan je controles. De beste toets hiervoor is een McNemar’s test. De uitkomst is categorisch: je hebt twee groepen en je vergelijkt rokers met niet-rokers. Daarnaast heb je gepaarde data.

Bij een p-waarde onder de 0.05 is het verschil significant.

Voordeel:

groepen zijn vergelijkbaar op variabelen waarop je matched.
Je verwacht een grotere respons, omdat mensen vaak sneller geneigd zijn mee te doen wanneer de partner bijvoorbeeld trombose heeft gehad.
Het is efficiënter, je kijkt binnen een paar naar de verschillen.

Nadelen:

Je kunt effect van variabelen waarop je match niet meer bepalen (bijvoorbeeld als case en controle zelfde geslacht hebben kun je niet meer nagaan of mannen meer kans op ziekte hebben).
Je kunt “overmatchen”. Omstandigheden van invloed zijn teveel gelijk tussen cases en controles. Bijvoorbeeld dat partners samen met het vliegtuig op vakantie gaan, kan je daar geen onderscheid meer tussen maken.
Als een van de twee personen in een paar missende data heeft, kun je het hele paar niet gebruiken.
Statistische analyse is lastiger (gepaarde gegevens), maar niet onmogelijk.

Probeer matchen eigenlijk zoveel mogelijk te voorkomen.

HC Verantwoord onderzoek doen

Wetenschappelijke integriteit: als je wetenschappelijk onderzoek gaat doen, heb je te maken met allerlei verschillende krachten die spelen in het veld dat je betreedt. Soms ben je beperkt door ethische aspecten (conflict of interest: als je financieel gewin zou hebben bij het onderzoek wat je uitvoert, ben je misschien niet helemaal meer “onpartijdig”)

Integriteit betekent eigenlijk “echtheid” of “puurheid”. Het is een persoonlijke keuze en een voorspelbare eigenschap.

Lewis (Britse schrijver): integriteit is iets doen wat jij denkt dat goed is, zelfs als iemand kijkt of als controle is.

Academische normen en waarden:

In de wetenschap zoek je naar de waarheid, je wil daarbij niet gehinderd zijn door commerciele belangen. Je wil later niet patienten gaan behandelen met een bepaalde interventie die eigenlijk niet effectief is en wellicht wel schadelijk. Bij het zoeken naar de waarheid is de nieuwsgierigheid van de wetenschapper belangrijk.
Vrijheid van meningsuiting/autonomie.
Het argument telt. Hiervoor moet je een open houding hebben in discussies.
Voor een groot gedeelte gebaseerd op vertrouwen. Daarom zijn de fraudegevallen van de afgelopen jaren vervelend. Niet alles kan gecontroleerd worden, daarom moet er vertrouwen zijn.
Objectiviteit en onafhankelijkheid zijn ook belangrijke karaktereigenschappen van een onderzoeker
Transparant

Waarom is wetenschappelijk onderzoek belangrijk?

Er is steeds meer sprake van transparante resultaten. De wetenschap moet verantwoording afleggen aan de maatschappij. Je kan niet meer als wetenschapper ‘vertrouw ons maar’. Maatschappij wil weten of het geld goed wordt besteed en of het onderzoek eerlijk is.

Het is belangrijk dat de maatschappij met ons meekijkt. Daarom heeft de VSNU (Vereniging van Samenwerkende Nederlandse Universiteiten) 5 kernwaarden uitgevaardigd. Het onderzoek dat gebeurd aan de Nederlandse universiteiten moet voldoen aan een aantal voorwaarden:

Zorgvuldigheid (scrupulousness): op alle gebieden moet zorgvuldig worden omgegaan met de resultaten. Alle handelingen dienen zorgvuldig te gebeuren
Betrouwbaarheid (reliability): als een student of onderzoeker gefraudeerd heeft, bezoedeld dat de naam van de universiteit of instelling. Door gedrag van één iemand, kan de reputatie van de hele groep aangetast worden. Daarnaast heeft het nare gevolgen voor de persoonlijke carriere.
Controleerbaarheid (verifiability): je zult hiervoor uitgebreid moeten documenteren. Op alle niveaus moet kunnen worden teruggehaald hoe je aan je resultaten bent gekomen. Alle stappen in het wetenschappelijk proces moeten gedocumenteerd worden.
Onpartijdigheid (impartiality): op wat hoger niveau waarbij mensen (financieel) gebaat zijn bij een bepaalde uitkomst, is dit iets wat speelt. “Wie betaalt, bepaalt”. Dat wil je in de wetenschap nadrukkelijk niet. Onpartijdig in ons oordeel.
Onafhankelijkheid (independence): je wil onafhankelijk zijn van alle partijen. Onderzoekers bepalen zelf wat de richting van het onderzoek is en welke vragen beantwoord zullen worden. Daar hebben andere partijen zoals de Raad van Bestuur of de universiteit geen invloed op.

Gedragscode: niiet zozeer gedrag, maar wettelijk vastgelegd.

FFP

Fabrication: verzinsels
Falsification: vervalsen van gegevens  door kleine aanpassingen krijg je andere resultaten
Plagiarism: plagiaat  stelen van ideeën, processen, resultaten zonder daarnaar te verwijzen dat deze data niet van jou zijn. Enige vorm van plagiaat is niet te voorkomen. Er zijn niet oneindig veel manieren om iets te beschrijven.

Publication-related misconduct

Soms zijn er mensen die wel hebben meegewerkt aan het onderzoek, maar niet genoemd worden en andersom: mensen die er niet op thuishoren, maar wel de credit krijgen.

Salami-slicing: als je je onderzoek in verschillende kleine onderdelen splitst, waardoor je in plaats van één publicatie bijvoorbeeld 6 publicaties krijgt.

Hoe vaak het voorkomt dat iemand iets heeft gedaan wat niet helemaal hoorde:

Zelf: maar een paar procent
Een collega: gemiddelde gaat wat omhoog
1 op de 5 wetenschappers geeft toe ooit eens iets gedaan te hebben wat ‘questionable’ zou zijn.

Waarom gebeurt dat?

Het is belangrijk om publicaties te krijgen. Publish often in high impact journals with breaking results to get new grants.

Onwetendheid: ik wist het niet

‘Iedereen doet het, ik dacht dat het gebruikelijk was’

Door wie gebeurt het?

De wanhopige: de significantie is er wel, maar door mijn falen komt het er niet uit, laat ik maar wat veranderen
De perfectionist: kan niet accepteren dat er niet uitkomt wat er uit zou moeten komen.
De psychopatholoog: hebben geen geweten en vinden het normaal om met de data te rommelen
De grandioos: denkt geen data nodig te hebben om te laten zien dat hij gelijk heeft
De sociopaat: lijkt op de psychopatholoog
De nonprofessionele support staff:

Het kan zijn dat je bij je wetenschapsstage aanloopt tegen dingen die je raar vindt.

Gebruik je relatieve onwetendheid die je hebt als student: “gaat dit altijd zo?” gaat niet zozeer over je eigen functioneren, maar om de werkzaamheden in bijvoorbeeld het lab. Het is moeilijk, je bent de jongste en de nieuwste en je moet aan het einde nog een beoordeling krijgen. Als er bepaalde dingen zijn kan je de vertrouwenspersoon die gaat over wetenschappelijke integriteit aankloppen.
Commissie wetenschappelijke integriteit. Deze onderzoekt de serieuze gevallen die een zekere grens gepasseerd hebben.

HC Schrijven verslag

Goed taalgebruik is belangrijk bij het schrijven van een (onderzoeks)verslag.

Taalgebruik

Schrijftaal vs. Spreektaal: Altijd een zin met een hoofdletter beginnen, schrijf cijfers onder de 10 voluit.
Passieve vorm vs. actieve vorm. Niet: er wordt onderzoek gedaan of wij hebben onderzoek gedaan. Wel: Onderzoek wordt gedaan.
Tijden in inleiding/protocol tegenwoordige tijd en in artikel/resultaten de verleden tijd, in de conclusie meestal weer in tegenwoordige tijd. Meestal gaat dit op gevoel vanzelf goed. (algemeen geldende dingen: tegenwoordige tijd)
Spel- en stijlfouten maken een slechte indruk.
Lay-out is belangrijk. Bied overzicht en structuur. Ruimte voor commentaar is belangrijk en laat zien dat je wil leren van commentaar van de begeleider..
Alinea’s en structuur. Elke alinea één boodschap, kern komt in eerste of laatste zin, dit creëert structuur.

Wat mag niet ontbreken?

Titel pagina (titel, naam, afdeling, jaar, etc.), samenvatting (aan begin van verslag, moet uitnodigen om artikel te lezen), achtergrond/rationale, hypothese/vraagstelling, doel, eindpunten, proefpersonen (in- exclusiecriteria), opzet, interventie, meetmethode, analyse (+stat. power), resultaten, tabellen en figuren, discussie, conclusie, referenties.

Opzet/structuur Artikel:

Abstract (is een soort mini-artikel waar alles in is samengevat).
- achtergrond met vraagstelling
- studie-opzet en methoden
- resultaten met data
- conclusie en implicatie.
Inleiding (hier is ruimte voor creativiteit):
- de ziekte/ het probleem
- waarom is het onopgelost?
- idee: hoe kan het wel
- hypothese/vraagstelling

Een ander format voor de inleiding is:

algemeen probleem
specifiek
wat deden anderen?
wat moet er DUS gebeuren?
doel/vraagstelling

De inleiding is een betoog dat naar de vraagstelling leidt. Je hoeft niet uitputtend literatuuroverzicht of beschrijving van de ziekte en de behandeling te beschrijven in je inleiding. Een goede inleiding is een betoog en zorgt dat de lezer denkt: ‘dit moet ik inderdaad weten’.

Methode
- design en waarom (trail, case-control, cohort want die beginnen ergens anders met de selectie, etc)
- patiënten (inclusiecriteria, exclusiecriteria, wervingsprocedure)
- verzamelde gegevens (demografie, klinische gegevens, labgegevens, eerst baseline en dan follow up)
- definities/classificaties
- statistische analyse (niet welke SPSS versie of welke p-waarde significant is, maar hoe bijv. gecorrigeerd is en welke testen zijn gebruikt).
Resultaten (logische volgorde):
- Logische volgorde: beschrijving populatie (dus niet in methode sectie), tabel 1, belangrijkste resultaat, tabel 2, andere resultaten, tabel 3.
- naar elke tabel verwijzen in de tekst. Meestal zitten de tabellen achteraan in de tekst en niet tussendoor, dus er moet naar verwezen worden.
- tekst moet leesbaar zijn zonder tabellen (tabellen zijn slechts kapstokken).
- maar je mag tabellen niet compleet herhalen in de tekst. Het belangrijkste van de tabel moet dus in de tekst.
- alleen feiten (geen meningen of interpretaties) vermelden

Tabellen:

nummer tabellen op volgorde zoals ze verschijnen in de tekst
titel: helder en beknopt
tabel met titel moet duidelijk zijn zonder tekst erbij
gebruik zo nodig voetnoten onder de tabel.
geen verticale lijnen, alleen horizontale lijnen gebruiken. Kopiëer een tabel niet rechtstreeks uit SPSS.

Figuren:

nummer figuren op volgorde zoals ze verschijnen in de tekst
titel moet helder en beknopt zijn en duidelijk zijn zonder tekst erbij te hebben
voorzie alle assen van een label en laat ze beginnen bij 0
gebruik geen onnodige effecten zoals 3D of schaduw, dit maakt aflezen moeilijk.

Aan het eind van de resultaten komen vaak nog wat losse berekeningen die niet over de hoofdgroep gaan bijvoorbeeld, maar ter controle van de resultaten of dezelfde waarden worden gevonden voor andere groepen uit het onderzoek of via andere berekeningen. Hierdoor wordt het voor de lezer duidelijk waarom bepaalde keuzes in de methode en analyse gemaakt zijn en dat dit inderdaad juist was, het resultaat wordt daardoor sterker.

Discussie:
- Rode draad: voornaamste resultaat met boodschap.
- Foutenbronnen/beperkingen van het onderzoek: in opzet/methode, bias, stat. power, meeste weerleggen. Wat betekent het voor de resultaten van dit onderzoek. Goed om dit vroeg te doen in de discussie, anders lijkt het of het weggestopt wordt.
- Vergelijking met eerdere studies uit literatuur, wat is nieuw.
- Interpretatie: mechanismen (wat is nu opgelost, wat blijft onbekend?). En:
- Klinische interpretatie: medische relevantie. Bijv. gevolg voor richtlijnen.
- Conclusie met implicatie/belang van het onderzoek.

Eventueel kun je in de discussie nadelen van je onderzoek ombuigen in voordelen. Bijv. aangeven dat de onderzoeksgroep gevoelig is voor selectiebias, maar dat het wel een klinisch relevantie groep is.

Deze structuur geeft houvast. Onderverdeling in alinea’s per onderwerp is belangrijk.

Hoe schrijf je het verslag?

Eerst alineaschema te maken (belangrijkste resultaten eerst noemen), dit wordt de kapstok van het verslag waar je aan kunt puzzelen om de structuur van een betoog zo helder mogelijk te maken. Later kunnen vanuit dit schema cijfers en referenties ingevuld worden. Dit schema is een goed moment voor overleg met de begeleider.
Een boodschap per
alinea (meestal in eerste zin, of anders in de laatste)
De referenties erbij zoeken (je ziet gelijk wat er nog niet in staat, gerichter bezig met lezen en verwerken van de informatie!)
Tenslotte alinea voor alinea uitschrijven.
Vroegtijdig overleg met begeleider is heel belangrijk.

Soms lukt het schrijven van een artikel niet. Dan zijn er alternatieve strategieën:

Bij writers block (niet op woorden kunnen komen): schrijf alles achter elkaar, zonder je te laten onderbreken. Op deze manier kan je in een soort flow komen en uit de blokkade te komen. Kijk pas later naar leestekens en formulering etc.
Zoek soortgelijke artikelen als voorbeeld, liefst uit hetzelfde tijdschrift voor het vergelijkbare taalgebruik. Kan helpen om ergens een goed woord voor te vinden. Maar pas op voor plagiaat! Weet dat er plagiaat software bestaat waardoor het makkelijk ontdekt kan worden.
Maak eerst de tabellen en bediscussieer die uitvoerig met je begeleider om de kern van de boodschap duidelijker te maken en dan een beter betoog kan schrijven.
Schrijf de methode-sectie tijdens rekenwerk, schrijf de inleiding en discussie als laatste.
Schrijf vrijwel het hele het artikel voordat het onderzoek begint:
- inleiding = rationale
- methode = protocol
- tabellen en tekst resultaten liggen grotendeels vast en zou je later makkelijker kunnen invullen als je weet welke gegevens je nodig hebt.
- schrijf twee discussies: hypothese blijkt juist of niet
- doe eerst pilotstudie en dan pas het onderzoek zelf (eigenlijk moet dit altijd!) zodat je inzicht krijgt in hoelang het duurt om de gegevens uit een dossier te halen en of de gewenste patienten er wel zijn.

Vroegtijdig overleg met begeleider zodat fouten vroeg worden opgemerkt, doe dit na alles wat je hebt geschreven (eerst schema, dan inleiding, etc.).

Planning voor een 14 weken wetenschapsstage, bijvoorbeeld:

4 weken lezen
4 weken gegevens verzamelen / rekenen
4 weken schrijven
2 weken uitloop
Schrijf in de eerste paar weken een inleiding en alineaschema en lever die in bij begeleider voor feedback en overleg.

Extra artikel over dit thema: Een recept voor een klinisch-wetenschappelijk leeronderzoek. J.P. Vandenbroucke. 1989.

HC Problemen interpretatie

De p-waarde: kans op minstens het geobserveerde verschil (verbanden of associaties die je ziet), terwijl er in werkelijkheid geen verschil is (dus als de H₀waar is). Als het verschil groter wordt, wordt de P waarde kleiner. Is de waarde

Betrouwbaarheidsintervallen variëren in locatie en lengte. 95% van de betrouwbaarheidsintervallen bevat de ware waarde, slechts 5% valt daar dus buiten.

Dit geeft de variatie tussen studies aan. Hetzelfde geldt voor de p-waarde. Niet iedere studie geeft dezelfde p-waarde.

Rapporteren resultaten:

Wees volledig in informatie: noem alle waarden, dus de P-waarde, hoeveelheid patiënten, hoeveelheid controles, betrouwbaarheidsinterval~van de p-waarde. Alleen ‘niet significant verschil’ met p-waarde is niet voldoende! Zie kernliteratuur Petrie en Sabin, topic 34, voor de
alle kerninformatie in de belangrijkste tabel: bij een continue uitkomstmaat, niet alleen gemiddelde geven, maar ook de spreiding/standaard deviatie (dus min en max waarde geven). Ook wanneer niet significant, wel de p-waarde en indien beschikbaar correlatie coefficient vermelden.
afronden op basis van vuistregels:
- gemiddelden: rond het af op 1 decimaal meer dan oorspronkelijke gegevens. Bij leeftijden van 7 en 8 jaar, dus gemiddelde is 7,5 jaar.
- p-waarde rond je af tussen 0,01-0,99 op 2 decimalen
- p-waarde rond je af tussen 0,001-0,009 op 3 decimalen
- anders p-waarden:

Significantie/P-waarde:

Wanneer iets niet significant is, wil niet zeggen dat de H₀ gelijk waar is. Dus bij het niet verwerpen van H₀ kan H₀ of H₁ beide nog waar zijn. Men mag niet concluderen dat als iets niet significant is of er meteen “bewezen is” dat de twee groepen gelijk zijn. De conclusie is dan veel te stellig geformuleerd. De grens van p0.05 is bewezen dat de behandelingen gelijk zijn.
Stel dat een toets als uitkomst heeft van p= 0,000; zeer significant maar bedenk wel of het gevonden resultaat ook een klinisch relevant resultaat is.
P-waarde hangt af van de grootte van de studie. Een grotere studiegroep laat eerder significante verschillen zien, dan een kleinere groep. De betrouwbaarheidsintervallen worden kleiner naarmate de studiepopulatie groter wordt. Bij kleine studies is bijna niets significant, bij grote studies zijn kleine verschillen al significant. Kijk vooral ook naar geschatte klinisch relevante effecten en kijk naar de nauwkeurigheid.

Bijv: een verschil 1 persoon en dus 10% in een groep van van 10 personen geeft een andere p-waarde, niet significant, dan dat zelfde verschil in een groep van 500, statistisch zeer significant.

Fouten met toetsen:

	De waarheid
Onze beslissing	Geen verschil H0 is waar	Wel verschil H1 is waar
Niet significant	Correct	Fout tweede soort = β, door niet genoeg power
Wel significant	Fout eerste soort = α	Correct

Fout van de eerste soort: geobserveerde verschil statistisch significant noemen, terwijl er in werkelijkheid geen verschil is. H0 wordt onterecht verworpen. De kans op zo'n fout is 0,05 (afkapwaarde significantie P-waarde) en dat is α.
Fout van de 2^e soort: geobserveerde verschil niet-significant noemen, terwijl er in werkelijkheid een significant verschil is. H0 onterecht niet verworpen. Kans op zo'n fout hangt af van de power en dus van de steekproefgrootte (te weinig mensen) en de onnauwkeurigheid van de uitkomst. Kans op zo’n fout is β. Power = (1 – kans op fout tweede soort).

Fouten in interpretatie

Fishing expedition: is het fenomeen waarbij men doorgaat met hypotheses toetsen totdat iets significant is (herhaald toetsen). Indien er 3 groepen zijn en paarsgewijs worden vergeleken, de kans op minstens één significant verschil terwijl er geen verschil is 1-0,95³=0,14. Bij 20 toetsen is dit 1-0,95²⁰=0.64. Doorgaan met hypothesen testen totdat je een significant verschil vindt. Dit soort herhaalde toetsen is vooral een probleem bij het zoeken naar genen (gene hunting) en micro-array analyse. Daar wordt wel voor gecorrigeerd, maar daardoor vind je bijna nooit meer iets significants omdat de grenzen zo streng worden gesteld.
- De oplossing voor dit fenomeen is corrigeren voor het aantal toetsen dat je uitvoert. Er zijn daar verschillende methoden voor, waarvan Bonferonie er één is: neem niet p=0,05 als significantiegrens, maar p/aantal toetsen als significantie.
Data snooping: is een fenomeen waarbij aan de hand van het bestuderen van de data een mogelijke hypothesen en/of verklaringen worden bedacht. O.a. door extremen uit de data te pikken en daartussen een significant verschil aan te tonen. Een oplossing hiervoor is te kijken of er andere studies zijn met vergelijkbare resultaten. Wat men wel kan doen is vermelden van onverwachte bevinding en mogelijkheid benoemen voor een nieuw onderzoek. Het kan immers gewoon een toeval zijn. Voorbeeld is de grafiek van geboortemaand en studieresultaten. Als je de twee extremen (slechtste resultaten en hoogste resultaten) met elkaar gaat vergelijken en de rest van de maanden eruit laat, krijg je wel een significant verschil. Dus eerst kijken naar je data en dan daar bijbehorende hypotheses bedenken noem je data snooping.
Verwar associaties niet met een causaal verband. Een relatie tussen verschillende data wil niet zeggen dat er ook een causaal verband is.

Wanneer kan men zeggen dat er een causaal verband is?

Criteria van Hill voor beoordeling causaliteit (hoemeer criteria van toepassing, hoemeer het voor de hand ligt dat er een causaal verband is):

tijdsrelatie: blootstelling voor optreden ziekte
plausibiliteit: hoe aannemelijk is een causaal effect, is er een goede verklaring.
consistentie: zelfde relatie in meerdere studies
biologische dosis-respons relatie - geeft meer respons bij hogere dosis!
Grootte van het effect: grote effecten kunnen moeilijk verklaard worden door andere factoren (zoals confounders)
Interventie/experimenten: je moet het lab/dierproeven/clinical trials in om de gevonden associatie zeker te maken. Bij observationele studies weet je namelijk niet of de effecten causaal zijn. Mogelijke confounders maken het onmogelijk om een causaal verband te bewijzen.
Specificiteit: uitkomst hangt niet af van andere factoren. Indien wel is het moeilijk om te zeggen dat er echt een causaal verband bestaat.
Coherentie: is de relatie coherent met de andere bekende kennis over risicofactoren.
Analogie: soortgelijke associaties in andere vakgebieden
Indien je al deze punten kan beredeneren(hoef niet aan alle punten te voldoen), wordt causaal verband duidelijker met name bij observationeel studies.

Tips voor succesvolle analyse en interpretatie:

Opzet studie is erg belangrijk: verkeerde data kunnen achteraf niet verbeterd worden.
Motiveer aantallen
Maak eerst analyseplan
P-waarden kunnen misleidend zijn. Niet alles hangt af van de p-waarde.
Bij kleine studies is bijna nooit iets relevant, bij grotere studies juist wel.
Klinische relevant vs. Statistisch significant
Ook negatieve resultaten kunnen interessant zijn!
Geef p-waarden (dus niet alleen ‘wel significant’ of ‘niet significant’ en ook betrouwbaarheidsintervallen, vertel hoe groot de effecten zijn.
Let op Fishing Expeditions, en Data Snooping
Ook negatieve resultaten kunnen interessant zijn. Focus je niet alleen op het behalen van een positief resultaat.
Een statistische relatie hoef niet causaal te zijn.

Responsiecollege

Let er op bij Kaplan Meier (KM) curves om de gecensureerde waarnemingen niet mee te tellen in de overlevingskans. Deze personen worden wél van het totale aantal mensen afgetrokken. Dus tijdens het volgende tijdstip in de tabel telt een gecensureerd persoon niet meer mee.

Met een Log rank test kun je twee KM curves met elkaar te vergelijken. Als groepen groot zijn kan je t toetsen gerust gebruiken, de gemiddelden moeten redelijk gelijk zijn. Bij kleine groepen of niet-normaal verdeelde of skewed/scheve variabelen kan je beter geen t toetsen nemen maar een niet-parametrische analyse.

Bland Altman plot gebruik je om twee continue variabelen met elkaar te vergelijken. Bijvoorbeeld twee meetmethoden met elkaar vergelijken op effectiviteit/nauwkeurigheid.

Betrouwbaarheidsinterval bereken je door + en – 1.96 keer de standaardfout te doen.

Vraag 21 proeftentamen
Aantal personen per groep = 16 / (gestandaardiseers verschil²)
Gestandaardiseerd verschil = p1 – p2 / wortel (p gemiddeld – (p gemiddeld – 1))
Gest. verschil = 0.3 – 0.5 / wortel (0.4 x 0.6)

Limits of agreement lijkt op 95% betrouwbaarheidsinterval. Alleen 95% BI-interval gaat over Odds, en significantie. Limits of agreement gaat over de klinische waarde voor individuen.

Wanneer er tussen beoordelaars grote verschillen ontstaan in hun beoordeling kun je besluiten de meting door beide beoordelaars twee keer te laten uitvoeren en daar het gemiddelde van te nemen.

Referal bias = bijv. een patiënt die rookt en hoestend bij de dokter zit wordt waarschijnlijk eerder doorverwezen dan een niet rokende patiënt die hoestend bij de dokter zit.
Dit is een vorm van informatie bias.

Bij een homogene groep kun je sneller verschillen detecteren omdat er minder variatie is binnen de groep en het dus waarschijnlijker is dat verschillen die je eventueel vindt te wijten zijn aan de onderzoeksvariabele. De externe validiteit is weer minder. Als je bijv. een onderzoek hebt gedaan onder gezonde mannen van 18 – 35 (homogene groep) is de klinische relevantie van zo’n groep weer kleiner.

Bij een grotere spreiding (op de x-as) wordt de correlatie ook groter. Bijvoorbeeld: je meet het gewicht ten op zichte van de leeftijd (op de x-as). Als je van 0 – 100 jaar meet, zul je een lineair verband goed kunnen zien, de correlatie is duidelijker. Als je dat zelfde alleen doet voor 40 – 45 jaar, is de correlatie minder goed zichtbaar, de metingen in gewicht zullen vrij dicht bij elkaar liggen en geen duidelijke lijn vormen. De spreiding is dan kleiner en de R (correlatie) is lager.

Vraag over opdracht 4 van ZSO 10:

Uitkomst is gemiddelde hbcord (Hb in navelstreng) = 10.583 + 0.274 x Hb moeder

Voor elke waarde dat de Hb van het moeder omhoog gaat, gaat de Hb van het kind 0.274 omhoog.

Bij de tweede analyse is het gemiddelde hbcord 13.477 + 0.275 x Hb moeder - 0.076. de interpretatie wordt nu anders. Dit is het effect als de Hb van de moeder 1 omhoog gaat, maar gecorrigeerd voor zwangerschapsduur. Dit is een manier om te corrigeren voor confounding.

Vraag 6 oefententamen:

0.447 + (1.96 x 0.024) en 0.447 – (1.96 x 0.024)

Vraag 29 oefententamen:

Vergelijking interventiearm en controlearm.

Alle aftrekpunten van interventiearm bij elkaar optellen. Hetzelfde doe je voor de controlearm. Deze waarden trek je van elkaar af en dan heb je het verschil over 1 jaar. De vraag gaat over 10 jaar, dus moet je de waarde die je uiteindelijk had nog maal 10 doen om op het goede antwoord te krijgen.

Vraag 32 oefententamen:

Gevoeligheid is meer dat je kijkt of je twee keer dezelfde groep mensen bekijkt en of je dan ook twee keer hetzelfde meet. Validiteit is kijken of je meet wat je wil meten.

Eisen aan een vragenlijst: betrouwbaarheid (precisie van je instrument, is de meting betrouwbaar en meet je elke keer hetzelfde?), validiteit (meet ik wel wat ik zou willen weten?) en gevoeligheid/responsiviteit (op de powerpoint staat twee keer iets anders).

Vraag 37 oefententamen:

Het antwoord is b: goed voor de interne validiteit. Externe validiteit is hoe toepasbaar is het in de hele populatie. Interne validiteit kan je wel verhogen door meer mensen te nemen in je steekproef, dan wordt je geschatte gemiddelde nauwkeuriger.

Access:

Public

Join WorldSupporter!

Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Check more of topic:

Samenvattingen voor geneeskunde en gezondheidszorg

Universiteit Leiden en studieverenigingen

This content is used in:

Samenvattingen en studiehulp voor Geneeskunde Bachelor 3 aan de Universiteit Leiden

Going abroad?

Insure your way around the world

International expat insurances

Travel & Worldsupporter insurances (NL)

Study with summaries

Contributions: posts

Help other WorldSupporters with additions, improvements and tips

Spotlight: topics

Check the related and most recent topics and summaries:

Activities abroad, study fields and working areas:

Introduction to Global Health and Tropical Medicine

Samenvattingen, uittreksels, aantekeningen en oefenvragen bij Vraagstukken Kijken Denken Doen - UL - Studiebundel

Samenvattingen, aantekeningen en oefenvragen bij Vraagstukken Voortplanting, seksualiteit en Vroege Levensfasen - Geneeskunde UL - Studiebundel

Samenvattingen, uittreksels, aantekeningen en oefenvragen bij Vraagstukken Latere Levensfasen - Geneeskunde UL - Studiebundel

Oefenmateriaal bij het vak Vraagstukken Spoedeisende Zorg - Geneeskunde - B3 - UL

Oefenmateriaal Nefrologie & Urologie

Casuïstiekvragen over praktische geneeskunde

Lijn samenwerken en organisatie (College 1 t/m 6) - Geneeskunde - UL - Notes

Academische en Wetenschappelijke Vorming (AWV): Samenvattingen, uittreksels, aantekeningen en oefenvragen - UL

Samenvatting bij Veel Voorkomende Problemen - Geneeskunde - UL - Stof - 2013/14

Samenvatting bij Context Medisch Handelen - Geneeskunde - UL

Samenvatting bij Kind & Jongere - Geneeskunde - oud - UL

Ouderen geneeskunde en medische zorg voor senioren - Bundel

Samenvatting bij Praktische Onderzoeksvaardigheden - Geneeskunde - oud - UL

Samenvatting bij Veel Voorkomende Problemen - Geneeskunde - UL - Colleges (aanvulling) - 2013/14

Samenvatting bij Veel Voorkomende Problemen - Geneeskunde - UL - Colleges (deel 1) - 2013/14

Lees verder over Samenvattingen en studiehulp voor Geneeskunde Bachelor 3 aan de Universiteit Leiden
2734 keer gelezen

Check how to use summaries on WorldSupporter.org

Submenu: Summaries & Activities

Follow the author: Medicine Supporter

Work for WorldSupporter

JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Statistics

Search a summary, study help or student organization

Select any filter and click on Search to see results

	0	1	2
0	a	B	c	a + b + c
1	d	E	f	d + e + f
2	g	H	i	g + h + i
	a + d + g	b + e + h	c + f + i	Totaal

N	Se	95% bi
5	0.18	0.45 - 1.15
10	0.13	0.55 - 1.05
50	0.057	0.69 - 0.91
100	0.04	0.72 - 0.88

Samenvatting bij Praktische Onderzoeksvaardigheden - Geneeskunde - oud - UL

Thema 1: Ethische aspecten van klinisch wetenschappelijk onderzoek

Thema 2: Vragenlijstonderzoek

Artikel “Selecting, designing, and developing your questionnaire”, Boynton + e-extra’s

Artikel “Administering, analyzing, and reporting your questionnaire” Boynton

Thema 3: Kwaliteit van leven

Artikel: Assessment of post-stroke quality of life in cost-effectiveness studies: The usefulness of the Barthel Index and the EuroQoL-5D (van Exel et all.)

Artikel: agreement between patient and proxy assessments of health-related quality of life after stroke using the EQ-5D and health utilities index. (Pickard et al.)

Thema 4: Opzet van studie, bias en confounding

Hoofdstuk 3: ‘Risico op ziekte’

Hoofdstuk 6: ‘Opzet van onderzoek’

Hoofdstuk 8: ‘Experimenteel onderzoek’

Hoofdstuk 9: ‘Precisie en validiteit in epidemiologisch onderzoek’

Hoofdstuk 10: ‘Meten in epidemiologisch onderzoek’

Thema 5: Pragmatisch en economisch onderzoek

Artikel: Dwalingen in de methodologie. XII. Pragmatische en pathofysiologische trials: een kwestie van vraagstelling. (Algra en van der Graaf)

Artikel: Dwalingen in de methodologie. XXV. Uitkomstmaten, surrogaateindpunten en intermediaire maten. (M. Boers).

Thema 6: Statistiek

Topic 11: Betrouwbaarheidsintervallen

Topic 17: Hypothesen testen

Topic 18: Errors in hypothesis testing

Topic 36: Sample size calculations

Topic 37: Presenting results

Topic 39: Assessing agreement

Topic 44: Survival analyse

Thema 7: Verantwoord onderzoek

Collegeaantekeningen

HC Inleiding (maandag 5 januari 2015)

HC Vraagstelling en opzet van onderzoek (maandag 5 januari 2015)

HC Regulering en medisch ethische toetsing van wetenschappelijk onderzoek met mensen (maandag 5 januari 2015)

HC Studieprotocol (dinsdag 6 januari 2015)

HC Laboratoriumonderzoek (dinsdag 7 januari 2015)

HC Bias en confounding (dinsdag 6 januari 2015)

HC Onderzoek met gegevens uit registraties (dinsdag 6 januari 2015)

HC Zoeken naar literatuur deel 1 en 2 (woensdag 07 januari 2015)

HC Vragenlijst onderzoek (woensdag 7 januari 2015)

HC Kwaliteit van leven; beschrijving en waardering (woensdag 7 januari 2015)

RC Kwaliteit van leven; beschrijving en waarderen (donderdag 8 januari 2015)

HC Meten en reproduceerbaarheid (donderdag 8 januari 2015)

HC Pragmatisch en economisch onderzoek (donderdag 8 januari 2015)

HC Statistiek bij onderzoek deel 1 (donderdag 8 januari 2015)

HC Statistiek bij onderzoek deel 2 (donderdag 8 januari 2015)

HC Statistiek, survival, confounding deel 1

HC Statistiek, survival, confounding deel 2

HC Verantwoord onderzoek doen

HC Schrijven verslag

HC Problemen interpretatie

Responsiecollege

Samenvattingen voor geneeskunde en gezondheidszorg

Universiteit Leiden en studieverenigingen

Samenvattingen en studiehulp voor Geneeskunde Bachelor 3 aan de Universiteit Leiden

Contributions: posts

Add new contribution

Spotlight: topics

Samenvattingen voor geneeskunde en gezondheidszorg

Universiteit Leiden en studieverenigingen

Online access to all summaries, study notes en practice exams

How and why use WorldSupporter.org for your summaries and study assistance?

Using and finding summaries, notes and practice exams on JoHo WorldSupporter

Quicklinks to fields of study for summaries and study assistance