Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
Een kans is een getal tussen 0 en 100% dat weergeeft hoe waarschijnlijk iets is. Deze kans stijgt als een test positief is, en daalt als een test negatief is. Belangrijke termen zijn:
Op een polikliniek chirurgie komt een jonge patiënt, die sinds een halve dag buikpijn heeft. De pijn is heftig, continue en gelokaliseerd op het punt van McBurney. De dokter denkt aan appendicitis acuta:
Positieve testuitslagen kunnen terecht positief (TP) of fout positief (FP) zijn:
Deze gegevens kunnen gezet worden in een 2x2 tabel:
| Appendicitis | Geen appendicitis | Totaal |
Wel pijn MB | 18% | 12% | 30% |
Geen pijn MB | 2% (0,1 x 0,2) | 68% (0,85 x 0,8) | 70% |
Totaal | 20% | 80% | 100% |
De achterafkans na een positieve test is 18% van 30% → 60% kans. De kans dat de patiënt appendicitis heeft is 60%. Dit heeft ook wel de positief voorspellende waarde:
De negatief voorspellende waarde is de kans dat ziekte afwezig is, gegeven de negatieve testuitslag:
Thomas Bayes (1701-1761) was een Engelse dominee en wiskundige. Hij is bekend geworden door zijn theorema over conditionele kansen:
Een kans kan beschreven worden als “odds”:
De likelihood ratio van een testuitslag zegt hoeveel maal vaker de testuitslag voorkomt bij mensen met ziekte dan bij mensen zonder ziekte:
Op basis hiervan maakte Bayes een theorema voor de achteraf-odds van ziekte:
De achteraf-odds op ziekte is dus gelijk aan de vooraf-odds op ziekte maal de likelihood ratio. Het lastige van deze formule is dat deze in termen van odds is → de formule wordt daarom vaak omgeschreven in termen van kansen:
Verschillende factoren beïnvloeden de formule van Bayes:
Hierdoor geeft Bayes het correcte midden tussen 2 uitersten:
Ook met een nomogram wordt de formule van Bayes toegepast, maar door lijntjes te trekken in plaats van te berekenen. Dit werkt als volgt:
De formule van Bayes kan ook toegepast worden door het verschil van odds en kansen te negeren. Voor lage kansen geldt bij benadering:
Een voordeel is dat hiermee een snelle indicatie gegeven kan worden. Echter overschat deze benadering de verandering tussen de voorafkans en achterafkans en is alleen nauwkeurig voor kleine kansen tot 10%.
Dichotome testen zin testen die 2 uitslagen kunnen hebben → positief of negatief. Niet-dichotome testen:
Labuitslagen zijn continu. De verdeling van deze labuitslagen verschillen voor zieken en niet-zieken. Dit kan vastgesteld worden door:
Diagnostiek is vaak niet-dichotoom → de begrippen sensitiviteit en specificiteit zijn niet te gebruiken. Echter is behandeling vaak wel dichoom → de patiënt wordt of wel, of niet, behandeld. Om te bepalen of de patiënt ziek is kunnen 2 dingen gedaan worden:
De gedachte achter een ROC-curve is dat hoewel labwaarden niet dichotoom zijn, ze wel dichotoom gemaakt kunnen worden door een grenswaarde in te stellen → 1 kant van de grenswaarde is normaal (niet ziek), de andere kant is abnormaal (wel ziek). Afhankelijk van de gekozen grenswaarde ontstaat er een sensitiviteit en een specificiteit → niet iedereen boven de grenswaarde is ziek en niet iedereen onder de grenswaarde is niet ziek.
De ROC-curve ontstaat als de sensitiviteit en specificiteit tegen elkaar worden gezet in een figuur met op de X-as de fout-positieven en op de Y-as de terecht positieven:
De sensitiviteit en specificiteit zijn dus omgekeerd evenredig. De meeste testen liggen tussen het midden en linksbovenin.
Op basis van een ROC-curve kan gezien worden hoe goed een test is → het is een maat voor het onderscheidend vermogen van een test, onafhankelijk van de grenswaarde:
Het optimale punt op de ROC-curve is afhankelijk van de soort ziekte/diagnose. Over het algemeen geldt:
Het optimale afkappunt voor een testuitslag is dus nog onbepaald en afhankelijk van zowel de voorafkans als uitkomsten (het vooral niet willen missen of vooral niet willen lastigvallen).
Een tweede manier om om te gaan met niet-dichotome testen is met behulp van likelihood ratio’s. Per testuitslag wordt het volgende gedaan:
Het voordeel hiervaan is dat dichotomiseren niet nodig is → formules met sensitiviteit en specificiteit zijn niet nodig. Iedere testuitslag heeft zijn eigen likelihood ratio, bijvoorbeeld:
Vervolgens kan met deze ratio’s de achterafkans berekend worden. In het geval dat de voorafkans op een tumor 5% is, wordt de formule van Bayes als volgt ingevuld:
Bij een voldoende hoge achterafkans wordt de behandeling ingezet. Echter is het optimale afkappunt voor de achterafkans nog onbepaald → niet meer afhankelijk van de voorafkans, maar wel nog afhankelijk van de uitkomsten.
The ultimate goal of medical research is to improve medical practice. There are different aspects of medical practice which form 4 classes of medical research:
Research questions arise in practice. It is important to particularly articulate a research question → they are the starting point when designing a study or when reading a paper. A research question should be answerable and have standard elements/components.
Research questions can consist of several types of standard components:
Examples of research questions are:
ReDuCe is a new diuretic drug for patients with hypertension. Its effect has to be studied → a research question has to be made:
After 6 weeks of treatment, a patient prescribed with ReDuCe has a normalized blood pressure → the effect. However, this effect can have several causes:
The outcome is a combination of 4 phenomena:
Therefore, outcome = T + NC + EF + V. The interest mainly lies in the effect of the treatment (T):
To identify the effect of treatment, 2 (or more) groups need to be compared. These groups should be comparable with respect to NC, EF and V, and differ only with respect to treatment. In this case, an observed difference in the outcome between the groups can be attributed to the only aspects that the 2 groups differ on → the treatment. Comparability is necessary.
A randomized controlled trial is the number 1 design to achieve comparability. In order to achieve comparability, an RCT typically has 3 design elements:
In medical papers, there often is a statistical analysis paragraph with a motivation of the number of people in a sample of a study.
The aim of an RCT is to compare 2 treatments → patients are recruited to the study and randomized to treatment A or B. It also needs to be determined how many patients are included in the RCT → the sample size:
Factors for deciding sample size are:
Hypothesis testing yields P-values and statements of statistic significance. Hypothesis testing is done as follows:
However, mistakes can be made in hypothesis testing. H0is rejected in case the observations are unlikely to occur if H0is true, and not if they are impossible:
The power is the probability of finding a significant effect in a sample when the effect is really present in the population. This depends on:
The aim is to have a study with a large power of 80-90%.
There is an RCT on patients with high blood pressure:
In order to calculate the optimal sample size of this trial, some extra information is necessary:
Medical research almost always requires collection of data. Study design described how is the study set up and how the data are collected. There are 2 types of study design:
A cohort is a group of people with a common characteristic (gender, diabetes, age, etc.). A cohort study follows such a group over time and records certain outcomes in a follow-up study or longitudinal study. Usually, 2 or more groups are compared. For instance, with patients who are hospitalized for Covid-19, there is a follow-up, record of the mortality and comparison of chloroquine treatment versus no chloroquine treatment.
Cohort studies are often simplified in tables. An example is the association between smoking and lung cancer:
| Cases | N |
Exposed | A | N1 |
Unexposed | B | N0 |
| Cases | N |
Smokers | 1600 | 100 000 |
Unexposed | 400 | 200 000 |
| Cases | T |
Exposed | A | T1 |
Unexposed | B | T0 |
| Cases | N |
Exposed | 1600 | 300 000 |
Unexposed | 400 | 600 000 |
With a cohort, the risk/rate can be estimated:
There are several differences between a cohort and a dynamic population:
In a case control study, instead of a census (information about everybody), sampling is done. The cases are compared to a sample of the entire population. This happens as follows:
A case-control study is very efficient compared to a cohort study:
Case-control studies do not allow for:
The odds ratio is the ratio of odds of exposure among cases and odds of exposure among controls. It is the only measure that can be estimated with a case control study.
Case-control | Cases | Controls |
Exposed | a | c |
Unexposed | b | d |
The following calculations can be done:
The interpretation of the odds ratio depends on how the control study is done and what the controls represent. How this can be interpreted depends on the moment of sampling controls. Moments of sampling controls are:
Controls can represent various things, such as:
Case-control | Cases | Non-cases | N | Person time |
Exposed | A | C | N1(A+C) | T1 |
Unexposed | B | D | N0(B+D) | T0 |
In this case, non-cases (those who did not develop the outcome of interest) are sampled → the controls represent the non-cases in the cohort study:
Medical research often consists of the quantification of a phenomenon, for example quantifying the effect of cholesterol lowering treatment on the risk of cardiovascular events among those with elevated serum cholesterol levels. Ideally, results apply not only to those who participate in the study (the study population/sample), but also to others with elevated cholesterol levels (the domain).
The domain consists of a large group for whom the results of the study should apply. Of this domain, a sample is selected based on:
While the study is done within this sample, the results of the study should apply to the domain. If there is a systematic error, results of the study do not apply to the domain.
Systematic errors in design, conduct or analysis may lead to erroneous results → bias. An example of a systematic error is a broken measuring tape when measuring the length of something. Each time the measuring tape is used, results are incorrect → a systematic error is not solved by a large sample size.
Random errors can be decreased by increasing the sample size. As the study size increases, random errors start playing a increasingly smaller role.
There are 3 sources of bias:
There can be bias in different parts of studies, depending on the study type:
Examples of measurement errors are:
This changes the risk ratio → results of the study are (often) incorrect.
Measurement errors can have different consequences:
In case of missing data, certain information is not available:
The extent of the impact of missing data often depends on the research question, study design, data collection, etc. This changes the risk ratio → a small percentage of missing data (3%) can lead to 100% bias, but this doesn’t necessarily happen → 50% missing data can also result in no bias (the ratio remains the same). Depending on if it is a selective or random process, missing data has a different influence on the results.
Selection bias arises when in either of the exposure groups, a selection was made on stroke. Selecting on the outcome in a follow-up study hardly ever occurs since the participants have not yet developed the outcome at the start of follow-up.
Survival is used to determine when a certain event happens, such as:
Possible questions that can be answered with survival analysis are:
For patients with end stage renal disease, it needs to be determined which treatment gives better survival:
Survival probabilities and survival times after start of dialysis can possibly be compared with help of T-tests of Chi square tests. However, there are several problems:
Because the time of death of all patients isn’t known, some patients have censored survival times. In an ideal world, patients that are still alive in each group are compared after a certain time period. However, some patients may be lost to follow-up. This can be solved by censoring survival times → the time of event (e.g. death) is not observed, it is only known when the patient was last seen alive. Reasons for censoring are:
In the peritoneal dialysis group, 207 patients died and 446 are still alive and were last seen between 0,8 and 5 years after the start of dialysis → the follow-up varies. Not only the data of the 207 patients should be used because it is very informative that someone is still alive after 5 years → all patients must be used.
This can be shown in a graph with on the y-axis the a line for each patient, with the length of the line corresponding to the time after start of dialysis on the x-axis. Red dots indicate that the patient has died, green dots indicate that the patient is still alive or, if the dots are before the time of measurement, that the patient was lost to follow-up.
The aim of survival analysis is to estimate the survival function S(t):
Survival probabilities can be estimated with the Kaplan-Meier method. Information of each patient is used until death/censoring, for instance the information
.....read moreStatistics consists of making statements about a population based on data observed from a sample. This is often done using means and standard deviations (σ). The bigger the standard deviation, the bigger the spread in the population.
For example, the lung function (FEV1 in L) of 40 children is measured:
This means that roughly 95% of the population has a FEV1 between 3,16 – 0,82 and 3,19 + 0,82 L → approximately 95% of observations are less than 2σ from the mean:
However, lung function depends on many factors such as age and gender. These factors also need to be taken into account.
Simple linear regression is regression for continuous outcomes. Linear regression tries to predict or explain a variable → the outcome or the dependent variable (x). This variable is explained by another variable → the explanatory variable (y). A regression line is based on a scatter plot and calculates the mean value of “y” for a value of “x”:
For instance, a regression line can describe the mean FEV1 as function of age:
This means that for 2 children with an age difference of 1 year, the expected mean difference in the FEV1 is 0,119 L.
Observations of (x1, y1), (x2, y2), …, (xn, yn) show that each pair represents the values of 1 person. Sometimes, the error can also be taken into account:
The deviations of the regression line are called residuals, which are taken into the error. The error/residual is assumed to be normally distributed with the standard deviation σ. σ indicates how much the observations vary around the regression line:
The residual is the distance from a single observation to the regression line → the difference between what is observed and what is predicted:
The unknown true regression line in the population is line y = β0+ β1x. Using the least squares method, the regression line can be estimated by y = b0+ b1x. The b0and b1which minimize the sum of squared residuals need to be selected:
.....read moreEen kans is een getal tussen 0 en 100% dat weergeeft hoe waarschijnlijk iets is. Deze kans stijgt als een test positief is, en daalt als een test negatief is. Belangrijke termen zijn:
Op een polikliniek chirurgie komt een jonge patiënt, die sinds een halve dag buikpijn heeft. De pijn is heftig, continue en gelokaliseerd op het punt van McBurney. De dokter denkt aan appendicitis acuta:
Positieve testuitslagen kunnen terecht positief (TP) of fout positief (FP) zijn:
Deze gegevens kunnen gezet worden in een 2x2 tabel:
| Appendicitis | Geen appendicitis | Totaal |
Wel pijn MB | 18% | 12% | 30% |
Geen pijn MB | 2% (0,1 x 0,2) | 68% (0,85 x 0,8) | 70% |
Totaal | 20% | 80% | 100% |
De achterafkans na een positieve test is 18% van 30% → 60% kans. De kans dat de patiënt appendicitis heeft is 60%. Dit heeft ook wel de positief voorspellende waarde:
De negatief voorspellende waarde is de kans dat ziekte afwezig is, gegeven de negatieve testuitslag:
Thomas Bayes (1701-1761) was een Engelse dominee en wiskundige. Hij is bekend geworden door zijn theorema over conditionele kansen:
Een kans kan beschreven worden als “odds”:
Een beslisboom bestaat uit takken met beslisknopen en eindknopen. Een voorbeeld is het drie deuren probleem, waarbij achter 1 deur een auto staat. Vervolgens wordt van 1 deur bekend wordt dat deze fout is waardoor de kans 50% is dat achter 1 van de overgebleven deuren het goede zit. Vervolgens kan de persoon die voor 1 van de overgebleven 2 deuren staat besluiten om wel of niet te wisselen. Voor beide opties zijn 2 mogelijkheden:
Dit zijn de kansen vóór het wisselen. Deze analyse laat zien dat in het geval dat er niet gewisseld wordt, de kans op het winnen van de auto 1/3 is, terwijl als er wel gewisseld wordt, de kans 2/3 is.
Spijt ontstaat als de persoon eerst goed stond, en daarna wisselde waardoor de auto alsnog niet is gewonnen.
Een aantal opmerkingen bij het 3-deuren probleem zijn:
Met beslisbomen kunnen problemen geanalyseerd worden:
Over het algemeen is de verwachtingswaarde ongeveer “het midden” → in een continue of normale verdeling is de verwachtingswaarde de mediaan. Echter is de uitkomst bij beslisbomen niet continu → er zijn meerdere mogelijkheden. Zo zijn er bij het gooien van een dobbelsteen 6 mogelijkheden, die allemaal een kans van 1/6 hebben. De verwachtingswaarde van een dobbelsteenworp is daarom:
De verwachtingswaarde is niet hetzelfde als het gemiddelde → de verwachtingswaarde is een begrip uit de kansrekening en het gemiddelde is een begrip uit de statistiek:
De behandeldrempel beantwoord de klinische vraag: “Hoe zeker moet ik zijn van de ziekte, voordat ik overga tot behandeling, wetende dat elke behandeling zowel voor- als nadelen heeft?”
Elke behandeling heeft voor- en nadelen. De consequenties van een behandeling bepalen wanneer een behandeling wordt ingezet → er wordt gekeken naar de balans tussen de voor- en nadelen:
Het volgende geldt:
Bij de behandeldrempel is de baat gelijk aan de kosten.
De baat en kosten zijn ook zichtbaar in de beslisboom, bijvoorbeeld over AAAA:
In dit geval is de baat 40% - 0% = 40%, en zijn de kosten 100% - 95% = 5%.
Elke beslissing heeft zijn eigen uitkomst → elke uitkomst heeft een “utility” (waarde of nut):
Hiermee kunnen de baten en kosten berekend worden:
De “expected utility” (EU) is de verwachtingswaarde van het nut van de 2 mogelijke strategieën:
Door EU (wel behandelen) gelijk te stellen aan EU (niet behandelen), kan berekend worden wanneer het even goed is om wel/niet te behandelen:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Field of study
Add new contribution