Summary and Study Notes - Advanced Research Methods and Statistics (2019/2020 - UU)
- 2364 keer gelezen
Logistische regressie. Kan een predictor/set van predictoren de kan op gebeurtenis Y voorspellen. Als voorbeeld: kunnen het aantal lessen, geslacht en leeftijd voorspellen of iemand wel/niet slaagt voor het rijexamen? Het doel van een lineaire regressie is het voorspellen van een interval of ratio variabele op basis van één of meerdere predictoren.
Odds. De verhouding tussen het deel dat wel gaat stemmen en wat niet gaat stemmen. De odds is het aantal keer 1 gedeeld door het aantal keer 0.
Odds ratio. Odds van sekse 1 (vrouw) gedeeld door odds van sekse 0 (man).
In dit college worden geen andere onderwerpen besproken dit niet worden behandeld in de literatuur.
Er worden geen recente ontwikkelingen besproken.
Op het tentamen moet je de output van een logistische regressie kunnen lezen en je moet zelf de kans, odds en odds ratio kunnen berekenen.
Er worden geen tentamenvragen behandeld.
Logistische regressie lijkt het meest op een lineaire regressie. Het heeft 1 afhankelijke variabele (dichotoom) en 1 of meer onafhankelijke variabele (minimaal interval of dummies). Het verschil met lineaire regressie is dat daar de afhankelijke variabele minimaal interval niveau moet hebben, maar bij logistische regressie moet het de variabele dichotoom is. Kan een predictor/set van predictoren de kan op gebeurtenis Y voorspellen. Als voorbeeld: kunnen het aantal lessen, geslacht en leeftijd voorspellen of iemand wel/niet slaagt voor het rijexamen? Het doel van een lineaire regressie is het voorspellen van een interval of ratio variabele op basis van één of meerdere predictoren.
Dichotome afhankelijke variabelen
Voorbeeld Y is stemmen (dichotoom), 0 = niet stemmen en 1 = wel stemmen. X is intelligentie (interval). In plaats van dat bij een lineaire regressie de residuen rondom de gehele regressielijn lopen, is er bij een logistische regressie maar een keuze uit 2 opties dus heb je maar op 2 punten residuen. We voorspellen niet de kans dat iemand 1 scoort maar een link-functie op die kans. Deze link-functie noemen we de logit link-functie. Deze functie is de log van de kans gedeeld door 1 minus de kans van de regressiefunctie.
Als er geen relatie is tussen X en de kans op Y, ziet de regressielijn eruit als een horizontale lijn.
Als er wel een relatie is, ziet de regressielijn eruit als een S-curve met twee asymptoten.
Hoe sterk de relatie is, kan worden afgelezen aan hoe steil de regressielijn omhooggaat.
Voorbeeld met SPSS
In de analyse wordt de variabele die een 1 krijgt altijd voorspelt. Let altijd goed op hoe de predictoren gedefinieerd worden als dummies. Er zijn drie belangrijke stukken informatie die vertellen of je model goed is:
| Frequentie |
No (tegen legalisatie) | 597 |
Yes (voor legalisatie) | 261 |
Totaalaantal mensen | 858 |
Kans voor legalisatie = aantal keer Y / totaal = 261 / 858 = 0.304
Odds voor legalisatie = aantal keer Y / aantal keer niet Y = 261 / 597 = 0.437. Dit betekent dat voor elke 0.44 voorstemmer is er 1 tegenstemmer. In SPSS is dit Exp(B).
Wanneer je nog geen predictoren hebt toegevoegd, dus je zit in je 0-model, dan wordt in je classificatie model je voorspelling bepaalt door de meerderheid. In dit geval zal je voorspelde classificatie voor iedereen nee zijn, omdat dit de meerderheid is. Het percentage rechtsonder geeft aan hoeveel je goed hebt geclassificeerd.
In Chi-toets kijk je naar of de toegevoegde predictoren significant zijn en bij nagelkerke R square voor de verklaarde variantie. Vuistregel voor grootte verklaarde variantie: klein is .01, medium = .09 en groot is .25. ook al is een predictor significant, in het classificatiemodel hoeft er nog geen verandering te zijn wanneer het nog niet over de grenswaarde is gekomen. Wanneer de Exp(B) kleiner is dan 1 betekent dit een omgekeerd effect. Dus bij het toevoegen van sekse (man = 1, vrouw = 0), met een odds van 1.5, betekent dit dat de odds dat mannen voor legalisatie zijn 1.5 keer groter is dan de odds dat vrouwen voor legalisatie zijn. B-waarden geven aan of de relatie positief of negatief is. Alle predictoren zijn niet gestandaardiseerd, dus je kan niets zeggen over wat de belangrijkste predictor is.
Significantie op basis van 95% CI
Odds ratio = 1, betekent dat er geen relatie is tussen de predictor en DV. Wanneer de waarde 1 wel in het CI valt, is het niet significant. Wanneer de waarde 1 niet in het interval is, is het een significante odds ratio.
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
In dit bundel vind je de summary and study notes en de hoorcollege aantekeningen van de cursus ARMS van het jaar 2019/2020. Vanwege de Corona crisis zijn de laatste hoorcolleges herhalingen van vorig jaar. Dit betreft het hoorcollege logistische regressie, systematische
...There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Main summaries home pages:
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
2044 |
Add new contribution