
Aantekeningen hoorcollege 3 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
H C 3 - 4 M E I 2 0 2 3
Regressie
SLR = simple linear regression
MLR = multiple linear regression
Significantie
- Om te testen of de lineaire relatie ook significant is, zijn er twee toetsen om uit te voeren:
- Toets 1: toets voor de helling (hoe schuin de lijn loopt) » bepaald of de ‘helling’ significant anders is dan nul
- Dit kun je testen door een t-toets
- De resultaten zijn te vinden in de output
- toets 2: toets voor de verklaarde variantie » de toets bepaald of de proportie van bepaalde variantie significant groter is dan nul
- Het kan worden getest door middel van een F-toets
- Resultaten zijn te vinden in de output
- Toets 1: toets voor de helling (hoe schuin de lijn loopt) » bepaald of de ‘helling’ significant anders is dan nul
- Gebruik van alfa is een keuze. Een keuze om een nul-hypothese op basis van de ingestelde alfa wel of niet te verwerpen. Daardoor kunnen er onterecht nulhypotheses verworpen worden.
Coëfficiënten (SLR)
- Bij SLR is de gestandaardiseerde regressiecoëfficiënt bèta gelijk aan de correlatiecoëfficiënt r
- Het meet de toename/afname van Y in standaarddeviaties (standaardafwijkingen) wanneer X met 1 SD toeneemt.
- Voorbeeld 1: E+ of E- staat voor de decimaal zoveel plekken naar voren of naar achteren schuiven (dat zou een heleboel decimalen geven dus daarom wordt het zo neergezet)
Aannames over lineaire regressiemodellen
Validiteit: past je data bij je onderzoeksvraag? Wanneer dit niet het geval is ben je eigenlijk iets anders aan het meten
- Er is een lineaire relatie tussen IV en DV
- IV en DV zijn beide op interval/ratio niveau
- De residuen zijn normaal verdeeld » dit kun je checken d.m.v. een histogram van de residuen
- De residuen zijn gelijk verdeeld (homoscedasticiteit)
- Dit betekent dat er overal langs de regressielijn sprake moet zijn van gelijke spreiding van de restanten/residuen.
- Je kunt dit checken door een spreidingsdiagram van de residuen (op de y-as) en x-variabele of voorspelde waarde op de x-as
- Er moeten geen uitschieters zijn (je moet voorzichtig zijn met wat je een uitschieter noemt) » ze zijn niet goed voor het statistisch model maar kan soms wel horen bij de populatie/doelgroep die je onderzoekt
Homoscedasticiteit vs. heteroscedasticiteit
- homoscedasticiteit: gelijke verdeling van residuen (geen waarneembaar patroon)
- heteroscedasticiteit: verdeling van de residuen heeft de vorm van een vlinderdas of trechtervorm (op z'n kant)
Meervoudige lineaire regressie
- In een regressiemodel kunnen we meerdere variabelen toevoegen
- Dit schrijf je als:
- De regressievergelijking wordt op dezelfde manier bepaald
Een paar dingen om te weten
- Het toevoegen van meer onafhankelijke variabelen (voorspellers) aan een model zal altijd:
- Meer van de variatie van de afhankelijke variabele verklaren
- De gemiddelde voorspellingsfout verminderen
- Met meer voorspellers zal R2 altijd toenemen
- Het toevoegen van meer voorspellers zal niet altijd:
- Leiden tot een beter model
- Betekenen dat deze voorspellers significant zijn
- Met meer voorspellers zal de SE (standaardfout) altijd afnemen want de nauwkeurigheid van de voorspellers neemt toe
- De toename in R2 en de afname van de SE zullen niet altijd significante veranderingen zijn
- De significantie van individuele voorspellers kan getest worden door gebruik te maken van een t-toets in de output
Coëfficiënten (MLR)
- Gestandaardiseerde regressiecoëfficiënten zetten variabelen op dezelfde schaal (SD’s)
- De grootste gestandaardiseerde coëfficiënt wijst op de voorspeller met de meeste impact
Significantie (MLR)
Het testen van significantie in MLR werkt een beetje anders:
- Toets 1: toets voor de verklaarde variantie
- Dezelfde toets als bij SLR
- Het is een toets om de significantie te meten van het hele model (met alle voorspellers)
- Toets 2: toets voor de ‘helling’
- Het is een toets om de significantie van een enkele voorspeller te meten (dus één per keer)
- Het kan worden gebruikt om het model te verbeteren
- Spaarzaam/zuinig
- Zo nauwkeurig maar tegelijk zo makkelijk mogelijk
Toets voor een enkele voorspeller
- De test bepaald of de regressiecoëfficiënt voor één voorspeller significant anders is dan nul
- Dit kan worden getest door een t-toets
- De resultaten kunnen worden gevonden in de output
- Als een voorspeller niet significant is in het model, kan een eenvoudiger model worden gebruikt zonder die voorspeller. Maar doe dit slechts één voor één! Verwijder nooit meerdere variabelen tegelijk op basis van de t-test.
Aannames
- De aannames voor MLR zijn hetzelfde voor die van SLR
- De aannames kunnen gecheckt worden door middel van grafieken (bijv. een histogram van de residuen om de aanname van normaalverdeling te controleren)
Hoorcollege aantekeningen - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 1 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 2 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 3 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 4 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 5 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 6 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 7 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 8 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 10 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 11 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 12 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
- Aantekeningen hoorcollege 13 - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)

Contributions: posts
Spotlight: topics
Hoorcollege aantekeningen - Toepassing van Onderzoeksmethoden en Statistiek - Universiteit Utrecht (2022/2023)
In deze bundel zijn alle hoorcolleges te vinden van het vak 'Toepassing van Onderzoeksmethoden en Statistiek'. De colleges worden in het Nederlands gegeven, maar de slides zijn in het Engels. Zodoende zullen er in de aantekeningen ook regelmatig Engelse termen te vinden zijn
...JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Add new contribution