Hoorcollegeaantekeningen 5-7

Deze samenvatting is gebaseerd op het studiejaar 2013-2014.


College 5: MANOVA en descriptieve DA

Overzicht MVDA deel 2

In deel 1 wilden we één afhankelijke variabele Y voorspellen uit een aantal onafhankelijke variabelen X. Alleen de meetniveaus varieerden. In deel 2 gaan we elke keer wat anders doen.

 

Bij MANOVA willen we een set van intervalvariabelen zo goed mogelijk voorspellen met behulp van een indeling in groepen. Bij RMA (college 6) willen we gemiddelden vergelijken op verschillende variabelen binnen dezelfde groep. Met mediatie-analyse (college 7) gaan we het hebben over kleine causale modellen met een causale factor.

 

MANOVA: wanneer, waarvoor?

MANOVA is redelijk overzichtelijk: we hebben een heleboel afhankelijke intervalvariabelen (p) die we voorspellen uit één of meer nominale variabelen verdeeld over k groepen. Dit wordt multivariate variantie-analyse genoemd. We zijn bezig met de vergelijking van gemiddelden, maar we bekijken nu meerdere variabelen tegelijk in een onderlinge samenhang (= multivariaat). Let op: bij onafhankelijke variabelen maak je het onderscheid in een- twee- drieweg enzovoorts.

Overzicht:

ANOVA: één afhankelijke variabele

MANOVA: twee of meer afhankelijke variabelen

Aantal onafhankelijke variabelen wordt aangegeven met eenweg, tweeweg of drieweg.

 

We zouden ook meerdere ANOVA’s kunnen doen in plaats van één MANOVA. Waarom doen we dat dan niet? Er zijn twee problemen:

  1. Je krijgt meerdere F-toetsen waardoor de kans op type-I fouten te groot wordt.

  2. Bij meerdere ANOVA’s houd je geen rekeningen met de onderlinge relaties tussen de afhankelijke variabelen

 

Multivariate toetsen

H0: het gemiddelde van groep 1 op variabele 1 is gelijk aan het gemiddelde van groep 2 op variabele 1 is gelijk aan het gemiddelde van groep k op variabele 1. Als de nulhypothese klopt hebben alle groepen per variabele dus hetzelfde gemiddelde.

De nulhypothese kan worden getoetst met de multivariate toetsen Wilks, Pillai’s, Hotellings en Roys. Dit zijn allen zinvolle en goed verdedigbare manieren om de nulhypothese te toetsen. Welke de beste is, weten we niet. Ze geven echter niet altijd alle vier gelijke antwoorden. Als de multivariate toetsen niet significant zijn, handhaaf je de nulhypothese. Bij significante multivariate toetsen moet je de alternatieve hypothese aannemen en de nulhypothese verwerpen.

Wanneer je de alternatieve hypothese aanneemt weet je dat er op tenminste één afhankelijke variabele minstens één verschil is tussen twee groepsgemiddelden. Dit is nog niet heel veel informatie. Je moet dus verder zoeken. Dit kan op vier verschillende manieren, waaronder de Protected F benadering en de Descriptieve discriminant-analyse. Alleen deze twee worden besproken.

 

Protected F benadering

Als je meerdere univariate ANOVA’s doet, wordt de kans op type-I fouten nogal groot. Dat is niet de bedoeling. Wanneer je het als een tweestaps procedure doet, helpt dit tot op zekere hoogte. Je doet eerst een multivariate toets en zodra deze significant is, ga je pas een univariate toets doen. De univariate toetsen worden als het ware beschermd door de multivariate toetsen.

Voordat je aan alles begint, moet je de assumpties checken. Daarna inspecteer je de multivariate toetsen, als deze significant zijn kijk je naar de univariate toetsen en alleen bij variabelen met een significate univariate F-waarde vergelijk je de gemiddelden.

Er is inmiddels ook kritiek op de Protected F benadering gekomen: de bescherming door de multivariate toetsen is onvoldoende. De bescherming is slechts gedeeltelijk en ontoereikend. Toch wordt hier in de praktijk weinig mee gedaan.

 

Assumpties

Multivariate normaliteit: elk van de afhankelijke variabelen is normaal verdeeld en is ook normaal verdeeld voor alle mogelijke combinaties van waarden voor de andere afhankelijke variabelen. Als geldt n > 20 per cel, hoef je je geen zorgen te maken wat betreft deze assumptie.

Homogeniteit van de variantie-covariantiematrices: er moet sprake zijn van gelijke varianties én gelijke covarianties in alle groepen. Als de groepen ongeveer even groot zijn, heb je hier weinig last van (nmin / nmax

Onafhankelijke errors: de error van de ene persoon mag niets zeggen over de error van de andere persoon (onafhankelijk van tot welke groepen de personen behoren). Om de assumtpie te checken moet je voornamelijk kijken naar de onderzoeksopzet.

 

MANOVA in SPSS

Bekijk slide 9 t/m 12 voor een SPSS voorbeeld van MANOVA/Protected F.

 

Uitbreidingen van MANOVA

MANOVA kan op verschillende manieren worden uitgebreid. Zo kun je een meerweg MANOVA of een MANCOVA uitvoeren. Alles wat je met ANOVA kan, kun je eigenlijk ook met MANOVA. Elke uitbreiding krijgt wel een eigen multivariate toets.

 

DA: descriptief of predictief

Discriminantanalyse (DA) is een omgekeerde MANOVA. Op basis van p (twee of meer) intervalvariabelen wil je een zo goed mogelijk onderscheid maken tussen k groepen (meer dan twee).

Er bestaan twee varianten: descriptieve DA (je wilt een zo goed mogelijke multivariate beschrijving geven van de verschillen tussen de groepen) en predictieve DA (je wilt zo goed mogelijk kunnen voorspellen tot welke groep een persoon eigenlijk hoort). De predictieve DA wordt verder bij psychometrie besproken, bij MVDA hebben we het enkel over descriptie DA.

MANOVA en DA zijn volledig gelijk wat betreft multivariate toetsen en discriminantfunctievariaten. Het enige verschil tussen MANOVA en DA is dat de X en Y verwisseld zijn.

 

Discriminantfunctievariaten

Discriminantfunctievariaten zijn lineaire combinaties van de intervalvariabelen:

Dj = b1jY1 + … + bpjYp

De gewichten van de eerste discriminantfunctievariaat worden zo gekozen dat er een maximaal onderscheid kan bestaan tussen de k groepen. Bij de tweede discriminantfunctievariaat gebeurt dit ook, maar mag de tweede variaat in zijn geheel niet gecorreleerd zijn met de eerste variaat (= orthogonaal). Dit geldt ook voor de derde variaat etc.

Het maximum aantal discriminantfunctievariaten is of k groepen – 1 of p (kies de kleinste).

imax = min (k – 1, p).

Discriminantfunctievariaten kunnen worden gezien als een soort onderliggende dimensies voor zover ze onderscheid tussen groepen laten zien.

 

Descriptieve DA

Als de multivariate toets significant is, kun je descriptieve DA gebruiken als alternatief voor de Protected F benadering.

Er zijn drie hoofdstappen:

  1. Bereken het aantal discriminantfunctievariaten die voldoende verklaarde variantie hebben en die te interpreteren zijn.

  2. Interpreteer de discriminantfunctievariaten.

  3. Bepaal de positie van groepen op de discriminantfunctievariaten. Voor elke groep op elke variaat vervang je hiervoor de Y’s in de formule van Dj door de groepsgemiddelden.

Bekijk voor een rekenvoorbeeld van stap 3 slide 21 (let op: deze vraag komt regelmatig terug op het tentamen!).

 

SPSS-voorbeeld

Bekijk slides 22 t/m 25 voor een SPSS-voorbeeld van descriptieve DA.

Eigenwaarde: de proportie verklaarde variantie van wat er verklaard wordt (en niet van het totaal!).

Plaatje (slide 26): de lengte van de vectoren (pijlen) bepaalt het belang van de vector (hoe langer, hoe belangrijker).

Descriptieve DA heeft een paar beperkingen:

  • Descriptieve DA werkt alleen bij goed interpreteerbare discriminantfunctievariaten.

  • Multivariate verschillen tussen groepen zou je graag willen toetsen, maar dit kan niet met SPSS.

 

College 6: Repeated measures ANOVA

 

1. Wanneer, waarvoor?

We hebben het alleen over herhaalde metingen van intervalvariabelen. Er zijn vier soorten situaties met herhaalde metingen:

  • Tijdreeks (hoe ontwikkelt de variabele zich over de tijd?)

  • Herhaalde metingen experiment (elke proefpersoon doorloopt verschillende condities waarbij er een identieke meting is: je vergelijkt mensen met zichzelf > maximale statistische power)

  • Gemeenschappelijke meetlat (er wordt eigenlijk niets herhaald, maar er wordt bij elke antwoordcatagorie dezelfde antwoordschaal gebruikt, waardoor je de gemiddelden met elkaar kunt vergelijken)

  • Paren of groepen (we willen gemiddelden of groepen met elkaar vergelijken, maar onze observaties zijn niet meer onafhankelijk van elkaar. De observaties zijn dus gecorreleerd aan elkaar. Je gebruikt dan paren als groepen als observatie-eenheden en binnen die paren of groepen behandel je de verschillende observaties als verschillende variabelen)

 

Bij zowel RMA als gewone ANOVA gaat het om het vergelijken van gemiddelden. Het enige verschil is dat je geen gemiddelden uit verschillende groepen met elkaar vergelijkt. Binnen één groep vergelijk je de verschillen op de verschillende variabelen.

Gewone ANOVA: X (nom) > Y (int)

Dit is een between subjects design.

RMA: Y1 … Y2 … Yp

Dit is een within subjects design.

 

2. Mogelijkheden en problemen

In de meeste situaties hebben we niet per se een keuze, maar dicteren de gegevens die we hebben wat we moeten doen. De keuze heb je alleen als je een experiment uitvoert. Een RMA experiment is hierbij heel handig, je vergelijk mensen gewoon met zichzelf (within subjects), hier wordt de power groter van. Maar waarom doen we dat dan niet altijd?

  • Volgorde effect (latency). Eerdere metingen hebben een blijvend effect van een vroege meting op latere metingen.

  • Carry-over effect. Een eerdere meting heeft tijdelijke effecten op latere metingen.

Het volgorde effect kun je neutraliseren door counterbalancing. De ene groep proefpersonen krijgt dan bijvoorbeeld eerst conditie A en dan B, terwijl de andere groep proefpersonen eerst conditia B en dan conditie A krijgt. Wanneer je een sterk latency effect verwacht, is het vaak beter om een between subjects design te hanteren.

Het carry-over effect kun je makkelijker tegengaan door simpelweg de tijd tussen de metingen lang genoeg te maken.

 

3. Twee benaderingen

H0: μ1 = μ2 = μp

p = aantal afhankelijke variabelen

 

De nulhypothese lijkt op die van de gewone ANOVA, maar er zijn problemen op twee niveaus:

  • De meetniveaus zijn verschillend (maar dit is op te lossen).

  • Bij herhaalde metingen zijn de errors niet onafhankelijk maar gecorreleerd. Dit is voor ANOVA een belangrijke aanname.

Het probleem van de gecorreleerde errors is op twee manieren op te lossen. Welke manier het beste is weten we niet en soms kunnen ze totaal andere uitkomsten hebben. De eerste manier is de univeariate benadering van herhaalde metingen. Je voert een gewone ANOVA uit en daarvóór (als stap 0) filter je de individuele verschillen uit de error. De errorterm is dan zuiver.

De tweede manier wordt uitgebreider besproken: de multivariate benadering van herhaalde metingen. Dit lijkt op MANOVA, maar we kijken niet alleen naar de pure afhankelijke variabelen maar naar de contrasten van de afhankelijke variabelen.

 

4. Contrasten

Bij een gewone ANOVA voer je post hoc toetsen uit wanneer de F-toets significant is. Een alternatief voor de post hoc toetsen is de planned comparisons (= contrastanalyse). Van tevoren bepaalt de onderzoeker welke gemiddelden hij met elkaar vergelijkt (op basis van de theorie): contrasten. Wanneer dit goed wordt gekozen leidt dit tot minder toetsen en een mogelijkheid op orthogonale toetsen.

 

Definitie van het contrast:

L = c1Y1 + c2Y2 + … + cpYp

Er geldt: Σci = 0

 

De onderzoeker kies de gewichten op zo’n manier dat het past bij de hypothesen die getoetst moeten worden.

Bekijk slide 9 voor een voorbeeld. Hier zijn vier variabelen (meting 1, 2, 3 en 4). Het eerste contrast La geeft aan dat het gemiddelde van Y1 vergeleken moet worden met het gemiddelde van Y2. La zegt dan ook 1xY1 –1xY2 en 0 x Y3 en Y4. Y3 en Y4 worden nu dus niet meegenomen.

Lb geeft aan dat Y1 wordt vergeleken met het gemiddelde Y2 en Y3.

Het gemiddelden van een contrast is het contrast van de gemiddelden van de afhankelijke variabelen. Alle contrasten kun je voor elke persoon uitrekenen. Het gemiddelde van al die individuele contrasten is het gemiddelde contrast. Er geldt nu:

De contrasten hebben twee mogelijke toepassingen. Je kunt gericht toetsen; je maakt je toetsen op maat voor je hypothesen. Daarnaast kun je contrasten gebruiken voor de multivariate benadering van herhaalde metingen.

Op slides 11-12 wordt een voorbeeld besproken.

Let op: toets ALTIJD tweezijdig. Bij eenzijdig toetsen maak je het jezelf onmogelijk om onverwachte resultaten te toetsen.

In vergelijking met post hoc toetsen sluiten contrasten beter aan bij de theorie en doe je minder toetsen (groter power en minder kand op Type-I fouten).

 

5. Multivariate toetsen

Bij het aannemen van de nulhypothese geldt er dat de uitkomst van elk mogelijk contrast (ongeacht de waarde van cp) 0 is (in de populatie). We hoeven maar één ding te doen: testen of alle mogelijke contrasten 0 zijn. Dit kun je makkelijk doen door de set van p -1 lineair onafhankelijke contrasten gelijk is aan 0. Wanneer de contrasten absoluut geen overlap vertonen is er sprake van orthogonaliteit.

 

Belangrijke punten van de multivariate benadering: zie slide 14.

Verschillen MANOVA en de multivariate benadering:

  • De afhankelijke variabelen zijn contrasten.

  • Er wordt een constante getoetsen (in plaats van verschillen tussen groepen).

 

6. SPSS-voorbeeld: hechtingsstijl

Bekijk de slides 15-22

 

De aannamen bij RMA lijken op die van MANOVA.

Polynoom contrast: a + bx + cx2 + dx3 + ex4 + … Met polynome contrasten kun je trends in de data schatten (alleen als er sprake is van een ordening). Lineair: a + bx; kwadratisch: a + bx + cx2; kubic: a + bx + cx2 + dx3.

 

College 7: Mediatieanalyse

 

Inleiding

Het gaat vandaag over zowel mediatieanalyse (toepassing van regressie analyse) en suppressie (een speciaal geval van mediatie). De vraag is hoe goed je Y kunt voorspellen aan de hand van een aantal x-variabelen.

 

Bij hiërarchische regressie analyse bekijk je twee modellen na elkaar. Je kijkt eerst naar de voorspelling van bijvoorbeeld x1 en x2 en kijkt daarna of x3 nog iets extra’s toevoegt aan het model.

 

Mediatieanalye

Bij padanalyse worden heel veel regressie analyses aan elkaar geplakt. Dit is geen tentamenstof. Met padanalyse kun je verschillende variabelen causaal aan elkaar relateren. Wat wel behoort tot de tentamenstof is een simpele padstructuur: het mediatiemodel. Er zijn drie variabelen. Een x- variabele, een y-variabele en een mediator (M). In het model op slide 6 verklaart X Y uit zichzelf (direct effect) en via M (indirect effect). Bekijk slide 7 voor een voorbeeld.

Bij mediatie zijn er drie gevallen te onderscheiden:

  • Complete mediatie: alleen een indirect effect van X op Y via M.

  • Gedeeltelijke mediatie: zowel een indirect (via M) als een direct effect van X op Y.

  • Geen mediatie: geen effect van de mediator M op Y. X heeft wel een direct effect op Y en M, maar M medieert het effect van X op Y niet. Een ander geval is dat er geen relatie is tussen X en M, maar wel tussen M en Y.

  • (Suppressie)

 

Vierstapsprocedure

Om met zekerheid mediatie te kunnen aantonen moeten er vier stappen worden gechecked met drie regressie analyses. Hiervoor bekijk je vier regressiecoëfficiënten: a, b, c en c’. Bij een niet gemedieerd model wordt de relatie tussen X en Y beschreven door c. Bij een gedeeltelijk gemedieerd model wordt de relatie tussen X en M beschreven met a, de relatie tussen M en Y wordt beschreven met b en de relatie tussen X en Y met c’.

 

Stap 1

Je kijkt met enkelvoudige regressie naar het ongemedieerde model: is er een relatie van X op Y (zo niet, dan is er niets te medieren). De c –waarde moet worden geschat, er geldt c ≠ 0.

 

Stap 2

Je doet een tweede enkelvoudige regressie analyse om te kijken of X en M gerelateerd zijn. De a-waarde moet dus worden geschat, er geldt a ≠ 0

 

Stap 3

Je doet een derde meervoudige regressie analyse om te kijken of M en Y gerelateerd zijn, gecontroleerd voor de relatie tussen X en Y. De b-waarde moet dus worden geschat, er geldt b ≠ 0. X moet ook worden meegenomen, omdat je wilt bekijken of er geen alternatieve verklaring bestaat.

 

Als deze drie stappen goed zijn, is er sprake van mediatie via M.

 

Stap 4

De regressie analyse van stap 3 gebruik je ook om een schatting te krijgen van c’. Als c’≠ 0, is er ook sprake van een direct effect van X op M (= gedeeltelijke mediatie). Als geldt: c’= 0, dat is er alleen een indirect effect van X op Y via de mediator (complete mediatie).

 

Slides 15-21 geven een voorbeeld. Kijk in de tabellen naar:

  • is de t-waarde significant en wijkt deze ver genoeg af van 0?

  • de schatting van β

 

Als c kleiner is dan c’, is er sprake van suppressie.

Ook met een correlatietabel kun je de hierboven beschreven stappen doorlopen. Tentamentip: er wordt een vraag gesteld over mediatie met drie regressies, niet met correlaties.

Let op: correlaties bewijzen geen causaliteit!

Een mediatiemodel kan worden uitgebreid met meerdere mediatoren, er kunnen dan meerdere indirecte effecten ontstaan.

 

Proportie gemedieerd

Het is lastig de verklaarde variantie te bepalen bij mediatie, maar hier wordt niet verder op ingegaan. Wel kunnen we kijken wat de proportie gemedieerd is:

totaal effect = direct effect + indirect effect

c = c’ + ab

c – c’ = ab

 

Pmediated = indirect/totaal = ab/c

Pdirect = direct/totaal = c’/c

 

Bekijk slides 26-27 voor een rekenvoorbeeld.

De proportie gemedieerd is een maat om te kijken hoe sterk het directe effect is ten opzichte van het indirecte effect. Welk effect is belangrijker? Je kunt dus niet de verklaarde variantie berekenen. Er is ook geen sprake van effectgrootte.

 

Sobel test

Het indirecte effect van X op Y via M, gaat altijd in twee delen middels twee regressies. Je kunt het effect ook berekenen door a * b. Om de significantie hierbij te toetsen heeft Sobel een test ontwikkeld. Dit is geen onderdeel in SPSS en moet dus handmatig worden gedaan:

Z = ab / SEab

Z = ab / √(b2SEa2 + a2SEb2 + SEa2SEb2)

 

Bekijk slide 30 voor een rekenvoorbeeld.

Als Z verder weg ligt van 0 dan (-)1.96, is de z-waarde significant bij p

 

Suppressie

Bij suppressie wordt het effect van één van de predictoren vergroot door tenminste één andere predictor. Het is een multivariaat fenomeen (er moeten minimaal drie variabelen zijn). Om suppressie aan te tonen vergelijk je de gewone (= zero order) correlatie met de bèta coëfficiënt of de semi-partiële correlatie. De bèta coëfficiënt en de semipartiële correlatie moeten beiden duidelijk verder weg van 0 liggen dan de zero-order correlatie of de bèta coëfficiënt en de semi-partiële correlatie hebben een ander teken (+ of -) dan de zero order correlatie.

Bekijk slides 32-35 voor een voorbeeld.

 

 

Tentamen

Op dinsdag 10 juni is er tussen 9-11 uur een responsiecollege van Peter de Heus (SC01). Dit college is bedoeld voor vragen van studenten. Het tentamen is op woensdag 11 juni tussen 9-12 uur met 40 Nederlandse vragen. Je mag een A4 spiekbrief (handgeschreven, dubbelzijdig) meenemen en een rekenmachine.

 

De inzage is op woensdag 18 juni tussen 11-13 uur en de herkansing valt op woensdag 2 juli tussen 9-12 uur.

Elk onderwerp dat besproken werd in de afgelopen colleges wordt getoetst aan de hand van 5 vragen (theorie-, reken- en SPSS output vragen). Er zijn ook 5 techniekkeuzevragen.

Mediatie analyse: weinig theorievragen.

Het formuleblad dat bij het tentamen hoort is terug te vinden op blackboard. Tip: (bijna) alle formules op het blad heb je bij het tentamen nodig

Access: 
Public
Work for WorldSupporter

Image

JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Image

Comments, Compliments & Kudos:

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.
Check how to use summaries on WorldSupporter.org


Online access to all summaries, study notes en practice exams

Using and finding summaries, study notes en practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Use the menu above every page to go to one of the main starting pages
    • Starting pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
  2. Use the topics and taxonomy terms
    • The topics and taxonomy of the study and working fields gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
  3. Check or follow your (study) organizations:
    • by checking or using your study organizations you are likely to discover all relevant study materials.
    • this option is only available trough partner organizations
  4. Check or follow authors or other WorldSupporters
    • by following individual users, authors  you are likely to discover more relevant study materials.
  5. Use the Search tools
    • 'Quick & Easy'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject.
    • The search tool is also available at the bottom of most pages

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study for summaries and study assistance

Field of study

Access level of this page
  • Public
  • WorldSupporters only
  • JoHo members
  • Private
Statistics
1285