Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
Deze samenvatting is gebaseerd op het studiejaar 2013-2014.
- Werkgroep 1: Correlaties en maten voor effectgrootte
- Werkgroep 2: Enkelvoudige lineaire regressie
- Werkgroep 3: Meervoudige lineaire regressie
- Werkgroep 4: Geavanceerde lineaire regressie
- Werkgroep 5: Herhaling + regressie met dummies
- Werkgroep 6: Eenweg ANOVA
- Werkgroep 7: Post-hoc toetsen en contrasten
- Werkgroep 8: Tweeweg Anova
Werkgroep 1: Correlaties en maten voor effectgrootte
Introductory Homework Assignment
1.1 Definieer de volgende key terms in je eigen woorden:
Scatterplot: Twee dimensionele weergave van de scores
Lineaire relatie: Toename/afname variabele X varieert met variabele Y
Positieve relatie: Toename variabele X gaat samen met toename variabele Y
Negatieve relatie: Afname variabele X gaat samen met afname variabele Y
Kromlijnige relatie: Een niet-lineaire relatie
Correlatiecoëfficiënt: Summatieve maat van samenhang
Pearson r: 2 variabelen minimaal op interval niveau
Spearman rs: 2 ordinale variabelen (eerst rangordes, rekening houden met ties)
Dichotome variabele: 2 categorieën (bij nominaal mogen het er meer zijn)
Punt-biseriële correlatie rpb: 1 dichotome variabele en 1 kwantitatieve variabele (vanaf interval)
φ coëfficiënt: 2 dichotome varibelen.
Populatie correlatiecoëfficiënt ρ: een maat voor de correlatie tussen twee stochastische grootheden. (hoeft geen causaal verband te zijn)
Werkgroepopdracht LO 1.1:
Een onderwijskundige is geïnteresseerd in de ontwikkeling van taal bij middelbare scholieren. Hij vraagt zich af of gesproken kan worden van een talenknobbel. Daartoe bekijkt hij de samenhang tussen de eindexamen- cijfers voor Engels (X) en Frans (Y).Verwachten we een positief of een negatief verband tussen X en Y? De resultaten:
1 2 3 4 5 6 7 8 studenten
3 4 5 6 7 7 8 9 Engels(X)
2 4 7 5 6 8 10 7 Frans(Y)
Opdracht: bereken twee correlatiecoëfficiënten en toets of ze significant zijn (welke twee hoor je in de werkgroep)
voor Pearson r: neem aan dat de variabelen een interval meetniveau hebben
voor Spearman rs: neem aan dat de variabelen een ordinaal meetniveau hebben
voor Punt-biseriële rpb: verdeel X in 0 = gezakt en 1 = geslaagd (≥ 5.5)
voor Phi φ: verdeel X en Y in 0 = gezakt en 1 = geslaagd (≥ 5.5)
Rpb berekenen
-Standaarddeviaties berekenen:
Sx=0,518 Sy=2,475.
-Rangordes aanbrengen:
(x=0 of x=1)
0=gezakt 1=geslaagd
-Xgem en Ygem berekenen
Xgem=som van alle Xscores/aantal studenten
Ygem=som van alle Yscores/aantal studenten
Xgem=5/8=0,625
Ygem=49/8=6,125
-Zscores berekenen:
Z-score Zx=X-Xgem/Sx
Z-score Zy=Y-Ygem/Sy
Voorbeeld score 1: Xrangorde=0
0(je neemt de rangorde score! Niet de “oude” Xscore!)-0,625/0,518=-1,207
Voorbeeld score 1: y=2
2-6,125/2,475=-1,667
-Zscores vermenigvuldigen
Zx x Zy
Voorbeeld scores 1: -1,207 x -1,667=2,0116
-Som van alle vermenigvuldigde Zscores nemen.
Som totaal= 4,19256
Rpb=som(Zx x Zy)/(n-1)=4,19256/(8-1)=0,5989
df=N-2=8-2=6 (degrees of freedom)
t=0,5989√ (8-2)/(1-0,5989kwadraat)=1,8435
t opzoeken voor alpha 0,05, vrijheidsgraden 6 = 1,943
1,8435 is kleiner dan 1,943 > valt buiten het verwerpingsgebied.
0,05
Phi φ berekenen
-Standaarddeviaties berekenen:
Sx=0,518 Sy=0,518
-Rangordes aanbrengen:
(x=0 of x=1)
0=gezakt 1=geslaagd
(y=0 of y=1)
0=gezakt 1=geslaagd
-Xgem en Ygem berekenen
Xgem=som van alle Xscores rangordes/aantal studenten
Ygem=som van alle Yscores rangordes/aantal studenten
Xgem=5/8=0,625
Ygem=5/8=0,625
-Zscores berekenen:
Z-score Zx=X-Xgem/Sx
Z-score Zy=Y-Ygem/Sy
Voorbeeld score 1: Xrangorde=0
0(je neemt de rangorde score! Niet de “oude” Xscore!)-0,625/0,518=-1,207
Voorbeeld score 1: y=0 (nu ook voor y de rangorde score nemen)
0-0,625/0,518=-1,207
-Zscores vermenigvuldigen
Zx x Zy
Voorbeeld scores 1: -1,207 x -1,207=1,457
-Som van alle vermenigvuldigde Zscores nemen.
Som totaal= 3,2627
Phi φ som(Zx x Zy)/(n-1)=3,2627/(8-1)=0,4661
df=N-2=8-2=6 (degrees of freedom)
t=0,4661√(8-2)/(1-0,4661kwadraat)=1,29
t opzoeken voor alpha 0,05, vrijheidsgraden 6 = 1,943
1,29 is kleiner dan 1,943 > valt buiten het verwerpingsgebied.
0,10
Naarmate je lager gaat in de meeteenheid, gooi je informatie weg en dus zal de correlatie (nog) minder significant zijn.
Werkgroepopdracht LO 1.2:
Gebruik de data uit H 10.8
Neem aan dat rpb = 0.2134 en maak de volgende opdrachten:
1. Bereken of de correlatie significant is.
Gegeven Rpb=0,2134
t=0,2134√(25-2)/(1-0,2134kwadraat)=1,0476
df=n-2=25-2=23
tgrens voor df=23 alpha=0,05 > t=2,069
1,0476 (p>0,05 en dus niet significant)
2. Beschrijf de relatie tussen rpb en tindep
Vanuit een tindep kan de rpb ook berekend worden.
rpb=√(tkwadraat)/(tkwadraat+df)
3. Hercodeer de data uit 10.8 als aangegeven bij 10.9 4. Visualiseer de data in een kruistabel
| x=0 | x=1 |
y=0 | 5 (A) | 3 (B) |
y=1 | 6 (C) | 11 (D) |
Φ=(AD-BC)/√(A+B)(C+D)(A+C)(B+D)=(5x11)-(3x6)/√(8)(17)(11)(14)=0,2557
5. Bereken φ met de specifieke formule
φ=√(χ2 /N)= √(1,6341)/(26)=0,2557
6. Beschrijf de relatie tussen φ en χ2
De overeenkomst tussen beide is dat beide categorische data aangaat.
φ Geeft een samenhang weer: bij een toename van X verwacht je ook een toename van Y. Je mag geen scatterplot maken, want je beschikt niet over een numerieke waarde.
χ2 Kijkt of een geobserveerde waarde overeen komt met verwachte waarde. Je hoopt hier een afhankelijkheid in te vinden.
Werkgroepopdracht H 9.23 & 9.22.
9.23
r1=0,68
r2=0,53
Dit zijn verschillende r’s bij verschillende steekproeven. Maak deze vergelijkbaar:
Gebruik Howell tabel blz 701. (transformatie van r)
r1’=0,829
r2’=0,590
z=r1’-r2’/√(1/N1-3)+(1/N2-3)=(0,829-0,590)/ √(1/14)+(1/25)=0,716
Z voor alpha 0,05=1,96 > 0,716 valt buiten het verwerpingsgebied: niet significant!
Met de Z-toetsing wordt er gekeken of twee correlatiecoefficienten uit twee onafhankelijke stkeeproeven significant van elkaar verschillen.
9.22
r1=0,88
r2=0,72
Gebruik Howell tabel blz 701. (transformatie van r)
r1’=1,376
r2’=0,908
z=r1’-r2’/√(1/N1-3)+(1/N2-3)=(1,376-0,908)/√(1/49)+(1/71)=2,52
Z voor alpha 0,05=1,96 > 2,52 valt binnen het verwerpingsgebied.
Er is sprake van een significant verschil! P - Bij een grotere steekproef wordt de s kleiner of de df wordt hoger (kleinere verdeling)
- Bij een homogenere steekproef wordt de s kleiner.
- Cohen’s d vertelt ons iets over de effectgrootte
Een grotere Cohen’s d duidt op een groter verschil tussen de correlatiecoefficienten.
Met een t-toets wordt er gekeken of een correlatie significant is. We toetsen altijd tegen H0 (die beweert dat er geen sprake is van de aanwezigheid van een correlatie).
Werkgroep 2: Enkelvoudige lineaire regressie
Introductory Homework Assignment 2.1
Definieer de volgende key terms in je eigen woorden:
Enkelvoudige regressie-analyse: Een variabele voorspellen uit een andere variabele. Er is maar 1 predictorvariabele.
Meervoudige regressie-analyse: Een variabele voorspellen uit meerdere andere variabele. Er zijn nu meerdere predictorvariabelen.
Predictorvariabele: Variabele die voorspellingen maakt > onafhankelijk.
Response variabele: Criterion, afhankelijke variabele. Deze variabele reageert op de predictorvariabele.
Regressielijn: Enkelvoudig y=ax+b. Relatie tussen verklarende variabele en de waarnemingen. Het trekken van een lijn die de meeste punten zo veel mogelijk benadert.
Helling/slope: Hoeveelheid y verschil als x 1 stapje omhoog gaat.
Intercept: De voorspelde waarde van y als x=0. Snijpunt van de regressielijn op de onafhankelijke variabele.
Residu/Error: Het deel van de variantie dat niet verklaard kan worden. Errorvariantie is de variantie om de regressielijn heen (dit noemen we ook wel residual variance).
Het doel van regressie analyses uitvoeren? Om te zien of we ook een verband in de populatie zullen vinden.
Werkgroepopdracht H 9.31 a,b en d (alleen significantie van de slope):
Gebruik alleen de eerste 7 personen uit de dataset
Neem aan dat r = 0.962, sheight = 2.719, sweight = 18.889 en se = 5.671
Het gewicht moet voorspeld worden uit de lengte. Bereken eerst het Xgem en Ygem van de eerste 7 personen.
Xgem(lengte)=492,5/7=70,36
Ygem(gewicht)=(150+140+180+190+145+150+164)/7=159,86
b1=Sxy/Sxkwadraat=r(sy/sx)=0,962(18,889/2,719)=6,683
6,683 is de slope (gewicht)
b0=ydakje-b1x
b0=159,86-6,68x70,36=-310,13
y=b0+b1x
y=-310,13+6,68x
Is de slope significant verschillend van 0?
b1=6,68 > Is dit ook zo in de populatie?
SEb1=se/sx√(n-1)=5,671/2,719√(7-1)=0,852
t=b1/SEb1=6,68/0,852=7,84
df=n-2=7-2=5
p
Werkgroepopdracht H 9.34 a, b en c (alleen significantie van de slope) + extra’s:
Gebruik alleen de eerste 7 personen uit de dataset
Neem aan dat: r = −0.279, sheight = 3.200, sweight = 9.209 en se = 9.688
Eerst worden Xgem en Ygem berekend voor de eerste 7 gegevens van de personen 1-7.
Xgem=66,29 Ygem=127,14
SEb1=9,688/3.200√6=1,236
b1=r(sy/sx)=-0,279(9,209/3.200)=0,802
t=b1/SEb1=-0,802/1,236=-0,649
df=n-2=7-2=5
t grenswaarde opzoeken in Howell met df=5 (alpha=0,05)
t=-0,649 is onwijs niet significant p>0,20(tweezijdig).
Gestandaardiseerde regressiecoefficienten: Zy=B0+B1Zx.
B0=0
B1=r(szy/szx)
Szy en szx gestandaardiseerde waarden (0,1) Dus s=1 voor x en y.
szy/szx=1/1=1
B1=r x 1=-0,279 x 1=-0,279
DUS Zy=-0,279Zx.
b1=-0,803
b0=ydakje-b1x=127,143x(-0,803)x 66,286=180,371
ydakje=180,371-0,803x
Er is dus sprake van een afname (-0,803x)
Transformeer de gebruikte data in cm in kg: 1 Inch = 2.54 cm en 1 pound = 0.45 kg
155 63
168 54
173 59
173 62
160 54
178 56
173 52
(cm) (kg)
Bekijk de verschillen tussen de scatterplots in inches/poundsencm/kg;
Waarom is het soms handig om een gestandaardiseerd regressiemodel te gebruiken, en wat zijn in dit geval de gestandaardiseerde regressiecoefficienten?
Z-scores zijn altijd gestandaardiseerd (0,1). (gemiddelde, standaardafwijking). En zal dus door de oorsprong X=0 en Y=0 gaan. De verschillende meeteenheden zijn op dezelfde schaal aangebracht. Verder is de scatterplot van de getransformeerde data minder stijl.
Werkgroepopdracht H 9.33a, 9.36, 9.35 en 9.32
9.33a:
Gebruik Weight = −310.339 + 6.683Height
en Howells lengte 5′8′′ = 68 inch (= 1.73 meter) en gewicht.
Actual weight = 146 pounds
Predicted weight = -310,339+6,683x68=144,105
144 pounds op basis van de regressielijn.
Actual weight-Predicted weight=146-144,105=1,895
9.36:
bekijk de scatterplot die je hebt gemaakt voor de eerste 7 personen uit 9.34 - wat is de grootste residu in deze scatterplot?
Grootste residue in deze scatterplot: Residu/error=y-ydakje.(Ygeobserveerd-Yverwacht)
68 ligt ver van de regressielijn af. Invullen predicted=125,767.
138-125,767=12,233
9.35: Gebruik vergelijking mannen: Weight = −310.339 + 6.683Height
Gebruik vergelijking vrouwen: Weight = 180.371 − .803Height
5′6′′ = 66 inch
Een regressielijn gaat altijd door beide gemiddeldes.
Man: W=-310,339+6,683x66=130,739
Vrouw: W=180,371-0,803x66=127,373
Verschil man vrouw =Wman=Wvrouw=130,739-127,373=3,366 pounds
9.32
sb1.1-1.2=√(skwadraat e.1/skwadraat x.1(n1-1))+(skwadraat e.2)/skwadraat x.2(n2-1)
df=n1+n2-4
s e.1=5,671
s e.2=9,668
sb1.1-1.2=√(5,671kwadraat/2,719kwadraat x 6)+(9,668kwadraat/3,200kwadraat x 6)=1,501
t=b1.1-b1.2/sb1.1-b1.2=(6,683-0,803)/1,501=4,987
Werkgroep 3: Meervoudige lineaire regressie
Introductory Homework Assignment 3.1
Definieer de volgende key terms in je eigen woorden:
Regressie coëfficiënt: Schatting van een parameter door middel van een regressie analyse. Je hebt een bo (intercept) en een b1 (helling/slope).
Errorvariantie: De variantie om de regressielijn heen/rondom de voorspelde waarden. De errorvariantie is de variantie die niet door het model wordt verklaard.
Multipele correlatiecoëfficiënt: Hoe goed een gegeven variabele voorspeld kan worden door gebruik te maken van een lineaire regressie van een andere set variabelen.
Semi partiële correlatie: Unieke correlatie/part correlations (SPSS): Onderscheid maken tussen onafhankelijke en afhankelijke variabelen. Er is wel uitgezuiverd voor een derde variabele.
(SPSS Analyze, Regression, Lineair, Statistics: part & partial correlations)
Introductory Homework Assignment 3.2
Voer de meervoudige regressie-analyse uit opdracht 15.2 uit in SPSS. De data is te vinden op http://www.uvm.edu/~dhowell/methods8/DataFiles/ DataSets.html als Ex15-4.sav. Vraag tevens om de (semi-)partiele correlaties. Is de output hetzelfde als de output in Exhibit 15.6 op p. 567?
Analyze, Regression, Lineair, Statistics: part & partial correlations. Wat wordt er voorspeld? De job satisfaction (Y). Ja beide outputs komen overeen.
Werkgroepopdracht H 15.1, 15.4 en 15.3
15.1
Hoe hoger de temperatuur, hoe lager de levenskwaliteit (interpreter)
Ydakje=5,37-0,01temp+0,05income+0,003xsocser-0,01xpopulation
Ydakje=5,37-0,01temp(=55)+0,05income(=12)+0,003xsocser(=500)-0,01xpopulation(=200)
Ydakje=4,92
Ydakje=5,37-0,01temp(=55)+0,05income(=12)+0,003xsocser(=100)-0,01xpopulation(=200)
Ydakje=3,72
(Waarden niet te interpreteren)
15.4
B(-0,438, 0,762, 0,081, -0,132)
De regressie coëfficiënten verschillen van de coëfficiënten in een enkelvoudige analyse, omdat hier steeds een coëfficiënt berekend wordt voor een variabele terwijl de andere onder controle wordt gehouden.
15.3
t=B/SE (standard errors)
B kan gevonden worden in oefening 15.4 (zie hierboven).
SE kan gevonden worden in oefening 15.3 (zie de beschrijving in Howell).
Temperatuur t=-0,438/0,397=-1,103
Income t=0,762/0,252=3,024
Socser t=0,081/0,052=1,558
Population t=-0,132/0,025=-5.28
Temperatuur heeft de kleinste t-waarde. Dit betekent dat deze gevonden t-waarde het dichtst bij 0 ligt en daarom het minst significant is. De temperatuur zal het minst van de variantie van y (job satisfaction) verklaren. Temperatuur draagt vrijwel niets bij aan de variantie van y.
Werkgroepopdracht LO 3.1
Een onderzoeker probeert stressbestendigheid (Y) te voorspellen uit emotionele stabiliteit (X1 ) en probleemoplossend vermogen (X2 ). Met een steekproef van vijf personen wordt de volgende regressievergelijking gevon- den: Yˆ = 23.3135 + .3631X1 + .0589X2.
De scores van de vijf personen zijn als volgt: X1 X2 Y Yˆ (Y−Yˆ)2 48 98 47 45 42 41 29 72 38 43 7 40 25 26 34
1. Vul de voorspelde stressbestendigheid in in de tabel (Yˆ)
Y=23,3135+0,3631x+0,0589x2
Ygem is 40.
2. Als we het hele model gaan toetsen, wat is dan de H0 en de HA?
H0: B1=B2=0
Ha: Minsten een B= niet 0.
B gaan altijd over populatiewaardes.
3. Bereken, met behulp van de tabel, de SSE
Y-Ydakje (voorspeld met de formule uit 1.) = (47-46,5145)kwadraat=0,2357.
Doe dit voor elke Y score (41,38,40,34)
SSE= Som van (y-ydakje(voorspelde waarden))2=1,95531
4. s2Y = 22.5, wat is de SST?
SST=som van (y-ygem)kwadraat.
Dit betekent dat wanneer we voor elke Yscore de Ygem eraf halen en deze kwadrateren, de som hiervan genomen SST is. =90
OF
S2y=som(y-ygem)2/n-1=90/4=22,5
5. Bepaal de waarde van de SSM
SSM=SST-SSE
SSM=90-1,95531=88,0447
6. Stel een ANOVA-tabel op en vul deze in (zie college)
7. Is de F-waarde significant? En geef de conclusie
F=MSM/MSE
MSM=SSM/DFM=88,0447/2=44,0224
(DFM=p)
MSE=SSE/DFE=1,95531/(5-2-1)=0,9777
(DFE=n-p-1)
F=MSM/MSE=44,0224/0,9777=45,0265
Gebruik Howell om de grenswaarde van F op te zoeken.
Rij df(model)=2
Kolom df(error) =2
Voor een alpha van 0,05(2+2) vinden we 19.
Onze F waarde is 45,0265 > 45,0265>19. Er is significantie! (p
8. Wat is de waarde van R2 en R? Interpreteer
Bij een meervoudige regressie: VAF=R2
VAF=SSM/SST=88,0447/90=0,98
R=wortel(0,98)=0,9891
Onze error is heel erg klein. Er wordt veel door het model verklaard.
Werkgroepopdracht H 15.2, 15.5, 15.8, 15.20
15.2
Tabel wordt gegeven in de werkgroep. B’s zijn af te lezen in de linkerkolom.
Ydakje=1,669+0,605response-0,334nosup+0,486envir+0,070yearsofservice
Ydakje=job satisfaction.
Gestandaardiseerde regressiecoefficienten zijn berekend op basis van Zscores.
15.5
Environment part correlatie is 0,399. Dit betekent dat environment de minste overlap met de andere variabelen (predictoren) zal hebben. En dus de meest unieke bijdrage aan het model komt van environment.
Wanneer een predictor een grote t-waarde heeft, maar niet significant is. Moet er nader gekeken worden naar het aantal proefpersonen. Waarschijnlijk zijn er meer proefpersonen nodig.
15.8
R2 = R Square in de tabel uit SPSS (=0,486)
Adjusted R Square is vrijwel altijd kleiner dan R Square.
Adjusted R Square is de VAF (verklaarde variantie) die je zou verwachten als je rekening houdt met het aantal proefpersonen en predictoren. Met een R adjusted kan je dus beter generaliseren/ uitspraken doen over de populatie in het algemeen.
R2 en R2adj komen dicht bij elkaar te liggen, wanneer er veel proefpersonen zijn.
Discussie (15.7)
2 variabelen minder elkaar overlappen, er wordt meer variantie verklaard vanuit een 3e variabele. De onderlinge samenhang tussen X-en moet zo klein mogelijk gehouden worden.
Tussen X en Y wil je hoge correlaties. Je wil ervoor zorgen dat deze correlaties zo uniek mogelijk zijn (er mogen vrijwel geen/kleine onderlinge correlaties tussen de verschillende X-en/predictoren zijn).
Werkgroep 4: Geavanceerde lineaire regressie
Introductory Homework Assignment 4.1
Homoscedasticiteit: De varianties van de residuen (error) is voor elke voorspelde waarde gelijk. Dit is te controleren in een scatterplot met op de x-as de voorspelde waarden en op de y-as de gestandaardiseerde residuen.
Normaliteit van residuen: De residuen (errors) voor elke voorspelde waarden zijn normaal verdeeld. Dit is te beoordelen via een histogram of p-p plot.
Voorspellingsinterval van individuele observatie: De foutenmarge is hier altijd groter dan bij de voorspelling van de gemiddelde respons. Het betreft hier een schatting voor 1 persoon uit een subpopulatie.
Betrouwbaarheidsinterval van gemiddelde respons: SE (foutenmarge) kleiner bij veel personen (n). Het betreft hier een schatting van mensen uit de subpopulatie met een bepaalde score X.
Multivariate uitbijters: Een ongewone combinatie van scores op de variabelen. Meerdere variabelen worden in beschouwing genomen (multivariate).
Mediatie: Predictor X beïnvloedt de respons variabele Y indirect: X>Z>Y.
Moderatie: De sterkte van de relatie tussen predictor X en respons Y hangt af van een andere variabele. X>Y
Introductory Homework Assignment 4.2
Voer opnieuw een regressie-analyse uit op de data van H 15.18, maar dit keer met de STEPWISE methode. Aangezien Howell aangeeft in deze opgave niet op het gebrek aan significantie te letten, zet je onder “OP- TIONS” het ENTRY-niveau op ,98 en het REMOVAL-niveau op ,99. De output van de eerste drie stappen moet hetzelfde zijn als de output in Exhibit 15.7. Beschrijf de verschillen tussen de resultaten met de ENTER en met de STEPWISE methode.
Enter methode: Alle variabelen worden op hetzelfde moment toegevoegd.
(De rest van de variabelen worden onder controle gehouden bij het voorspellen van de ene variabele).
Stepwise methode: Op basis van sterkte van de voorspelling worden de variabelen toegevoegd. De variabele die als eerst wordt toegevoegd, voorspelt het meest, en verklaart dus uniek (individueel) het meest ten opzichte van de andere variabelen.
SPSS open het document ex.15-4.sav
Analyze, Regression, Linear, options entry=0,98 removal=0,99.
Method stepwise invoer:
Analyze, Regression, Lineair, statistic: part & partial correlations (uniek verklaarde variantie)
respons = 0,321
numsuper=-0,141
environment=0,399
yearsservice=0,061
In procenten (%):
respons=10%
numsuper=2%
environment=16%
yearsservice=0/1%
Allemaal een uniek deel verklaarde variantie van het totaal (R2 totaal=VAF=0,486=48,60%)
Dus op volgorde van meest toe doen-minst toe doen:
1 environment 2 respons 3 numsumer 4 yearsservice
dependent: satisfaction,
independent: respons, numsumer, environment, yearsservice
Introductory Homework Assignment 4.3
Stepwise regression is geen favoriet bij de meeste statistici. Het toetsen via de stepwise methode kan weliswaar een statistisch optimaal resultaat geven (significantie aantonen), terwijl dat echter inhoudelijk onzinnig kan zijn. Dit kan bijvoorbeeld komen doordat belangrijke predictors buiten beschouwing zijn gelaten. Voorspelling kunnen ook veel te extreem zijn.
Werkgroepopdracht LO 4.1
Kopieer het bestand SKINFOLD.SAV van Blackboard. Voer een regressie- analyse uit om het soortelijk lichaamsgewicht (DEN) te voorspellen op basis van de dikte van huidplooien (LSKIN).
a. Noteer de proportie verklaarde variantie, de regressievergelijking en de 95% betrouwbaarheidsintervallen voor β1 en β0
R Square = 0,720
β0=den=1,150-1,176
β1=skin=-0,071--0,055
(Aflezen via SPSS tabel)
Voer de analyse nogmaals uit en laat via de Save optie de voorspelde waarden voor DEN en de standard error van het voorspelde gemiddelde van DEN bewaren. Kijk in het datavenster of er inderdaad twee nieuwe variabelen zijn en maak een scatterplot van de standard error als functie van de huidplooidikte.
b. Voor welke waarde van de huidplooidikte is de standard error het kleinst?
Analyze, Regression, Lineair, Save : unstandardized, SE of mean predictions (aanklikken)
Graphs, Legacy Dialogs, Scatter/Dot, Yaxis is standard er, X axis is lskin.
Descriptives, Lskin, Mean=1,5679
Er is een dal zichtbaar en het minimum ligt precies rondom het gemiddelde = 1,5679.
Maak nog een scatterplot, dit keer van LSKIN op de X-as en DEN op de Y-as. Pas vervolgens de X-as aan naar het interval 0-4 en de Y-as naar het interval 0.8-1.2. Voeg een regressielijn toe en vraag via Properties → Fit Line Tab een 95% betrouwbaarheidsinterval voor de gemiddelde respons en een 95% voorspellingsinterval voor de individuele respons op.
c. Voor welke waarde van de huidplooidikte zijn beide intervallen het smalst?
Simple Scatterplots, Y axis=den, Xaxix=lskin, Dubbelklik op de gegeven scatterplot:
Lskin, scale, minimum=0, maximum=4.
den, scale, minimum=0,8, maximum=1,2
Regressielijn toevoegen via: Elements, fit line at total, individual 95% (aanklikken)
Tweede regressielijn toevoegen via: Elements, fit line at total, mean (aanklikken)
In de oorspronkelijke scatterplot zijn nu 2 betrouwbaarheidsintervallen verschenen.
Beide zijn de betrouwbaarheidsintervallen het smalst rond het gemiddelde.
d. Wat zijn de meest opvallende verschillen tussen de twee intervallen?
Beide even smal rond het gemiddelde: x=1,57
BI van de gemiddelde respons is kleiner dat het BI van het individu (deze is groter).
Werkgroepopdracht H 15.26, 15.29, 15.25
15.26
Open het document mireault.sav
Analyze, Regression, Lineair, dependent=depressT, independent=PVLoss, SuppTotl, AgeatLoss.
Statistics, Model Fit & Part & partial correlations (aanklikken).
AgeatLoss>niet significant sig=0,496.
Analyze, Regression, Lineair, Plots, Y=Zresid, X=Zpred (lineairiteit toetsen)
SRP aanvinken: Histogram, normal probability plot. (normaliteit van residuen toetsen)
Scatterplot moet gecheckt worden op lineairiteit, wanneer er een horizontale lijn zichtbaar is, is er sprake van lineairiteit. In ons geval zien we dat 95% van onze resultaten tussen de -2 en 2 liggen.
Scatterplot moet ook gecheckt worden op homoscedasticiteit. Zo kunnen we zien of de spreiding even groot is. In ons geval is er inderdaad sprake van homoscedasticiteit.
Via een histogram of p-p plot zien we dat de residuen normaal verdeeld zijn (curve-bell vormige histogram of een rechte lijn op p-p plot).
15.29
Er moet ook getoetst worden op multicollineairiteit.
Analyze, Regression, Lineair, Statistics, collinearity diagnostics (aanvinken).
Tolerance (0-1)/VIF(tussen 1-2) worden zichtbaar in een tabel.
We willen de tolerance zo hoog mogelijk (richting 1) en de VIF zo laag mogelijk (ook richting 1).
Wanneer we ons model testen op uitbijters kijken we naar distance, leverance en influence.
Analyze, Regression, Lineair, Save, residuals: standardized (aanvinken), distances: cook’s en leverage values (aanvinken).
Distance aflezen: -2,518-2,599
Leverance aflezen: 0,002-0,131
Influence aflezen: Cook’s d: 0,137
Onze resultaten interpreteren:
Distance, geen sprake van uitbijters wanneer de score tussen -3 en 3 valt.
Leverance er moet eerst een grenswaarde worden berekend via de formle: 3(p+1)/N
In ons geval is het 3(3+1)/135=0,089.
De waarde uit onze tabel (al afgelezen) = 0,131 (maximum)
0,131>0,089 De grenswaarde wordt overschreden er zal dus sprake zijn van een uitbijter.
Influence waarden van Cook’s d kleiner dan 1 zijn niet invloedrijk.
0,137 Deze drie modellen samengenomen gaan we er van uit dat er geen sprake is van uitbijters, ookal wijst Leverance in de oppositie richting. We kunnen in de scatterplot zien dat 1 score er een klein beetje buitenvalt en dit is waarschijnlijk waar de uitkomst van Leverance mee te maken heeft. Omdat dit echter de enige uitbijter is, kunnen we hem in dit geval negeren.
15.25
Analyze, Regression, Analyze, block 2: PVtotal, Statistics: Rsquared change (aanvinken), Save uitzetten (reset).
R2 model 1 =0,244
R2 model 2 =0,244
Radj model 1 =0,227
Radj model 2 =0,221
Radj voor model 2 is lager, wat betekent dat we minder goed kunnen generaliseren (conclusies betrekken op de gehele populatie) dan model 1 (die een hogere Radj score heeft). Dit komt omdat we er als het ware een variabele bij hebben gestopt, die niet blijkt te verklaren. Wanneer er meer variabelen in een model worden gestopt, die echter niets van het model verklaren (R2=VAF=verklaarde variantie=gelijk voor beide modellen, model 2 voegt dus niets toe) Er verandert niets, alleen kunnen we minder goed generaliseren.
Radj=(1-R2)(n-1)/(n-p-1)
De p in de formule staat voor predictoren. Aangezien model 2 er een predictor bijstopt, wordt de onderkant van de breuk groter, en Radj zal dus lager uitvallen. (minder zijn).
Werkgroep 5: Herhaling + regressie met dummies
Introductory Homework Assignment 5.1
Maak de oefentoets over de stof van de eerste 4 weken
Werkgroepopdracht LO 5.1:
Twee getrainde neuzen (X en Y) maken ieder een rangordening van 8 parfums door ze een score te geven op een geur-impact-schaal (hoe meer impact, hoe hoger de score). Komen de beoordelaars overeen?
De resultaten:
1 2 3 4 5 6 7 8 parfum
X 32 45 51 66 71 78 83 95
Y 24 41 74 53 67 85 98 78
Prepareer de data voor gebruik in R, zie R in een Notendop (RN) D.3.
1. Laat in R de Pearson correlatie uitrekenen tussen X en Y (RN D.5.2).
X Y cor (X,Y, use=”everything”, method=”pearson”) = 0,8213704
2. Laat vervolgens in R de Spearman Rangorde correlatie uitrekenen tussen X en Y (RN D.5.2).
cor (X,Y, use=”everything, method=”spearman”) = 0,8571429
3. Interpreteer de resultaten
Spearman is hoger, want de data is ordinaal. Pearson mag dus eigenlijk niet gebruikt worden, aangezien er geen interval data aanwezig is.
Werkgroepopdracht LO 5.2:
Een psycholoog werkzaam bij de Marine wilt in de nabije toekomst twee testen gebruiken bij de selectie van duikbootpersoneel. De ene test meet emotionele stabiliteit (X1) en de andere probleemoplossend vermogen (X2). De psycholoog denkt dat hiermee stressbestendigheid (Y) te voorspellen is. Alle variabelen worden gemeten bij vijf leerlingen van het Koninklijk Instituut voor de Marine (KIM). Dit leidt tot de volgende scores:
1 2 3 4 5 leerling
X1(STAB) 4845294325
X2(PROB) 98 42 72 7 26
Y (STRESS) 47 41 38 40 34
Prepareer de data voor gebruik in R, zie R in een Notendop (RN) D.3.
1. Is Y uit X1 te voorspellen? Voer een enkelvoudige regressie-analyse uit (RN D.5.2).
X1 X2 Y1 coef coef
X1=0,408
2. Is Y uit X2 te voorspellen? Voer een enkelvoudige regressie-analyse uit (RN D.5.2).
coef coef
X2=0,08118
3. Laat nu in R Y voorspellen uit zowel X1 en X2 met behulp van een meervoudige regressie-analyse (RN D.5.2). Schrijf de regressievergeli- jking op en interpreteer de resultaten.
coef coef
summary (coef)
X1=0,36312
X2=0,05894
Y=23,31350+0,36312X1+0,05894X2
Werkgroepopdracht LO 5.3
1. Kopieer het bestand TEST.TXT van Blackboard. Open het bestand in Notepad en bekijk het goed.
2. Open SPSS. Klik op File, Open, Data, TEST.TXT. Zorg ervoor dat SPSS de data juist weergeeft. Gebruik daarvoor de onderstaande tabel:
File > Open > Data files of type: all files, Text Important Wizard:
Step1 > next > Step 2 vink aan:fixed with >next > Step 3 > next > Step 4 : lijnen aanbrengen > next > Step 5 > next > Step 6 > next
File > Open > Data files of type: all files. Text Important Wizard:
Step1 > next > Step 2 vink aan:fixed with >next > Step 3 , how many lines represent a case: 2 > next > Step 4 : lijnen aanbrengen, Insert break: 5 >enter, 9 >enter, > next > Step 5 > next > Step 6 > next
Werkgroepopdracht LO 5.5
1. Kopieer de bestanden METING1.SAV en METING2.SAV en bekijk de inhoud
2. Voeg de twee bestanden samen
Open meting1.sav, Data > Merge files > add variables > meting2(1).sav aanklikken > continue > cnum= kolomnummer, meting2(+) deze komt erbij,
Cnum (+) > klik aan: match cases on key variables
Cnum (+) > sleep deze naar key variables
3. Welke personen hebben geen tweede meting gedaan?
4x een missing data, aangeien meting2.sav maar 96 personen bevatte en meting1.sav 100 personen.
4. Bepaal de verschilscore meting2 - meting1 en maak een boxplot van deze verschilscore
Transform > Compute variable > meting12: meting 2 – meting 1 > continue
Graphs > Boxplot > simple, summaries of separate variables > boxes represent: meting12 > ok.
5. Wat is uw conclusie over de verandering in depressie?
Heel veel negatieve scores (50%), Meting 1 is hoger. Meting 2 is de depressiescore lager.
6. Bewaar de gecombineerde data als METING12.SAV
Werkgroepopdracht LO 5.6
We willen de informatie van therapeuten en cli ̈enten koppelen om een uitspraak te doen over de invloed van ervaring van een therapeut op de mate van reductie in BDI scores. Hiervoor moeten we de informatie van een behandelaar aan ́e ́en of meer cli ̈enten koppelen. De therapeuten data fungeren dan als table file.
1. Voeg de bestanden THERAPEUT.SAV en METING12.SAV samen. De sleutel is TNUM.
Data > Merge files > add variables: match cases on key variables > therapeut (1) key variable > tnum.
2. Hebben alle cliënten een therapeut?
Nee, niet alle cliënten hebben een therapeut.
3. Bepaal de correlatie tussen ervaring en de verschilscore meting2 - meting1
Analyze > Correlate > Bivariate > variables: meting 12, ervaring > ok.
R= -0,03
Sig = 0,778 (niet significant)
4. Wat is uw conclusie over de invloed van ervaring van therapeut op de mate van reductie in depressie?
Invloed van de ervaring van therapeut heeft geen invloed op de mate van reductie in depressie.
5. Bewaar de data als METINGT12.SAV
Werkgroepopdracht LO 5.7
1. Maak nog een correlatietabel, maar dit keer met ervaring in jaren en de BDI scores op beide meetmomenten.
Analyze > Correlate > Bivariate> variables: ervaring 12, BDI1, BDI2. > ok
2. De correlatie tussen BDI I en BDI II is zo significant dat de p-waarde wordt afgerond op 0.000. Maar wat is de echte waarde? Laat SPSS deze noteren in de tabel met behulp van Cell Properties.
Dubbelklik op de tabel, exacte p-waarden zichtbaar.
3. Haal nu de rijen met de N-en weg en verwijder de dubbele correlatiecoëfficiënten.
4. Zet met CellProperties het aantal decimalen van de correlatiecoëfficiënten op 2.
Cell properties > format value > apply eentje onder, exacte pwaarden.
5. Pas de correlatietabel aan met TableLooks, zodat deze het meest op APA-stijl lijkt.
Tablelooks > Academic
Werkgroepopdracht LO 5.8
1. Maak nog een correlatietabel, opnieuw met ervaring in jaren en de BDI scores op beide meetmomenten.
Zelfde correlatietabel uit LO 5.7. dubbelklik.
2. Laat met behulp van Pivoting Trays alleen de correlatie zien tussen de variabelen.
Pivot > pivoting trays > statistic slepen naar linkerbovenhoek > tabel verandert automatisch.
3. Maak nog een correlatietabel, opnieuw met ervaring in jaren en de BDI scores op beide meetmomenten, maar laat nu met behulp van Pivoting Trays alleen het aantal personen zien in de analyses.
Er is nu een tabel zichtbaar met alleen de sterktes van correlaties en de significanties.
Werkgroep 6: Eenweg ANOVA
Introductory Homework Assignment 6.1
Definieer de volgende key terms in je eigen woorden:
Effectparameter: Variabele waaraan een bepaalde waarde wordt toegekend om met behulp daarvan andere onbekende grootheden te kunnen berekenen. In dit geval wordt een bepaald effect benaderd en onderzocht.
Gebalanceerd ontwerp: Elk factorlevel bestaat uit dezelfde sample size grootte. (evenveel proefpersonen).
Eta squared η2: SSG/SST: De proportie verklaarde variantie in de steekproef.
Estimated omega squared ωˆ2: SSG-(DFGxMSE)/SST+MSE: Altijd kleiner dan n2. (Verklaarde variantie in de populatie)
Introductory Homework Assignment 6.2
Maak opgave 11.1 uit Howell (met de hand). Vul de ANOVA tabel, zoals deze besproken wordt op het college, in. Vermeld niet alleen het eindresul- taat, maar ook de tussenantwoorden.
Bereken eerst de a parameters. Dit door van elk groepsgemiddelde het groot gemiddelde af te trekken:
Acounting=7-10,06=-3,06
Arhyming=6,90-10,06=-3,16
Aadjective=11-10,06=0,94
Aimagery=13,40-10,06=3,34
Aintentional=12-10,06=1,94
De som van de A parameters is gelijk aan 0. (klopt)
SSG= Som ni x Ai = (10 x (-3,06)2)+(10 x (-3,16)2) + (10 x (0,94)2) + (10 x (3,34)2) + (10 x (1,94)2). =351.52
SSE= Som (ni – 1) si2 = (9 x 3,33)+(9x4,54)+(9x6,22)+(9x20,27)+(9x14,00)+(9x16,058)= 435,24
SST=SSG+SSE=351,52+435,24=786,84
Between Groups DF: |-1=5-1=4
Within Groups DF: N-|=50-5=45
Total DF= N-1=50-1=49
MSG=SSG/DFG=351,52/4=87,88
MSE=SSE/DFE=435,24/45=9,67
MST=SST/DFT=786,84/49=16,06
F=MSG/MSE=87,88/9,67=9,09
F(4,45)= 9,09 p
Werkgroepopdracht H11.3a, 11.15, 11.7
11.3a
Deel de groep met de grootste std deviatie/de groep met de kleinste std deviatie:
3,74/1,42=2,62 >2 Niet voldoen aan homogeniteitsaanname. (niet homogeen)
A parameters berekenen. (Groepsgemiddelde – groot gemiddelde)
Ayl=6,5-11,2=-4,7
Ayh=19,3-11,2=8,1
Aol=7-11,2=-4,2
Aoh=12-11,2=0,8
De som van de A parameters is samen 0. (klopt)
Van standaard deviatie naar variantie (Kwadrateer de standaard deviatie)
Sd=1,43
Variance=2,0449
Sd=2,67
Variance=7,1289
Sd=1,83
Variance=3,3489
Sd=3,74
Variance=13,9876
SSG= (10 x (-4,7)2)+(10 x (8,1)2)+(10 x (-4,2)2)+(10 x (0,8)2)=1059,80
SSE=(9 x 2,0449)+(9 x 7,1289)+(9 x 3,3489)+(9 x 13,9876)=238,5927
SST=SSG+SSE=1059,80+238,5927=1298,3927
Between Groups DF: |-1=3
Within Groups DF: N-|=36
Total DF: N-1=39
MSG=SSG/DFG=1059,80/3=353,27
MSE=SSE/DFE=238,5927/36=6,6276
MST=SST/DFT=1298,3927/39=33,292
F=MSG/MSE=353,27/6,6276=53,3
F(3,36) (Kijk bij (3,30) wees conservatief) = p Minimaal 1 paar gemiddelde wat betreft de groepen verschilt in gemiddelden van elkaar.
11.15
Xij=u-Tj+Eij
=Het groot gemiddelde (gemiddelde van iedereen) – Het speciaal behandelingseffect van de desbetreffende groep j: een schatting van de effectparameter van de groep + Verschil tussen iemands score en het gemiddelde van de groep waarin diegene zit.
11.7
η2: SSG/SST = 1059,80/1298,3927=0,816
Estimated omega squared ωˆ2: SSG-(DFGxMSE)/SST+MSE = (1059,8-(3 x 6,6276))/(1298,3927+6,6276)= 0,7969
Werkgroepopdracht LO6.1
In haar onderzoek naar het effect van een nieuw medicijn op depressieve klachten wil Anne drie groepen met elkaar vergelijken: een experimentele groep, een placebogroep en een controlegroep. Om eventuele verschillen tussen de groepen te toetsen heeft ze een variantieanalyse uitgevoerd. In de onderstaande tabel vind je een deel van de resultaten van deze analyse.
Source
Between Groups
Within Groups/Error
DF
Sum of Squares
Mean Square = 394.13
F = 4.93
1. Vul de ANOVA-tabel aan
SSG=788,26
SSE4556,865
SST=SSG+SSE=788,26+4556,865=5345,155
Between Groups DF: |-1=2
Within Groups DF: N-|=57
Total DF: N-1=59
MSG=SSG/DFG=394,13
MSE=SSE/DFE=79,945
MST=SST/DFT=90,596
F=MSG/MSE=4,93
2. Hoe groot was de steekproef van Anne?
De steekproef bestond uit 60 personen.
3. Hoe groot is s2totaal?
De totale variantie= SST/DFT=5345,155/59=90,596 (Kijk bij MST)
4. Levert deze toets een significant resultaat op, uitgaande van α = 0.05?
Ja, onze gevonden F waarde is groter dan de gevonden grenswaarde voor F (2,57) bij een alpha van 0,05.
5. De experimentele groep scoorde gemiddeld 62.73, de placebogroep 67.21. Mag Anne op basis van deze variantieanalyse concluderen dat deze twee groepen significant van elkaar afwijken? Leg uit...
Nee, met de one-way ANOVA hebben wij een verschil in gemiddelden gedetecteerd, echter weten we nog niet waar dit verschil aanwezig is. We kunnen dus ook geen uitspraken doen over welke gemiddelden met elkaar zouden verschillen.
Werkgroep 7: Post-hoc toetsen en contrasten
Introductory Homework Assignment
Definieer de volgende key terms in je eigen woorden:
Familie-gewijze foutenkans (αfam): De kans dat deze familie van conclusies tenminste 1 Type-1 error bevat. (familie is een set van vergelijkingen/set van conclusies)
A priori vergelijkingen: Contrasten worden gespecificeerd voordat de data worden verzameld.
Post hoc vergelijkingen: Aanvullende toetsen die worden gedaan nadat een significante F-waarde gevonden is om te bepalen welke gemiddelden significant van elkaar verschillen.
Contrast (ψ): Een combinatie van populatiegemiddelden die onder H0 gelijk is aan 0.
Contrast (c): Het contrast in de steekproef (Contrast invullen met steekproefgemiddelden).
Contrast coëfficiënt (ai): De gewichten die worden geassocieerd met de gemiddeldes.
Bonferroni-methode: Alpha wordt aangepast door deze te delen door het aantal vergelijkingen die gemaakt worden.
Introductory homework assignment 7.2
Een onderzoek naar de effectiviteit van haarwasmiddelen vergelijkt de werking van vier haarwasmiddelen:
– PYR (na 1 maal wassen) – PYR (na 2 maal wassen) – KETO
– een placebo
Een “schilferscore”, lopend van 0-10, wordt voor 8 plekken op de schedel bepaald. De som van de 8 “schilferscores” wordt als afhankelijke variabele gebruikt. Er waren 112 personen per experimentele groep en 28 personen in de placebo groep.
Van te voren stelt de onderzoeker 3 a priori hypotheses op:
1. 1x wassen met PYR werkt minder goed dan 2x wassen met PYR
2. De werking van KETO verschilt ten opzichte van beide PYR behan- delingen
3. De placebo werkt minder goed dan de drie andere condities
Specificeer de a priori contrasten die bij deze vergelijkingen horen in termen van μ’s. Gaat het hier om ́e ́en- of tweezijdige hypothesen?
1. Pyr(1x) minder goed dan Pyr(2x)
H0: ψ = 0
Ha: ψ is niet 0
ψ= μ(pyr1)- μ(pyr2)
2. Keto verschilt t.o.v. Pyr(1) en Pyr(2x)
H0: ψ = 0
Ha: ψ is niet 0
ψ= μ(1)-0,5 μ(2)-0,5 μ(3)
3. Placebo is minder goed dan Pyr(1x) en Pyr(2x) en Keto.
H0: ψ = 0
Ha: ψ is niet 0
ψ= 3 μ(placebo)- μ(1)- μ(2)- μ(3)
1. Eenzijdig
2. Tweezijdig
3. Eenzijdig
Werkgroepopdracht LO 7.1
Kopieer het bestand DANDRUFF.SAV van Blackboard. Toets in SPSS de a priori contrasten zoals opgesteld in Introductory Homework Assignment 7.2. Rapporteer het toetsresultaat en noteer de conclusies.
Analyze à Compare Means à One-way ANOVA dependent: flaking /factor: treatment
Waar je de groep op wil vergelijken is altijd dependent.
De groepsvariabele is de factor.
Contrast 1 of 1
1 addà-1 addà0 addà0 add
Contrast 2 of 2
-1 addà-1 addà2 addà0 add
Contrast 3 of 3
-1 addà-1 addà-1 addà3 add
Contrast 1:
ψ= μ(1)- μ(2)
Contrast 2:
ψ= 2μ(3)- μ(1)- μ(2)
Contrast 3:
ψ= 3μ(4)- μ(1)- μ(2)- μ(3)
Contrast 1:
p=0,236 is niet significant.
Contrast 2:
p=0,000 is significant
Er is verschil, Keto heeft een lagere schilferscore en daarom kan men het best Keto gebruiken.
Contrast 3:
p=0,000 is significant
Het placebo werkt slechter. Het heeft een hoog gemiddelde en werkt daarom niet goed.
Werkgroepopdracht LO 7.2
Gebruik de informatie van opdracht H12.1.
De dataset is te vinden op de website van Howell als Ex12-1.sav
1. Specificeer eerst de a priori contrasten die bij de vergelijkingen horen in termen van μ’s
2. Toets deze a priori contrasten in SPSS
3. Rapporteer het toetsresultaat en noteer de conclusies
4. Zijn de significante resultaten nog steeds significant als we de Bonferroni correctie gebruiken?
A priori contrasten:
Analyze à Compare means à One-way ANOVA dependent: trials/factor: group
Contrast 1 of 1
3 addà3 addà-2 addà-2 addà-2 add
Contrast 2 of 2
1 addà-1 addà0 addà0 addà0 add
Contrast 3 of 3
0 addà0 addà0,5 addà0,5 addà-1 add
Contrast 4 of 4
0 addà0 addà1 addà-1 addà0 add
Contrast 1:
ψ= 3μ(1)+3μ(2)- 2μ(3)- 2μ(4)- 2μ(5)
Contrast 2:
ψ= μ(1)- μ(2)
Contrast 3:
ψ= 0,5μ(3)+ 0,5μ(4)- μ(5)
Contrast 4:
ψ= μ(3)- μ(4)
Contrast 1:
p=0,000 is significant.
Contrast 2:
p=0,001 is significant
Contrast 3:
p=0,449 is niet significant
Contrast 4:
p=0,015 is niet significant.
Groep 3 werkt sneller, want groep 4 beschikt over een hoger gemiddelde, wat betekent meer trials en dus een langere periode voor het is aangeleerd.
Bonferroni correctie
Alpha/4 (aantal vergelijkingen: In dit geval zijn er 4 contrasten opgesteld)=0,0125.
Het vierde contrast is nu niet significant meer. Bonferroni werkt nu als een soort “bescherming”, het corrigeert voor het aantal toetsen die gedaan worden.
Werkgroepopdracht H 11.3a met SPSS
De dataset is te vinden op de website van Howell als Ex11-3.sav
1. Voer de ANOVA uit in SPSS en check tevens de volgende aannames met behulp van SPSS (dus niet met de hand):
– normaliteit van de residuen
– homogeniteit van de varianties van de residuen
2. Interpreteer de resultaten
3. Voer de ANOVA nogmaals uit, maar vraag dit keer om Tukey’s post- hoc toets en interpreteer het resultaat
4. Omdat er eigenlijk niet voldaan wordt aan de aannames, voer je nu ook nog een Kruskal Wallis toets uit in SPSS
Normaliteit van de residuen controleren: Graphs à Legacy dialogs à boxplot: variabele:recall (wat we willen toetsen) CA: group.
Boxplot 2: Onwijs scheef verdeeld : Er is een schending van de assumptie van normaliteit.
Homogeniteit van de varianties van de residuen controleren: Levene’s Statistic: 0,045 (kleiner dan 0,05) Er is een schending van de assumptie van de homogeniteit.
Analyze àCompare means à One-way ANOVA dependent: recall/factor: group. Optionsà homogeneity of variance test, Post hocà (vink aan:) Tukey.
ANOVA F=53,301 Dit is een significante waarde: Er is een verschil in minstens 2 gemiddelden tussen de groepen (minstens 2 condities verschillen).
Welke condities van elkaar verschillen? Hier bekijken we de Post-hoc toets voor. We doen veel meer toetsen dan we eigenlijk nodig hebben, waardoor we power verliezen.
1 en 3 blijken niet van elkaar significant te verschillen.
Non-parametische test van de Anova = Kruskal Wallis toets.
Non-parametic testsàLegacy diaglogsà K independent Define range: min=1, max=4 (Je gaat groep 1 t/m groep 4 vergelijken) (Ze worden iets gerangeerd en vervolgens vergeleken.) X2 kijkt of er verschillen tussen de groepen zitten. X2 is 0,000 en dus significant. Er zit een verschil tussen de groepen, en wel in de medianen. We hebben met de Kruskal Wallis toets namelijk de medianen van verschillende groepen met elkaar vergeleken.
Willen we nu nog zien welke medianen van elkaar verschillend zijn, moeten we deze toets opvolgen met onafhankelijke losse t-toetsjes: Wilcoxon rank toetsen (in de “parametrische wereld”).
Werkgroep 8: Tweeweg Anova
Werkgroepopdracht H 13.5 in SPSS:
Gebruik de informatie van opdracht H13.5. De dataset is te vinden op de website van Howell als Ex13.5.sav. Maak de volgende opgaven:
1. Voer een tweeweg ANOVA uit in SPSS zoals beschreven in H13.5
Analyze > General Linear Model > Univariate
Dependent Variable: Time
Fixed Factor(s): Area, Duration
Vraag bij een One Way Anova altijd de descriptives ook aan.
SS(CM)=916,578
2. Voer de ANOVA nogmaals uit en vraag om gemiddelden
Zie 1, + Options: Descriptive Statistics of Display Means For invullen
3. Voer de ANOVA nogmaals uit en laat nu ook een grafiek maken van de gemiddelden via de optie Plots. “Duration” komt op de horizontale as en “Area” wordt met verschillende lijnen weergegeven.
Zie 1, + Plots
Horizontal Axis: Duration
Seperate Lines: Area
Klik op Add
Hoofdeffect: Area: 365,044/Duration: 188,578
Deze effecten zijn 1(significant, p=0,005) en 2 (niet significant, p=0,052)
Het interactie-effect van Area x Duration: 371,956 (significant, p=0,025)
N2 partial = SSeffect/(Sseffect+SSE)= 371,956/(371,956+1055,200)=0,2606
N2 = SSeffect/SST=371,956/1971,778=0,1886
W2=SSeffect-(DFeffect x MSE)/ SST + MSE= 371,956 – (4x29,311)/ (1971,778 + 29,311) = 0,1272867 (Generaliseer baar naar de populatie).
19% van de verschillen in “Time” worden verklaard door de interactie-effecten tussen Area en Duration.
6. Voer de ANOVA nogmaals uit en vraag om Estimates of effect size en beoordeel de grootte van de effectmaten.
Zie 1, + Options: Estimates of effect size
7. Voer Tukey's post-hoc toets uit en bekijk welke Area-gemiddelden precies significant van elkaar verschillen. Interpreteer het resultaat.
Zie 1, + Post-Hoc > Post Hoc Tests for: Area + selecteer Tukey
Werkgroepopdracht Herhaling:
Kopieer het bestand STUDENT.SAV van Blackboard en maak de volgende opgaven
1. Onderzoek of mensen die geloven in astrologie (V4) verschillen van mensen die niet geloven in astrologie qua lengte
Gebruik hiervoor een contrasttoets: Analyze > CompareMeans > One-wayANOVA > Contrasts
2. Bekijk de relatie tussen Geslacht, Lengte en Gewicht. Pas in de output de resultaten aan zodat alleen de correlaties nog zichtbaar zijn en zijn afgebeeld met 7 decimalen.
Bereken Pearson correlaties: Analyze > Correlate > Bivariate
Gebruik Pivoting Trays om alleen de correlatie weer te geven en cell properties om het aantal decimalen aan te passen
3. Als het aantal uren dat iemand betaald werk heeft voorspeld wordt uit iemands lengte en gewicht, hoeveel variantie wordt dan ALLEEN door gewicht verklaard?
Deze vraag kan op twee manieren geïnterpreteerd worden:
1) Gebruik een meervoudige regressie analyse (methode: ENTER) en vraag om de semi-partiële correlaties (in SPSS onder part). Deze correlaties in het kwadraat geven de unieke verklaarde variantie.
Analyze > Regression > Linear > Statistics: Partandpartial correlations
2) Gebruik een hiërarchische meervoudige regressie analyse en bekijk de R2change
Analyze > Regression > Linear
Dependent: V11
Block 1: V7
Block 2: V8
> Statistics: R squared change
4. Ga na of mensen met verschillende sterrenbeelden overeenkomen in hun reistijd en bekijk of er uit mag worden gegaan van gelijke varianties in de verschillende groepen
Gebruik een eenweg ANOVA en vraag om standaarddeviaties of Levene’s toets
Analyze > Compare Means > One-way ANOVA > Options: Descriptives + Homogeneity of Variance Test
5. Maak een grafiek van Gewicht als functie van Lengte voor alleen de mannen. Laat een regressielijn in de scatterplot tekenen en laat een Regression Prediction Line maken voor de Mean Response met een 90% CI.
Graphs > LegacyDialogs > Scatter/Dot > Simple Scatter
(In output vragen om regressielijn en interval)
Voordat aan een SPSS vraag wordt begonnen, herinner altijd: Hoeveel variabelen zijn in de vraag gegeven? Wat is het meetniveau van de variabelen in de vraag? Wat wordt er van ons gevraagd, wat willen ze weten? Pas hier de strategie op aan die je zal gebruiken om te toetsen.
Contributions: posts
Spotlight: topics
Online access to all summaries, study notes en practice exams
- Check out: Register with JoHo WorldSupporter: starting page (EN)
- Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)
How and why would you use WorldSupporter.org for your summaries and study assistance?
- For free use of many of the summaries and study aids provided or collected by your fellow students.
- For free use of many of the lecture and study group notes, exam questions and practice questions.
- For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
- For compiling your own materials and contributions with relevant study help
- For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, study notes and practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
- Use the menu above every page to go to one of the main starting pages
- Starting pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
- Use the topics and taxonomy terms
- The topics and taxonomy of the study and working fields gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
- Check or follow your (study) organizations:
- by checking or using your study organizations you are likely to discover all relevant study materials.
- this option is only available trough partner organizations
- Check or follow authors or other WorldSupporters
- by following individual users, authors you are likely to discover more relevant study materials.
- Use the Search tools
- 'Quick & Easy'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject.
- The search tool is also available at the bottom of most pages
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
- Check out: Why and how to add a WorldSupporter contributions
- JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
- Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Quicklinks to fields of study for summaries and study assistance
Field of study
- All studies for summaries, study assistance and working fields
- Communication & Media sciences
- Corporate & Organizational Sciences
- Cultural Studies & Humanities
- Economy & Economical sciences
- Education & Pedagogic Sciences
- Health & Medical Sciences
- IT & Exact sciences
- Law & Justice
- Nature & Environmental Sciences
- Psychology & Behavioral Sciences
- Public Administration & Social Sciences
- Science & Research
- Technical Sciences
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
964 |
Add new contribution