
Samenvatting SPSS-videos statistiek II Politicologie Universiteit Leiden Jaar 1, blok 3
SPSS instructies video samenvatting Statistiek II:
Scatterplot en regressielijn
Scatterplot maken (simpel):
Beide interval ratio, geen missing values!
x-as onafhankelijk, y-as afhankelijjk
Graphs > Chartbuilder > Scatter > simple scatter > linear fit lines total > OK
Chart editor > fit line at total
Scatterplot maken (lastig)
Beide interval ratio, geen missing values!
x-as onafhankelijk, y-as afhankelijjk
Graphs > Chartbuilder > Scatter > simple scatter > Paste > (rij ELEMENT point.jitter( > Run (vanaf GGRAPH)
Chart editor > fit line at total
Bivariate en multivariate regressie
Bivariate regressie analyse maken
Beide interval ratio
Analyze > regression > linear > Dependent en independent > ok
Coefficients unstandardized B voor de constante en de richtingscoëfficient
Multivariate regressie analyse maken
Beide interval ratio
Analyze > regression > linear > Dependent en 2x independent > ok
Multivariate regressie hiërarchische methode gebruiken
Analyze > regression > linear > independent > next > independent > r square change (geeft weer of het model in blok twee significant beter is dan het model in blok 1) > OK
Significantie van de R squared change laat zien of model 1 beter is dan geen independent variables en of model 2 beter is dan model 1.
Anovatest: laat zien dat beide modellen dezelfde N gebruikt
Coëfficiënts: constanten en coëfficienten voor model 1 en 2 los, laat zien dat beide een significante waarde hebben
excluded variable: laat zien welke waarde niet is toegevoegd aan model 1
Dummy-variabelen in een regressieanalyse
Voor nominale waarden in een regressietabel moet er een dummyvariabele worden gemaakt
transform > recode into different variable > verander naam in voorspelling van de nieuwe variabele > Change > old and new values > 1 wordt 0, 2 wordt 1, MISSING-SYSMIS
Analyze > regression > linear > independent=dummy > ok
Coefficients: constante laat de gemiddelde waarde op de variabele zien, female coefficient laat zien hoe meer/minder op de variabele wordt gekeken (Let op sig)
Bij meerdere dummies
Transform > create dummy’s > create dummy variables for > Rootname > OK > SPSS heeft nu voor elke categorie een dummy heeft gemaakt, bij een regressie analyse neem je alle dummy’s -1 op. De overige is de referentiecategorie.
Regressieanalyse met meerdere dummy’s
Analyze > regression > linear > dummy’s-1 in independent > ok
Constante: gemiddelde score
MISSINGS altijd eerst aangeven voor het creëren van dummys! Anders worden deze bij een regressieanalyse gezien worden als onderdeel van de constante.
Interactie in de lineaire regressie
Eerst regressie uitvoeren
Interactie-effect toevoegen
Transform > compute > vermenigvuldigen van 2 independent waarden.
Interpretatie:b1 geeft zijn effect op de dependent waarde, de b2 zijn effect. Om het totale effect van een coëfficient te vinden op 2 waarden (Bijvoorbeeld op een bepaalde locatie, of een bepaald regime) moeten b1 en b3 worden opgeteld. Dan heb je het totale effect van b1 op de onafhankelijke variabele waar b3 geldt.
Assumpties van de lineaire regressie testen
Bij meerdere onafhankelijke waarden
Onafhankelijke errors: durbin watson test: regressiescherm > statistics > durbin-watson > OK > model summary > 2 = geen probleem
Multicollineariteit: regressiescherm > statistics > Collinearity diagnostics > OK > Tolerance en VIF > VIF moet lager zijn dan 5.
Non-lineariteit: regressiescherm > plots > Y=zresid X=ZPRED > produce all partial plots > continue > OK > scatterplots > kijk of er nonlineaire patronen zichtbaar zijn
Heteroskedasticiteit: regressiescherm > plots > Y=zresid X=ZPRED > produce all partial plots > continue > OK > scatterplots > is er minder variantie bij de getallen verder van 0? > oplossen door variabele te veranderen in het natuurlijk logaritme.
Transform > compute variable > LN(VARIABELE) > OK > voeg toe aan de regressieanalyse
non-Normaliteit van de errors: normal probability plot
- regressiescherm > plots > Y=zresid X=ZPRED > Normal probability plot > OK > liggen de errors op de diagonale lijn?
Outliers & influential cases: regressiescherm > statistics > casewise diagnostics > outlier outside > 2 standard deviations > Continue
Save > unstandardized, adjusted, Distances, residuals, influence statistics > Continue > OK
Casewise diagnostics > laat de casussen zien die boven 2 komen
residual statistics > samenvatting van elke waarde met min,max en mean.
Om dit te controleren moet de case worden weggefilterd.
Data > select cases > if condition is satisfied > (ZRE_1 < 2 & ZRE_1 > -2) > continue > filter out unselected cases > OK
Opnieuw de regressieanalyse doen en vergelijken of deze afwijkt van de vorige analyse.
Logistische regressie uitvoeren in SPSS
Hebben meerdere variabelen effect op één afhankelijke variabele
Voor logistische regressie variabelen aanpassen naar 2 antwoord opties (ja of nee, man of vrouw), anderen naar interval ratio
Voor dummy van afhankelijke waarde: Transform > recode into different variable > 1 - 1, 2 - 0, Else - missing
Analyze > regression > binary logistic > dummy naar dependent, rest naar independent
Block 0 = zonder onafhankelijke variabelen
Block 1 = met onafhankelijke variabelen. Variables in the equation geeft de coëfficiënten weer, EXP(B)>1 en positieve richtingscoëfficiënt > positief verband > let op significantie!
Logistische regressie: hiërarchische methode uitvoeren in SPSS
Analyze > regression > binary logistic > dummy naar dependent, onafhankelijke variabelen in blokken > OK
Block 1: Omnibus test of model coëfficients: is model 1 beter dan model 0? > zie aan chikwadraat positief getal
Block 2: Omnibus test of model coëfficients: is model 1 beter dan model 0? > zie aan chikwadraat positief getal. Model vergelijkt block 2 met block 0.
Logistische regressie met interactie toevoegen
transform > compute variable > b1 x b2 > toevoegen aan regressieanalyse
Interpretatie: omdat de dummy bestaat aan 1x 0 en 1x1 zit er een verschil in omdat het interactie effect wordt bijgerekend wanneer de 1x0 wordt gebruikt.
Logistische regressie: assumpties testen
multicollineariteit: voer de analyse uit als lineair > statistics > collinearity diagnostics > continue > OK > kijk naar Tolerance en VIF > VIF onder 5
Outliers en influential Cases: Logitic regressian > options > casewise diagnostics buiten 2 > continue > save > influence, unstandardized, standardized en studentized > continue > OK
Casewise list laat zien welke casussen buiten 2 vallen
Andere maatstaven opvragen: Analyze > descriptive statistics > summary statistics opvragen van de gecreëerde variabelen > min max means.
Het is zorgwekkend als er cassussen zijn ZRE>3,29, 1% van de casussen ZRE>2,58 of 5% van de casussen ZRE>1,96
DUmmy variabele aanmaken om te controleren: transform > compute variable > ZRE_1 > 1.96 | ZRE_1 < -1,96= 1
Frequentie tabel van deze variabel
Missing values bereken als percentage van het totaal
Lineaire regressie gebruiken:
stap 1: variabelen inspecteren
Analyze > descriptive statistics > frequencies > frequentietabel voor alle variabelen >
Stap 2: missings aanduiden
Stap 3: hercoderen nominaal en ordinaal naar dummy’s
transform>recode into different variable > OK
Stap 4: regressie analyse zelf
analyze > regression > linear > independent and dependent > OK
Stap 5: assumpties testen
analyze > regression > linear > statistics > collinearity diagnostics, durbin watson, casewise diagnostics 2 > plots > ZRESID Y, ZPRED X, produce all partial plots, normal probability plot > Continue > Save > Unstandardized, adjusted, distances, residuals, influence statistics > continue > Ok
Stap 6: rapportage voorbeeld tabel:
Logistische regressie gebruiken:
stap 1: variabelen inspecteren
Analyze > descriptive statistics > frequencies > frequentietabel voor alle variabelen >
Stap 2: missings aanduiden
Stap 3: hercoderen nominaal en ordinaal naar dummy’s
transform>recode into different variable > naar 0 en 1 > OK
voor veel dummy’s
Transforms>create dummy’s>ordinale waarde naar create dummy’s for> create dummy’s for all variables > OK
Stap 4: regressie uitvoeren
Analyze > regression > binary logistic > dependent, rest in independent > OK
Block 0: model zonder onafhankelijke variabelen
Block 1: eigenlijke model
Stap 5: assumpties testen:
analyze > regression > linear > statistics > collinearity diagnostics > OK > Tolerance en VIF waarden.
Analyze > regression > binary logistic > options > outliers outside 2 >continue > SAVE > influence, unstandardised, studentized, standardized > continue > OK
Stap 6: rapportage:
Eventueel:
Analyze > regression > binary logistic > options > CI for EXP(B) 95% > continue > OK
SPSS toets
120 min
voor elke vraag:
Syntax
output
interpretatie van de output
Tentameninfo
180 min
40 meerkeuzevragen
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Contributions: posts
Spotlight: topics
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Add new contribution