Bijlagen: Hoe gebruik je SPSS voor beschrijvende statistiek? CH.6
- 1455 keer gelezen
Samengestelde samenvatting, gebaseerd op hoofdstuk 6 van SPSS Survival Manual van Pallant, 6e druk uit 2016.
Wanneer je er zeker van bent dat er geen sprake is van error in je databestand dan kun je beginnen met de beschrijvende fase van je data-analyse. Dit noemde we beschrijvende statistiek ofwel descriptive statistics. Deze hebben als doel:
Het beschrijven van de kenmerken van je steekproef in de methodesectie van je artikel
Het checken van je variabelen om te onderzoeken of je aan bepaalde assumpties voldoet behorende bij de statistiektechnieken die je wilt uitvoeren om je onderzoeksvragen te beantwoorden
Het stellen van specifieke onderzoeksvragen
Wanneer het om onderzoek met menselijke proefpersonen gaat is het vrijwel noodzakelijk om algemene kenmerken te verzamelen. Denk hierbij aan het aantal mensen in de steekproef, het aantal of percentage mannen en vrouwen, de leeftijden, en opleidingsniveau.
Voorbeelden van beschrijvende statistieken zijn het gemiddelde, de standaarddeviatie en de spreiding van de scores.
Als je alleen een snelle samenvatting wilt van de kenmerken van je variabelen in je databestand heb je waarschijnlijk genoeg aan een codeboek. Hier volgt de procedure om een codeboek te verkrijgen.
Klik op Analyze en ga naar Reports en kies Codebook.
Selecteer de variabelen die je wilt (bijvoorbeeld geslacht, leeftijd) en sleep deze variabelen naar het Codebook Variables venster.
Klik op het Output blad en vink alle Opties uit, behalve Label, Value Labels and Missing Values, uit.
Klik op Statistics en zorg ervoor dat alle opties in beide secties zijn aangevinkt.
Klik op OK (of op Paste om alles op te slaan in de Syntax Editor).
De syntax is dan als volgt:
DATASET ACTIVATE DataSet1.
CODEBOOK geslacht [n] leeftijd [s]
/VARINFO LABEL VALUELABELS MISSING
/OPTIONS VARORDER=VARLIST SORT=ASCENDING MAXCATS=200
/STATISTICS COUNT PERCENT MEAN STDDEV QUARTILES.
Deze output geeft je een snelle samenvatting van de proefpersonen in je databestand. Als je meer gedetailleerde informatie wilt hebben kun je deze verkrijgen door middel van Frequencies, Descriptive of Explore. Om informatie te verkrijgen van categorische variabelen kun je gebruikmaken van Frequencies.
Om beschrijvende statistieken te krijgen van categorische variabelen maak je gebruik van de functie Frequencies. Deze vind je door de volgende stappen:
Ga naar Analyze en vervolgens naar Descriptive Statistics en dan naar Frequencies.
Kies vervolgens de categorische variabelen waarin je geïnteresseerd bent. Verschuif deze naar de variabelenbox.
Klik dan op OK (of op Paste als je het wil opslaan op de Syntax Editor).
De syntax die bij deze procedure hoort is:
FREQUENCIES
VARIABES = geslacht
/ORDER = ANALYSIS
Voor continue variabelen (bijvoorbeeld leeftijd) is het makkelijker om Descriptives te gebruiken. Deze analyse verschaft de basis ‘samenvattende’ statistieken zoals het gemiddelde, de mediaan en de standaarddeviatie. Het betrouwbaarheidsinterval vind je door middel van Explore.
De procedure behorende bij het verkrijgen van beschrijvende statistiek voor continue variabelen is:
Klik op Analyze selecteer daarna Descriptive Statistics en vervolgens Descriptives.
Klik alle continue variabelen aan waarvan je graag beschrijvende statistieken voor wilt verkrijgen. Klik vervolgens op de pijltjestoets (wijzend naar rechts) om deze variabelen te verschuiven naar de Variables sectie.
Klik op Options. Zorg ervoor dat de volgende statistieken zijn aangevinkt: mean, standard deviation, minimum, maximum en klik vervolgens ook skewness en kurtosis aan.
Klik op Continue en vervolgens op OK (of op Paste om de analyse op te slaan in de Syntax Editor).
De syntax die bij deze procedure wordt gegenereerd is:
DESCRIPTIVES
VARIABLES = leeftijd
/STATISTICS=MEAN STDDEV MIN MAX KURTOSIS SKEWNESS
De Skewness functie geeft informatie over de symmetrie van de verdeling van de scores. Kurtosis geeft informatie over de piek van de verdeling. Als de verdeling van de scores perfect normaal verdeeld zouden zijn zouden zowel de Skewness als de Kurtosis negnoeg nul zijn. Een positieve waarde van skewness indiceert dat de scores zich met name aan de linkerkant bevinden. Negatieve waardes suggereren dat de scores zich met name aan de rechterkant begeven van het gemiddelde. Een Kurtosis van nagenoeg nul indiceert een verdeling die relaties vlak is (te veel proefpersonen in de extreme scores).
Bij het doen van onderzoek, in het bijzonder naar mensen, verkrijg je zelden van iedere casus alle gegevens. Daarom is het belangrijk dat bij het onderzoek ook gekeken wordt naar de ontbrekende data. Dit kan in SPSS met behulp van de Missing Value Analysis procedure (onderste optie in het Analyze menu). Tevens moet je beslissen hoe je tijdens het uitvoeren van statistische analyses met ontbrekende data omgaat. De Options-knop in veel van de statistische procedures in SPSS biedt diverse keuzemogelijkheden betreffende het omgaan met ontbrekende data. Het is belangrijk dat je hier zorgvuldig uit kiest, aangezien het grote gevolgen kan hebben op je resultaten. De verschillende opties voor het omgaan met ontbrekende data zijn:
Het wordt sterk aangeraden om de optie exclude cases pairwise te gebruiken, tenzij er een zeer dringende reden is anders te doen.
Hier volgt de procedure om normaliteit te meten door middel van Explore.
Kies Analyze en selecteer Descriptive statistics en vervolgens Explore.
Klik de variabelen aan waarin je geïnteresserd bent. Klik op de pijltjestoets (wijzend naar rechts) en sleep deze variabelen naar de Dependent list.
Plaats in de Labels Cases by je onafhankelijke variabele.
In de Display sectie: zorg ervoor dat Both is geselecteerd.
Klik op Statistics en klik Descriptives en Outliers aan. Klik daarna op Continue.
Klik daarna op Plots en klik onder Descriptives aan: Histogram. Vervolgens vink je Stem-and-leaf uit. Klik Normality plots with tests aan en klik daarna op Continue.
Klik op Options. In de Missing Values sectie klik je op Exclude cases pairwise. Klik daarna op Continue en op OK (of op Paste om de analyse op te slaan in de Syntax Editor).
De syntax wordt als volgt gegenereerd:
EXAMINE VARIABLES=leeftijd
/ID=geslacht
/PLOT BOXPLOT HISTOGRAM NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING PAIRWISE
/NOTOTAL.
Bij het meten normaliteit komt er veel output uit. De output kun je als volgt interpreteren.
Deze functie haalt 5% van het bovenste en 5% van het onderste van de gegevens af, en berekent hiermee een nieuw gemiddelde, waarop de sterk afwijkende gegevens minder invloed hebben gehad. Als je dit nieuwe gemiddelde vergelijkt met het oorspronkelijke gemiddelde, kun je zien hoeveel invloed de meest afwijkende gegevens hebben. Je kunt de meest afwijkende gegevens zien bij Extreme Values.
De Skewness functie geeft informatie over de symmetrie van de verdeling van de scores. Kurtosis geeft informatie over de piek van de verdeling. Tezamen geven de skewness en kurtosis informatie over de distributie van scores over de verschillende groepen.
De Kolmogorov-Smirnov test kan worden gebruikt om te onderzoeken of de resultaten normaal verdeeld zijn. Je voert deze toets uit met ‘Explore’. Je volgt dan de volgende stappen: Analyze –→ Descriptive statistics –→ Explore. Verevolgens kies je je afhankelijke variabele. Vervolgens ga je naar ‘Plots’. Bij ‘Boxplots’ vink je ‘None’ aan. Vervolgens vink je aan ‘Normality plots with tests’. Bij ‘Descriptive’ klik je ‘Stem-and-leaf’ uit en klink je ‘Histogram’ aan. Klik op ‘Continue’.
Vervolgens kijk je in je output naar de ‘Tests of Normality’ tabel. Een niet-significant resultaat (p > .05) indiceert een normale verdeling. In de tabel is sprake van een significante p-waarde, waardoor niet kan worden voldaan aan de assumptie van normaliteit. Dit komt vaak voor bij grote steekproeven.
De vorm van de verdeling per groep is te zien met Histograms. Hiermee kun je bekijken of er sprake is van een normale verdeling.
De Boxplot geeft met een rechthoek 50% van de gevallen weer. De lijntjes erbuiten geven de kleinste en grootste waarde weer.
Soms worden in een Boxplot cirkels weergegeven, dit zijn de outliers.
‘Outliers’, of uitbijters, bestaan uit proefpersonen die extreem hoge of extreem lage waarden hebben in vergelijking met de meerderheid van de dataset. Er zijn verschillende technieken mogelijk om outliers te controleren, namelijk door middel van een histogram, boxplot of informatie in de descriptives tabel. Wanneer je outliers hebt gevonden, kun je nieuwe variabelen aanmaken die geen outliers bevatten.
Je kunt eerst de variabele los van elkaar bekijken door middel van Analyze –→ Descriptives –→ Frequencies.
Je kan nu de functie recode gebruiken wanneer de data bijvoorbeeld alleen de waardes 1 t/m 10 kan hebben maar er ook 100 in voorkomen. Als dit het geval is kan je door middel van ‘Recode into different variabele’ een nieuwe variabele aan maken. Voor dit laatste: klik op ‘Analyze’ -> ‘Descriptive Statistics’ -> ‘Explore’
Klik op de variabele waarin je geïnteresseerd bent.
Klik dan op ‘Statistics’ en klik op ‘Outliers’ → ‘Continue’ → ‘OK’
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
Samengestelde samenvatting, gebaseerd op de SPSS Survival Manual van Pallant, 6e druk uit 2016.
Deze samenvatting is zowel te gebruiken bij versie 24 van IBM SPSS als bij andere versies. Bij gebruik van andere versies kan het voorkomen dat de opties een soortgelijke naam hebben gekregen...
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Main summaries home pages:
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
4580 | 1 |
Add new contribution