Hoe gebruik je SPSS voor beschrijvende statistiek? CH.6

Samengestelde samenvatting, gebaseerd op hoofdstuk 6 van SPSS Survival Manual van Pallant, 6e druk uit 2016.

Wanneer je er zeker van bent dat er geen sprake is van error in je databestand dan kun je beginnen met de beschrijvende fase van je data-analyse. Dit noemde we beschrijvende statistiek ofwel descriptive statistics. Deze hebben als doel:

  • Het beschrijven van de kenmerken van je steekproef in de methodesectie van je artikel

  • Het checken van je variabelen om te onderzoeken of je aan bepaalde assumpties voldoet behorende bij de statistiektechnieken die je wilt uitvoeren om je onderzoeksvragen te beantwoorden

  • Het stellen van specifieke onderzoeksvragen

Wanneer het om onderzoek met menselijke proefpersonen gaat is het vrijwel noodzakelijk om algemene kenmerken te verzamelen. Denk hierbij aan het aantal mensen in de steekproef, het aantal of percentage mannen en vrouwen, de leeftijden, en opleidingsniveau.

Voorbeelden van beschrijvende statistieken zijn het gemiddelde, de standaarddeviatie en de spreiding van de scores.

Procedure voor het maken van een codeboek

Als je alleen een snelle samenvatting wilt van de kenmerken van je variabelen in je databestand heb je waarschijnlijk genoeg aan een codeboek. Hier volgt de procedure om een codeboek te verkrijgen.

  1. Klik op Analyze en ga naar Reports en kies Codebook.

  2. Selecteer de variabelen die je wilt (bijvoorbeeld geslacht, leeftijd) en sleep deze variabelen naar het Codebook Variables venster.

  3. Klik op het Output blad en vink alle Opties uit, behalve Label, Value Labels and Missing Values, uit.

  4. Klik op Statistics en zorg ervoor dat alle opties in beide secties zijn aangevinkt.

  5. Klik op OK (of op Paste om alles op te slaan in de Syntax Editor).

De syntax is dan als volgt:

DATASET ACTIVATE DataSet1.

CODEBOOK geslacht [n] leeftijd [s]

/VARINFO LABEL VALUELABELS MISSING

/OPTIONS VARORDER=VARLIST SORT=ASCENDING MAXCATS=200

/STATISTICS COUNT PERCENT MEAN STDDEV QUARTILES.

Deze output geeft je een snelle samenvatting van de proefpersonen in je databestand. Als je meer gedetailleerde informatie wilt hebben kun je deze verkrijgen door middel van Frequencies, Descriptive of Explore. Om informatie te verkrijgen van categorische variabelen kun je gebruikmaken van Frequencies.

6.1 Wat is de procedure voor het verkrijgen van beschrijvende statistiek voor categorische variabelen?

Om beschrijvende statistieken te krijgen van categorische variabelen maak je gebruik van de functie Frequencies. Deze vind je door de volgende stappen:

  1. Ga naar Analyze en vervolgens naar Descriptive Statistics en dan naar Frequencies.

  2. Kies vervolgens de categorische variabelen waarin je geïnteresseerd bent. Verschuif deze naar de variabelenbox.

  3. Klik dan op OK (of op Paste als je het wil opslaan op de Syntax Editor).

De syntax die bij deze procedure hoort is:

FREQUENCIES

VARIABES = geslacht

/ORDER = ANALYSIS

6.2 Wat is de procedure voor het verkrijgen van beschrijvende statistiek voor continue variabelen?

Voor continue variabelen (bijvoorbeeld leeftijd) is het makkelijker om Descriptives te gebruiken. Deze analyse verschaft de basis ‘samenvattende’ statistieken zoals het gemiddelde, de mediaan en de standaarddeviatie. Het betrouwbaarheidsinterval vind je door middel van Explore.

De procedure behorende bij het verkrijgen van beschrijvende statistiek voor continue variabelen is:

  1. Klik op Analyze selecteer daarna Descriptive Statistics en vervolgens Descriptives.

  2. Klik alle continue variabelen aan waarvan je graag beschrijvende statistieken voor wilt verkrijgen. Klik vervolgens op de pijltjestoets (wijzend naar rechts) om deze variabelen te verschuiven naar de Variables sectie.

  3. Klik op Options. Zorg ervoor dat de volgende statistieken zijn aangevinkt: mean, standard deviation, minimum, maximum en klik vervolgens ook skewness en kurtosis aan.

  4. Klik op Continue en vervolgens op OK (of op Paste om de analyse op te slaan in de Syntax Editor).

De syntax die bij deze procedure wordt gegenereerd is:

DESCRIPTIVES

VARIABLES = leeftijd

/STATISTICS=MEAN STDDEV MIN MAX KURTOSIS SKEWNESS

De Skewness functie geeft informatie over de symmetrie van de verdeling van de scores. Kurtosis geeft informatie over de piek van de verdeling. Als de verdeling van de scores perfect normaal verdeeld zouden zijn zouden zowel de Skewness als de Kurtosis negnoeg nul zijn. Een positieve waarde van skewness indiceert dat de scores zich met name aan de linkerkant bevinden. Negatieve waardes suggereren dat de scores zich met name aan de rechterkant begeven van het gemiddelde. Een Kurtosis van nagenoeg nul indiceert een verdeling die relaties vlak is (te veel proefpersonen in de extreme scores).

6.3 Hoe ontdek je ontbrekende data?

Bij het doen van onderzoek, in het bijzonder naar mensen, verkrijg je zelden van iedere casus alle gegevens. Daarom is het belangrijk dat bij het onderzoek ook gekeken wordt naar de ontbrekende data. Dit kan in SPSS met behulp van de Missing Value Analysis procedure (onderste optie in het Analyze menu). Tevens moet je beslissen hoe je tijdens het uitvoeren van statistische analyses met ontbrekende data omgaat. De Options-knop in veel van de statistische procedures in SPSS biedt diverse keuzemogelijkheden betreffende het omgaan met ontbrekende data. Het is belangrijk dat je hier zorgvuldig uit kiest, aangezien het grote gevolgen kan hebben op je resultaten. De verschillende opties voor het omgaan met ontbrekende data zijn:

  • De Exclude cases listwise-optie neemt alle casussen in de analyses mee, mits er geen sprake is van ontbrekende data. Een casus waarbij sprake is van ontbrekende data wordt volledig buiten de analyse gehouden.
  • De Exclude cases pairwise-optie (soms ook aangeduid als Exclude cases analysis by analysis) sluit alleen casussen uit indien de benodigde data voor een specifieke analyse ontbreekt. Ze worden wel meegenomen in een analyse waarvoor ze de benodigde informatie bevatten.
  • De Replace with mean-optie berekent de gemiddelde waarde voor de variabele en geeft elke missende casus deze waarde. Deze optie dient nooit te worden gebruikt, omdat het de resultaten van je analyse ernstig kan verstoren.

Het wordt sterk aangeraden om de optie exclude cases pairwise te gebruiken, tenzij er een zeer dringende reden is anders te doen.

6.4 Hoe meet je normaliteit?

Hier volgt de procedure om normaliteit te meten door middel van Explore.

  1. Kies Analyze en selecteer Descriptive statistics en vervolgens Explore.

  2. Klik de variabelen aan waarin je geïnteresserd bent. Klik op de pijltjestoets (wijzend naar rechts) en sleep deze variabelen naar de Dependent list.

  3. Plaats in de Labels Cases by je onafhankelijke variabele.

  4. In de Display sectie: zorg ervoor dat Both is geselecteerd.

  5. Klik op Statistics en klik Descriptives en Outliers aan. Klik daarna op Continue.

  6. Klik daarna op Plots en klik onder Descriptives aan: Histogram. Vervolgens vink je Stem-and-leaf uit. Klik Normality plots with tests aan en klik daarna op Continue.

  7. Klik op Options. In de Missing Values sectie klik je op Exclude cases pairwise. Klik daarna op Continue en op OK (of op Paste om de analyse op te slaan in de Syntax Editor).

De syntax wordt als volgt gegenereerd:

EXAMINE VARIABLES=leeftijd

/ID=geslacht

/PLOT BOXPLOT HISTOGRAM NPPLOT

/COMPARE GROUPS

/STATISTICS DESCRIPTIVES

/CINTERVAL 95

/MISSING PAIRWISE

/NOTOTAL.

Interpretatie van de output van normaliteit

Bij het meten normaliteit komt er veel output uit. De output kun je als volgt interpreteren.

Trimmed mean

Deze functie haalt 5% van het bovenste en 5% van het onderste van de gegevens af, en berekent hiermee een nieuw gemiddelde, waarop de sterk afwijkende gegevens minder invloed hebben gehad. Als je dit nieuwe gemiddelde vergelijkt met het oorspronkelijke gemiddelde, kun je zien hoeveel invloed de meest afwijkende gegevens hebben. Je kunt de meest afwijkende gegevens zien bij Extreme Values.

Skewness en kurtosis

De Skewness functie geeft informatie over de symmetrie van de verdeling van de scores. Kurtosis geeft informatie over de piek van de verdeling. Tezamen geven de skewness en kurtosis informatie over de distributie van scores over de verschillende groepen.

Kolmogorov-Smirnov

De Kolmogorov-Smirnov test kan worden gebruikt om te onderzoeken of de resultaten normaal verdeeld zijn. Je voert deze toets uit met ‘Explore’. Je volgt dan de volgende stappen: Analyze –→ Descriptive statistics –→ Explore. Verevolgens kies je je afhankelijke variabele. Vervolgens ga je naar ‘Plots’. Bij ‘Boxplots’ vink je ‘None’ aan. Vervolgens vink je aan ‘Normality plots with tests’. Bij ‘Descriptive’ klik je ‘Stem-and-leaf’ uit en klink je ‘Histogram’ aan. Klik op ‘Continue’.

Vervolgens kijk je in je output naar de ‘Tests of Normality’ tabel. Een niet-significant resultaat (p > .05) indiceert een normale verdeling. In de tabel is sprake van een significante p-waarde, waardoor niet kan worden voldaan aan de assumptie van normaliteit. Dit komt vaak voor bij grote steekproeven.

Histograms

De vorm van de verdeling per groep is te zien met Histograms. Hiermee kun je bekijken of er sprake is van een normale verdeling.

Boxplot

De Boxplot geeft met een rechthoek 50% van de gevallen weer. De lijntjes erbuiten geven de kleinste en grootste waarde weer.

Soms worden in een Boxplot cirkels weergegeven, dit zijn de outliers.

6.5 Hoe controleer je of er outliers zijn?

‘Outliers’, of uitbijters, bestaan uit proefpersonen die extreem hoge of extreem lage waarden hebben in vergelijking met de meerderheid van de dataset. Er zijn verschillende technieken mogelijk om outliers te controleren, namelijk door middel van een histogram, boxplot of informatie in de descriptives tabel. Wanneer je outliers hebt gevonden, kun je nieuwe variabelen aanmaken die geen outliers bevatten.

  1. Je kunt eerst de variabele los van elkaar bekijken door middel van Analyze –→ Descriptives –→ Frequencies.

  2. Je kan nu de functie recode gebruiken wanneer de data bijvoorbeeld alleen de waardes 1 t/m 10 kan hebben maar er ook 100 in voorkomen. Als dit het geval is kan je door middel van ‘Recode into different variabele’ een nieuwe variabele aan maken. Voor dit laatste: klik op ‘Analyze’ -> ‘Descriptive Statistics’ -> ‘Explore’

  3. Klik op de variabele waarin je geïnteresseerd bent.

  4. Klik dan op ‘Statistics’ en klik op ‘Outliers’ → ‘Continue’ → ‘OK’

Image

Access: 
Public

Image

Join WorldSupporter!
Search a summary

Image

 

 

Contributions: posts

Help other WorldSupporters with additions, improvements and tips

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.

Image

Spotlight: topics

Check the related and most recent topics and summaries:
Activities abroad, study fields and working areas:

Image

Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams

How and why use WorldSupporter.org for your summaries and study assistance?

  • For free use of many of the summaries and study aids provided or collected by your fellow students.
  • For free use of many of the lecture and study group notes, exam questions and practice questions.
  • For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
  • For compiling your own materials and contributions with relevant study help
  • For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, notes and practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Use the summaries home pages for your study or field of study
  2. Use the check and search pages for summaries and study aids by field of study, subject or faculty
  3. Use and follow your (study) organization
    • by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
    • this option is only available through partner organizations
  4. Check or follow authors or other WorldSupporters
  5. Use the menu above each page to go to the main theme pages for summaries
    • Theme pages can be found for international studies as well as Dutch studies

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study for summaries and study assistance

Main summaries home pages:

Main study fields:

Main study fields NL:

Follow the author: Psychology Supporter
Work for WorldSupporter

Image

JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Statistics
4580 1