Bijlagen: Hoe kun je data in SPSS screenen en opschonen? CH.5
- 1545 keer gelezen
Samengestelde samenvatting, gebaseerd op hoofdstuk 5 van SPSS Survival Manual van Pallant, 6e druk uit 2016.
Het is altijd heel belangrijk om je data even door te lopen op bijvoorbeeld typefouten. Je kan dan natuurlijk alle ingevoerde data nog een keer controleren aan de hand van de oorspronkelijke data, maar dit kost erg veel tijd. Een makkelijkere manier is het opvragen van Frequencies. Dit doet je door de volgende stappen te volgen: Analyze –→ Descriptive Statistics –→ Frequencies.
Voordat je je data kunt analyseren is het van belang om je databestand te controleren voor errors, mogelijke fouten. Als eerst is het belangrijk om te kijken of je typefouten hebt gemaakt (zie boven). Daarnaast is het essentieel om te onderzoeken of er andere fouten zijn met je data. Je volgt hiervoor de volgende stappen:
Stap 1: Het controleren op errors. Eerst is het noodzakelijk om alle scores na te gaan van alle variabelen. Je onderzoekt dan of er bepaalde scores zijn die buiten de normale range vallen.
Stap 2: Het vinden en controleren van error in het databestand. Vervolgens is het noodzakelijk om uit te zoeken waar de error zich bevindt in het databestand. Deze error dient dan of gecorrigeerd te worden of te worden verwijderd.
Wanneer je je bestand controleert op errors ga je met name na of er waarden zijn die buiten de normale range van mogelijke scores vallen. Bijvoorbeeld: wanneer variabele ‘geslacht’ gecodeerd is met 0 of 1 (waarbij geldt 0 = man en 1 = vrouw), is het niet mogelijk om scores te vinden anders dan 0 of 1. Scores die een ander getal dan 0 of 1 hebben (bijvoorbeeld 2 of 3) dienen daarom te worden verwijderd of te worden aangepast. Er zijn verschillende manieren om errors te vinden met IBM SPSS. Deze kunnen grofweg worden verdeeld in twee methoden: één voor error bij categorische variabelen en één voor error bij continue variabelen.
Volg de volgende procedure om error te controleren bij categorische variabelen.
Klik op Analyze en vervolgens op Descsriptive Statistics en dan op Frequencies.
Kies de variabelen die je wil checken (bijvoorbeeld geslacht). Om een variabele gemakkelijk te vinden kun je je variabelenlijst sorteren op alfabet.
Klik op de pijltjestoets (wijzend naar rechts) om de gewenste variabelen te verschuiven naar het variabelenvenster.
Klik vervolgens op Statistics. Vink Minimum en Maximum aan in de Disperson sectie.
Klik vervolgens op Continue en dan op OK (of op Paste om alles op te slaan in de Syntax Editor).
De syntax wordt als volgt gegenereerd:
FREQUENCIES VARIABLES=geslacht
/STATISTICS=MINIMUM MAXIMUM
/ORDER=ANALYSIS.
In dit voorbeeld zie je dat er één error is in het databestand. Er is namelijk één proefpersoon waarbij het geslacht is gecodeerd met cijfer 2 (in plaats van 0 of 1). Kijk daarom bij deze proefpersoon na of er sprake is van een mannelijk geslacht of vrouwelijk geslacht. Verander daarna de data van deze proefpersoon.
Het kan ook voorkomen dat er bij een proefpersoon vergeten is om data in te voeren voor de desbetreffende variabele. In de tabel kun je deze vinden bij ‘Missing’.
In dit voorbeeld is bijvoorbeeld te zien dat bij één proefpersoon de data voor variabele geslacht ontbreekt. Zoek deze proefpersoon op en kijk of je de data kunt corrigeren (zie hieronder).
Wat te doen wanneer je responsen hebt gevonden die buiten de normale range vallen? Dan is het belangrijk om deze proefpersonen op te sporen. Dit kun je doen door de volgende stappen te ondernemen:
Klik op Data en vervolgens kies je voor Sort Cases.
In het dialoogvenster kies je vervolgens de variabele waarvoor je wist dat er sprake was van error (in dit geval dus ‘geslacht’). Klik op de pijltjestoets (wijzend naar rechts) en verplaats de variabele naar het Sort By venster. Kies dan uit ascending (van laag naar hoog) of descending (van hoog naar laag). In ons voorbeeld willen we graag de proefpersoon vinden die bij geslacht antwoordoptie ‘2’ had. We kiezen in dit geval dus voor aflopend (descending).
Klik dan op OK.
Volg de volgende procedure om error te controleren bij continue variabelen.
De syntax wordt als volgt gegenereerd:
DESCRIPTIVES
VARIABLES=age
/STATISTICS=MEAN STDDEV MIN MAX
Bekijk of de minimum en maximum logisch zijn, bijvoorbeeld een leeftijd van 2 tot 82. Bekijk ook of het gemiddelde logisch is, of dat er bepaalde gegevens zijn die het gemiddelde sterk doen afwijken.
Summarize Cases geeft je een tabel met daarin specifieke informatie voor elke proefpersoon. Je volgt de volgende stappen om deze samenvatting te verkrijgen:
Klik op Analyze, ga naar Reports en kies dan voor Case Summaries.
Kies de variabelen waarin je geïnteresseerd bent (in dit geval geslacht, provincie en leeftijd).
Klik op Statistics en verwijder Number of Case van het Cell Statistics venster. Klik dan op Continue.
Klik op Options en verwijder Subheadings for totals.
Klik op Continue en vervolgens op OK (of op Paste als je de analyse wil opslaan in de Syntax Editor).
De syntax wordt als volgt gegenereerd:
SUMMARIZE
/TABLES=geslacht provincie leeftijd
/FORMAT=VALIDLIST NOCASENUM NOTOTAL LIMIT=5
/TITLE='Case Summaries'
/MISSING=VARIABLE
/CELLS=NONE.
In het voorbeeld is alleen een samenvatting gegeven van de eerste vijf proefpersonen. Dit kun je aangeven door onder Display Cases bij Limit cases to first het aantal te noteren (in dit geval 5).
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
Samengestelde samenvatting, gebaseerd op de SPSS Survival Manual van Pallant, 6e druk uit 2016.
Deze samenvatting is zowel te gebruiken bij versie 24 van IBM SPSS als bij andere versies. Bij gebruik van andere versies kan het voorkomen dat de opties een soortgelijke naam hebben gekregen...
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Main summaries home pages:
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
7242 |
Add new contribution