Samenvatting van SPSS Survival Manual van Pallant - 6e druk
- 3303 keer gelezen
Samengestelde samenvatting, gebaseerd op hoofdstuk 15 van SPSS Survival Manual van Pallant, 6e druk uit 2016.
Factoranalyse verschilt van veel van de andere technieken in SPSS. Het is niet ontworpen om hypothesen te toetsen of om aan te geven of de ene groep significant verschilt van de andere groep. In plaats daarvan neemt het een grote reeks variabelen en zoekt naar een manier om de data te ‘reduceren’ of samen te vatten door het gebruik van een kleinere verzameling factoren of componenten. Dit wordt gedaan door te zoeken naar clusters of groepen tussen de intercorrelaties van een verzameling variabelen. Er zijn twee kernbenaderingen van de factoranalyse: (1) exploratieve factoranalyse – vaak gebruikt tijdens de vroege onderzoekstadia om informatie over de relaties tussen een verzameling variabelen te verzamelen – en (2) confirmatieve factoranalyse – later in het onderzoeksproces toegepast om specifieke hypothesen of theorieën betreffende de onderliggende structuur van een verzameling variabelen te toetsen.
De term ‘factoranalyse’ omvat een verscheidenheid aan verschillende gerelateerde technieken. Een van de belangrijkste onderscheidingen is die tussen de principale componentenanalyse (PCA) en factoranalyse (FA). Deze twee technieken lijken in veel opzichten op elkaar; beide trachten een kleiner aantal lineaire combinaties van de oorspronkelijke variabelen te produceren op een wijze die het grootste deel van de variabiliteit in het correlatiepatroon omvat (of deze kan verklaren). Uiteraard zijn er ook verschillen; bij PCA worden de oorspronkelijke variabelen getransformeerd naar een kleinere verzameling lineaire combinaties waarbij gebruik wordt gemaakt van alle variantie in de variabelen, terwijl bij FA de factoren worden geschat met behulp van een wiskundig model waarbij enkel de gedeelde variantie wordt geanalyseerd.
Hier wordt de PCA gedemonstreerd.
Er zijn twee belangrijke kwesties waar je rekening mee dient te houden tijdens het bepalen van de geschiktheid van je dataset voor factoranalyse: steekproefgrootte en de sterkte van de relatie tussen je variabelen (of items). Voor de steekproefgrootte zijn niet echt duidelijke richtlijnen. Over het algemeen geldt; hoe groter, hoe beter. Mocht je een kleine steekproef (<150) of heel veel variabelen hebben, zoek dan meer informatie op over factoranalyse.
De tweede kwestie betreft de sterkte van de intercorrelaties tussen de items. Tabachnick en Fidell raden aan dat correlatiecoëfficiënten een waarden van groter dan .3 hebben. SPSS biedt twee statistische metingen die kunnen helpen met het bepalen van de ‘factorability’ van de data: (1) Bartlett’s test voor sphericiteit, en (2) Kaiser-Meyer-Olkin (KMO) meting voor steekproef adequatie. Bartlett’s test moet significant zijn (p < .05) voor geschikte factoranalyse. De KMO-index moet een minimale waarde van .6 hebben voor een goede factoranalyse.
Factorextractie omvat het vaststellen van het kleinste aantal factoren die het best kunnen worden gebruikt om de interrelaties tussen de verzameling variabelen te representeren. Er zijn verschillende benaderingen die kunnen worden toegepast om het aantal onderliggende factoren of dimensies te identificeren, waarvan PCA de meest gebruikte is. Het is aan de onderzoeker om het aantal factoren vast te stellen dat volgens hem/haar de beste weergave is van de onderliggende relatie tussen de variabelen. Technieken die kunnen worden toegepast om te helpen bij het vaststellen van het aantal factoren zijn:
Kaiser’s criterium: ook wel bekend als de eigenwaarde-regel. Aan de hand van deze regel worden alleen factoren met een eigenwaarde van 1.0 of meer gebruikt voor verder onderzoek.
Catell’s scree test: bij deze test worden alle eigenwaarden van de factoren geplot en wordt in dit plot vervolgens gezocht naar het punt waarop de vorm van de curve van richting verandert en horizontaal wordt. Catell adviseert om alle factoren boven dit punt te behouden.
Horn’s parallelle analyse: dit omvat het vergelijken van de grootte van de eigenwaarden met de eigenwaarden die zijn verkregen uit een willekeurig gegenereerde dataset van dezelfde grootte. Alleen de eigenwaarde die de corresponderende waarden van de willekeurige dataset overschrijven, worden behouden. Deze benadering blijkt het meest accuraat (Kaiser’s criterium en Catell’s scree test zijn geneigd het aantal componenten te overschatten).
Nadat het aantal factoren is bepaald, moeten deze geïnterpreteerd worden. Om dit proces te vergemakkelijken, worden de factoren ‘geroteerd’. SPSS laat zien welke variabelen samenklonteren; het is aan jou om hier mogelijke interpretaties aan te geven.
Er zijn twee algemene rotatiebenaderingen die resulteren in orthogonale (niet gecorreleerde) of oblieke (gecorreleerde) factoroplossingen. In de praktijk resulteren deze twee benaderingen vaak in soortgelijke resultaten, vooral wanneer het correlatiepatroon tussen de items helder is. Pallant adviseert om te beginnen met oblieke rotatie om de mate van correlatie tussen je factoren te onderzoeken.
Binnen de twee brede categorieën van rotatiebenaderingen zijn er in SPSS een aantal verschillende technieken beschikbaar. De meest gebruikte orthogonale techniek is de Varimax methode; deze tracht het aantal variabelen met hoge ladingen op iedere factor te minimaliseren. De meest gebruikte oblieke techniek is Direct Oblimin.
Voor je met de onderstaande procedure begint, ga eerst naar Edit in het hoofdmenu. Selecteer daar Options en zorg dat de box No scientific notation for small numbers in tables is aangevinkt.
Klik in het menu bovenaan het scherm op Analyze, selecteer vervolgens Dimension Reduction en daarna Factor.
Selecteer alle benodigde variabelen (of items) en verplaats ze naar de Variables box.
Klik op de Descriptives-knop. Zorg dat in het Statistics gedeelte Initial Solution aangevinkt is. Selecteer in het Correlation Matrix gedeelte de opties Coefficients en KMO and Bartlett’s test of sphericity. Klik op Continue.
Klik op de Extraction-knop.
Zorg dat in het Method gedeelte Principal components wordt getoond, of kies een van de andere factorextractietechnieken (bijv. Maximum likelihood). Selecteer in het Analyze gedeelte de Correlation matrix. In het Display gedeelte moeten Screeplot en de Unrotated factor solution worden geselecteerd. Selecteer in het Extraction gedeelte de optie Based on Eigenvalue of klik op Fixed number of factors indien je een specifiek aantal factoren wil specificeren en type het aantal gewenste factoren in. Klik op Continue.
Klik op de Rotation-knop. Kies Direct Oblimin en klik op Continue.
Klik op de Options-knop en selecteer in het Missing Values gedeelte de optie Exclude cases pairwise. Selecteert in het Coefficient Display Format gedeelte de opties Sorted by size en Surpress small coefficients. Type in de box naar Absolute value below de waarde van .3 in. Dit betekent dat alleen factorladingen met een waarde groter dan .3 vertoond zullen worden, wat de output makkelijker te interpreteren maakt.
Klik op Continue en vervolgens op OK (of op Paste om de Syntax Editor op te slaan).
Kijk of de Kaiser-Meyer-Olkin Measure of Sampling Adequacy (KMO) waarde .6 of hoger is en dat de waarde van Bartlett’s test of sphericity significant (.05 of kleiner) is om te verifiëren of je dataset geschikt is voor factoranalyse. Zoek in de Correlation Matrix tabel naar correlatiecoëfficiënten van .3 of hoger.
Om vast te stellen hoeveel componenten aan het criterium van een eigenwaarde van 1 of hoger voldoen, moet je kijken in de Total Variance Explained tabel. Kijk naar de waarden in de eerste reeks kolommen (Initial Eigenvalues). In de Cumulative % kolom zie je hoeveel procent van de variantie de componenten verklaren.
Kaiser’s criterium geeft vaak teveel componenten. Daarom is het belangrijk ook naar de Screeplot te kijken. Zoek naar het punt waarop de vorm van de curve van richting verandert en horizontaal wordt. Alle factoren boven dit punt moet je behouden.
Voor parallelle analyse, de derde manier om het aantal factoren vast te stellen, moet je gebruik maken van de lijst met eigenwaarden in de Total Variance Explained tabel en extra informatie die je aan de hand van een ander statistisch programma (verkrijgbaar via de website van dit boek) kunt verkrijgen. Volg de link naar de Additional Material site en download de zip-file (parallel analysis.zip) op je computer. Unzip dit bestand op je harde schijf en klik op de file MonteCarloPA.exe. Het programma Monte Carlo PCA for Parallel Analysis wordt nu gestart, waarin je vervolgens de volgende informatie moet invoeren: (1) het aantal variabelen dat je wilt analyseren, (2) het aantal participanten in je steekproef, en (3) het aantal replicaties). Klik op Calculate. Vervolgens moet je de eerste eigenwaarde die je in SPSS hebt verkregen systematisch vergelijken met de eerste waarde uit de resultaten van de parallelle analyse. Indien je waarde groter is dan de criteriumwaarde uit de parallelle analyse, behoud je deze factor; als je waarde kleiner is, verwerp je deze.
In de tabel Component Matrix vind je de ongeroteerde ladingen van elk van de items op de verschillende componenten. SPSS gebruikt Kaiser’s criterium als standaard techniek.
Voor je een definitief besluit maakt betreffende het aantal factoren, dien je te kijken naar de geroteerde factoroplossing in de Pattern Matrix tabel: deze toont de itemladingen op de verschillende factoren. Idealiter wil je minstens drie itemladingen per component. Indien dit niet het geval is, zal je een oplossing met minder factoren moeten vinden. Volg in dit geval de onderstaande procedure:
Herhaal alle stappen die eerder in dit hoofdstuk worden genoemd. Let op: wanneer je nu op de Extraction-knop klikt, selecteer dan Fixed number of factors. In de box naast Factors to extract type je het aantal factoren in dat je wilt extraheren.
Klik op Continue en vervolgens op OK.
Het eerste dat je moet checken, is het percentage variantie dat door de nieuwe factoroplossing wordt verklaard; dit staat in de Total Variance Explained tabel. Na rotatie van de nieuwe factoroplossing, vind je aan het eind van je output drie nieuwe tabellen waar je naar moet kijken. Allereerst de Component Correlation Matrix (aan het eind van je output); deze laat de sterkte van de relatie tussen de factoren zien. Dit geeft je informatie voor je besluit of het redelijk was om ervan uit te gaan dat de componenten niet gerelateerd zijn aan elkaar (en dus de Varimax rotatie toegepast kan worden), of dat de Oblimin rotatie oplossing toegepast en gerapporteerd moet worden.
Oblimin rotatie levert twee tabellen van factorladingen op. De Pattern Matrix geeft de factorladingen van elk van de variabelen weer. Zoek naar de hoogst geladen items op elk component om zo het component te identificeren en een naam te geven. De Structure Matrix tabel levert informatie op over de correlatie tussen variabelen en factoren. Indien je de Oblimin rotatie oplossing in je output moet presenteren, moet je beide tabellen weergeven.
Eerder in de output vind je de tabel genaamd Communalities; deze tabel geeft informatie over hoeveel variantie in elk item verklaard wordt. Lage waarden (< .3) betekenen mogelijk dat het item niet goed past bij de andere items in dat component. Als je de schaal wil verbeteren of verfijnen, kan je deze informatie gebruiken om items van de schaal te verwijderen. Het verwijderen van items met lage gemeenschappelijke (communality) waarden vergroot over het algemeen de totale verklaarde variantie. Gemeenschappelijke waarden kunnen drastisch veranderen, afhankelijk van het aantal factoren dat wordt behouden. Het is daarom ook vaak beter om de gemeenschappelijke waarden te interpreteren nadat je hebt gekozen hoeveel factoren je zou moeten behouden volgens de screeplot en parallelle analyse.
De informatie die je in je resultaten weergeeft is afhankelijk van je vakgebied, het soort verslag dat je schrijft en waar je verslag gepresenteerd zal worden. Indien je je onderzoek wil publiceren binnen het vakgebied van de psychologie en het onderwijs zijn er redelijk strikte eisen wat je in je artikel plaatst wanneer je gebruik heb gemaakt van factoranalyse. Allereerst moet je de details weergeven van de factorextractiemethode die je hebt gebruikt; dus de gebruikte criteria om het aantal factoren te bepalen, het type rotatietechniek, de totale verklaarde variantie, de oorspronkelijke eigenwaarden en de eigenwaarden na rotatie. In je verslag dien je een tabel met factorladingen op te nemen met daarin alle waarden (dus niet alleen waarden > .3). In het geval van de Varimax geroteerde oplossing moet de tabel ‘pattern/structure coefficients’ worden genoemd. In het geval van de Oblimin rotatie moeten zowel de Pattern Matrix, als de Structure Matrix coëfficiënten volledig worden gepresenteerd, samen met de informatie over de correlaties tussen de factoren.
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
Samengestelde samenvatting, gebaseerd op de SPSS Survival Manual van Pallant, 6e druk uit 2016.
Deze samenvatting is zowel te gebruiken bij versie 24 van IBM SPSS als bij andere versies. Bij gebruik van andere versies kan het voorkomen dat de opties een soortgelijke naam hebben gekregen...
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Main summaries home pages:
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
4952 |
Add new contribution