Samenvattingen bij Discovering statistics using IBM SPSS Statistics van Field
- 2729 reads
| Een manier van het voorspellen van een uitkomstvariabele d.m.v. een voorspellende variabele. |
| Een manier van voorspellen van een uitkomstvariabele d.m.v. meerdere voorspellende variabelen. |
| Met deze methode kan gekeken worden welke lijn het beste de verzamelde date beschrijft (de lijn die door de meeste datapunten heen gaat). |
| Het punt waarop de lijn de verticale as van de grafiek raakt. |
| De helling en de intercept, dus de parameters bₓ en bₒ. |
| De deviaties. De regressielijn overschat of onderschat de ware data. De afstand tot de lijn en de ware data is het residu. |
| Kijken hoe goed de regressielijn de data representeert, omdat de best gevonden lijn nog niet een goed representatie hoeft te zijn. |
| Het kwadrateren van de verschillen tussen de geobserveerde data met het gemiddelde. |
| Het kwadrateren van het verschil tussen de geobserveerde data en de regressielijn. |
| Het delen van de residual sum of squares door de total sum of squares. Het representeert het percentage variantie dat verklaard wordt door het model (de regressielijn). |
| Een meting van hoeveel het model de voorspelling verbeterd heeft vergeleken met het niveau van onnauwkeurigheid. |
| De b-waarde die we verwachten als de nul-hypothese waar is. |
| De uitkomstvariabele Y wordt voorspeld met gebruik van de vergelijking van een rechte lijn. |
| Een veelvoudige correlatie coëfficiënt. Dit is de geobserveerde waarden van Y en de waarden van Y die door het model zijn voorspeld. |
| De hoeveelheid variantie die door het model verklaard kan worden. |
| Ze worden geselecteerd d.m.v. eerder werk en de onderzoeker besluit in welke volgorde de voorspellers in het model worden gedaan. Als algemene regel is er dat belangrijke voorspellers eerst in het model gestopt moeten worden. |
| Er wordt geen onderscheid gemaakt in de volgorde van inclusie van voorspellers in het model. Ze worden dus allemaal tegelijk erin gedaan. |
| Het besluiten van volgorde van voorspellers in het model gebeurd d.m.v. wiskundige criteria. |
| Als een voorspeller een significant effect heeft, maar alleen als een andere variabele constant wordt gehouden. |
| Teveel variabelen in het model hebben die essentieel zijn, maar die te weinig bijdrage leveren aan het voorspellen van de uitkomst. |
| Belangrijke voorspellers eruit laten. |
| Dit is een geval dat substantieel verschilt van de algemene trend van de data. |
| Het verschil tussen de waarden van de voorspelde uitkomst door het model en de waarden van de uitkomst geobserveerd door de steekproef. Ze representeren de ‘error’. |
| Er zou geen perfecte lineaire relatie moeten zijn tussen twee of meer voorspellers. |
| Dit zijn variabelen die niet in het model zitten, maar wel de uitkomst beïnvloeden. |
| Op elk niveau van de voorspellende variabele(n) zou de variantie van de residuele termen constant moeten zijn. |
| Als ten minste één voorspeller een perfecte lineaire combinatie is van de anderen. |
| Variance inflation factor. Dit is een indicatie of een voorspeller een sterke lineaire relatie met de andere voorspellers heeft. |
| Het omgekeerde van de VIF (1/VIF). |
| Analysis of variance. Model om meer dan twee condities te analyseren. |
| Als er verschillende participanten voor de ANOVA gebruikt worden.
|
| De kans op een Type 1 fout neemt toe, omdat verschillende statistische tests met dezelfde experimentele data worden uitgevoerd. |
| Deze test kijkt naar een totaal experimenteel effect. Er wordt vaak geen specifieke informatie gegeven. |
| De ratio van variantie |
| Als de groepen uit een oneven aantal bestaan. |
| De variantie van alle observaties. |
| Hoeveel van de variantie niet verklaard kan worden door het model. Ookwel het verschil tussen wat het model voorspelt en de werkelijke observaties. |
| De gemiddelde hoeveelheid variantie dat verklaard kan worden door het model. |
| Een schatting van de gemiddelde hoeveelheid variantie dat verklaard kan worden door andere factoren.
|
| De schatting van de effectgrootte. |
| Pearson’s r tussen twee variabelen als één daarvan continu is en de andere twee categorieën heeft, met de codes 1 en 0. |
| Een manier van groepen van mensen representeren, gebruikmakend van nullen en enen. |
| Dit breidt het basis idee van de Anova uit. |
| Stel je voor dat je een stippellijngrafiek (scatterplot) maakt van elke experimentele conditie met de covariaat op een as en de uitkomst op een andere as, dan zouden de regressielijnen voor elke stippellijngrafiek er ongeveer hetzelfde uitzien. |
| Een ANOVA tussen groepen (ook wel een algemeen lineair model genoemd). |
| Een variabel die niet in groepen verdeeld is.
|
| Variabelen die alleen de waarden 0 of 1 aan kunnen nemen. |
| Het gebruik van dezelfde proefpersonen bij verschillende condities in een experiment. |
| Houdt in dat de relatie tussen paren van experimentele condities gelijk is. |
| De beide varianties langs de condities zijn gelijk en de covarianties tussen de paren zijn ook gelijk. Deze aanname is specifieker van bovenstaande aanname. |
| Toetst de hypothese dat de varianties van de verschillen tussen de condities gelijk zijn. Wanneer de test significant is, wordt er niet aan de aanname voldaan. |
| Bestaat uit de tussengroepsvariantie (SSb) en de binnengroepsvariantie (SSw). |
| Bestaat uit het effect van het experiment (SSm) en de residuvariantie (SSr). |
| De verklaarde variantie gedeeld door de variantie verklaard door de niet-systematische factoren. (MSm / MSr). |
| Een mix van tussengroepsvariabelen en herhaalde metingen variabelen. Voor dit ontwerp zijn minstens twee onafhankelijke variabele nodig. |
| Wordt gebruikt om te kijken of voldaan wordt aan de aanname van homogeniteit. |
| Kan naar gekeken worden om te bepalen of de interactie-effecten significant zijn. |
| Kan gebruikt worden in een situatie met meerdere afhankelijke variabelen. |
| Een verzameling van nummers die geordend zijn in rijen en kolommen. |
| Een matrix met een gelijk aantal rijen en kolommen, waardoor het eruit ziet als een vierkant. |
| De getallen die op de diagonaal van de square matrix liggen. |
| De getallen die niet op de diagonaal van de square matrix liggen. |
| Wanneer de diagonale componenten samen 1 zijn en de niet-diagonale componenten samen 0 zijn. |
| Matrix die de systematische variantie laat zien. Wordt aangeduid met de letter H. |
| Matrix die de niet-systematische variantie laat zien. Wordt aangeduid met de letter E. |
| Matrix die de totale variantie voor elke afhankelijke variabele laat zien. Wordt aangeduid met de letter T. |
| Een maat voor de totale relatie tussen twee variabelen. |
| Kijkt naar hoe de relatie tussen twee afhankelijke variabelen wordt beïnvloed door de experimentele manipulatie. |
| Kijkt naar hoe de relatie van de twee afhankelijke variabelen beïnvloed wordt door individuele verschillen. |
| Een onderliggende lineaire dimensie bij de afhankelijke variabelen in een matrix. |
| De functie die groepen onderscheidt. |
| Kijkt naar de effectgrootte aan de hand van de som van de proportie verklaarde variantie op de discriminant functies. |
| Kijkt naar de effectgrootte aan de hand van de som van de eigenwaarden per variate. |
| Kijkt naar de effectgrootte aan de hand van het product van de onverklaarde variantie van elk variate. |
| De maximale eigenwaarde voor het eerste variate. |
| Aanname die stelt dat bij MANOVA de afhankelijke groepen multivariate normaliteit hebben binnen de groepen. |
| Aanname die stelt dat voor elke afhankelijke variabele de varianties gelijk moeten zijn en de correlatie tussen elk van de afhankelijke variabelen hetzelfde moeten zijn in alle groepen. |
| Test waarmee de variantie-covariantie matrices met elkaar vergeleken kunnen worden. |
| De score van elk persoon op elk variaat. |
| Veel informatie/variabelen wordt in SPSS verminderd tot minder variabelen, waardoor het makkelijker te verwerken is. SPSS doet dit door overmatige informatie eruit te filteren.
|
| Metingen die niet direct gemeten kunnen worden. Er worden dan verschillende aspecten gemeten.
|
| Het identificeren van groepen of clusters van variabelen.
|
| Op één rechte lijn gelegen.
|
| Dit is een correlatiematrix: een tabel van correlatie coëfficiënten tussen variabelen. De diagonaal van deze matrix bestaat uit enen, omdat alle variabelen perfect correleren met zichzelf.
|
| Je kan het voorstellen als een as van een grafiek, waarlangs variabelen gezet kunnen worden.
|
| Representatie van de relatie met de factoren.
|
| De coördinatie van variabelen.
|
| De bevindingen zijn alleen toepasbaar op de steekproef.
|
| De bevindingen generaliseren naar de gehele populatie.
|
| De totale variantie voor één variabele heeft twee componenten, waarvan één de common variance is. Dit houdt in dat die totale variantie van een variabele gedeeld kan worden met andere variabele.
|
| Dit is de andere component van de totale variantie van een variabele. Dit is specifieke variantie voor die meting, wat ook betekent dat het betrouwbaar is.
|
| Dit is specifieke variantie, maar niet betrouwbaar.
|
| De proportie van common variance die in een variabele wordt gepresenteerd. Dus als een variabele geen specifieke variantie heeft, dan heeft de variabele een communality van 1.
|
| Ontbinden van de originele data in lineaire variaties.
|
| Associatie met een variabele geeft de belangrijkheid van een factor. Met zo’n waarde kan gekeken worden of een factor belangrijk genoeg is om te behouden.
|
| Een grafiek van elke eigenwaarde (de y-as) tegen de factoren waarmee de eigenwaardes geassocieerd worden (de X-as).
|
| Kaiser beweerde dat factoren geselecteerd moeten worden als de eigenwaarde groter is dat 1.
|
| Het roteren van assen van de factoren, zodat variabelen maximaal geladen zijn op één factor.
|
| Rotatie waarbij de factoren onafhankelijk worden gehouden. De factoren blijven ongerelateerd.
|
| Bij deze vorm van rotatie mogen de factoren na de rotatie wel correleren.
|
| Hierin staan de geroteerde factor ladingen.
|
| Een meting moet consistent het gemeten construct reflecteren.
|
| Een persoon zou dezelfde score moeten krijgen op een test als deze test op twee verschillende momenten gemaakt wordt.
|
| Een vragenlijst is betrouwbaar als elk item dezelfde kant op scoort, dus als een persoon hoog scoort op het ene item, dan moeten alle items hoog scoren. De split-half methode onderzoekt dit door de data aselect in tweeën te delen. De twee helften zouden ongeveer hetzelfde moeten scoren.
|
| Dit is de meest gebruikte meting van schaal betrouwbaarheid. Hiermee wordt de data op elke mogelijke manier in tweeën gesplitst en daarna wordt de correlatie coëfficiënt voor elke deling uitgerekend. Een waarde van .7 of .8 is acceptabel. Daaronder geeft onbetrouwbaarheid weer. Er moet wel voorzichtig met deze getallen omgegaan worden, omdat de Cronbach’s alfa groter wordt naarmate het aantal items toeneemt. Dit zegt dan dus niks over de betrouwbaarheid.
|
| De mate waarin de schaal één onderliggend construct meet.
|
| Als het ene item een hoge score geeft als de participant bijvoorbeeld statistiek niet leuk vindt en het andere item een lage score geeft, terwijl dat item ook gaat over het niet leuk vinden van statistiek.
|
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Verzameling Nederlandstalige en Engelstalige studiematerialen bij het boek van Moore & McCabe
Deze bundel bevat (zowel Nederlandstalig als Engelstalig) een boeksamenvatting, BulletPoints en TentamenTickets te gebruiken bij de 5e druk van Agresti Statistical Methods for the Social Sciences.
Bijgaand oefenvragen bij de hoofdstukken 1 tot en met 7 van het boek van Moore & McCabe in PDF.
Deze oefenvragen zijn onder andere te gebruiken bij het vak Statistiek 1A en Statistiek 1B zoals gegeven aan de Universiteit van Groningen (Psychologie).
Succes met leren!
| Een manier van het voorspellen van een uitkomstvariabele d.m.v. een voorspellende variabele. |
| Een manier van voorspellen van een uitkomstvariabele d.m.v. meerdere voorspellende variabelen. |
| Met deze methode kan gekeken worden welke lijn het beste de verzamelde date beschrijft (de lijn die door de meeste datapunten heen gaat). |
| Het punt waarop de lijn de verticale as van de grafiek raakt. |
| De helling en de intercept, dus de parameters bₓ en bₒ. |
| De deviaties. De regressielijn overschat of onderschat de ware data. De afstand tot de lijn en de ware data is het residu. |
| Kijken hoe goed de regressielijn de data representeert, omdat de best gevonden lijn nog niet een goed representatie hoeft te zijn. |
| Het kwadrateren van de verschillen tussen de geobserveerde data met het gemiddelde. |
| Het kwadrateren van het verschil tussen de geobserveerde data en de regressielijn. |
| Het delen van de residual sum of squares door de total sum of squares. Het representeert het percentage variantie dat verklaard wordt door het model (de regressielijn). |
| Een meting van hoeveel het model de voorspelling verbeterd heeft vergeleken met het niveau van onnauwkeurigheid. |
| De b-waarde die we verwachten als de nul-hypothese waar is. |
| De uitkomstvariabele Y wordt voorspeld met gebruik van de vergelijking van een rechte lijn. |
| Een veelvoudige correlatie coëfficiënt. Dit is de geobserveerde waarden van Y en de waarden van Y die door het model zijn voorspeld. |
| De hoeveelheid variantie die door het model verklaard kan worden. |
| Ze worden geselecteerd d.m.v. eerder werk en de onderzoeker besluit in welke volgorde de voorspellers in het model worden gedaan. Als algemene regel is er dat belangrijke voorspellers eerst in het model gestopt moeten worden. |
| Er wordt geen onderscheid gemaakt in |
Samenvatting Discovering statistics using IBM SPSS Statistics van Field - 4e druk
De samengevatte hoofdstukken bij het boek (4e druk) zijn te vinden in de bijlages.
Stuck in your analysis? Want to know more about statistics? Seek no more - below you will find the go-to guide for all your questions about statistics!
In the attachment you will find an explanation and practice questions about the following topics:
What are statistics? How can data be collected? What do reliability and validity mean? Which distributions emerge in statistics? How to construct a sample? What is statistical inference? What are correlation, regression and linear regression? What is multiple regression? What is logistic regression? How to conduct an analysis...Read moreDeze bundel bevat een samenvatting van SPSS en is gebaseerd op de 24e versie. De volgende delen zijn beschikbaar:
Wat is SPSS: een introductie (1)
Definities en begrippen in SPSS (2)
Afhankelijke en onafhankelijke variabelen (3)
Meetschalen van variabelen (4)
Betrouwbaarheidsinterval berekenen (7)
Standaarddeviatie berekenen (9)
Eenzijdige en tweezijdige toesten (11)
Power; onderscheidingsvermogen (13)
Within- en between-subjects designs (14)
Variabele View en Data View (16)
Variabelen en data invoeren (17)
Outliers; extreme waarden (19)
Assumpties bij parametrische testen (20)
Spearman Correlation & Kendall’s Tau (34)
Enkelvoudige regressieanalyse (38)
Multipele regressieanalyse (40)
Complexe regressieanalyse (43)
Afhankelijke (gepaarde) t-toets (45)
Point-biserial correlatie (46)
Wilcoxon signed rank test (47)
One way repeated measures ANOVA (48)
Independent factorial ANOVA (54)
Kwantitatieve methoden van onderzoek zijn gebaseerd op cijfers, kwalitatieve methoden van onderzoek zijn gebaseerd op taal.
Er is sprake van falsificatie als de verzamelde gegevens de theorie of hypothese tegenspreken.
De onafhankelijke variabele is de variabele die gezien wordt als de oorzaak, de afhankelijke variabele wordt gezien als de uitkomst.
Een categorische variabele bestaat uit verschillende categorieën, een continue variabele is een score die elke waarde kan aannemen die op de meetschaal wordt gebruikt.
Validiteit is de mate waarin het instrument daadwerkelijk meet wat je wil meten. Er zijn verschillende soorten, zoals criteriumvaliditeit en inhoudsvaliditeit.
Betrouwbaarheid is de mate waarin het instrument dezelfde uitkomst geeft bij dezelfde condities. Dit kan bijvoorbeeld gemeten worden door de test te herhalen.
Er zijn verschillende soorten onderzoek. Correlationeel onderzoek is observeren wat er in de wereld gebeurt zonder het te manipuleren. Experimenteel onderzoek is variabelen manipuleren om te kijken of het de andere variabelen beïnvloedt.
Er is volgens Hume sprake van een oorzakelijk verband als oorzaak en gevolg elkaar nauw in de tijd opvolgen, de oorzaak voorafgaat aan het gevolg en het gevolg nooit voorkomt zonder dat de oorzaak heeft plaatsgevonden.
Niet-systematische variatie is het verschil in prestatie tussen condities wat niet door bekende factoren verklaard kan worden. Systematische variatie kan juist wel verklaard worden.
Bij het analyseren van de gegevens komt een normale verdeling vaak voor. Dit is een belvormige curve met symmetrische helften. De meeste scores zitten rond het midden van de verdeling.
Om te berekenen waar het centrum van de frequentieverdeling ligt (central tendency) kunnen er verschillende methodes gebruikt worden: de modus, mediaan en het gemiddelde.
De verspreiding van de scores kan berekend worden met de hoogste en laagste score. Kwartielen zijn waardes die de verdeling in vier gelijke stukken verdelen.
De deviatie is het verschil tussen de score en het gemiddelde. De kwadratensom (SS) is de optelling van alle gekwadrateerde deviatiescores. De variantie is de kwadratensom gedeeld door de
| Een manier van het voorspellen van een uitkomstvariabele d.m.v. een voorspellende variabele. |
| Een manier van voorspellen van een uitkomstvariabele d.m.v. meerdere voorspellende variabelen. |
| Met deze methode kan gekeken worden welke lijn het beste de verzamelde date beschrijft (de lijn die door de meeste datapunten heen gaat). |
| Het punt waarop de lijn de verticale as van de grafiek raakt. |
| De helling en de intercept, dus de parameters bₓ en bₒ. |
| De deviaties. De regressielijn overschat of onderschat de ware data. De afstand tot de lijn en de ware data is het residu. |
| Kijken hoe goed de regressielijn de data representeert, omdat de best gevonden lijn nog niet een goed representatie hoeft te zijn. |
| Het kwadrateren van de verschillen tussen de geobserveerde data met het gemiddelde. |
| Het kwadrateren van het verschil tussen de geobserveerde data en de regressielijn. |
| Het delen van de residual sum of squares door de total sum of squares. Het representeert het percentage variantie dat verklaard wordt door het model (de regressielijn). |
| Een meting van hoeveel het model de voorspelling verbeterd heeft vergeleken met het niveau van onnauwkeurigheid. |
| De b-waarde die we verwachten als de nul-hypothese waar is. |
| De uitkomstvariabele Y wordt voorspeld met gebruik van de vergelijking van een rechte lijn. |
| Een veelvoudige correlatie coëfficiënt. Dit is de geobserveerde waarden van Y en de waarden van Y die door het model zijn voorspeld. |
| De hoeveelheid variantie die door het model verklaard kan worden. |
| Ze worden geselecteerd d.m.v. eerder werk en de onderzoeker besluit in welke volgorde de voorspellers in het model worden gedaan. Als algemene regel is er dat belangrijke voorspellers eerst in het model gestopt moeten worden. |
| Er wordt geen onderscheid gemaakt in |
Waar zijn kwalitatieve methoden van onderzoek op gebaseerd?
Wanneer is er sprake van falsificatie?
Wat is de afhankelijke variabele?
Wat is een continue variabele?
Wat betekent validiteit?
Wanneer is een onderzoek betrouwbaar?
Wat is het verschil tussen correlationeel en experimenteel onderzoek?
Aan welke drie voorwaarden moet een oorzakelijk verband volgens Hume voldoen?
Wat is het verschil tussen niet-systematische en systematische variatie?
Hoe ziet een normale verdeling eruit?
Welke methodes kunnen gebruikt worden om het centrum van de frequentieverdeling te vinden?
Welke scores heb je nodig om de verspreiding van scores te berekenen?
Hoe bereken je de standaardafwijking?
Wat geeft een z-score aan?
Op welke formule zijn alle statistische modellen gebaseerd?
Wat is het verschil tussen variabelen en parameters?
Wat wordt bedoeld met dat het gemiddelde een hypothetische waarde heeft?
Hoe bepaal je de variantie?
Wat is de method of least squares?
Waarvoor wordt de steekproefverdeling gebruikt?
Wat is het betrouwbaarheidsinterval?
Hoe bepaal je de grenzen van het betrouwbaarheidsinterval?
Wat is de regel van Fisher?
Wat is het verschil tussen de nulhypothese en de alternatieve hypothese?
Wat is het stappenplan bij een nulhypothese significantie toets?
Wat moet je doen om te kijken of de hypothese een goede verklaring is voor de gegevens?
Wat is het verschil tussen een eenzijdige en een tweezijdige toets?
Wat is het verschil tussen een type 1 en een type 2 fout?
Wat is de power van een test?
Op welke twee manieren kun je de effectgrootte berekenen?
Stuck in your analysis? Want to know more about statistics? Seek no more - below you will find the go-to guide for all your questions about statistics!
In the attachment you will find an explanation and practice questions about the following topics:
What are statistics? How can data be collected? What do reliability and validity mean? Which distributions emerge in statistics? How to construct a sample? What is statistical inference? What are correlation, regression and linear regression? What is multiple regression? What is logistic regression? How to conduct an analysis...Read moreIn deze bundel worden o.a. samenvattingen, oefententamens en collegeaantekeningen gedeeld voor de opleiding Psychologie, jaar 2&3 aan de Universiteit Utrecht
Voor een compleet overzicht van de door JoHo aangeboden samenvattingen & studiehulp en de beschikbare geprinte samenvattingen voor dit vak ga je naar de Samenvattingen Shop Psychologie - UU B2/3 op JoHo.org
Op zoek naar een uitdagende job die past bij je studie? Word studentmanager bij JoHo !
Werkzaamheden: o.a.
Interesse? Reageer of informeer
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Field of study
Add new contribution