Statistiek en methoden: samenvattingen, suggesties en tips van WorldSupporters
Statistiek en methoden: samenvattingen, suggesties en tips van WorldSupporters
Begrippenlijst bij het vak statistiek
| Een manier van het voorspellen van een uitkomstvariabele d.m.v. een voorspellende variabele. |
| Een manier van voorspellen van een uitkomstvariabele d.m.v. meerdere voorspellende variabelen. |
| Met deze methode kan gekeken worden welke lijn het beste de verzamelde date beschrijft (de lijn die door de meeste datapunten heen gaat). |
| Het punt waarop de lijn de verticale as van de grafiek raakt. |
| De helling en de intercept, dus de parameters bₓ en bₒ. |
| De deviaties. De regressielijn overschat of onderschat de ware data. De afstand tot de lijn en de ware data is het residu. |
| Kijken hoe goed de regressielijn de data representeert, omdat de best gevonden lijn nog niet een goed representatie hoeft te zijn. |
| Het kwadrateren van de verschillen tussen de geobserveerde data met het gemiddelde. |
| Het kwadrateren van het verschil tussen de geobserveerde data en de regressielijn. |
| Het delen van de residual sum of squares door de total sum of squares. Het representeert het percentage variantie dat verklaard wordt door het model (de regressielijn). |
| Een meting van hoeveel het model de voorspelling verbeterd heeft vergeleken met het niveau van onnauwkeurigheid. |
| De b-waarde die we verwachten als de nul-hypothese waar is. |
| De uitkomstvariabele Y wordt voorspeld met gebruik van de vergelijking van een rechte lijn. |
| Een veelvoudige correlatie coëfficiënt. Dit is de geobserveerde waarden van Y en de waarden van Y die door het model zijn voorspeld. |
| De hoeveelheid variantie die door het model verklaard kan worden. |
| Ze worden geselecteerd d.m.v. eerder werk en de onderzoeker besluit in welke volgorde de voorspellers in het model worden gedaan. Als algemene regel is er dat belangrijke voorspellers eerst in het model gestopt moeten worden. |
| Er wordt geen onderscheid gemaakt in |
Begrippenlijst Beschrijvende Statistiek
Deze samenvatting is gebaseerd op het studiejaar 2013-2014.
Fundamenteel wetenschappelijk onderzoek | Onderzoek dat je uitvoert om meer kennis te vergaren |
Praktijkgericht wetenschappelijk onderzoek | Onderzoek dat je uitvoert om oplossingen te vinden voor problemen in de praktijk |
Gedragswetenschappen | Onderzoeken het gedrag van individuen |
Maatschappijwetenschappen | Onderzoeken groepen mensen |
Sociale wetenschappen | Onderzoeken het samenleven van mensen |
Methodeleer | De studie van de verschillende methoden waarop je onderzoek uit kan voeren binnen de sociale wetenschap |
Methodologie | Doet wetenschappelijke uitspraken over methoden |
Methoden | Manieren waarop je iets, bijvoorbeeld onderzoek, kunt doen |
Technieken | Een simpele methode voor een kleine handeling |
Alledaagse kennis | Kennis die je opdoet in het dagelijks leven (bijv. fruit eten is gezond) |
Systematische kennis | Kennis die je opdoet door iets te onderzoeken |
Literatuuronderzoek | Het bestuderen van teksten omtrent het onderwerp van jouw onderzoek dat je doet ter voorbereiding van het echte onderzoek |
Vooronderzoek | Een kleine versie van je onderzoek die je uitvoert om eventuele fouten in de methode of technieken van te voren op te sporen |
Onderzoeksplan | Plan waarin je de probleemstelling en de onderzoeksopzet behandelt |
Probleemstelling | Hierin behandel je waartoe het onderzoek dient en voor wie het onderzoek is bedoeld |
Onderzoeksopzet | Hierin behandel je wat je precies wil weten, hoe het onderzoek uitgevoerd moet worden, wie er onderzocht moeten worden, waar het onderzoek gehouden zal worden en wanneer het onderzoek gehouden zal worden |
Probleemschets | Korte weergave van de onderzoeksvraag |
Probleem | In het dagelijks leven: een lastige situatie In de wetenschap: een vraagstuk dat je kunt onderzoeken |
Wetenschappelijk relevantie | Een onderzoek is wetenschappelijk relevant als het iets toevoegt aan de kennis over een bepaald onderwerp |
Maatschappelijke relevantie | Een onderzoek is maatschappelijk relevant als de uitkomsten kunnen helpen bij het vinden van antwoorden op praktijkproblemen |
Explorerend onderzoek | Onderzoek dat je uitvoert om je kennis over een onderwerp uit te breiden |
Toetsen onderzoek | Onderzoek dat je uitvoert om te kijken of een vermoeden of een bewering klopt (bijv. is fruit eten wel echt gezond?) |
Verklarende vraagstelling | Deze vraag stel je omdat je een verklaring zoekt voor een verschijnsel |
Voorspellingsvraagstelling | Deze vraag stel je omdat je iets wilt kunnen voorspellen aan de hand van onderzoek |
Causale |
Samenvattingen per onderwerp bij Inleiding Statistiek
Samenvattingen per onderwerp bij Inleiding Statistiek. Deze samenvatting behandelt een set met de meest voorkomende statistische begrippen en methoden met focus op de sociale wetenschappen.
Wat is statistiek?
Als gedragswetenschapper is het belangrijk om statistiek te begrijpen. Onderzoek wordt namelijk gedaan met empirische technieken, en statistiek is daar een essentieel onderdeel van. Wanneer je weet welke techniek in welke situatie toegepast moet worden, kun je statistiek op de juiste manier gebruiken. Statistiek staat voor de rekenkundige procedures waarmee informatie georganiseerd, opgesomd en geïnterpreteerd kan worden. Door statistiek kun je informatie op een compacte manier noteren. Statistiek heeft twee doelen: het organiseren en opsommen van informatie zodat onderzoeksresultaten bekend gemaakt kunnen worden en het beantwoorden van onderzoeksvragen die de onderzoeker voorafgaand aan het onderzoek heeft opgesteld. Veel studenten hebben moeite met statistiek, vandaar deze overzichtssamenvatting waarin alle belangrijkste onderwerpen die vaak terugkomen staan uitgelegd. Statistiek is niet om van in paniek te raken, maar zonder studeren wordt het wel erg moeilijk. Hopelijk maakt dit overzicht statistiek voor jullie wat duidelijker.
Basisbegrippen
Onderzoek wordt meestal gedaan om het verband tussen variabelen te ontdekken. Een variabele is een eigenschap of conditie die veranderlijk is of verschillende waarden heeft voor verschillende individuen, bijvoorbeeld leeftijd. Dit zijn persoonsvariabelen. Het kunnen ook eigenschappen van de omgeving zijn, zoals temperatuur, het worden dan omgevingsvariabelen genoemd. Variabelen worden vaak aangegeven door middel van letters, bijvoorbeeld variabele X en variabele Y. Er zijn verschillende soorten variabelen. Een onafhankelijke variabele is een variabele die gemanipuleerd wordt door de onderzoeker. Dit bestaat vaak uit twee of meer condities waaraan de proefpersonen worden blootgesteld. De afhankelijke variabele is de variabele die geobserveerd wordt nadat de onafhankelijke variabele is gemanipuleerd. Dit laat zien wat het effect van de verschillende condities van de onafhankelijke variabele is Vaak wordt een controlegroep gebruikt bij een experiment. Deze groep krijgt geen behandeling of een placebo, om te zien of er daadwerkelijk een verschil is tussen de experimentele conditie en de controlegroep. Variabelen kunnen ook onderverdeeld worden in discrete en continue variabelen. Een discrete variabele bestaat uit verschillende categorieën. Een klas kan bijvoorbeeld bestaan uit 18 of 19 leerlingen, maar niet uit 18,5 leerling. Tussen twee waarden kan dus niets zitten bij een discrete variabele. Bij een continue variabelen zijn er oneindig veel mogelijke waarden die vallen tussen twee geobserveerde waarden. Denk hierbij aan lengte of gewicht.
Veel variabelen die onderzocht worden zijn hypothetische constructen, denk bijvoorbeeld aan zelfvertrouwen. Deze constructen zijn niet direct meetbaar. Om deze variabelen toch te kunnen meten, moeten er definities aan verbonden worden die wel onderzocht kunnen worden. Intelligentie kan bijvoorbeeld onderzocht worden met behulp van een IQ test. Een operationele definitie beschrijft hoe een construct onderzocht moet worden. Honger kan bijvoorbeeld beschreven worden als de staat waarin iemand verkeert als diegene 12 uur of langer niets gegeten heeft. Dit is een operationele definitie.
Soorten onderzoek
Wetenschappers kunnen gebruikmaken van
.....read moreWelke verdelingen bestaan er binnen de statistiek?
Normaalverdeling
De normaalverdeling is een symmetrische, klokvormige verdeling. De normaalverdeling is om vier redenen de belangrijkste verdeling binnen de statistiek:
- We verwachten dat veel van de afhankelijke variabelen waar we mee werken normaal verdeeld zijn in de populatie.
- Als een variabele (ongeveer) normaal verdeeld is, kunnen we vervolgens uitspraken gaan doen over waarden van die variabele (het is vaak een voorwaarde om analyses te doen).
- Wanneer een oneindig aantal steekproeven wordt getrokken van een populatie, zal de verdeling van die steekproefgemiddelden neigen naar een normaal verdeling.
- De meeste statistische programma’s gaan er vanuit dat de observaties normaal verdeeld zijn.
Bij de normaalverdeling wordt gebruik gemaakt van zogenaamde z-scores. Om de normaalverdeling te kunnen bespreken, zal dus eerst moeten worden uitgelegd wat z-scores zijn en hoe je ze gebruikt.
Standaardscores
Vaak worden individuele scores omgezet in standaardscores, ook wel z-scores genoemd. Dit wordt gedaan om de exacte ligging van elke score in een distributie vast te stellen en te beschrijven. Z-scores worden gebruikt om een hele distributie te standaardiseren. Op die manier kunnen verschillende verdelingen met elkaar vergeleken worden.
De z-score beschrijft de exacte positie van een X-waarde op twee manieren: ten eerste via het teken en ten tweede via de waarde. Het plus- of minteken van de z-score beschrijft of de X-waarde zich boven of juist onder het gemiddelde bevindt (het gemiddelde krijgt in de standaardverdeling altijd de waarde nul). De waarde van de z-score beschrijft de afstand van de X-waarde tot het gemiddelde in termen van aantal standaarddeviaties (een z-score van 1,00 betekent dat de X-waarde 1 standaarddeviatie van het gemiddelde verwijderd is). In een distributie met µ =100 en σ =15 is een score van X = 130 een z-score van +2. 130-100 is namelijk 30. Dit getal delen door 15 geeft een standaardscore van 2. Bij alle curven staat de µ in het midden. Aan de rechterkant lopen de z-scores met een plusteken op, terwijl de negatieve standaardscores aan de linkerkant staan.
De formule voor de berekening van standaardscores is: z=(X- µ)/ σ. De deviatiescore wordt gedeeld door de standaarddeviatie. Zo kan de z-waarde omschrijven hoeveel standaarddeviaties een individuele score van het gemiddelde af ligt. Een IQ-score van 70 valt precies twee standaardscores onder het gemiddelde: (70-100)/15= -2. In deze formule staat (X- µ) voor de deviatiescore. Door het gemiddelde van een score af te trekken, kan meteen gezien worden of de score boven of onder het gemiddelde valt. Deze formule is handig bij het omzetten van ruwe scores naar z-scores, maar niet in het omzetten van z-scores naar ruwe scores, daarvoor kun je de formule herschrijven.
De z-score en de normale verdeling
De standaardnormaalverdeling heeft een gemiddelde van 0 en een standaarddeviatie van 1, de distributie wordt dus N(0,1). De normaalverdeling is symmetrisch; de
.....read moreWat zijn de veelgebruikte symbolen in de statistiek? - Chapter 0
In dit hoofdstuk worden de meest gebruikte (wiskundige, Griekse en Latijnse) symbolen besproken.
Wat zijn de wiskundige symbolen die gebruikt worden?
- Σ: dit symbool wordt ook wel een sigma genoemd. Dit symbool houdt in dat alles opgesomd wordt. Het is een sommatieteken. Wanneer er bijvoorbeeld staat Σ(xi), betekent dit dat alle verzamelde scores van x maal i bij elkaar opgeteld moeten worden.
- Π: dit symbool houdt in dat alles vermenigvuldigd moet worden. Wanneer er bijvoorbeeld staat Π(xi), betekent dit dat alle verzamelde scores van x maal i met elkaar vermenigvuldigd moeten worden.
- √x: dit symbool houdt in dat er een wortel genomen moet worden van x.
Wat zijn de Griekse symbolen die veel gebruikt worden?
- α: dit symbool wordt ook wel de alfa (Engels: alpha) genoemd. Dit is de kans op het maken van een type I fout.
- β: dit symbool wordt ook wel de bèta genoemd. Dit is de kans op het maken van een type II fout.
- βi: dit is de gestandaardiseerde regressiecoëfficiënt.
- ε: dit symbool wordt ook wel de epsilon genoemd. Dit staat meestal voor een error, dus een fout. Het wordt ook gebruikt om sfericiteit aan te geven.
- η2: dit symbool wordt een gekwadrateerde èta genoemd. Dit is een maatstaf voor effectgrootte.
- μ: dit symbool wordt de mu genoemd. Dit is het gemiddelde van de scores van de populatie.
- ρ: dit symbool wordt de rho genoemd. Dit geeft de correlatie in de populatie weer. Dit symbool wordt ook gebruikt om de Spearman’s correlatiecoëfficiënt weer te geven.
- σ: dit symbool wordt de sigma genoemd. Het symbool wordt gebruikt om de standaardafwijking van de populatie aan te duiden.
- σ2: dit symbool wordt de gekwadrateerde sigma genoemd. Dit symbool geeft de variantie in de populatie weer.
- σX: dit symbool is een andere variant op de sigma en geeft de standaardfout van het gemiddelde aan.
- τ: dit symbool wordt de Kendall’s Tau genoemd. Dit is een niet-parametrische correlatiecoëfficiënt.
- φ: dit symbool wordt de phi genoemd. Dit meet de associatie tussen twee categoriale variabelen.
- χ2: dit symbool staat voor een Chi-square test. Dit is een test statistiek dat de associatie tussen twee categoriale variabelen meet.
- χ2F: dit symbool wordt gebruikt als test statistiek in de Friedman’s ANOVA.
- ω2: dit symbool wordt de gekwadrateerde omega genoemd. Dit is ook een maatstaf voor effectgrootte.
Wat zijn de Latijnse symbolen die veel gebruikt worden?
- bi: de regressiecoëfficiënt (niet gestandaardiseerd).
- df:
Summaries: home page for statistics and research
Summaries for statics and research
What is this page about?
- Contents: information and assortment pointers related to the use of summaries for statics and research on WorldSupporter
- Study area: Statics, Research, Science and statics per study field (e.g. business, economics, psychology, pedagogy and social sciences)
- Language: English
- Access: public
Where to go next?
- For all summaries for statics and research: see:
- For all summaries for statics and research in NL: Statistiek en methoden
What to find below?
- Read on for the highlighted summaries, tools and pages
Statistics and research: home bundle
Main content and contributions for statistics and research
- 175 reads