College-aantekeningen bij Statistiek voor MTS 1 aan de Universiteit Utrecht - 2015/2016
8-9 Hoorcollege MTS1 - Statistiek
Hoofdstuk 1 – Introductie
Je kunt op allerlei manieren data verzamelen, maar je moet het ook kunnen samenvatten. Als we dat doen heeft dat beschrijvende statistiek (descriptive statistics).
Wanneer je statistiek gaat beschrijven heb je een populatie nodig die je wilt bestuderen. De grootte wordt aangegeven door de letter N. Maar je kunt het bijna nooit doen onder alle mensen in de populatie, daarom doe je een steekproef en daarvan verzamel je data. Deze is representatief voor de populatie. De grootte van de steekproef wordt aangegeven door de letter n.
Parameter: Een getal (numerieke waarde) dat de gehele populatie beschrijft.
Statistiek: Een getal (numerieke waarde) dat alleen de steekproef beschrijft.
We gaan leren wat je kunt met statistieken. Dus wat we met deze numerieke waarden kunnen en hoe kan je dit terugkoppelen naar de hele populatie, dat is:
Inductieve statistiek: het generaliseren van resultaten uit de steekproef naar de gehele populatie.
Wanneer je dingen wilt gaan meten heb je 2 soorten kenmerken:
Fysieke kenmerken: lengte, gewicht, haarkleur
Abstracte kenmerken (constructs): Moeilijk te meten, bijvoorbeeld agressie, stress, angst.
Dit soort abstracte kenmerken moet je leren meten, dat leer je bij Methoden.
Een variabele is een eigenschap of conditie dat per individu anders kan zijn.
Een variabele is direct te meten, kan je aangeven met bijvoorbeeld X of Y.
Er zijn twee soorten numerieke variabelen:
Discreet (discrete): een beperkt (finite) aantal waarden die de variabele aan kan nemen of de waarden zijn telbaar: ‘Iets wat we kunnen tellen’.
Continu (continuous): Er is een oneindig (infinite) aantal waarden: ‘Iets wat we (nauwkeurig) kunnen meten’.
Hoofdstuk 2 – Tabellen en Grafieken
Frequentietabel: Elke keer als we de waarden die een variabele kan aannemen samen met hoe vaak de variabele deze waarde aanneemt in een tabel zetten.
Proportie/ percentage: welk deel een bepaalde waarde aangeeft
Gegroepeerde frequentietabel: Dan zet je meerdere waarden samen, zodat je niet enorm veel gegevens onder elkaar krijgt. Bij continue scores begin je met de interval waarbij [ gesloten/inclusief betekend en ) open/inclusief.
Je kunt allerlei verschillende grafieken maken:
Histogram: Frequentie verticaal, X horizontaal. De staven liggen tegen elkaar aan. Het is belangrijk de waarden goed te verdelen, anders krijg je hele lage of hele hoge staven.
Polygoon: ‘Een samenvatting van een histogram’. In het midden van elke staaf van een histogram zet je een puntje en daar trek je dan lijnen tussen. Een polygoon begint en eindigt altijd op de x-as! Wanneer je intervallen gebruikt zet je de stippen in het midden van de klasse. Ook wanneer de getallen onder de 0 uit komen moet je toch eindigen op de x-as.
Staafdiagram: (bar graph) een staafdiagram is voor variabelen van nominaal of ordinaal meetniveau, dus die niets met elkaar te maken hebben. De staven liggen los van elkaar.
Glooiende curve: (smooth curve) De verdeling van variabelen van interval of ratio meetniveau wordt vaak met een glooiende curve getekend. Het geeft in globale lijnen de vorm van de verdeling van een histogram aan.
Je hebt verschillende vormen van een verdeling:
Symmetrisch.
Scheef (skewed): links is negatief, rechts is positief. De staart geeft de richting van de scheefheid. Dus als hij rechts heel laag is (de staart) dan is hij positief.
Bimodaal: Verdeling met twee toppen (bi staat voor 2). Een bimodale verdeling is niet iets natuurlijks, ga op onderzoek uit want er klopt iets niet.
Uitschieters/uitbijters (outliers): Een waarde die ver weg ligt van de rest van de observaties. Wanneer je een uitschieter zit, stop dan weer met je onderzoek en ga op onderzoek uit, er klopt iets niet.
Percentielen: percentiel score of percentiel rangscore van een bepaalde waarde is het percentage van individuen wiens waarde lager of gelijk is aan deze waarde. Veel mag er worden overgeslagen in het boek over percentielen.
Hoofdstuk 3 – Centrummaten & Hoofdstuk 4 – Spreidingsmaten
Ga altijd eerst je data verzamelen in een grafiek waardoor je weet of de verdeling symmetrisch of scheef is.
Symmetrisch: dan gebruiken we het gemiddelde en de standaardafwijking.
Scheef: dan gebruiken we de mediaan en IQR.
Gemiddelde = mean / average:
Gemiddelde voor de populatie: µ (Griekse mu) = ∑X / N
Gemiddelde voor de steekproef: M= ∑x / n
Speciale gevallen:
Gewogen gemiddelde voor twee groepen: M= som van alle waarden / het aantal waarden M= (∑x1 + ∑x2) / (n1 + n2)
Voor frequentietabellen: als de frequentie 50 is dan doe je de X direct x 50 i.p.v. dat je het 50 keer op gaat schrijven.
Spreidingsmaten
Omdat het gemiddelde je niet alles vertelt heb je een spreidingsmaat nodig. Hoe is het gemiddelde verdeeld? Ligt het allemaal rond het gemiddelde of zijn er heel veel uit uitschieters boven en onder het gemiddelde?
Standaardafwijking (of standaarddeviatie): de meest gebruikte maat. Meet (ongeveer) de gemiddelde afstand tussen de waarden in de populatie/steekproef en het gemiddelde.
Variantie (variance)
Eigenlijk zijn de standaardafwijking en variantie van hetzelfde formaat.
SD = standaarddevviatie √variantie
Var = variantie = standaarddeviantie²
De standaardafwijking in de populatie is anders dan die bij de steekproef:
Bij populatie:
Je rekent eerst de variantie uit en vervolgens doe je die in de wortel.
Bij steekproef,
Kwadratensom: SS = ∑(X-M)²
Dus dan is s² = SS / n-1
Dat is dan de variantie, dus nog de wortel gebruiken!
Transformatie: een verandering in meeteenheid: dus bijvoorbeeld van m naar cm of maanden naar jaren. Als je overal een meter bij doet, kan je ook gewoon bij het gemiddelde een meter erbij doen: zo hoeft niet al je data overnieuw. Maar de standaardafwijking blijft hetzelfde! Dus die veranderd niet mee.
Het gemiddelde en standaardafwijking zijn gevoelig voor uitschieters dus wanneer je uitschieters (scheve verdeling) hebt is het handig om andere beschrijvende statistieken te gebruiken:
Mediaan: een waarde die de verdeling in twee gelijke helften verdeelt: 50% is groter, 50% is kleiner. Dus de mediaan is het 50e percentiel. Om de mediaan uit te rekenen moet je alle getallen van klein naar groot zetten. Als de steekproef oneven is, dan is de mediaan de middelste observatie. Is de steekproef even dan neem je het gemiddelde van de middelste 2.
Ook daarbij hoort een maat van spreiding, dat zijn kwartielen (quartiles).
Kwartielen: waarden die de verdeling in 4 gelijke stukken verdelen. Het tweede kwartiel is dan de mediaan.
Q1 = de mediaan van de onderste helft
Q2 = de mediaan
Q3 = de mediaan van de bovenste helft.
Het verschil tussen Q1 en Q3 is de interkwartielafstand = interquartile range = IQR
Stap 1: zet de getallen op volgorde
Stap 2: bepaal de mediaan, Q2
Stap 3: zoek Q1, dus je neemt de getallen kleiner dan Q2 en daarvan de mediaan.
Stap 4: zoek Q3, dus je neemt de getallen groter dan Q2 en daarvan de mediaan.
De IQR is dan het verschil tussen Q1 en Q3 (in formule is dat Q3-Q1)
Modus: is de waarde met de hoogste frequentie / hoogste staaf in een histogram. Deze kan je gebruiken bij nominale waarden, bijvoorbeeld dat psychologie de modus is bij sociale wetenschappen.
The range: Het verschil tussen de grootste waarde en de kleinste waarde: Xmax - Xmin
Let op: Een fout in het boek op bladzijde 106. De formule voor range is Xmax - Xmin
15-9 Hoorcollege MTS1 - Statistiek
Hoofdstuk 5 – Standaard scores en Hoofdstuk 6 - Kansverdelingen
Normale verdeling
De verdeling van scores binnen een populatie heet een kansverdeling. Een veel voorkomende is de normaalverdeling die gedefinieerd wordt door het gemiddelde µ en de standaardafwijking α.
De normaalverdeling is symmetrisch. Het inflectiepunt ligt precies 1 standaardafwijking vanaf het gemiddelde.
Bij een normaalverdeling liggen de meeste waarden van de variabelen redelijk dicht bij het gemiddelde, daarom ‘de grote bult’. Er zijn minder waarden die verder weg liggen dus daarom is het daar laag.
Je hebt in een normaalverdeling een oppervlakte onder de curve, die laten de proporties/ het percentage/ de kans zien. Bepaalde percentages zijn al standaard bekend
De standaardnormaalverdeling (een standaard model) heeft een µ=0 en α=1. De scores van die standaardnormaalverdeling worden aangegeven met de letter z.
Vaak heb je niet een standaard oppervlakte nodig maar één er tussenin. Dus is het belangrijk om te weten hoe je andere oppervlaktes kunt bepalen. Dit kan wiskundig maar je kunt ook leren om via de tabel het te bepalen.
Kolom A geeft waarden van z: alleen maar positief in de tabel. Maar wat als er een negatieve waarde staat in de vraag? Door symmetrie kan je dus gewoon bij de positieve waarde kijken.
Kolom B geeft waarden van de body. Het grootste stuk van de verdeling.
Kolom C geeft waarden van de staart. Het kleine stukje. De kolom die je het meeste gebruikt.
Kolom D geeft waarden tussen 0.0 en z. Gebruik je haast nooit.
Percentielen
Het 90ste percentiel van de standaard normaalverdeling is dat je de normaalverdeling verdeelt in 90% (body, linkerkant) en 10% (tail, rechterkant). In de tabel kan je dan opzoeken bij kolom B dat 0.9 een z-score van 1.28 heeft.
Z-score
Voor een populatie met gemiddelde en standaardafijking kunnen we voor elke observaring een standaard score uitrekenen: de z-score: z = (X-µ)/α. Deze score heeft 2 toepassingen:
Geeft de locatie van de originele score binnen de populatie verdeling (originele score = raw score = ruwe score)
Je kunt twee observaties met elkaar vergelijken.
Als je een schaalscore hebt is het meetniveau interval.
Een z-score geeft een relatieve locatie van een observatie binnen de verdeling. Het teken (the sign) van de z-score geeft aan of de waarde boven (+) of onder (–) het gemiddelde ligt. De waarde van de z-score geeft aan hoeveel standaardafwijkingen hij heeft.
Voorbeeld: ‘Welk percentage van de studenten zal hoger dan 25 scoren?’ Eerst reken je de z-score uit en dan kan je in de tabel gaan kijken. Omdat het ‘hoger dan 25’ is vindt je het antwoord in kolom C.
Voorbeeld: Bij een percentielscore gaat het andersom. ‘Wat is het 28ste percentiel (28% of minder) van de UML-scores?’. Eerst ga je de z-score zoeken. Daarna moet je gaan terugrekenen: De X-score vinden: X = µ + zα
Hoofdstuk 7 – Steekproevenverdeling
Wanneer je een steekproef neemt dan is bij verschillende steekproeven uit dezelfde populatie het steekproefgemiddelde anders. Dus de waarde van de statistiek die we uitrekenen uit de steekproef is bijna zeker niet gelijk aan de parameter in de populatie. Het verschil tussen de waarde van de statistiek en de waarde van de parameter is een schattingsfout: sampling error. Het feit dat steekproefgemiddelden variëren maakt het steekproefgemiddelde variabel. We kunnen het steekproefgemiddelde beschrijven aan de hand van een (frequentie) verdeling.
Belangrijk om te weten:
Het gemiddelde van de steekproevenverdeling van M ligt precies bij het populatiegemiddelde.
De vorm van de steekproevenverdeling van M lijkt er op die van de normaalverdeling.
Hoe groter het steekproefgemiddelde is, hoe kleiner de standaardafwijking is.
Central limit theorem
Deze 3 belangrijke regels kan je samenvoegen binnen één van de belangrijkste resultaten van de statistiek: Central Limit Theorem (CLT) of centrale limiet theorie. Stel je hebt een populatie met een gemiddelde en standaardafwijking, het maakt niet uit wat je meet. Uit die populatie trekken we een steekproef van n mensen. Wat weten we dan over het steekproefgemiddelde? Hoe groter n, hoe dichter de steekproevenverdeling van M bij de normaalverdeling zal liggen.
Wanneer een verdeling niet normaal verdeeld is, dan is de verdeling van M ongeveer normaal, zolang n groter dan 30 is. Dus als hij maar groter dan 30 is, dat is het belangrijke punt.
Dus bij een normaalverdeling van ?;
Het gemiddelde: µM = µ populatie
De standaardafwijking: αM = αpopulatie / √N
De hoeveelheid van αM heet de standaardfout (standard error) want het is de standaardafwijking van de steekproevenverdeling.
Waarom willen we dit weten? We moeten van beschrijvende statistiek naar verklarende statistiek.
29-9 Hoorcollege MTS1 - Statistiek
Behandeld wordt hoofdstuk 8, hypothese toetsen.
Bij statistiek maak je keuzes en kies je voor de optie die het meest waarschijnlijk is. De keuzes worden gemaakt tussen twee tegenstrijdige stellingen die iets zeggen over de gehele populatie (parameter).
De eerste stelling is H0, de nulhypothese en de tweede stelling is H1, de alternatieve hypothese. Bij H1 is er sprake van een verandering/verschil/relatie/effect. Je moet tussen deze hypothesen gaan kiezen: ‘wel/ niet verwerpen van nulhypothese’.
Er kunnen fouten ontstaan:
Je verwerpt H0 maar eigenlijk is H0 waar. Dit noem je een Type 1 error.
Je verwerpt H0 niet terwijl H0 eigenlijk niet waar is, dus verworpen zou moeten worden, noem je Type 2 error.
Een Type 1 fout is eigenlijk ernstiger om te maken omdat je iets verwerpt waar wel sprake van is. Je wilt dus voorkomen dat deze fout gemaakt wordt. De kans op Type 1 fout wordt aangeduid met Griekse letter α, het significantieniveau. Om de kans op Type 1 error zo klein mogelijk te maken, laat je α erg laag hebben.
De kans op Type 2 fout wordt aangeduid met β.
Bij de nulhypothese zullen we over het algemeen ‘=’ gebruiken. Bij alternatieve hypothese heb je ≠ (tweezijdige toets), > of < (eenzijdige toets).
Belangrijk: Hypothesen gaan altijd over de populatie.
Stappenplan om hypothesen te toetsen
Wanneer je een hypothese toetst neem je altijd aan dat H0 waar is, daarna probeer je aan te tonen dat die aanname niet waarschijnlijk is. We proberen dus de nulhypothese dus te falsifiëren. Het is een ondersteuning van de alternatieve hypothese.
Stap 1: Hypotheses bepalen en significantieniveau kiezen. De keuze van het significantieniveau is een keuze van de onderzoeker.
Stap 2: Kritieke waarden bepalen. De kritieke waarden worden bepaald aan de hand van de steekproevenverdeling die gebaseerd is op de aanname dat de nulhypothese waar is. Het gemiddelde van de steekproevenverdeling is hetzelfde als het gemiddelde van de populatie. Daarnaast reken je de standaardfout uit.
De waarden die niet vaak voorkomen vallen in het kritieke gebied dus het zijn onwaarschijnlijke waarden. De kritieke waarden worden bepaald door α. Als je α=0.10 dan heb je aan beide kanten bij een tweezijdige toets 0.05 zitten. Wanneer je 0.05 bij Kolom C opzoekt, dan vindt je daarbij een z-score van 1.645.
Bij een grotere waarde van α wordt het kritieke gebied groter dus bij minder bewijs kan je H0 al verwerpen.
Bij een eenzijdige toets zullen de extreme waarden aan 1 kant liggen. De extreme waarden zijn waarden die tot gevolg hebben dat we H0 verwerpen. De α hoeft je bij een eenzijdige toets niet door twee te delen want extreme waarden zitten maar aan 1 kant.
Stap 3: H0 aannemen en de z-score uitrekenen. Om M met µ te vergelijken gebruiken we een toetsingsgrootheid. Deze toetsingsgrootheid is de z-score.
Stap 4: Beslissing nemen over H0. Wanneer je nu een z-score van groter dan 1.645 vindt, dan valt dat binnen het kritieke gebied dus zal je H0 verwerpen Wanneer de z-score tussen -1.645 en 1.645 ligt dan verwerp je H0 niet.
Overschrijdingskans
Keuzes maken bij een hypothesetoets kan ook zonder kritieke waarde. Je maakt gebruik van de staartoppervlakte (tail probability). Dit heet de overschrijdingskans of de p-waarde.
P-waarde: meet de kans dat we een waarde observeren ‘net zo extreem of nog extremer dan de waarde die wij geobserveerd hebben’.
Bij een kleine p-waarde is de geobserveerde waarde heel klein, dus is het onwaarschijnlijk dat H0 waar is, dus verwerp je H0. Bij een grote p-waarde is de geobserveerde waarde een veel voorkomende waarde dus verwerp je H0 niet. Nu is de vraag, wat is groot en wat is klein? Deze grens ligt bij α. Universele beslissingsregel: We verwerpen H0 als de p-waarde ≤ α. Wanneer je H0 daarom verwerpt dan is het resultaat statistisch significant.
Je kunt de p-waarde uitrekenen door middel van de z-score. Bij een tweezijdige toets dan reken je 1 kant uit en vermenigvuldig je dat met 2 omdat je beide kanten moet weten. Wanneer de p-waarde dan kleiner is dan α dan verwerp je H0.
Wanneer je de p-waarde gebruikt hoef je bij stap 2 de kritieke waarde niet uit te rekenen.
Effectgrootte
Cohen’s d = verschil in gemiddelden / standaardafwijking dus M-µ / 2
Richtlijnen zijn dat wanneer
D= 0.2 een klein effect
D= 0.5 een medium effect
D= 0.8 een groot effect
Type 2 error
De onderzoeker beslist de α bij Type 1 error. De waarde van α hangt af van hoe ernstig het maken van een type 1 fout is.
De type 2 error wordt uitgebreid behandeld in het boek, maar de berekeningen slaan we allemaal over.
Bij Type 2 error is er sprake van β.
Β = de kans dat we H0 niet verwerpen terwijl H0 eigenlijk waar is. Dus je draait het om als bij Type 1 error want daar gaat het om de kans dat je H0 juist wel verwerpt.
De kans dat we H0 verwerpen als H1 waar is heet de Power.
Power is 1 – β.
Omdat je β zo klein mogelijk wilt zal de power juist hoog zijn. De power wordt meestal bepaald voordat het onderzoek gedaan wordt. Het wordt gebruikt om te kijken of een bepaald onderzoek succesvol lijkt te zijn. De power wordt beïnvloed door 4 dingen:
De keuze van α: Wanneer α groter wordt, wordt β kleiner dus wordt de power weer groter.
Het verwachtte effect (verschil tussen µ0 en µ1): Wanneer dit verschil groot is dan is het gemakkelijker om dit verschil in de steekproef terug te vinden. Dus hoe groter het verschil, hoe hoger de power.
De grootte van n: Wanneer je een grote steekproef hebt, hoe hoger de power is.
1- of 2-zijdige toetsen. Je hebt een specifiekere toets bij een 1-zijdige toets dus bij een 1-zijdige toets is de power hoger.
6-10 Hoorcollege MTS1 - Statistiek
We behandelen hoofdstuk 9: t-toets voor één steekproef en hoofdstuk 11: t-toets voor gekoppelde steekproeven.
Hoofdstuk 9
Stappenplan om een hypothese te toetsen:
Stap 1: hypotheses bepalen en significantie niveau kiezen
Stap 2: kritieke waarden bepalen
Stap 3: H0 aannemen en de z-score uitrekenen.
Bij de z-score heb je de standaardafwijking nodig. Omdat deze in de praktijk vaak niet beschikbaar is mag je deze vervangen met de geschatte standaardfout. De geschatte standaardfout bereken je door: sm = s / √n. De score die je dan krijgt is (M-µ) / sm. Wanneer je daar gebruik van maakt dan bereken je dus de t-score. Deze kan je dus gebruiken wanneer je de standaardafwijking niet weet, en is een vervanging voor de z-score.
Stap 4: beslissing nemen over H0.
Het stappenplan voor een t-score is hetzelfde als voor de z-score, maar nu gebruik je de t-verdeling. De t-verdeling lijkt heel erg op de standaardnormaalverdeling. Bij de t-verdeling heb je iets meer spreiding dan bij de normaalverdeling, verder is hij bijna hetzelfde.
De t-verdeling wordt niet door het gemiddelde en de standaardafwijking gedefinieerd maar door de vrijheidsgraden (degrees of freedom = df). Hoe hoger df, hoe meer de t-verdeling op de standaard normaalverdeling lijkt. De degrees of freedom is n-1.
In de t-verdeling zoek je eerst de df op. Daarnaast maak je een keuze of je een eenzijdige of tweezijdige toets hebt. Daarna kijk je welke α je gebruikt en dan kan je de juiste t-score opzoeken. Helemaal onderin staan de kritieke waarden van een z-toets.
Nu wederom het stappenplan. Nu zouden we alle stappen kunnen doorlopen:
Stap 1: hypotheses bepalen en significantie niveau kiezen: dat konden we al.
Stap 2: kritieke waarden bepalen: Hiervoor hebben we 3 dingen nodig: de α, de vrijheidsgraden, dus df = n-1 en daarnaast: toetsen we eenzijdig of tweezijdig? Vervolgens kan je in de tabel kijken welke t-score er bij hoort. Wanneer je df er niet bij staat dan rond je af naar beneden. Wanneer je bijvoorbeeld df = 74 hebt, ga je naar df = 60.
Stap 3: H0 aannemen en de z-score uitrekenen. Hierbij gebruik je dus s in plaats van de standaardafwijking, omdat je die niet hebt.
Stap 4: Beslissing nemen over H0. Je kijkt of de t-score die je hebt uitgerekend (bij stap 3) valt binnen de krtitieke waarden die je hebt uitgerekend (bij stap 2). Wanneer de t-score in het kritieke gebied valt, dan verwerp je H0.
Ook bij Cohen’s d mag je de geschatte waarde uitrekenen. Dit doe je wederom door de standaardafwijking te vervangen door s. De Cohen’s d richtlijnen blijven het zelfde.
Effectgrootte: r²
Dit is naast de Cohen’s d een effectgrootte. Je kunt niet direct zien wat deze r kwadraat meet, dat komt in MTS 2 aan de orde. De simpele formule is:
r² = t² / (t² + df). Hierbij heb je andere richtlijnen. Namelijk: r² = 0.01 is klein effect, r² = 0.09 is medium effect, r² = 0.25 is een groot effect.
Vervolg stappenplan
Stap 5: het toetsingsproces.
Er is nog een stap 5, dus het stappenplan is nog niet klaar. De vraag is: Wat weten we over de p-waarde? Wanneer je H0 verwerpt is de p-waarde kleiner dan α. Exacte p-waarden krijg je met SPSS, niet met de hand. Wanneer je gaat rapporteren dan rapporteer je de M en s, daarnaast zeg je of het verschil significant was, je rapporteert t, je zegt of de p-waarde kleiner of groter is dan α en tot slot zet je de effectgrootte (d) erbij.
Bij SPSS krijg je twee tabellen, 1 met one-sample statistics, de andere met one-sample test. De test value is de waarde uit de nulhypothese. Het getal dat staat bij sig. is de p-waarde. Met de gegevens van SPSS kan je stap 5, het rapporteren, uitvoeren.
Schatten
Bij hypothese toetsen kan je in plaats van toetsen ook gaan schatten. Bij toetsen vraag je je af of er een verschil is. Bij schatten vraag je je af hoe groot het verschil is. Zo verzamel je algemene informatie over een bepaalde populatie. Vaak worden ze gerapporteerd als aanvullende informatie op de getoetste hypothese. Je hebt twee manieren van schatten:
Intervalschatting: Je hebt een interval van waarden. Aan de hand van de verzamelde data rekenen wij twee grenswaarden uit. Deze rekenen we op zo’n manier uit dat we er vrij zeker van zijn dat de populatie prameter tussen deze grenzen ligt. Deze twee grenswaarden moet je gaan bepalen. De zekerheid die je aan zo’n schatting koppelt noem je het betrouwbaarheidsniveau, die je aangeeft met een percentage. De meest gebruikten zijn 80, 90 of 95 procent. Het betrouwbaarheidsniveau is 1 – α. De α geeft de kans dat je Type 1 fout maakt, de betrouwbaarheidsniveau geeft het tegenovergestelde, dus dat het goed kan gaan.
Wanneer je de intervalschatting en het betrouwbaarheidsniveau combineert heb je een betrouwbaarheidsinterval (BI).
Hoe reken je de grenzen van de BI uit? Je rekent M uit. De ondergrens is dan M – 2 standaardfouten. De bovengrens is M + 2 standaardfouten. Tussen deze ondergrens en bovengrens zal de µ liggen. Dus wanneer je voor 95% kiest zal µ 95% van de keren tussen de grenzen liggen, dus heel soms valt µ buiten deze grenzen.
Bij een andere betrouwbaarheidsniveau passen we de alfa aan en verandert de kritieke waarde. Dan moeten we de t-verdeling gebruiken om te bepalen hoeveel standaardfouten we boven en onder het gemiddelde gaan. Hiervoor gebruiken we de tweezijdige kritieke waarde met α.
De formule voor BI is: M± t x s. Wanneer je dit voor + en – uitrekent dan heb je de grenzen.
Het doel van schatten is om nauwkeurig te schatten. Een nauwkeurige schatting betekent een smal BI. Wanneer je BN verandert van 95 naar 90 dan wordt BI smaller. Wanneer n zou stijgen dan wordt BI smaller. Dit komt omdat je bij n meer informatie hebt dus nauwkeuriger.
Hoofdstuk 11
Er bestaan ook t-toetsen waarbij je een vergelijking doet tussen 2 groepen. Dit komt door:
Herhaalde metingen
Matched-subjects ontwerpen
Onafhankelijke steekproeven
Bij herhaalde metingen en matched-subjects doe je gekoppelde metingen, een bepaald soort t-toets. De onafhankelijke steekproeven doen we de volgende keer.
De gekoppelde metingen zijn studies met afhankelijke steekproeven kunnen die ook gebruik maken van een t-toets. Het idee blijkt hetzelfde te zijn als een t-toets voor één gemiddelde. Bij gekoppelde metingen vormen de data paren. Je gaat kijken naar de verschillen tussen voor én na. Dus wordt de toets uitgevoerd op verschilscores: difference score = D.
Voor deze verschilscore gebruik je precies hetzelfde stappenplan als bij hoofdstuk 9.
19-10 Hoorcollege MTS1 - Statistiek
Vandaag wordt hoofdstuk 10 behandeld, het gaat over een t-toets voor twee onafhankelijke steekproeven. Dus: Hoe kan je twee groepen met elkaar vergelijken?
Voorbeeld voor vandaag
De UU wordt vergeleken met de HU: Zijn UU studenten zelfverzekerder dan HU studenten?
De data die bekent is, is:
UU: n= 75, M = 21.40, s= 4.87
HU: n= 63, M=19.93, s= 5.11
Stappenplan bij t-toets voor onafhankelijke groepen
Deze t-toets is een uitbreiding van de t-toets voor één groep maar de basis blijft dat je stekproef resultaten met elkaar vergelijkt door H0. Hierbij gebruik je hetzelfde stappenplan:
Stap 1: Hypothese opstellen. Het is belangrijk dat je het verschil tussen UU en HU laat zien dus gebruik je µ1 en µ2. De nulhypothese is altijd een stelling van gelijkheid dus H0: µ1 = µ2. De alternatieve hypothese is dan H1: µ1 > µ2. Een andere formulering is H0: µ1 - µ2 = 0 en H1: µ1 - µ2 > 0. Significantieniveau = 0.10
Stap 2: Om de hypothesen te gaan toetsen heb je de vrijheidsgraden nodig: df1 + df2 = (n1-1) + (n2-1). Wanneer je df hebt kan je samen met het significantieniveau en het feit dat het een eenzijdige toets is de kritieke waarden bepalen. (Bij het voorbeeld komt daar 1.289 uit.)
Stap 3: t-score uitrekenen.
Bij 1 gemiddelde (hoofdstuk 9): t= (M-µ)/sm
Bij gekoppelde metingen (hoofdstuk 11): t= (Md - µd) / smd
Bij twee onafhankelijke groepen (hoofdstuk 10): t= (m1 – M2) / (µ1 - µ2)/ s(m1-m2)
Belangrijk is: De steekproeven moeten aselect en onafhankelijk zijn. De populatie moet normaal verdeeld zijn en een gelijke spreiding hebben. Dus de gemiddelden van de populaties hoeven niet hetzelfde te zijn maar de spreiding wel. Wanneer je deze voorwaarden hebt heeft de toets heel veel power.
Bij het uitrekenen van de t-score is het lastig om de steekproeffout (sm1-m2) uit te rekenen.
Je mag de varianties van m1 en em2 bij elkaar optellen, dat mag niet bij de steekproeffout. Dus de formule wordt: s(m1-m2) = √s²1/n1 + s²2/n2)
Voor deze formule reken je eerst de variantie uit. Dat is s² = SS / df. Hier is SS = SS1 + SS2 en df = df1 + df2. Dus de variantie is (SS1+SS2)/ (df1 + df2).
Dus stap 3 bestaat uit: s² uitrekenen > sm1-m2 uitrekenen > invullen bij t formule.
Stap 4: Beslissing nemen of je H0 wel of niet verwerpt.
Feitjes bij SPSS
Als de p-waarde groter is dan α, mag je H0 niet verwerpen.
Als de p-waarde kleiner is dan α, mag je H0 wel verwerpen.
Bij de SPSS output staat de p-waarde onder Sig.
Bij een eenzijdige toets dan deel je de p waarde door 2.
Effectgrootte
Geschatte waarde Cohen’s d = (M1-M2) / √s²p.
Verklaarde variantie r² = t² / (t² + df). Maar denk aan df = df1 + df2
Om deze waarden uit te rekenen kan je gebruik maken van de gegevens die je eerder hebt uitgerekend.
Vervolgens kan je met alle voorgaande resultaten een rapportage doen. Dit gaat volgens de strikte lijnen van de APA stijl. Bij dit voorbeeld wordt dat: “De Universiteit Utrecht studenten (M = 21.40, s = 4.87) scoorden gemiddeld significant hoger op de SES dan de Hogeschool Utrecht studenten (M = 19.93, s = 5.11), t(136) = 1.73, p = .043, d = 0.29.”
Deze rapportage moet altijd zo dus op het tentamen moet je de juiste manier kunnen herkennen.
Betrouwbaarheidsinterval
Je gebruikt een betrouwbaarheidsinterval om de waarde van een bepaalde parameter te schatten. De formule hiervoor is: (M1 – M2) ± t x sm1-m2
Wanneer de gehele betrouwbaarheidsinterval boven nul ligt kan je zeggen dat je de nulhypothese verwerpt. Het moet dan wel per se een tweezijdige toets zijn. Wanneer het een eenzijdige toets is dan gebruik je voor BN: 100 – 2x significantieniveau. Bij een tweezijdige toets is BN: 100 – significantieniveau, dat was BN= 1-α.
Wanneer we een BI willen uitrekenen om puur het verschil te schatten gebruiken we een BN = 90%.
Wanneer we een BI willen gebruiken om een beslissing te nemen over de nulhypothese gebruiken we een BN= 80%.
Schatten? BN = 1- α
Toetsen? Tweezijdig 1- α en eenzijdig 1- 2α
BI gebruik je als ‘hoe groot is het verschil?’ de vraag is. Je gaat toetsen als je wilt weten of er een verschil is.
Beslissingsregels
Je mag H0 verwerpen als:
T in het kritieke gebied ligt.
De p-waarde is kleiner of gelijk aan α.
De H0 waarde niet in BI ligt.
Het beslissingsschema is erg handig. Deze kan je terug vinden op Blackboard.
Welke analysetechniek?
Er staan voorbeelden op Blackboard over welke analysetechniek je bij bepaalde gevallen kunt gebruiken. De vragen hierbij zijn: Welke t-toets? BI of toets gebruiken? 1- of 2-zijdig toetsen? Wat zijn de hypothesen?
Verhaaltje 1: Om buitenlandse kinderen Nederlands te leren zijn twee methoden ontwikkeld. Een groep kinderen gebruikt een mondelinge methode. Een andere groep kinderen gebruikt een schriftelijke methode. Verschillen de methodes significant van elkaar?
Toetsen > onafhankelijke toets > 2-zijdig > H0: µ1 - µ2 = 0 en H1: µ1 - µ2 ≠0
Verhaaltje 2: Bestuurders die zijn veroordeeld vanwege een snelheidsovertreding, moeten een verplichte cursus volgen. Met een apparaat in hun auto werd voor de cursus de gemiddelde snelheid gemeten. Is de gemiddelde snelheid na de cursus lager?
Toetsen > gekoppelde toets > 1-zijdig > H0: µ=0 en H1: µ<0
Verhaaltje 3: Van een bepaalde multiple choice test is bekend dat men gemiddeld 40 vragen goed heeft. Tien mensen kijken eerst naar reclamespotjes en vullen vervolgens de vragenlijst in. Wat is het gemiddeld aantal vragen goed in de populatie van mensen die naar de reclamespotjes kijken?
BI gebruiken > gaat over één gemiddelde.
Verhaaltje 4: Mensen die stoppen met roken, klagen vaak over gewichtstoename. Van 50 mensen die stoppen met roken is het gewicht gemeten terwijl ze rookten. Nadat ze gestopt waren met roken, is het gewicht opnieuw gemeten. Is er sprake van gewichtstoename?
Toetsen > gekoppelde toets > 1-zijdig > H0: µ=0 en H1: µ > 0
26-10 Responsiecollege MTS1
Dit college gaat aan de hand van de voorbeeldvragen als voorbereiding voor de MTS toets. Deze zijn te vinden op Blackboard. Hieronder staan alle antwoorden met soms een uitleg erbij.
Vraag 1: D. Er is alleen maar een correlatie want er zijn nog allerlei andere variabelen die invloed kunnen hebben.
Vraag 2: B. In dit artikel staat een heleboel informatie in het methoden deel. Maar deze vraag gaat om de afhankelijke variabelen. Ze zoeken naar agressiviteit, dat is dan ook het antwoord.
Vraag 3: D. Het is geen indruksvaliditeit omdat het gaat om de interpretering van de codering door twee mensen. Wanneer je het bekijkt met twee mensen dan is het dus betrouwbaar. Bij indruksvaliditeit zouden twee mensen het kritisch gaan bekijken maar dat is nu niet aan bod.
N.B.: Iets kan zowel betrouwbaar als valide is, maar iets kan wel betrouwbaar zijn maar niet valide. Hoe kan dit? Je kunt wel een betrouwbaar onderzoek doen maar wanneer je verkeerde vragen stelt om een juist antwoord te krijgen op de onderzoeksvraag is het niet valide: je meet namelijk niet wat je zou moeten meten.
Vraag 4: C. Externe validiteit gaat over hoe je kunt generaliseren naar een groter publiek. De grootte van je steekproef heeft daar niets mee te maken, dus A valt direct af. Antwoord B gaat wel om validiteit en betrouwbaarheid maar niet om externe validiteit, want hoe je meet heeft niets te maken met generaliseren naar groter publiek. D valt ook af, dat is gewoon een nietszeggend antwoord.
Vraag 5: D.
Vraag 6: C. Het verhaal begint inderdaad met observatie maar uiteindelijk krijgt ze de verwachting door deductie. Ze leest iets in de literatuur en daaruit komt een verwachting.
Vraag 7: D. Als je het over een steekproef hebt moet je altijd eerst beginnen met de vraag: Wat is de populatie? Daarna kan je pas een uitspraak doen over de steekproef. Bij dit voorbeeld heeft hij 20 mensen aselect geselecteerd die op dat moment aanwezig zijn. Maar uiteindelijk is het geen aselecte steekproef over de populatie want de mensen die er niet zijn, maken geen kans dus is het niet aselect voor de hele populatie. Daarom is het géén enkelvoudige aselecte steekproef maar is het de gemakssteekproef.
Vraag 8: C. Je krijgt aan de rechterkant de staart omdat je heel veel 2’en hebt. Door de hoeveelheid 2’en krijg je aan de linkerkant een hoge bult. Dan komt je op antwoord C.
Vraag 9: A. Wanneer je de mediaan uitrekent dan moet je eerst de totale frequentie weten. Dat is hier 80. Het midden daarvan is het 40e en 41e getal. Dan kom je bij ‘aantal 2’ terecht.
Vraag 10: A. Wat handig is op je tentamen: maak er een klein tekeningetje bij. Dit is een z-toets. Je kunt het dus gewoon met de formule van de z uitrekenen.
Vraag 11: A. Hierbij heb je een n dus ga je de standaardfout uitrekenen. En vervolgens reken je dan de z uit, waarbij je de z scores zoekt. Dan kom je terecht bij 0.0244.
Vraag 12: C. Het is een tweezijige t-toets. Je kijkt bij df 15. Hierbij kan je de tkritiek zoeken. Vervolgens reken je de standaardfout uit en daarna de t. Daaruit blijkt dat t groter is dan tkritiek.
Vraag 13: A. M=4.3, t=2,947 en sm=0.125. De 99% houdt in dat je bij 0.01 moet kijken om t te vinden. Wanneer je dan de formule gebruikt voor het betrouwbaarheidsinterval kom je op antwoord A.
Vraag 14: C. Dit komt omdat je de verdeling van de 128 kinderen niet goed hebt gedaan.
Vraag 15: B. Voor deze vraag moet je Cohen’s d uitreken op de manier die je in hoofdstuk 10 hebt geleerd. Je rekent eerst sp² door gebruik te maken van SS en df. Wanneer je de sp² hebt kan je d uitrekenen omdat M al bekend is. Dan kom je uit op antwoord B.
N.B.: De formule voor SS is: SS = ∑X² - (∑X)²/ n maar wanneer je sp² uitrekent moet je SS1 en SS2 uitrekenen, en die optellen. Dit moet je delen door df die verdeelt is door df1 en df2. Zo kom je op sp².
Vraag 16: A. Voor deze vraag moet je goed kijken naar t-test for equality of means en dan naar Sig. Het is een eenzijdige toets bij α=0.05. Het resultaat blijkt dus significant te zijn want 0.05 is groter dan Sig. dus wordt H0 verworpen. Dan heb je de keuze tussen A en B. Dit moet A zijn omdat het zou kunnen dat hij Ho verwerpt terwijl dat eigenlijk niet nodig is.
Extra vraag 16: Er is bij op Blackboard nog een extra vraag toegevoegd. De vraag is wat de juiste p-waarde is. Je moet kijken bij ‘equal variances not assumed’ onder Sig. (2-tailed). Aangezien het een eenzijdige toets is moet je het nog wel delen door 2. Dan kom je uit op 0.002.
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
Contributions: posts
Spotlight: topics
Universiteit Utrecht en studieverenigingen
Online access to all summaries, study notes en practice exams
- Check out: Register with JoHo WorldSupporter: starting page (EN)
- Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)
How and why use WorldSupporter.org for your summaries and study assistance?
- For free use of many of the summaries and study aids provided or collected by your fellow students.
- For free use of many of the lecture and study group notes, exam questions and practice questions.
- For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
- For compiling your own materials and contributions with relevant study help
- For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, notes and practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
- Use the summaries home pages for your study or field of study
- Use the check and search pages for summaries and study aids by field of study, subject or faculty
- Use and follow your (study) organization
- by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
- this option is only available through partner organizations
- Check or follow authors or other WorldSupporters
- Use the menu above each page to go to the main theme pages for summaries
- Theme pages can be found for international studies as well as Dutch studies
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
- Check out: Why and how to add a WorldSupporter contributions
- JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
- Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Quicklinks to fields of study for summaries and study assistance
Main summaries home pages:
- Business organization and economics - Communication and marketing -International relations and international organizations - IT, logistics and technology - Law and administration - Leisure, sports and tourism - Medicine and healthcare - Pedagogy and educational science - Psychology and behavioral sciences - Society, culture and arts - Statistics and research
- Summaries: the best textbooks summarized per field of study
- Summaries: the best scientific articles summarized per field of study
- Summaries: the best definitions, descriptions and lists of terms per field of study
- Exams: home page for exams, exam tips and study tips
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
- Studies: Bedrijfskunde en economie, communicatie en marketing, geneeskunde en gezondheidszorg, internationale studies en betrekkingen, IT, Logistiek en technologie, maatschappij, cultuur en sociale studies, pedagogiek en onderwijskunde, rechten en bestuurskunde, statistiek, onderzoeksmethoden en SPSS
- Studie instellingen: Maatschappij: ISW in Utrecht - Pedagogiek: Groningen, Leiden , Utrecht - Psychologie: Amsterdam, Leiden, Nijmegen, Twente, Utrecht - Recht: Arresten en jurisprudentie, Groningen, Leiden
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
3027 | 1 |
Add new contribution