College-aantekeningen bij Statistiek voor MTS 1 aan de Universiteit Utrecht - 2016/2017

College: Inleiding statistiek

Hoofdstuk 1 van de voorgeschreven statistiek literatuur

Je kunt op allerlei manieren data verzamelen, maar je moet het ook kunnen samenvatten. Als we dat doen heeft dat beschrijvende statistiek (descriptive statistics). Wanneer je statistiek gaat beschrijven heb je een populatie nodig die je wilt bestuderen. De grootte wordt aangegeven door de letter N. Maar je kunt het bijna nooit doen onder alle mensen in de populatie, daarom doe je een steekproef en daarvan verzamel je data. Deze is representatief voor de populatie. De grootte van de steekproef wordt aangegeven door de letter n.

  • Parameter: een getal (numerieke waarde) dat de gehele populatie beschrijft.

  • Statistiek: een getal (numerieke waarde) dat alleen de steekproef beschrijft.

Deze collegereeks draait om het leren omgaan met statistiek, het kunnen bepalen van numerieke waarden en het terugkoppelen hiervan naar de hele populatie.

  • Inductieve statistiek: het generaliseren van resultaten uit de steekproef naar de gehele populatie.

Wanneer je dingen wilt gaan meten, heb je twee soorten kenmerken:

  1. Fysieke kenmerken: lengte, gewicht, haarkleur

  2. Abstracte kenmerken (constructs): moeilijk te meten, bijvoorbeeld agressie, stress, angst.

Dit soort abstracte kenmerken moet je leren meten, hier wordt nader op ingegaan bij het onderdeel methoden van deze collegereeks.

Variabelen in de statistiek

  • Een variabele is een eigenschap of conditie dat per individu anders kan zijn.

  • Een variabele is direct te meten, kan je aangeven met bijvoorbeeld X of Y.

Er zijn twee soorten numerieke variabelen:

  1. Discreet (discrete): een beperkt (finite) aantal waarden die de variabele aan kan nemen of de waarden zijn telbaar: ‘Iets wat we kunnen tellen’.

  2. Continu (continuous): er is een oneindig (infinite) aantal waarden: ‘Iets wat we (nauwkeurig) kunnen meten’.

Tabellen en Grafieken

Hoofdstuk 2 van de voorgeschreven statistiek literatuur

  • Frequentietabel: elke keer als we de waarden die een variabele kan aannemen samen met hoe vaak de variabele deze waarde aanneemt in een tabel zetten.

  • Proportie/ percentage: welk deel een bepaalde waarde aangeeft

  • Gegroepeerde frequentietabel: dan zet je meerdere waarden samen, zodat je niet enorm veel gegevens onder elkaar krijgt. Bij continue scores begin je met de interval waarbij [ gesloten/inclusief betekend en ) open/inclusief.

Je kunt allerlei verschillende grafieken maken:

  • Histogram: frequentie verticaal, X horizontaal. De staven liggen tegen elkaar aan. Het is belangrijk de waarden goed te verdelen, anders krijg je hele lage of hele hoge staven.

  • Polygoon: ‘een samenvatting van een histogram’. In het midden van elke staaf van een histogram zet je een puntje en daar trek je dan lijnen tussen. Een polygoon begint en eindigt altijd op de x-as! Wanneer je intervallen gebruikt zet je de stippen in het midden van de klasse. Ook wanneer de getallen onder de 0 uit komen moet je toch eindigen op de x-as.

  • Staafdiagram: (bar graph): een staafdiagram is voor variabelen van nominaal of ordinaal meetniveau, dus die niets met elkaar te maken hebben. De staven liggen los van elkaar.

  • Glooiende curve: (smooth curve): de verdeling van variabelen van interval of ratio meetniveau wordt vaak met een glooiende curve getekend. Het geeft in globale lijnen de vorm van de verdeling van een histogram aan.

Je hebt verschillende vormen van een verdeling:

  • Symmetrisch

  • Scheef (skewed): links is negatief, rechts is positief. De staart geeft de richting van de scheefheid. Dus als hij rechts heel laag is (de staart) dan is hij positief.

  • Bimodaal: verdeling met twee toppen (bi staat voor 2). Een bimodale verdeling is niet iets natuurlijks, ga op onderzoek uit want er klopt iets niet.

  • Uitschieters/uitbijters (outliers): een waarde die ver weg ligt van de rest van de observaties. Wanneer je een uitschieter zit, stop dan weer met je onderzoek en ga op onderzoek uit, er klopt iets niet.

  • Percentielen: percentiel score of percentiel rangscore van een bepaalde waarde is het percentage van individuen wiens waarde lager of gelijk is aan deze waarde. Veel mag er worden overgeslagen in het boek over percentielen.

Centrummaten

Hoofdstuk 3 van de voorgeschreven statistiek literatuur

Ga altijd eerst je data verzamelen in een grafiek waardoor je weet of de verdeling symmetrisch of scheef is.

  • Symmetrisch: dan gebruiken we het gemiddelde en de standaardafwijking.

  • Scheef: dan gebruiken we de mediaan en IQR.

  • Gemiddelde = mean / average:

    • Gemiddelde voor de populatie: µ (Griekse mu) = ∑X / N

    • Gemiddelde voor de steekproef: M= ∑x / n

Speciale gevallen:

  • Gewogen gemiddelde voor twee groepen: M= som van alle waarden / het aantal waarden M= (∑x1 + ∑x2) / (n1 + n2)

  • Voor frequentietabellen: als de frequentie 50 is dan doe je de X direct x 50 i.p.v. dat je het 50 keer op gaat schrijven.

Spreidingsmaten

Hoofdstuk 4 van de voorgeschreven statistiek literatuur

Omdat het gemiddelde je niet alles vertelt heb je een spreidingsmaat nodig. Hoe is het gemiddelde verdeeld? Ligt het allemaal rond het gemiddelde of zijn er heel veel uit uitschieters boven en onder het gemiddelde?

  • Standaardafwijking (of standaarddeviatie): de meest gebruikte maat. Meet (ongeveer) de gemiddelde afstand tussen de waarden in de populatie/steekproef en het gemiddelde.

  • Variantie (variance)

Eigenlijk zijn de standaardafwijking en variantie van hetzelfde formaat.

  • SD = standaarddevviatie √variantie

  • Var = variantie = standaarddeviantie²

De standaardafwijking in de populatie is anders dan die bij de steekproef:

  • Bij populatie: je rekent eerst de variantie uit en vervolgens doe je die in de wortel.

  • Bij steekproef: kwadratensom: SS = ∑(X-M)², dus dan is s² = SS / n-1. Dat is dan de variantie, dus nog de wortel gebruiken!

  • Transformatie: een verandering in meeteenheid: dus bijvoorbeeld van m naar cm of maanden naar jaren. Als je overal een meter bij doet, kan je ook gewoon bij het gemiddelde een meter erbij doen: zo hoeft niet al je data overnieuw. Maar de standaardafwijking blijft hetzelfde! Dus die veranderd niet mee.

Het gemiddelde en standaardafwijking zijn gevoelig voor uitschieters dus wanneer je uitschieters (scheve verdeling) hebt is het handig om andere beschrijvende statistieken te gebruiken:

  • Mediaan: een waarde die de verdeling in twee gelijke helften verdeelt: 50% is groter, 50% is kleiner. Dus de mediaan is het 50e percentiel. Om de mediaan uit te rekenen moet je alle getallen van klein naar groot zetten. Als de steekproef oneven is, dan is de mediaan de middelste observatie. Is de steekproef even dan neem je het gemiddelde van de middelste 2. Ook daarbij hoort een maat van spreiding, dat zijn kwartielen (quartiles).

  • Kwartielen: waarden die de verdeling in 4 gelijke stukken verdelen. Het tweede kwartiel is dan de mediaan.

    • Q1 = de mediaan van de onderste helft

    • Q2 = de mediaan

    • Q3 = de mediaan van de bovenste helft.

Het verschil tussen Q1 en Q3 is de interkwartielafstand = interquartile range = IQR

Stap 1: zet de getallen op volgorde

Stap 2: bepaal de mediaan, Q2

Stap 3: zoek Q1, dus je neemt de getallen kleiner dan Q2 en daarvan de mediaan.

Stap 4: zoek Q3, dus je neemt de getallen groter dan Q2 en daarvan de mediaan.

De IQR is dan het verschil tussen Q1 en Q3 (in formule is dat Q3-Q1)

  • Modus: is de waarde met de hoogste frequentie / hoogste staaf in een histogram. Deze kan je gebruiken bij nominale waarden, bijvoorbeeld dat psychologie de modus is bij sociale wetenschappen.

  • The range: Het verschil tussen de grootste waarde en de kleinste waarde: Xmax - Xmin

Let op: Een fout in het boek op bladzijde 106. De formule voor range is Xmax - Xmin

College: Standaard scores & kansverdeling

Hoofdstuk 5 & Hoofdstuk 6 & Hoofdstuk 7 van de voorgeschreven statistiek literatuur

De verdeling van scores binnen een populatie heet een kansverdeling. Een veel voorkomende is de normaalverdeling die gedefinieerd wordt door het gemiddelde µ en de standaardafwijking α. De normaalverdeling is symmetrisch. Het inflectiepunt ligt precies 1 standaardafwijking vanaf het gemiddelde. Bij een normaalverdeling liggen de meeste waarden van de variabelen redelijk dicht bij het gemiddelde, daarom ‘de grote bult’. Er zijn minder waarden die verder weg liggen dus daarom is het daar laag. Je hebt in een normaalverdeling een oppervlakte onder de curve, die laten de proporties/ het percentage/ de kans zien. Bepaalde percentages zijn al standaard bekend. De standaardnormaalverdeling (een standaard model) heeft een µ=0 en α=1. De scores van die standaardnormaalverdeling worden aangegeven met de letter z.

Vaak heb je niet een standaard oppervlakte nodig maar één er tussenin. Dus is het belangrijk om te weten hoe je andere oppervlaktes kunt bepalen. Dit kan wiskundig maar je kunt ook leren om via de tabel het te bepalen.

  • Kolom A geeft waarden van z: alleen maar positief in de tabel. Maar wat als er een negatieve waarde staat in de vraag? Door symmetrie kan je dus gewoon bij de positieve waarde kijken.

  • Kolom B geeft waarden van de body. Het grootste stuk van de verdeling.

  • Kolom C geeft waarden van de staart. Het kleine stukje. De kolom die je het meeste gebruikt.

  • Kolom D geeft waarden tussen 0.0 en z. Gebruik je haast nooit.

Percentielen

Het 90ste percentiel van de standaard normaalverdeling is dat je de normaalverdeling verdeelt in 90% (body, linkerkant) en 10% (tail, rechterkant). In de tabel kan je dan opzoeken bij kolom B dat 0.9 een z-score van 1.28 heeft.

Z-score

Voor een populatie met gemiddelde en standaardafijking kunnen we voor elke observaring een standaard score uitrekenen: de z-score: z = (X-µ)/α. Deze score heeft twee toepassingen:

  • Geeft de locatie van de originele score binnen de populatie verdeling (originele score = raw score = ruwe score)

  • Je kunt twee observaties met elkaar vergelijken.

Als je een schaalscore hebt is het meetniveau interval. Een z-score geeft een relatieve locatie van een observatie binnen de verdeling. Het teken (the sign) van de z-score geeft aan of de waarde boven (+) of onder (–) het gemiddelde ligt. De waarde van de z-score geeft aan hoeveel standaardafwijkingen hij heeft.

Voorbeeld: ‘Welk percentage van de studenten zal hoger dan 25 scoren?’ Eerst reken je de z-score uit en dan kan je in de tabel gaan kijken. Omdat het ‘hoger dan 25’ is vindt je het antwoord in kolom C.

Voorbeeld: Bij een percentielscore gaat het andersom. ‘Wat is het 28ste percentiel (28% of minder) van de UML-scores?’. Eerst ga je de z-score zoeken. Daarna moet je gaan terugrekenen: De X-score vinden: X = µ + zα

Steekproevenverdeling

Wanneer je een steekproef neemt dan is bij verschillende steekproeven uit dezelfde populatie het steekproefgemiddelde anders. Dus de waarde van de statistiek die we uitrekenen uit de steekproef is bijna zeker niet gelijk aan de parameter in de populatie. Het verschil tussen de waarde van de statistiek en de waarde van de parameter is een schattingsfout: sampling error. Het feit dat steekproefgemiddelden variëren maakt het steekproefgemiddelde variabel. We kunnen het steekproefgemiddelde beschrijven aan de hand van een (frequentie) verdeling.

Belangrijk om te weten:

  • Het gemiddelde van de steekproevenverdeling van M ligt precies bij het populatiegemiddelde.

  • De vorm van de steekproevenverdeling van M lijkt er op die van de normaalverdeling.

  • Hoe groter het steekproefgemiddelde is, hoe kleiner de standaardafwijking is.

Central limit theorem

Deze 3 belangrijke regels kan je samenvoegen binnen één van de belangrijkste resultaten van de statistiek: Central Limit Theorem (CLT) of centrale limiet theorie. Stel je hebt een populatie met een gemiddelde en standaardafwijking, het maakt niet uit wat je meet. Uit die populatie trekken we een steekproef van n mensen. Wat weten we dan over het steekproefgemiddelde? Hoe groter n, hoe dichter de steekproevenverdeling van M bij de normaalverdeling zal liggen. Wanneer een verdeling niet normaal verdeeld is, dan is de verdeling van M ongeveer normaal, zolang n groter dan 30 is. Dus als hij maar groter dan 30 is, dat is het belangrijke punt. Dus bij een normaalverdeling van:

  • Het gemiddelde: µM = µ populatie

  • De standaardafwijking: αM = αpopulatie / √N

De hoeveelheid van αM heet de standaardfout (standard error) want het is de standaardafwijking van de steekproevenverdeling. Waarom willen we dit weten? We moeten van beschrijvende statistiek naar verklarende statistiek.

College: Hypothese toetsen

Behandeld wordt hoofdstuk 8 uit het statistiekboek van Gravetter.

Bij statistiek maak je keuzes en kies je voor de optie die het meest waarschijnlijk is. De keuzes worden gemaakt tussen twee tegenstrijdige stellingen die iets zeggen over de gehele populatie (parameter). De eerste stelling is H0, de nulhypothese en de tweede stelling is H1, de alternatieve hypothese. Bij H1 is er sprake van een verandering/verschil/relatie/effect. Je moet tussen deze hypothesen gaan kiezen: ‘wel/ niet verwerpen van nulhypothese’.

Er kunnen fouten ontstaan:

  1. Je verwerpt H0 maar eigenlijk is H0 waar. Dit noem je een Type 1 error.

  2. Je verwerpt H0 niet terwijl H0 eigenlijk niet waar is, dus verworpen zou moeten worden, noem je Type 2 error.

Een Type 1 fout is eigenlijk ernstiger om te maken omdat je iets verwerpt waar wel sprake van is. Je wilt dus voorkomen dat deze fout gemaakt wordt. De kans op Type 1 fout wordt aangeduid met Griekse letter α, het significantieniveau. Om de kans op Type 1 error zo klein mogelijk te maken, laat je α erg laag hebben.

De kans op Type 2 fout wordt aangeduid met β.

Bij de nulhypothese zullen we over het algemeen ‘=’ gebruiken. Bij alternatieve hypothese heb je ≠ (tweezijdige toets), > of < (eenzijdige toets).

Belangrijk: Hypothesen gaan altijd over de populatie.

Stappenplan om hypothesen te toetsen

Wanneer je een hypothese toetst neem je altijd aan dat H0 waar is, daarna probeer je aan te tonen dat die aanname niet waarschijnlijk is. We proberen dus de nulhypothese dus te falsifiëren. Het is een ondersteuning van de alternatieve hypothese.

  • Stap 1: Hypotheses bepalen en significantieniveau kiezen. De keuze van het significantieniveau is een keuze van de onderzoeker.

  • Stap 2: Kritieke waarden bepalen. De kritieke waarden worden bepaald aan de hand van de steekproevenverdeling die gebaseerd is op de aanname dat de nulhypothese waar is. Het gemiddelde van de steekproevenverdeling is hetzelfde als het gemiddelde van de populatie. Daarnaast reken je de standaardfout uit. De waarden die niet vaak voorkomen vallen in het kritieke gebied dus het zijn onwaarschijnlijke waarden. De kritieke waarden worden bepaald door α. Als je α=0.10 dan heb je aan beide kanten bij een tweezijdige toets 0.05 zitten. Wanneer je 0.05 bij Kolom C opzoekt, dan vindt je daarbij een z-score van 1.645. Bij een grotere waarde van α wordt het kritieke gebied groter dus bij minder bewijs kan je H0 al verwerpen. Bij een eenzijdige toets zullen de extreme waarden aan 1 kant liggen. De extreme waarden zijn waarden die tot gevolg hebben dat we H0 verwerpen. De α hoeft je bij een eenzijdige toets niet door twee te delen want extreme waarden zitten maar aan 1 kant.

  • Stap 3: H0 aannemen en de z-score uitrekenen. Om M met µ te vergelijken gebruiken we een toetsingsgrootheid. Deze toetsingsgrootheid is de z-score.

  • Stap 4: Beslissing nemen over H0. Wanneer je nu een z-score van groter dan 1.645 vindt, dan valt dat binnen het kritieke gebied dus zal je H0 verwerpen Wanneer de z-score tussen -1.645 en 1.645 ligt dan verwerp je H0 niet.

Overschrijdingskans

Keuzes maken bij een hypothesetoets kan ook zonder kritieke waarde. Je maakt gebruik van de staartoppervlakte (tail probability). Dit heet de overschrijdingskans of de p-waarde.

P-waarde: meet de kans dat we een waarde observeren ‘net zo extreem of nog extremer dan de waarde die wij geobserveerd hebben’.

Bij een kleine p-waarde is de geobserveerde waarde heel klein, dus is het onwaarschijnlijk dat H0 waar is, dus verwerp je H0. Bij een grote p-waarde is de geobserveerde waarde een veel voorkomende waarde dus verwerp je H0 niet. Nu is de vraag, wat is groot en wat is klein? Deze grens ligt bij α. Universele beslissingsregel: We verwerpen H0 als de p-waarde α. Wanneer je H0 daarom verwerpt dan is het resultaat statistisch significant.

Je kunt de p-waarde uitrekenen door middel van de z-score. Bij een tweezijdige toets dan reken je 1 kant uit en vermenigvuldig je dat met 2 omdat je beide kanten moet weten. Wanneer de p-waarde dan kleiner is dan α dan verwerp je H0. Wanneer je de p-waarde gebruikt hoef je bij stap 2 de kritieke waarde niet uit te rekenen.

Effectgrootte

Cohen’s d = verschil in gemiddelden / standaardafwijking dus M-µ / 2

Richtlijnen zijn dat wanneer:

  • D= 0.2 een klein effect

  • D= 0.5 een medium effect

  • D= 0.8 een groot effect

Type 2 error

De onderzoeker beslist de α bij Type 1 error. De waarde van α hangt af van hoe ernstig het maken van een type 1 fout is.

De type 2 error wordt uitgebreid behandeld in het boek, maar de berekeningen slaan we allemaal over.

Bij Type 2 error is er sprake van β.

Β = de kans dat we H0 niet verwerpen terwijl H0 eigenlijk waar is. Dus je draait het om als bij Type 1 error want daar gaat het om de kans dat je H0 juist wel verwerpt.

De kans dat we H0 verwerpen als H1 waar is heet de Power.

Power is 1 – β.

Omdat je β zo klein mogelijk wilt zal de power juist hoog zijn. De power wordt meestal bepaald voordat het onderzoek gedaan wordt. Het wordt gebruikt om te kijken of een bepaald onderzoek succesvol lijkt te zijn. De power wordt beïnvloed door 4 dingen:

  • De keuze van α: Wanneer α groter wordt, wordt β kleiner dus wordt de power weer groter.

  • Het verwachtte effect (verschil tussen µ0 en µ1): Wanneer dit verschil groot is dan is het gemakkelijker om dit verschil in de steekproef terug te vinden. Dus hoe groter het verschil, hoe hoger de power.

  • De grootte van n: Wanneer je een grote steekproef hebt, hoe hoger de power is.

  • 1- of 2-zijdige toetsen:  Je hebt een specifiekere toets bij een 1-zijdige toets dus bij een 1-zijdige toets is de power hoger.

College: T-toets en steekproeven

We behandelen hoofdstuk 9: t-toets voor één steekproef en hoofdstuk 11: t-toets voor gekoppelde steekproeven uit de literatuur van Gravetter.

Stappenplan om een hypothese te toetsen

  • Stap 1: hypotheses bepalen en significantie niveau kiezen

  • Stap 2: kritieke waarden bepalen

  • Stap 3: H0 aannemen en de z-score uitrekenen. Bij de z-score heb je de standaardafwijking nodig. Omdat deze in de praktijk vaak niet beschikbaar is mag je deze vervangen met de geschatte standaardfout. De geschatte standaardfout bereken je door: sm = s / √n. De score die je dan krijgt is (M-µ) / sm. Wanneer je daar gebruik van maakt dan bereken je dus de t-score. Deze kan je dus gebruiken wanneer je de standaardafwijking niet weet, en is een vervanging voor de z-score.

  • Stap 4: beslissing nemen over H0.

Het stappenplan voor een t-score is hetzelfde als voor de z-score, maar nu gebruik je de t-verdeling. De t-verdeling lijkt heel erg op de standaardnormaalverdeling. Bij de t-verdeling heb je iets meer spreiding dan bij de normaalverdeling, verder is hij bijna hetzelfde.

De t-verdeling wordt niet door het gemiddelde en de standaardafwijking gedefinieerd maar door de vrijheidsgraden (degrees of freedom = df). Hoe hoger df, hoe meer de t-verdeling op de standaard normaalverdeling lijkt. De degrees of freedom is n-1.

In de t-verdeling zoek je eerst de df op. Daarnaast maak je een keuze of je een eenzijdige of tweezijdige toets hebt. Daarna kijk je welke α je gebruikt en dan kan je de juiste t-score opzoeken. Helemaal onderin staan de kritieke waarden van een z-toets.

Nu wederom het stappenplan. Nu zouden we alle stappen kunnen doorlopen:

  • Stap 1: hypotheses bepalen en significantie niveau kiezen: dat konden we al.

  • Stap 2: kritieke waarden bepalen: Hiervoor hebben we 3 dingen nodig: de α, de vrijheidsgraden, dus df = n-1 en daarnaast: toetsen we eenzijdig of tweezijdig? Vervolgens kan je in de tabel kijken welke t-score er bij hoort. Wanneer je df er niet bij staat dan rond je af naar beneden. Wanneer je bijvoorbeeld df = 74 hebt, ga je naar df = 60.

  • Stap 3: H0 aannemen en de z-score uitrekenen. Hierbij gebruik je dus s in plaats van de standaardafwijking, omdat je die niet hebt.

  • Stap 4: Beslissing nemen over H0. Je kijkt of de t-score die je hebt uitgerekend (bij stap 3) valt binnen de krtitieke waarden die je hebt uitgerekend (bij stap 2). Wanneer de t-score in het kritieke gebied valt, dan verwerp je H0.

Ook bij Cohen’s d mag je de geschatte waarde uitrekenen. Dit doe je wederom door de standaardafwijking te vervangen door s. De Cohen’s d richtlijnen blijven het zelfde.

Effectgrootte: r²

Dit is naast de Cohen’s d een effectgrootte. Je kunt niet direct zien wat deze r kwadraat meet, dat komt in MTS 2 aan de orde. De simpele formule is:

r² = t² / (t² + df). Hierbij heb je andere richtlijnen. Namelijk: r² = 0.01 is klein effect, r² = 0.09 is medium effect, r² = 0.25 is een groot effect.

Vervolg stappenplan

  • Stap 5: het toetsingsproces.

Er is nog een stap 5, dus het stappenplan is nog niet klaar. De vraag is: Wat weten we over de p-waarde? Wanneer je H0 verwerpt is de p-waarde kleiner dan α. Exacte p-waarden krijg je met SPSS, niet met de hand. Wanneer je gaat rapporteren dan rapporteer je de M en s, daarnaast zeg je of het verschil significant was, je rapporteert t, je zegt of de p-waarde kleiner of groter is dan α en tot slot zet je de effectgrootte (d) erbij.

Bij SPSS krijg je twee tabellen, 1 met one-sample statistics, de andere met one-sample test. De test value is de waarde uit de nulhypothese. Het getal dat staat bij sig. is de p-waarde. Met de gegevens van SPSS kan je stap 5, het rapporteren, uitvoeren.

Schatten

Bij hypothese toetsen kan je in plaats van toetsen ook gaan schatten. Bij toetsen vraag je je af of er een verschil is. Bij schatten vraag je je af hoe groot het verschil is. Zo verzamel je algemene informatie over een bepaalde populatie. Vaak worden ze gerapporteerd als aanvullende informatie op de getoetste hypothese. Je hebt twee manieren van schatten:

  • Puntschatting: je hebt één waarde

  • Intervalschatting: Je hebt een interval van waarden. Aan de hand van de verzamelde data rekenen wij twee grenswaarden uit. Deze rekenen we op zo’n manier uit dat we er vrij zeker van zijn dat de populatie prameter tussen deze grenzen ligt. Deze twee grenswaarden moet je gaan bepalen. De zekerheid die je aan zo’n schatting koppelt noem je het betrouwbaarheidsniveau, die je aangeeft met een percentage. De meest gebruikten zijn 80, 90 of 95 procent. Het betrouwbaarheidsniveau is 1 – α. De α geeft de kans dat je Type 1 fout maakt, de betrouwbaarheidsniveau geeft het tegenovergestelde, dus dat het goed kan gaan.

Wanneer je de intervalschatting en het betrouwbaarheidsniveau combineert heb je een betrouwbaarheidsinterval (BI). Hoe reken je de grenzen van de BI uit? Je rekent M uit. De ondergrens is dan M – 2 standaardfouten. De bovengrens is M + 2 standaardfouten. Tussen deze ondergrens en bovengrens zal de µ liggen. Dus wanneer je voor 95% kiest zal µ 95% van de keren tussen de grenzen liggen, dus heel soms valt µ buiten deze grenzen.

Bij een andere betrouwbaarheidsniveau passen we de alfa aan en verandert de kritieke waarde. Dan moeten we de t-verdeling gebruiken om te bepalen hoeveel standaardfouten we boven en onder het gemiddelde gaan. Hiervoor gebruiken we de tweezijdige kritieke waarde met α. De formule voor BI is: M± t x s. Wanneer je dit voor + en – uitrekent dan heb je de grenzen.

Het doel van schatten is om nauwkeurig te schatten. Een nauwkeurige schatting betekent een smal BI. Wanneer je BN verandert van 95 naar 90 dan wordt BI smaller. Wanneer n zou stijgen dan wordt BI smaller. Dit komt omdat je bij n meer informatie hebt dus nauwkeuriger.

T-toetsen: vergelijking tussen 2 groepen

Er bestaan ook t-toetsen waarbij je een vergelijking doet tussen 2 groepen. Dit komt door:

  • Herhaalde metingen

  • Matched-subjects ontwerpen

  • Onafhankelijke steekproeven

Bij herhaalde metingen en matched-subjects doe je gekoppelde metingen, een bepaald soort t-toets. De onafhankelijke steekproeven doen we de volgende keer. De gekoppelde metingen zijn studies met afhankelijke steekproeven kunnen die ook gebruik maken van een t-toets. Het idee blijkt hetzelfde te zijn als een t-toets voor één gemiddelde. Bij gekoppelde metingen vormen de data paren. Je gaat kijken naar de verschillen tussen voor én na. Dus wordt de toets uitgevoerd op verschilscores: difference score = D.

Voor deze verschilscore gebruik je precies hetzelfde stappenplan als bij hoofdstuk 9.

College: T-toets voor twee onafhankelijke steekproeven

Vandaag wordt hoofdstuk 10 behandeld, het gaat over een t-toets voor twee onafhankelijke steekproeven. Dus: Hoe kan je twee groepen met elkaar vergelijken?

Voorbeeld voor vandaag

De UU wordt vergeleken met de HU: Zijn UU studenten zelfverzekerder dan HU studenten?

De data die bekent is, is:

UU: n= 75, M = 21.40, s= 4.87

HU: n= 63, M=19.93, s= 5.11

Stappenplan bij t-toets voor onafhankelijke groepen

Deze t-toets is een uitbreiding van de t-toets voor één groep maar de basis blijft dat je stekproef resultaten met elkaar vergelijkt door H0. Hierbij gebruik je hetzelfde stappenplan:

  • Stap 1: Hypothese opstellen. Het is belangrijk dat je het verschil tussen UU en HU laat zien dus gebruik je µ1 en µ2. De nulhypothese is altijd een stelling van gelijkheid dus H0: µ1 = µ2. De alternatieve hypothese is dan H1: µ1 > µ2. Een andere formulering is H0: µ1 - µ2 = 0 en H1: µ1 - µ2 > 0. Significantieniveau = 0.10

  • Stap 2: Om de hypothesen te gaan toetsen heb je de vrijheidsgraden nodig: df1 + df2 = (n1-1) + (n2-1). Wanneer je df hebt kan je samen met het significantieniveau en het feit dat het een eenzijdige toets is de kritieke waarden bepalen. (Bij het voorbeeld komt daar 1.289 uit.)

  • Stap 3: t-score uitrekenen.

Bij 1 gemiddelde (hoofdstuk 9): t= (M-µ)/sm

Bij gekoppelde metingen (hoofdstuk 11): t= (Md - µd) / smd

Bij twee onafhankelijke groepen (hoofdstuk 10): t= (m1 – M2) / (µ1 - µ2)/ s(m1-m2)

Belangrijk is: De steekproeven moeten aselect en onafhankelijk zijn. De populatie moet normaal verdeeld zijn en een gelijke spreiding hebben. Dus de gemiddelden van de populaties hoeven niet hetzelfde te zijn maar de spreiding wel. Wanneer je deze voorwaarden hebt heeft de toets heel veel power.

Bij het uitrekenen van de t-score is het lastig om de steekproeffout (sm1-m2) uit te rekenen. Je mag de varianties van m1 en em2 bij elkaar optellen, dat mag niet bij de steekproeffout. Dus de formule wordt: s(m1-m2) = √s²1/n1 + s²2/n2). Voor deze formule reken je eerst de variantie uit. Dat is s² = SS / df. Hier is SS = SS1 + SS2 en df = df1 + df2. Dus de variantie is (SS1+SS2)/ (df1 + df2). Dus stap 3 bestaat uit: s² uitrekenen > sm1-m2 uitrekenen > invullen bij t formule.

  • Stap 4: Beslissing nemen of je H0 wel of niet verwerpt.

Feitjes bij SPSS

  • Als de p-waarde groter is dan α, mag je H0 niet verwerpen.

  • Als de p-waarde kleiner is dan α, mag je H0 wel verwerpen.

  • Bij de SPSS output staat de p-waarde onder Sig.

  • Bij een eenzijdige toets dan deel je de p waarde door 2.

Effectgrootte

Geschatte waarde Cohen’s d = (M1-M2) / √s²p.

Verklaarde variantie r² = t² / (t² + df). Maar denk aan df = df1 + df2

Om deze waarden uit te rekenen kan je gebruik maken van de gegevens die je eerder hebt uitgerekend.

Vervolgens kan je met alle voorgaande resultaten een rapportage doen. Dit gaat volgens de strikte lijnen van de APA stijl. Bij dit voorbeeld wordt dat: “De Universiteit Utrecht studenten (M = 21.40, s = 4.87) scoorden gemiddeld significant hoger op de SES dan de Hogeschool Utrecht studenten (M = 19.93, s = 5.11), t(136) = 1.73, p = .043, d = 0.29.”

Deze rapportage moet altijd zo dus op het tentamen moet je de juiste manier kunnen herkennen.

Betrouwbaarheidsinterval

Je gebruikt een betrouwbaarheidsinterval om de waarde van een bepaalde parameter te schatten. De formule hiervoor is: (M1 – M2) ± t x sm1-m2

Wanneer de gehele betrouwbaarheidsinterval boven nul ligt kan je zeggen dat je de nulhypothese verwerpt. Het moet dan wel per se een tweezijdige toets zijn. Wanneer het een eenzijdige toets is dan gebruik je voor BN: 100 – 2x significantieniveau. Bij een tweezijdige toets is BN: 100 – significantieniveau, dat was BN= 1-α.

Wanneer we een BI willen uitrekenen om puur het verschil te schatten gebruiken we een BN = 90%.

Wanneer we een BI willen gebruiken om een beslissing te nemen over de nulhypothese gebruiken we een BN= 80%.

Schatten? BN = 1- α

Toetsen? Tweezijdig 1- α en eenzijdig 1- 2α

BI gebruik je als ‘hoe groot is het verschil?’ de vraag is. Je gaat toetsen als je wilt weten of er een verschil is.

Beslissingsregels

Je mag H0 verwerpen als:

  • T in het kritieke gebied ligt.

  • De p-waarde is kleiner of gelijk aan α.

  • De H0 waarde niet in BI ligt.

Het beslissingsschema is erg handig. Deze kan je terug vinden op Blackboard.

Welke analysetechniek?

Er staan voorbeelden op Blackboard over welke analysetechniek je bij bepaalde gevallen kunt gebruiken. De vragen hierbij zijn: Welke t-toets? BI of toets gebruiken? 1- of 2-zijdig toetsen? Wat zijn de hypothesen?

Verhaaltje 1

Om buitenlandse kinderen Nederlands te leren zijn twee methoden ontwikkeld. Een groep kinderen gebruikt een mondelinge methode. Een andere groep kinderen gebruikt een schriftelijke methode. Verschillen de methodes significant van elkaar?

Toetsen > onafhankelijke toets > 2-zijdig > H0: µ1 - µ2 = 0 en H1: µ1 - µ2 ≠0

Verhaaltje 2

Bestuurders die zijn veroordeeld vanwege een snelheidsovertreding, moeten een verplichte cursus volgen. Met een apparaat in hun auto werd voor de cursus de gemiddelde snelheid gemeten. Is de gemiddelde snelheid na de cursus lager?

Toetsen > gekoppelde toets > 1-zijdig > H0: µ=0 en H1: µ<0

Verhaaltje 3

Van een bepaalde multiple choice test is bekend dat men gemiddeld 40 vragen goed heeft. Tien mensen kijken eerst naar reclamespotjes en vullen vervolgens de vragenlijst in. Wat is het gemiddeld aantal vragen goed in de populatie van mensen die naar de reclamespotjes kijken?

BI gebruiken > gaat over één gemiddelde.

Verhaaltje 4

Mensen die stoppen met roken, klagen vaak over gewichtstoename. Van 50 mensen die stoppen met roken is het gewicht gemeten terwijl ze rookten. Nadat ze gestopt waren met roken, is het gewicht opnieuw gemeten. Is er sprake van gewichtstoename?

Toetsen > gekoppelde toets > 1-zijdig > H0: µ=0 en H1: µ > 0

Bron

Aantekeningen gebaseerd op de hoorcolleges van het vak MTS 1 aan de Universiteit Utrecht over het onderwerp Statistiek

Image

Access: 
Public

Image

Join WorldSupporter!
Search a summary

Image

 

 

Contributions: posts

Help other WorldSupporters with additions, improvements and tips

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.

Image

Spotlight: topics

Image

Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams

How and why use WorldSupporter.org for your summaries and study assistance?

  • For free use of many of the summaries and study aids provided or collected by your fellow students.
  • For free use of many of the lecture and study group notes, exam questions and practice questions.
  • For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
  • For compiling your own materials and contributions with relevant study help
  • For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, notes and practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Use the summaries home pages for your study or field of study
  2. Use the check and search pages for summaries and study aids by field of study, subject or faculty
  3. Use and follow your (study) organization
    • by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
    • this option is only available through partner organizations
  4. Check or follow authors or other WorldSupporters
  5. Use the menu above each page to go to the main theme pages for summaries
    • Theme pages can be found for international studies as well as Dutch studies

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study for summaries and study assistance

Main summaries home pages:

Main study fields:

Main study fields NL:

Follow the author: Psychology Supporter
Work for WorldSupporter

Image

JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Statistics
2573