TentamenTests bij de meestvoorkomende statistiekonderwerpen tijdens je studie - Bundel
- 3847 reads
Welke waarde in een regressiefunctie is de constante waarde?
y
α
β
ε
Wanneer is een correlatie sterker?
Als de waarde groter is
Als de waarde kleiner is
Als de waarde negatief is
Als de waarde positief is
Wat betekent R2 binnen de regressieanalyse? Wat is R2?
Waarom kun je beter niet extrapoleren met een regressieanalyse?
Wat houdt een positieve relatie tussen twee variabelen in?
Wat geeft de covariantie aan?
Wat is Pearson correlatie coëfficiënt?
Wat is een bivariate correlatie?
Waarom is er bij correlatie niet automatisch sprake van causaliteit?
Wat is het coëfficiënt van determinatie?
Wat is Spearman correlatie coëfficiënt?
Wanneer wordt de Kendall’s tau gebruikt?
Wanneer gebruik je de biseriële correlatie coëfficiënt?
Wat is de partiële correlatie?
Wat is het verschil tussen semi-partiële correlatie en partiële correlatie?
Wat gebruik je om correlaties te vergelijken?
Wat moet je doen om de effectgrootte te berekenen?
Wat wordt precies geanalyseerd wanneer er een regressieanalyse uitgevoerd wordt?
Wat wordt bedoeld met residuen?
Heeft een goed model een hoge F-ratio of juist een lage?
Wat betekent een regressiecoëfficiënt van 0?
Wat is een probleem bij de forwardmethode van invoer?
Wat is een probleem bij de stapsgewijze invoer?
Wat wordt bedoeld met een uitschieter?
Wat is het effect van een uitschieter op een lineaire regressielijn?
Waaraan moeten de meetniveaus van een regressieanalyse voldoen?
Wat is multicollineariteit? En welke drie problemen ontstaan er bij vergrote multicollineariteit?
Wat is homoscedasticiteit?
Wat test je met de Durbin-Watson test?
Wat is crossvalidatie? En door middel van welke twee methodes kan dit?
Wat geeft het betrouwbaarheidsinterval aan?
Wat is verklaarde variantie?
Wat zijn dummy variabelen?
Wat doet een mediërende variabele?
Wat is een modererend effect?
Welke drie eigenschappen van de relatie tussen X en Y worden er gemeten met een correlatie?
Variabele x en y hebben een r² van 0.15. Betekent dit een grote, een kleine of een gemiddelde correlatie?
Wanneer wordt de phi-coëfficiënt gebruikt?
Een bedrijfspsycholoog is voor 100 werknemers nagegaan wat hun bloeddruk (X) is en hoeveel winst (Y) hun bedrijf maakt. Voor deze gegevens berekent hij het gemiddelde, de variantie en de covariantie. Het gemiddelde van x = 80 , het gemiddelde van y = 60, sX² = 25, SY² = 36 en de Covariantie = -15 Welke waarde heeft de correlatie?
Een vervoerspsycholoog heeft vastgesteld dat tussen de rijsnelheid (X in km/u) en het aantal ongelukken (Y per jaar) die autobestuurders maken het volgende verband bestaat: y = 1 + 0.05*x Je weet dat meneer de Vries gewoonlijk met een snelheid van 160 km per uur rijdt. Hoeveel ongelukken zal hij per jaar maken?
Wat wil het zeggen als de helling van een gestandaardiseerde regressievergelijking 0.6 is?
Voor de volgende drie paren waarnemingen (x, y) bepaal je de Spearman rangcorrelatiecoefficient: (1, 1), (2, 2) en (3, 3). Wat gebeurt er met deze correlatiecoefficient als je het laatste paar verandert in (3, 25)?
Een onderzoeker berekent de Spearman rangcorrelatiecoefficient tussen lengte en confectiemaat. Lengten worden gemeten in cm, de confectiematen zijn S, M, L, XL, XXL, XXXL. De onderzoeker codeert deze maten als 1, 2, 3, 4, 5, 8. Is deze methode correct?
De (Pearson's) correlatiecoefficient voor twee variabelen x en y is 0.7. Wat is het percentage variabiliteit in y dat door variabele x wordt verklaard?
Bezie de volgende twee stellingen met betrekking tot de Pearson r:
Om te kunnen concluderen dat er een oorzaak-gevolg relatie is tussen de variabelen X en Y, moet de Pearson r tussen X en Y positief zijn.
Voor het interpreteren van een Pearson r tussen twee variabelen is een lineaire samenhang wenselijk, maar niet noodzakelijk
Als we Pearson r van .80 vinden tussen twee numerieke variabelen, terwijl inspectie van de bijbehorende puntenwolk laat zien dat het verband duidelijk kromlijnig is, dan geldt dat:
ondanks de gevonden correlatie, er eigenlijk geen verband is
er vermoedelijk wel een verband is, maar dat Pearson r niet het juiste middel is om te gebruiken
er vermoedelijk uitbijters zijn
de twee variabelen vermoedelijk niet normaal verdeeld zijn
Bij een positieve correlatie:
Neemt de ene variabele toe als de ander afneemt
Neemt de ene variabele af als de ander afneemt
Neemt de ene variabele toe als de andere toeneemt
Zowel antwoord b als c is correct
Om een lineaire relatie tussen twee variabelen op interval-niveau, te meten, gebruikt men de:
Pearson correlatie
Spearman correlatie
Chi-square relatie
Alle drie bovenstaande antwoorden zijn correct
Er wordt een Pearson correlatie berekend voor een sample met 30 participanten, met ∑XY = 120, ∑X = 16 en ∑Y = 30, de waarde van SP is:
16
104
16
136
Bereken de Pearson correlatie bij SP = - 20, SSx = 12 en SSy = 48, de waarde van r is:
0,25
-0,25
-0,83
0,83
Als er tussen de hoeveelheid geconsumeerde verzadigde vetten in gram en aantal gezondheidsklachten een correlatie van +1,00 wordt gevonden, kan hieruit geconcludeerd worden dat:
Verzadigde vetten slecht zijn voor de gezondheid
Verzadigde vetten goed zijn voor de gezondheid
Mensen die meer verzadigde vetten eten meer gezondheidsklachten hebben dan mensen die weinig verzadigde vetten eten
Mensen die meer verzadigde vetten eten minder vaak gezondheidsklachten hebben dan mensen die weinig verzadigde vetten eten
Bij een correlatie van 0,50 tussen het aantal gestudeerde uren en het tentamencijfer bij studenten, wordt:
50 procent van de variantie van het tentamencijfer voorspeld door het aantal gestudeerde uren
0,5 procent van de variantie van het tentamencijfer voorspeld door het aantal gestudeerde uren
25 procent van de variantie van het tentamencijfer voorspeld door het aantal gestudeerde uren
5 procent van de variantie van het tentamencijfer voorspeld door het aantal gestudeerde uren
Een voetballer is in 2011 topscoorder van het jaar, in 2012 komt hij echter niet eens in de top 10 voor, wat is, statistisch gezien, de beste verklaring hiervoor:
De voetballer kon de druk niet aan
De voetballer raakte geblesseerd
Er was sprake van correlatie
Er was sprake van regressie naar het gemiddelde
Bij een tweezijdige Pearson correlatie, is de nulhypothese:
Er is een positieve correlatie binnen de populatie
Er is geen positieve correlatie binnen de populatie
Er is een correlatie binnen de populatie
Er is geen correlatie binnen de populatie
De Spearman correlatie gebruikt men wanneer:
Men twee variabelen meet op ordinaal niveau
Men twee interval/ratio variabelen indeelt in categorieën
Er een niet-lineaire relatie is tussen twee variabelen
Alle bovenstaande antwoorden zijn correct
Wanneer de scores: 1, 3, 3 en 5 worden ingedeeld op rangorde, krijgen zij de volgende rangnummers:
1, 2, 3 en 4
1, 2.5, 2.5 en 3
1, 3, 3 en 5
1, 2.5, 2.5 en 4
Een onderzoeker kijkt naar het verband tussen aantal minuten wachttijd en aantal m&m’s die gegeten worden. De resultaten staan in de volgende tabel:
Min. Wachten Aantal m&m’s
2 9
1 10
3 6
0 8
4 2
Bereken de Pearson correlatie.
Wat is het effect van uitschieters op de waarde van een correlatie?
De correlatie wordt sterker.
De correlatie wordt zwakker.
De correlatie wordt negatief.
De correlatie blijft hetzelfde.
Wanneer wordt de Spearman-correlatie gebruikt?
Bij nominale data.
Bij ordinale data.
Bij numerieke data.
Bij een ratio.
Hoe groot moet de correlatie zijn bij een steekproef van 10 personen om statistisch significant te zijn bij een alfaniveau van .05?
0.521
0.576
0.632
0.488
Wat voor toets moet er gedaan worden als er gekeken wordt naar het aantal uren dat kinderen op internet besteden in verschillende leeftijdscategorieën?
Spearman-correlatie
Pearson-correlatie
ANOVA
Durbin-Watson
Er is een correlatie gevonden van r = 0.40 tussen IQ-score en motivatie bij een steekproef van 20 studenten. Wat is de verklaarde variantie?
In de volgende tabel mist een waarde, welke waarde resulteert in:
a. ...geen hoofdeffect voor factor A?
b. ...geen interactie-effect tussen factor A en B?
B1 B2 B3
A1 M = 10 M = 20 M = 40
A2 M = 15 M = 25
B
A
R-kwadraat ofwel de determinatiecoëfficiënt. Dit is de meting van hoe goed de kleinste-kwadratenlijn ŷ = a + b(x) de y voorspelt in vergelijking tot de voorspelling van ȳ. De r2 geeft aan hoeveel procent de variantie van een conditionele distributie groter of kleiner is dan de variantie van een marginale distributie. In het kort, r2 meet hoe goed x de y voorspelt.
Het is de hoeveelheid variantie die wordt verklaard door het model in verhouding tot de totale variantie. Het representeert het percentage variantie in de uitkomst dat kan worden verklaard door het model.
Buiten het bereik van de geobserveerde data kan de vorm van de lijn anders lopen dan lineair, dus hier kunnen geen uitspraken over gedaan worden met extrapoleren.
Een positieve relatie houdt in dat een toename in de ene variabele samenhangt met een toename in de andere variabele.
De covariantie geeft aan of variabelen samenhangen en of deze samenhang positief of negatief is.
Pearson correlatie coëfficiënt is de gestandaardiseerde covariantie, die ook wordt gebruikt voor het meten van effectgrootte.
Een bivariate correlatie is een correlatie tussen twee variabelen.
Er is bij correlatie niet automatisch sprake van causaliteit omdat andere variabelen ook invloed hebben op de correlatie, en de correlatie niets zegt over welke variabele de verandering bij de andere variabele teweegbrengt.
Het coëfficiënt van determinatie is een maat voor hoeveel variantie de gecodeerde variabelen delen.
Spearman correlatie coëfficiënt is de niet-parametrische variant van de Pearson correlatie.
Kendall’s tau gebruik je wanneer je een kleine steekproef hebt met veel gelijke scores.
De biseriële correlatie coëfficiënt gebruik je als de variabele continu dichotoom is.
Partiële correlatie is de relatie tussen twee variabelen waarin de effecten van een andere variabele constant worden gehouden.
Het verschil tussen semi-partiële en partiële correlatie is dat bij semi-partiële correlatie wordt gecontroleerd voor het effect dat een derde variabele heeft op één van de variabelen in de correlatie, en niet op beide variabelen zoals bij de partiële correlatie.
Om correlaties te vergelijken worden de z-scores en t-toetsen.
Correlaties zijn effectgroottes, dus om de effectgrootte te berekenen heb je geen verdere stappen nodig.
Je wilt een uitkomstvariabele Y voorspellen door middel van één voorspellende predictor (simpele regressie) of door meerdere predictoren (multiple regressie).
Een residu is de verticale afstand tussen de werkelijke data en de regressielijn, deze verschillen kunnen zowel positief als negatief zijn.
Een hoge F-ratio want dit betekend dat de verbetering in voorspelling groot is (MSm) en het verschil tussen het model en de geobserveerde data klein (MSr).
Dit betekent dat een verandering in de predictor variabele resulteert in geen verandering in de uitkomst variabele.
Er kan sprake zijn van supressor effecten dit houdt in dat een predictor significant is maar alleen als een andere predictor constant wordt gehouden. Hierdoor heb je bij de forward methode een grotere kans op een type II fout (een predictor elimineren terwijl deze wel significant was).
Er kan kans zijn op overfitting (teveel variabelen met maar kleine variantie) of underfitting (het niet toevoegen van belangrijke variabelen).
Een uitschieter wordt ook wel een outlyer genoemd. Een uitschieter is een meting die substantieel verschilt van de gemiddelde trend van de data.
De regressie wordt onevenredig beïnvloed door de uitschieter, waardoor de andere waarden grotere residuen krijgen.
De afhankelijke variabele moet van tenminste ratio of interval meetniveau zijn en de onafhankelijke variabele van ratio of interval of omgecodeerd tot een dummy.
Dit ontstaat wanneer er een sterke correlatie is tussen twee of meer predictoren. De problemen die ontstaan zijn:1) onbetrouwbare b’s, 2) limiteert de grootte van r en 3) het wordt moeilijker om onderscheidt te maken in belangrijkheid tussen predictoren.
Hierbij moet op elk niveau van de predictor variabele de variantie van de residuen constant zijn, als deze variantie ongelijk is, is er sprake van heteroscedasticiteit.
Hiermee test je of er sprake is van onafhankelijke errors, vuistregel is dat de waarde tussen de 1 en 3 moet liggen.
Als je niet zeker weet hoe accuraat de steekproef de populatie beschrijft kan worden gekeken hoe goed het model de uitkomst in andere steekproeven voorspelt. Dit kan door middel van de adjusted R2 en data-splitting.
Het betrouwbaarheidsinterval geeft het interval aan waarbinnen de werkelijke waarde van b zich bevind in de populatie.
Dat deel van de variantie wat wordt bepaald en veroorzaakt door de onafhankelijke variabelen en niet door externe factoren.
Dit is een variabele die van nominaal meetniveau is met meer dan 2 categorieën die is omgezet naar een dichotoom item met alleen 0 of 1 als score. Een dummy variabele is bijvoorbeeld: is de CEO betrokken? Ja of nee? Het krijgt de score 1 wanneer de CEO betrokken is en een 0 wanneer de CEO niet betrokken is.
Het effect van de predictor op de afhankelijke variabele verloopt via een derde variabele dit kan gedeeltelijk of geheel zijn.
Het effect van de predictor op de afhankelijke variabele hangt dan af van nog een derde variabele.
De richting van een relatie
De vorm van een relatie
De mate van een relatie
Dit is een gemiddelde correlatie.
Wanneer twee variabelen beide dichotoom zijn
-0.50
9
Dat houdt in dat de voorspelde waarde voor elke toename van 1 punt in X, met 0.6 toeneemt.
De Spearman rangcorrelatiecoefficient verandert niet, omdat de verandering van y = 3 in 25 geen invloed heeft op de verschillen in de rangnummers waarmee de correlatiecoefficient berekend wordt.
De methode is correct. De confectiematen zijn te ordenen volgens de rangschikking van klein naar groot van de bijbehorende (klassen van) lengten. De Spearman rangcorrelatiecoefficient kan dan berekend worden door de confectiematen zelf numeriek te coderen van klein naar groot. Met welke speciefieke codering dit verder gebeurt is niet van belang.
49% Het percentage variabiliteit in de ene variabele dat verklaard wordt door de andere variabele is gelijk aan (kwadraat correlatiecoefficient)x100%.
Beide stellingen zijn onjuist.
B
D
A
B
C
C
C
D
D
D
D
r = -0.8
A
B
C
B
De verklaarde variantie is r2 = 0.16.
a. M = 30, b. M = 45
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
Oefen- en tentamenvragen bij de meestvoorkomende statistiekonderwerpen tijdens je studie. Deze tentamenvragen zijn een aanvulling op de JoHo Statistiek samenvatting, waarin in dezelfde volgorde als deze tentamenbundel de
...There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Main summaries home pages:
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
2411 |
Add new contribution