Experimenteel en Correlationeel Onderzoek: Samenvattingen, uittreksels, aantekeningen en oefenvragen - UL
- 3445 keer gelezen
De effectmaat Hedges' g is een effectmaat gebaseerd op...
In een onderzoek wordt bij 10 personen een dichotome variabele X en een intervalvariabele Y gemeten. De resultaten staan in de onderstaande tabel.
Persoon | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
X | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
Y | 2 | 3 | 1 | 5 | 2 | 6 | 3 | 7 | 4 | 5 |
Op basis van verzamelde gegevens wil men iemands inkomen voorspellen uit het aantal jaren dat deze onderwijs heeft gevolgd. Welke bewering is juist?
Welke uitspraak over de correlatiecoëfficiënt r is juist?
Het aantal jaren opleiding is de responsevariabele; de waarden van deze variabele worden genoteerdop de verticale as van het spreidingsdiagramEen significantietest is in het algemeen een functie van effectgrootte en aantal proefpersonen. Welkevan de onderstaande formules geeft deze relatie correct weer als het gaat over een 2 x 2 kruistabel?
Voor twee variabelen X en Y is berekend:
\[X̄ = 3.4\]
\[ȳ = 2.6\]
\[s \frac {2}{x} = 1.81\]
\[s \frac {2}{Y} = 2.13\]
\[s_{XY} = 1.43\]
Wat is de regressievergelijking (in ruwe scores) voor de voorspelling van Y uit X?
Voor een regressielijn geldt...
Een onderzoeker heeft voor een groep personen de scores vastgesteld met betrekking tot de kwantitatieve variabelen X en Y. Hier is X de verklarende variabele en Y de responsevariabele. Na berekening blijkt dat regressiecoëfficiënt b1 = -2.
Een onderzoeker heeft bij een groep personen hun lengte (in cm) en hun gewicht (in kg) gemeten. Na berekening blijkt r = 0.80 en b1 = 0.34. Om zijn bevindingen in een Engels tijdschrift te plaatsen, bepaalt hij nieuwe lengtescores met inch als meeteenheid (1 inch = 2.54 cm).Wat kun je zeggen over de nieuwe r en b1
Een onderzoekster analyseert het verband tussen opleiding van de respondent en de opleiding van zijn of haar vader. In de onderstaande SPSS tabel ontbreekt de kolom met de p-waarden van de significantietoetsen voor de twee regressiecoefficienten. Probeer met behulp van de overige informatie in de tabel de juiste conclusie te trekken.
Coefficients (a)
Model | Unstandardized Coefficients | Standardized Coefficients | t | 95% Confidence interval for B | ||
B | Std. Error | Beta | Lower Bound | Upper Bound | ||
(Constant) | 9.926 | .219 | 45.260 | 9.495 | 10.356 | |
Highest Year School Completed, Father | .322 | .019 | 0.463 | 17.050 | .285 | .359 |
(a) Dependent Variable: Highest Year of School Completed
De ANOVA-tabel voor een enkelvoudige regressie-analyse is (gedeeltelijk) hieronder gegeven.
Source | DF | SS | MS | F |
Model Error | 12.43 | |||
Total | 11 | 23.43 |
Maak de tabel af. Kan H0 verworpen worden met alfa = 0.05?
Y | X1 | X2 | |
Y | - | .7 | .6 |
X1 | - | -.4 | |
X2 | - |
Wat is juist met betrekking tot de multipele correlatiecoëfficiënt R voor de voorspelling van Y uit X1 en X2?
We vinden in een onderzoek bij 20 personen de volgende regressievergelijking: ŷ = 1.3 – 2.4x1 + 0.9x2
Gegeven is verder SEb1 = 1.631 en we toetsen b1. Het resultaat is:
Anne voert een meervoudige regressie-analyse uit om haar onderzoeksvraag te kunnen beantwoorden. Wanneer ze de plot bekijkt waarbij de voorspelde waarden op de X-as staan en de gestandaardiseerde residuen op de Y-as, ziet ze dat er sprake is van homoscedasticiteit. Wat houdt dit in?
Bezie onderstaande stellingen over het bekijken van multicollineariteit tussen predictoren in een meervoudige regressie-analyse:
Stelling I: Wanneer de Tolerance een erg kleine waarde heeft (bijvoorbeeld onder de 0.1) hoeft de onderzoeker zich geen zorgen te maken over onstabiele regressiegewichten
Stelling II: Bij het berekenen van de Tolerance van een predictor wordt gekeken hoeveel variantie van een predictor voorspeld kan worden door de andere predictoren
Wat is juist?
Een psychologe heeft de volgende regressievergelijking gevonden in onderzoek met 42 personen die gemiddeld 32 scoorden op de X-variabele: ŷ = 0.61X + 0.23
Tevens vond de psychologe de volgende resultaten in het onderzoek:sx = 3, sy = 1.2 en se = 2
Met behulp van deze regressievergelijking voorspelt de psychologe een score op de Y-variabele voor een cliënt van haar die een X-waarde heeft van 25. Wat is de 99% voorspellingsinterval voor deze individuele observatie?
Antwoord C.
Hier geldt:
\[r_{pb} =\frac {s_{xy}}{s_x s_y}\]
\[s_{xy} = \frac {\sum {(x-x̅)^*(y-ȳ)}}{n-1}\]
\[x̅ = 0.5\]
\[ȳ = 3.8\]
\[s_{xy} = \frac {6}{9}\]
\[r_{pb} = \frac {0.66}{0.53^*1.93} = 0.65\]
x | y | x-x gem | y-y gem |
0 | 2 | -0.5 | -1.8 |
0 | 3 | -0.5 | -0.8 |
0 | 1 | -0.5 | -2.8 |
0 | 5 | -0.5 | 1.2 |
0 | 2 | -0.5 | -1.8 |
1 | 6 | 0.5 | 2.2 |
1 | 3 | 0.5 | -0.8 |
1 | 7 | 0.5 | 3.2 |
1 | 4 | 0.5 | 0.2 |
1 | 5 | 0.5 | 1.2 |
Antwoord B. Een responsevariabele is hetgeen dat we willen voorspellen. Deze heeft een respons naar aanleidingvan de verklarende variabele. We willen iemand inkomen voorspellen. Deze waarden worden genoteerd op de y-as, oftewel de verticale as.
Antwoord C. Robuust wil zeggen dat iets niet gevoelig is voor uitbijters. r is wel gevoelig voor uitbijters.
Antwoord A.
Antwoord A.
De regressievergelijking is altijd:
\[Ŷ = b_{1} * x + b_0\]
\[b_1 = \frac {s_{xy}}{s^2_x}\]
\[b_{1} = \frac {1.43}{1.81} = 0.79\]
\[b_{0} = ȳ - b_{1} * x̅\]
\[b_{0} = 2.6-0.79*3.4 = -0.09\]
Antwoord C.
Voor de regressielijn geldt het kleinste kwadratencriterium. Dit houdt in dat de som van de gekwadrateerde afwijkingen van punten ten opzichte van de regressielijn zo klein mogelijk zijn.
Antwoord B.
X is de verklarende variabel en Y is de responsevariabel.
In de formule:
\[Ŷ = b_{1} * x + b_0\]
Als b1 gelijk is aan -2 dan zou bij een toename van 2 van x er een vermindering van y met -4 (2x -2) zijn. Stel b0 = 0 dan: -4 = -2*2 +0.
Antwoord C.
De correlatie kan nooit verschillen door een transformatie. R blijft dus gelijk; b1 daarentegen is wel groter geworden, want de helling verloopt stijler (er is dus een grotere slope).
Antwoord D.
Hiervoor hoeven we eigenlijk alleen maar naar het betrouwbaarheidsinterval te kijken. Als we met 95% zekerheid kunnen zeggen dat b0 tussen de 9,495 en 10,356 ligt, dan kunnen we ook met 95% zekerheid zeggen dat b0 niet gelijk is aan iets wat buiten dit interval ligt. Bij de nul-hypothese ga je van 0 uit en dat ligt bij beide intervallen erbuiten. Ze wijken dus beide significant af.
Antwoord D.
Source | Df | SS | MS | F |
Model | DFM = \[p\] | SSM =\[\sum (ŷ_{i}-ȳ){^2}\] | MSM=\[\frac {SSM}{DFM}\] | F=\[\frac {MSM}{MSE}\] |
Error | DFE=\[n-p-1\] | SSM =\[\sum (y_{i} - ŷ){^2}\] | MSE=\[\frac {SSE}{DFE}\] | |
Total | DFT=\[n-1\] | SSM =\[\sum (y_{i} - ȳ){^2}\] | MST=\[\frac {SST}{DFT}\] |
Om dit model af te maken moeten we eerst kijken naar de SSerror. Deze is gelijk aan de SStotaal - de SSmodel. Verder is er sprake van een enkelvoudige regressie en dus 1 predictor. DFM = p =1DFtotaal = n-1 = 11. Dus n = 12. DFE = n-p-1 = 12 - 1 - 1 = 10. Dit telt ook bij elkaar op tot 11. Voor de F-waarde kan heb je ook de MSM en de MSE nodig. MSM = SSmodel/DFM. MSE = SSerror/DFE. Vervolgens kun je voor de F-waarde MSM delen door de MSE. Zoek deze op in de tabel met numerator = DFM en denominator = DFE. We komen uit op een p-waarde van <0.01. We verwerpen dus de nul-hypothese.
Antwoord D.
Alle drie de stellingen zijn onjuist.
Antwoord D.
We zien dat b1 een negatief getal is. Dit is omdat we zien dat hoe groter b1 wordt, hoe kleiner onze verwachte waarde voor y. Het gaat dus om de t-waarde van -1,4715. Deze kun je opzoeken in de tabel en die kan niet worden verworpen met een alpha van 0,05.
Antwoord A.
Homoscedasticiteit is een voorwaarde voor generalisering naar de populatie. Het houdt in dat de residuen gelijk verpreid zijn over elke voorspelde waarde. (zie week 4)
Antwoord C.
Voor de Tolerance willen wij juist een grote waarde. Hij moet zeker groter zijn 0,1 (vuistregel). Stelling I is dus onjuist. Voor het berekenen van de Tolerance wordt er gekeken naar de hoeveelheidvariantie van een predictor dat door andere predictoren voorspeld kan worden. Stelling II is juist.
Antwoord B.
De juiste formule hiervoor is:
\[ŷ \pm t * SE_{ŷ}\]
\[ŷ = 0.61x + 0.23\]
x is bij deze client gelijk aan 25. Dus:
\[ŷ = 0.61 * 25 + 0.23\]
\[ŷ = 15.48\]
t* is een waarde die in de tabel geschat moet worden. Hij wordt geschat met n-2 = 40 df. In de t-tabel vinden wij een alpha van 0,01 hier een waarde van 2,704.
\[SE_{ŷ} = s_{e} * \sqrt 1 + \frac {1}{n} + (\frac {(x * - x̅)^{2}}{(n-1) * {s^2_x}}\]
X* is de waarde van x die we willen weten. Dit is 25. In het verhaaltje zien we ook dat x gemiddeld gelijk is aan 32. Als we alles invullen zien we:
\[SE_{ŷ} = 2 * \sqrt 1 + \frac {1}{42} + (\frac {(25 - 32)^{2}}{(42-1) * {3^2}}\]
\[SE_{ŷ} = 2 * \sqrt 1 + \frac {1}{42} + \frac {49}{369}\]
\[SE_{ŷ} = 2 * \sqrt 1 + 0.0238 +0.1328\]
\[SE_{ŷ} = 2.1509\]
Invullen:
\[ŷ \pm t * SE_{ŷ}\]
\[15.48 - 2.704 * 2.1509 = 9.7\]
\[15.48 + 2.704 * 2.1509 = 21.3\]
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Stelling 1: Als er gekeken wordt naar een correlatie zijn er twee random variabelen bij betrokken.
Stelling 2: Bij regressie voorspellen we Y op basis van X.
In een onderzoek naar het verband tussen extraversie en zelfvertrouwen doen 6 mensen mee. De scores op beide variabelen nemen waarden aan tussen 1 en 10.
1 | 2 | 3 | 4 | 5 | 6 | |
Extraversie (X) | 6 | 2 | 7 | 9 | 10 | 5 |
Zelfvertrouwen (Y) | 5 | 4 | 9 | 6 | 7 | 4 |
Wat is de covariantie?
De correlatie tussen X (opleidingsniveau) en Y (inkomen) is 0,65. Daarnaast is bekend dat sx = 1,00 en sy = 1,50. Wat is de regressievergelijking?
We vinden een correlatie van r = 0,67 in een onderzoek met 20 participanten. Wat is de correlatiecoëfficiënt van de populatie?
Hier vind je oefententamens voor het vak Experimenteel en Correlationeel Onderzoek aan de Universiteit Leiden, inclusief een antwoordsleutel.
Meer oefenen?
Het idee bestaat dat vrouwen minder drinken dan mannen. Er zijn 10 mannen en 10 vrouwen onderzocht en er is gemeten of ze meer dan 2 glazen alcohol per dag drinken (veel; (Y = 1)) of minder (weinig; (Y=0)). Dit zijn de resultaten
Vrouwen (X = 0) | Mannen (X = 1) | Totaal | |
Weinig (Y = 0) | 6 | 3 | 9 |
Veel (Y=1) | 4 | 7 | 11 |
Totaal | 10 | 10 | 20 |
Hoe groot is phi en hoe groot is chi-kwadraat voor deze situatie?
Een verkeerspsycholoog heeft de volgende relatie tussen snelheid (X in km/h) en het aantal ongelukken in een jaar (Y) van motorrijders gevonden:
\[ŷ = 1.0 + 0.05x\]
Je weet dat meneer Jansen gewoonlijk rijdt met een snelheid van 160 km per uur. Hoeveel ongelukken zal hij krijgen per jaar?
In een groot onderzoek is een correlatie van 0.354 gevonden tussen kennis van de Nederlandse taal (X) en salaris (Y). Daarnaast weten we dat:
Rekenkundig gemiddelde = steekproef gemiddelde = 3
Sx = 2
Sy = de wortel van 2
Wat is de regressievergelijking als we Y uit X willen voorspellen?
Een onderzoeker wil het wiskundecijfer (Y) voorspellen uit de cijfers voor Engels (X1) en Nederlands (X2). De onderzoeker verwacht een positief verband tussen Y en X1 en X2. Hij verzamelt van 10 kinderen uit een VWO-klas de cijfers voor deze vakken en voert een regressie-analyse uit. Die levert het onderstaande resultaat op:
Model | B | Std. Error | Beta | t | Significantie |
(Constant) | -1.926 | 2.725 | -0.707 | 0.503 | |
Engels | 1.269 | 0.436 | 0.805 | 2.907 | 0.023 |
Nederlands | -0.046 | 0.404 | -0.032 | -0.115 | 0.912 |
Piet scoort voor Engels en Nederlands beide een 6, wat is het voorspelde cijfer voor wiskunde van Piet?
Een onderzoeker wil het wiskundecijfer (Y) voorspellen uit de cijfers voor Engels (X1) en Nederlands (X2). De onderzoeker verwacht een positief verband tussen Y en X1 en X2. Hij verzamelt van 10 kinderen uit een VWO-klas de cijfers voor deze vakken en voert een regressie-analyse uit. Die levert het onderstaande resultaat op:
Model | SS | DF | MS | F | Sig. |
Regression | 22.370 | 2 | 11.185 | 5.744 | 0.033 |
Residual | 13.630 | 7 | 1.947 | ||
Total | 36.000 | 9 |
De effectmaat Hedges' g is een effectmaat gebaseerd op...
In een onderzoek wordt bij 10 personen een dichotome variabele X en een intervalvariabele Y gemeten. De resultaten staan in de onderstaande tabel.
Persoon | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
X | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 |
Y | 2 | 3 | 1 | 5 | 2 | 6 | 3 | 7 | 4 | 5 |
Op basis van verzamelde gegevens wil men iemands inkomen voorspellen uit het aantal jaren dat deze onderwijs heeft gevolgd. Welke bewering is juist?
Welke uitspraak over de correlatiecoëfficiënt r is juist?
Het aantal jaren opleiding is de responsevariabele; de waarden van deze variabele worden genoteerdop de verticale as van het spreidingsdiagramEen significantietest is in het algemeen een functie van effectgrootte en aantal proefpersonen. Welkevan de onderstaande formules geeft deze relatie correct weer als het gaat over een 2 x 2 kruistabel?
Voor twee variabelen X en Y is berekend:
\[X̄ = 3.4\]
\[ȳ = 2.6\]
\[s \frac {2}{x} = 1.81\]
\[s \frac {2}{Y} = 2.13\]
\[s_{XY} = 1.43\]
Wat is de regressievergelijking (in ruwe scores) voor de voorspelling van Y uit X?
Voor een regressielijn geldt...
Nederlands:
Engels:
Ben jij secuur, zelfstandig en op zoek naar een bijbaan die flexibel naast je studie past?
Kom dan JoHo ondersteunen bij de administratie van de internationale verzekeringen en activiteiten
Interesse? Meld je dan hier aan
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Field of study
Add new contribution