Wat wordt bedoeld met de begrippen correlatie, regressie en lineaire regressie? - Tentamens 10

Vragen

Vraag 1

Welke waarde in een regressiefunctie is de constante waarde?

  1. y

  2. α

  3. β

  4. ε

Vraag 2

Wanneer is een correlatie sterker?

  1. Als de waarde groter is

  2. Als de waarde kleiner is

  3. Als de waarde negatief is

  4. Als de waarde positief is

Vraag 3

Wat betekent R2 binnen de regressieanalyse? Wat is R2?

Vraag 4

Waarom kun je beter niet extrapoleren met een regressieanalyse?

Vraag 5

Wat houdt een positieve relatie tussen twee variabelen in?

Vraag 6

Wat geeft de covariantie aan?

Vraag 7

Wat is Pearson correlatie coëfficiënt?

Vraag 8

Wat is een bivariate correlatie?

Vraag 9

Waarom is er bij correlatie niet automatisch sprake van causaliteit?

Vraag 10

Wat is het coëfficiënt van determinatie?

Vraag 11

Wat is Spearman correlatie coëfficiënt?

Vraag 12

Wanneer wordt de Kendall’s tau gebruikt?

Vraag 13

Wanneer gebruik je de biseriële correlatie coëfficiënt?

Vraag 14

Wat is de partiële correlatie?

Vraag 15

Wat is het verschil tussen semi-partiële correlatie en partiële correlatie?

Vraag 16

Wat gebruik je om correlaties te vergelijken?

Vraag 17

Wat moet je doen om de effectgrootte te berekenen?

Vraag 18

Wat wordt precies geanalyseerd wanneer er een regressieanalyse uitgevoerd wordt?

Vraag 19

Wat wordt bedoeld met residuen?

Vraag 20

Heeft een goed model een hoge F-ratio of juist een lage?

Vraag 21

Wat betekent een regressiecoëfficiënt van 0?

Vraag 22

Wat is een probleem bij de forwardmethode van invoer?

Vraag 23

Wat is een probleem bij de stapsgewijze invoer?

Vraag 24

Wat wordt bedoeld met een uitschieter?

Vraag 25

Wat is het effect van een uitschieter op een lineaire regressielijn?

Vraag 26

Waaraan moeten de meetniveaus van een regressieanalyse voldoen?

Vraag 27

Wat is multicollineariteit? En welke drie problemen ontstaan er bij vergrote multicollineariteit?

Vraag 28

Wat is homoscedasticiteit?

Vraag 29

Wat test je met de Durbin-Watson test?

Vraag 30

Wat is crossvalidatie? En door middel van welke twee methodes kan dit?

Vraag 31

Wat geeft het betrouwbaarheidsinterval aan?

Vraag 32

Wat is verklaarde variantie?

Vraag 33

Wat zijn dummy variabelen?

Vraag 34

Wat doet een mediërende variabele?

Vraag 35

Wat is een modererend effect?

Vraag 36

Welke drie eigenschappen van de relatie tussen X en Y worden er gemeten met een correlatie?

Vraag 37

Variabele x en y hebben een r² van 0.15. Betekent dit een grote, een kleine of een gemiddelde correlatie?

Vraag 38

Wanneer wordt de phi-coëfficiënt gebruikt?

Vraag 39

Een bedrijfspsycholoog is voor 100 werknemers nagegaan wat hun bloeddruk (X) is en hoeveel winst (Y) hun bedrijf maakt. Voor deze gegevens berekent hij het gemiddelde, de variantie en de covariantie. Het gemiddelde van x = 80 , het gemiddelde van y = 60, sX² = 25, SY² = 36 en de Covariantie = -15 Welke waarde heeft de correlatie?

Vraag 40

Een vervoerspsycholoog heeft vastgesteld dat tussen de rijsnelheid (X in km/u) en het aantal ongelukken (Y per jaar) die autobestuurders maken het volgende verband bestaat: y = 1 + 0.05*x Je weet dat meneer de Vries gewoonlijk met een snelheid van 160 km per uur rijdt. Hoeveel ongelukken zal hij per jaar maken?

Vraag 41

Wat wil het zeggen als de helling van een gestandaardiseerde regressievergelijking 0.6 is?

Vraag 42

Voor de volgende drie paren waarnemingen (x, y) bepaal je de Spearman rangcorrelatiecoefficient: (1, 1), (2, 2) en (3, 3). Wat gebeurt er met deze correlatiecoefficient als je het laatste paar verandert in (3, 25)?

Vraag 43

Een onderzoeker berekent de Spearman rangcorrelatiecoefficient tussen lengte en confectiemaat. Lengten worden gemeten in cm, de confectiematen zijn S, M, L, XL, XXL, XXXL. De onderzoeker codeert deze maten als 1, 2, 3, 4, 5, 8. Is deze methode correct?

Vraag 44

De (Pearson's) correlatiecoefficient voor twee variabelen x en y is 0.7. Wat is het percentage variabiliteit in y dat door variabele x wordt verklaard?

Vraag 45

Bezie de volgende twee stellingen met betrekking tot de Pearson r:
Om te kunnen concluderen dat er een oorzaak-gevolg relatie is tussen de variabelen X en Y, moet de Pearson r tussen X en Y positief zijn.
Voor het interpreteren van een Pearson r tussen twee variabelen is een lineaire samenhang wenselijk, maar niet noodzakelijk

Vraag 46

Als we Pearson r van .80 vinden tussen twee numerieke variabelen, terwijl inspectie van de bijbehorende puntenwolk laat zien dat het verband duidelijk kromlijnig is, dan geldt dat:

  1. ondanks de gevonden correlatie, er eigenlijk geen verband is

  2. er vermoedelijk wel een verband is, maar dat Pearson r niet het juiste middel is om te gebruiken

  3. er vermoedelijk uitbijters zijn

  4. de twee variabelen vermoedelijk niet normaal verdeeld zijn

 Vraag 47

Bij een positieve correlatie:

  1. Neemt de ene variabele toe als de ander afneemt

  2. Neemt de ene variabele af als de ander afneemt

  3. Neemt de ene variabele toe als de andere toeneemt

  4. Zowel antwoord b als c is correct

Vraag 48

Om een lineaire relatie tussen twee variabelen op interval-niveau, te meten, gebruikt men de:

  1. Pearson correlatie

  2. Spearman correlatie

  3. Chi-square relatie

  4. Alle drie bovenstaande antwoorden zijn correct

Vraag 49

Er wordt een Pearson correlatie berekend voor een sample met 30 participanten, met ∑XY = 120, ∑X = 16 en ∑Y = 30, de waarde van SP is:

  1. 16

  2. 104

  3. 16

  4. 136

Vraag 50

Bereken de Pearson correlatie bij SP = - 20, SSx = 12 en SSy = 48, de waarde van r is:

  1. 0,25

  2. -0,25

  3. -0,83

  4. 0,83

Vraag 51

Als er tussen de hoeveelheid geconsumeerde verzadigde vetten in gram en aantal gezondheidsklachten een correlatie van +1,00 wordt gevonden, kan hieruit geconcludeerd worden dat:

  1. Verzadigde vetten slecht zijn voor de gezondheid

  2. Verzadigde vetten goed zijn voor de gezondheid

  3. Mensen die meer verzadigde vetten eten meer gezondheidsklachten hebben dan mensen die weinig verzadigde vetten eten

  4. Mensen die meer verzadigde vetten eten minder vaak gezondheidsklachten hebben dan mensen die weinig verzadigde vetten eten

Vraag 52

Bij een correlatie van 0,50 tussen het aantal gestudeerde uren en het tentamencijfer bij studenten, wordt:

  1. 50 procent van de variantie van het tentamencijfer voorspeld door het aantal gestudeerde uren

  2. 0,5 procent van de variantie van het tentamencijfer voorspeld door het aantal gestudeerde uren

  3. 25 procent van de variantie van het tentamencijfer voorspeld door het aantal gestudeerde uren

  4. 5 procent van de variantie van het tentamencijfer voorspeld door het aantal gestudeerde uren

Vraag 53

Een voetballer is in 2011 topscoorder van het jaar, in 2012 komt hij echter niet eens in de top 10 voor, wat is, statistisch gezien, de beste verklaring hiervoor:

  1. De voetballer kon de druk niet aan

  2. De voetballer raakte geblesseerd

  3. Er was sprake van correlatie

  4. Er was sprake van regressie naar het gemiddelde

Vraag 54

Bij een tweezijdige Pearson correlatie, is de nulhypothese:

  1. Er is een positieve correlatie binnen de populatie

  2. Er is geen positieve correlatie binnen de populatie

  3. Er is een correlatie binnen de populatie

  4. Er is geen correlatie binnen de populatie

Vraag 55

De Spearman correlatie gebruikt men wanneer:

  1. Men twee variabelen meet op ordinaal niveau

  2. Men twee interval/ratio variabelen indeelt in categorieën

  3. Er een niet-lineaire relatie is tussen twee variabelen

  4. Alle bovenstaande antwoorden zijn correct

Vraag 56

Wanneer de scores: 1, 3, 3 en 5 worden ingedeeld op rangorde, krijgen zij de volgende rangnummers:

  1. 1, 2, 3 en 4

  2. 1, 2.5, 2.5 en 3

  3. 1, 3, 3 en 5

  4. 1, 2.5, 2.5 en 4

Vraag 57

Een onderzoeker kijkt naar het verband tussen aantal minuten wachttijd en aantal m&m’s die gegeten worden. De resultaten staan in de volgende tabel:

Min. Wachten                         Aantal m&m’s

2                                             9

1                                             10

3                                             6

0                                             8

4                                             2

Bereken de Pearson correlatie.

Vraag 58

Wat is het effect van uitschieters op de waarde van een correlatie?

  1. De correlatie wordt sterker.

  2. De correlatie wordt zwakker.

  3. De correlatie wordt negatief.

  4. De correlatie blijft hetzelfde.

Vraag 59

Wanneer wordt de Spearman-correlatie gebruikt?

  1. Bij nominale data.

  2. Bij ordinale data.

  3. Bij numerieke data.

  4. Bij een ratio.

Vraag 60

Hoe groot moet de correlatie zijn bij een steekproef van 10 personen om statistisch significant te zijn bij een alfaniveau van .05?

  1. 0.521

  2. 0.576

  3. 0.632

  4. 0.488

Vraag 61

Wat voor toets moet er gedaan worden als er gekeken wordt naar het aantal uren dat kinderen op internet besteden in verschillende leeftijdscategorieën?

  1. Spearman-correlatie

  2. Pearson-correlatie

  3. ANOVA

  4. Durbin-Watson

Vraag 62 a

Er is een correlatie gevonden van r = 0.40 tussen IQ-score en motivatie bij een steekproef van 20 studenten. Wat is de verklaarde variantie?

Vraag 62 b

In de volgende tabel mist een waarde, welke waarde resulteert in:

a. ...geen hoofdeffect voor factor A?

b. ...geen interactie-effect tussen factor A en B?

 

B1                   B2                   B3

A1                   M = 10            M = 20            M = 40

A2                   M = 15            M = 25

Antwoordindicatie

Vraag 1

    B

    Vraag 2

    A

    Vraag 3

    R-kwadraat ofwel de determinatiecoëfficiënt. Dit is de meting van hoe goed de kleinste-kwadratenlijn ŷ = a + b(x) de y voorspelt in vergelijking tot de voorspelling van ȳ. De r2 geeft aan hoeveel procent de variantie van een conditionele distributie groter of kleiner is dan de variantie van een marginale distributie. In het kort, r2 meet hoe goed x de y voorspelt.
    Het is de hoeveelheid variantie die wordt verklaard door het model in verhouding tot de totale variantie. Het representeert het percentage variantie in de uitkomst dat kan worden verklaard door het model.

    Vraag 4

    Buiten het bereik van de geobserveerde data kan de vorm van de lijn anders lopen dan lineair, dus hier kunnen geen uitspraken over gedaan worden met extrapoleren.

    Vraag 5

    Een positieve relatie houdt in dat een toename in de ene variabele samenhangt met een toename in de andere variabele.

    Vraag 6

    De covariantie geeft aan of variabelen samenhangen en of deze samenhang positief of negatief is.

    Vraag 7

    Pearson correlatie coëfficiënt is de gestandaardiseerde covariantie, die ook wordt gebruikt voor het meten van effectgrootte.

    Vraag 8

    Een bivariate correlatie is een correlatie tussen twee variabelen.

    Vraag 9

    Er is bij correlatie niet automatisch sprake van causaliteit omdat andere variabelen ook invloed hebben op de correlatie, en de correlatie niets zegt over welke variabele de verandering bij de andere variabele teweegbrengt.

    Vraag 10

    Het coëfficiënt van determinatie is een maat voor hoeveel variantie de gecodeerde variabelen delen.

    Vraag 11

    Spearman correlatie coëfficiënt is de niet-parametrische variant van de Pearson correlatie.

    Vraag 12

    Kendall’s tau gebruik je wanneer je een kleine steekproef hebt met veel gelijke scores.

    Vraag 13

    De biseriële correlatie coëfficiënt gebruik je als de variabele continu dichotoom is.

    Vraag 14 

    Partiële correlatie is de relatie tussen twee variabelen waarin de effecten van een andere variabele constant worden gehouden.

    Vraag 15

    Het verschil tussen semi-partiële en partiële correlatie is dat bij semi-partiële correlatie wordt gecontroleerd voor het effect dat een derde variabele heeft op één van de variabelen in de correlatie, en niet op beide variabelen zoals bij de partiële correlatie.

    Vraag 16

    Om correlaties te vergelijken worden de z-scores en t-toetsen.

    Vraag 17

    Correlaties zijn effectgroottes, dus om de effectgrootte te berekenen heb je geen verdere stappen nodig.

    Vraag 18

    Je wilt een uitkomstvariabele Y voorspellen door middel van één voorspellende predictor (simpele regressie) of door meerdere predictoren (multiple regressie).

    Vraag 19

    Een residu is de verticale afstand tussen de werkelijke data en de regressielijn, deze verschillen kunnen zowel positief als negatief zijn.

    Vraag 20

    Een hoge F-ratio want dit betekend dat de verbetering in voorspelling groot is (MSm) en het verschil tussen het model en de geobserveerde data klein (MSr).

    Vraag 21

    Dit betekent dat een verandering in de predictor variabele resulteert in geen verandering in de uitkomst variabele.

    Vraag 22

    Er kan sprake zijn van supressor effecten dit houdt in dat een predictor significant is maar alleen als een andere predictor constant wordt gehouden. Hierdoor heb je bij de forward methode een grotere kans op een type II fout (een predictor elimineren terwijl deze wel significant was).

    Vraag 23

    Er kan kans zijn op overfitting (teveel variabelen met maar kleine variantie) of underfitting (het niet toevoegen van belangrijke variabelen).

    Vraag 24

    Een uitschieter wordt ook wel een outlyer genoemd. Een uitschieter is een meting die substantieel verschilt van de gemiddelde trend van de data.

    Vraag 25

    De regressie wordt onevenredig beïnvloed door de uitschieter, waardoor de andere waarden grotere residuen krijgen.

    Vraag 26

    De afhankelijke variabele moet van tenminste ratio of interval meetniveau zijn en de onafhankelijke variabele van ratio of interval of omgecodeerd tot een dummy.

    Vraag 27

    Dit ontstaat wanneer er een sterke correlatie is tussen twee of meer predictoren. De problemen die ontstaan zijn:1) onbetrouwbare b’s, 2) limiteert de grootte van r en 3) het wordt moeilijker om onderscheidt te maken in belangrijkheid tussen predictoren.

    Vraag 28

    Hierbij moet op elk niveau van de predictor variabele de variantie van de residuen constant zijn, als deze variantie ongelijk is, is er sprake van heteroscedasticiteit.

    Vraag 29

    Hiermee test je of er sprake is van onafhankelijke errors, vuistregel is dat de waarde tussen de 1 en 3 moet liggen.

    Vraag 30

    Als je niet zeker weet hoe accuraat de steekproef de populatie beschrijft kan worden gekeken hoe goed het model de uitkomst in andere steekproeven voorspelt. Dit kan door middel van de adjusted R2 en data-splitting.

    Vraag 31

    Het betrouwbaarheidsinterval geeft het interval aan waarbinnen de werkelijke waarde van b zich bevind in de populatie.

    Vraag 32

    Dat deel van de variantie wat wordt bepaald en veroorzaakt door de onafhankelijke variabelen en niet door externe factoren.

    Vraag 33

    Dit is een variabele die van nominaal meetniveau is met meer dan 2 categorieën die is omgezet naar een dichotoom item met alleen 0 of 1 als score. Een dummy variabele is bijvoorbeeld: is de CEO betrokken? Ja of nee? Het krijgt de score 1 wanneer de CEO betrokken is en een 0 wanneer de CEO niet betrokken is. 

    Vraag 34

    Het effect van de predictor op de afhankelijke variabele verloopt via een derde variabele dit kan gedeeltelijk of geheel zijn.

    Vraag 35

    Het effect van de predictor op de afhankelijke variabele hangt dan af van nog een derde variabele.

    Vraag 36

    • De richting van een relatie

    • De vorm van een relatie

    • De mate van een relatie

    Vraag 37

    Dit is een gemiddelde correlatie.

    Vraag 38

    Wanneer twee variabelen beide dichotoom zijn

    Vraag 39

    -0.50

    Vraag 40

    9

    Vraag 41

    Dat houdt in dat de voorspelde waarde voor elke toename van 1 punt in X, met 0.6 toeneemt.

    Vraag 42

    De Spearman rangcorrelatiecoefficient verandert niet, omdat de verandering van y = 3 in 25 geen invloed heeft op de verschillen in de rangnummers waarmee de correlatiecoefficient berekend wordt.

    Vraag 43

    De methode is correct. De confectiematen zijn te ordenen volgens de rangschikking van klein naar groot van de bijbehorende (klassen van) lengten. De Spearman rangcorrelatiecoefficient kan dan berekend worden door de confectiematen zelf numeriek te coderen van klein naar groot. Met welke speciefieke codering dit verder gebeurt is niet van belang.

    Vraag 44

    49% Het percentage variabiliteit in de ene variabele dat verklaard wordt door de andere variabele is gelijk aan (kwadraat correlatiecoefficient)x100%.

    Vraag 45

    Beide stellingen zijn onjuist.

    Vraag 46

    B

    Vraag 47

    D

    Vraag 48

    A

    Vraag 49

    B

    Vraag 50

    C

    Vraag 51

    C

    Vraag 52

    C

    Vraag 53

    D

    Vraag 54

    D

    Vraag 55

    D

    Vraag 56

    D

    Vraag 57

    r = -0.8

    Vraag 58

    A

    Vraag 59

    B

    Vraag 60

    C

    Vraag 61

    B

    Vraag 62a

    De verklaarde variantie is r2 = 0.16.

    Vraag 62b

     a. M = 30, b. M = 45

    Image

    Access: 
    Public

    Image

    Join WorldSupporter!
    Search a summary

    Image

     

     

    Contributions: posts

    Help other WorldSupporters with additions, improvements and tips

    Add new contribution

    CAPTCHA
    This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
    Image CAPTCHA
    Enter the characters shown in the image.

    Image

    Spotlight: topics

    Check the related and most recent topics and summaries:
    WorldSupporter and development goals:
    This content is also used in .....

    Image

    Check how to use summaries on WorldSupporter.org

    Online access to all summaries, study notes en practice exams

    How and why use WorldSupporter.org for your summaries and study assistance?

    • For free use of many of the summaries and study aids provided or collected by your fellow students.
    • For free use of many of the lecture and study group notes, exam questions and practice questions.
    • For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
    • For compiling your own materials and contributions with relevant study help
    • For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

    Using and finding summaries, notes and practice exams on JoHo WorldSupporter

    There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

    1. Use the summaries home pages for your study or field of study
    2. Use the check and search pages for summaries and study aids by field of study, subject or faculty
    3. Use and follow your (study) organization
      • by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
      • this option is only available through partner organizations
    4. Check or follow authors or other WorldSupporters
    5. Use the menu above each page to go to the main theme pages for summaries
      • Theme pages can be found for international studies as well as Dutch studies

    Do you want to share your summaries with JoHo WorldSupporter and its visitors?

    Quicklinks to fields of study for summaries and study assistance

    Main summaries home pages:

    Main study fields:

    Main study fields NL:

    Follow the author: Psychology Supporter
    Work for WorldSupporter

    Image

    JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

    Working for JoHo as a student in Leyden

    Parttime werken voor JoHo

    Statistics
    2411