TentamenTests bij Statistical Methods for the Social Sciences van Agresti - 6e druk

Wat zijn statistische methoden? - TentamenTests 1

 

Meerkeuzevragen

Vraag 1

Welk soort data beschrijft de populatie?

  1. De parameter
  2. De statistiek
  3. De steekproef
  4. De regressie

Open Vragen

Vraag 1

Wat is het verschil tussen beschrijvende en inferentiële statistiek?

Vraag 2

Lydia doet onderzoek naar de invloed van kauwgum kauwen op concentratie bij jongeren. Ze selecteert deelnemers op verschillende middelbare scholen om mee te doen aan haar experiment. Wat is hier de populatie en wat is de steekproef?

Vraag 3

Myrthe kijkt naar de jaarlijkse uitgaven van gezinnen in verschillende regio’s in Nederland over de periode 1980 tot afgelopen jaar. Gebruikt zij inferentieel of beschrijvende statistiek?

Vraag 4

Een arbeidspsycholoog doet onderzoek naar werkstress bij startende ondernemers. Hij gebruikt gegevens van de Kamer van Koophandel en vindt dat 62% van de ondernemers man is, en 38% vrouw. Van de ondernemers die aan zijn onderzoek meedoen, rapporteert 73% van de vrouwen bovengemiddelde stress, tegenover 45% van de mannen. Hij voorspelt dat vrouwelijke ondernemers vaker last zullen krijgen van burn-outklachten. Welk deel in het onderzoek is beschrijvende statistiek, en welk deel is inferentieel?

Vraag 5

Hoe wordt de vorm van statistiek genoemd die zich bezig houdt met het trekken van conclusies?

Vraag 6

Wat is het verschil tussen een parameter en een statistiek?

    Antwoordindicatie Meerkeuzevragen

    Vraag 1

    A. De parameter

    Antwoordindicatie Open Vragen

    Vraag 1

    Beschrijvende statistiek wordt gebruikt om data samen te vatten. De beschrijvende statistiek heeft betrekking op de hele populatie. De beschrijvende data wordt eerst besproken in een wetenschappelijk artikel om een beeld te krijgen van de gegevens. Inferentieel statistiek wordt gebruikt om voorspellingen te doen en om de opgestelde hypotheses te testen. Beschrijvende statistiek en inferentieel statistiek staan tegenover elkaar.

    Vraag 2

    De populatie: jongeren
    Steekproef: de geselecteerde deelnemers op middelbare scholen

    Vraag 3

    Beschrijvende statistiek. Als ze met haar onderzoek voorspellingen zou doen over de uitgaven van gezinnen in het huidige jaar, dan zou het inferentiële statistiek zijn.

    Vraag 4

    De verdeling mannelijke/vrouwelijke ondernemers is beschrijvend, evenals het percentage ondernemers in beide groepen dat bovengemiddelde stress rapporteert. De voorspelling over burn-outklachten is inferentieel.

    Vraag 5

    Inferentiële statistiek. Deze methode gaat ervan uit dat de onafhankelijke variabele effect heeft gehad, wanneer het verschil tussen de gemiddelden van de condities groter is dan dat we zouden verwachten op basis van alleen toeval. We vergelijken daarom de groepsgemiddelden die we gevonden hebben met de groepsgemiddelden die we verwachtten te vinden als er alleen sprake zou zijn van errorvariantie. Deze methode geeft helaas geen zekerheid. We kunnen alleen de kans vaststellen dat de verschillen in groepsgemiddelden het gevolg zijn van errorvariantie.

    Vraag 6

    Een parameter staat voor een waarde die de populatie beschrijft. Denk hierbij aan de gemiddelde schoolprestatie in de populatie. Een statistiek beschrijft, in tegenstelling tot een parameter, gegevens over een steekproef. Meestal wordt gebruik gemaakt van een kanssteekproef.

    Welke soorten steekproeven en variabelen zijn er? – TentamenTests 2

     

    Meerkeuzevragen

    Vraag 1

    In een demografische vragenlijst wordt naar opleidingsniveau gevraagd, waarbij de antwoordopties zijn: basisschool, voortgezet onderwijs, middelbaar onderwijs en hoger onderwijs. Wat voor soort variabele is ‘opleidingsniveau’ in dit geval?

    1. Interval
    2. Ordinaal
    3. Nominaal
    4. Ratio

    Vraag 2

    Joost doet een opiniepeiling onder studenten en trekt een steekproef op iedere universiteit in Nederland. Wat voor soort steekproeftrekking is dit?

    1. Systematisch
    2. Cluster
    3. Gestratificeerd
    4. Gelaagd

    Vraag 3

    Welke van de volgende variabelen zijn zowel discreet als kwantitatief:

    1. Aantal hoofdsteden in Europa dat je binnen een minuut op kunt noemen
    2. Tijd die studenten nodig hebben om statistiek te leren begrijpen
    3. Bij welke studentenvereniging studenten zitten
    4. Aantal keer per jaar dat Spongebob op tv is

    Vraag 4

    Iemand beweert over een bepaalde variabele dat de score van Elise twee keer zo groot is als die van Adriaan. Welk meetniveau moet de variabele ten minste hebben om deze uitspraak te kunnen doen?

    1. Interval
    2. Ordinaal
    3. Nominaal
    4. Ratio

    Vraag 5

    In een onderzoek wordt de variabele Intelligentie op de volgende manier gemeten:

    1 = IQ lager dan 70

    2 = IQ tussen 71 en 90

    3 = IQ tussen 91 en 110

    4 = IQ tussen 111 en 120

    5 = IQ hoger dan 120

    Welk meetniveau heeft deze variabele?

    1. Interval
    2. Ordinaal
    3. Nominaal
    4. Ratio

    Open Vragen

    Vraag 1

    Wat is het verschil tussen een continue en een discrete variabele?

    Vraag 2

    Noem de drie typen bias die kunnen ontstaan in een steekproef.

    Vraag 3

    Wat is het verschil tussen een onafhankelijke en een afhankelijke variabele? Beschrijf beide begrippen?

    Antwoordindicatie Meerkeuzevragen

    Vraag 1

    B. Ordinaal

    Vraag 2

    A. Systematisch

    Vraag 3

    A. Aantal hoofdsteden in Europa dat je binnen een minuut op kunt noemen en D. Aantal keer per jaar dat Spongebob op tv is

    Vraag 4

    D. Ratio

    Vraag 5

    B. Ordinaal

    Antwoordindicatie Open Vragen

    Vraag 1

    Een variabele is discreet wanneer de mogelijke waarden alleen bepaalde, afzonderlijke nummers zijn. Een variabele is continu wanneer de waarden alle mogelijke waarden kunnen aannemen.

    Vraag 2

    Sampling bias, response bias en nonresponse bias.

    Vraag 3

    De afhankelijke variabele is de variabele waarover een voorspelling wordt gedaan. Er wordt een voorspelling gedaan over de afhankelijke variabele. De afhankelijke variabele wordt ook wel de uitkomst genoemd. De onafhankelijke variabele wordt gebruikt om een voorspelling op te baseren. Dit is de predictor. Een onderzoeker verwacht dat de onafhankelijke variabele invloed heeft op de afhankelijke variabele.

    Hoe werkt beschrijvende statistiek? - TentamenTests 3

     

    Meerkeuzevragen

    Vraag 1

    Welke centrummaat kun je gebruiken voor categorische variabelen?

    1. Het gemiddelde
    2. De mediaan
    3. De module
    4. De modus

    Vraag 2

    Welke weergave kan worden gebruikt om de observaties van een kwantitatieve variabele in kaart te brengen?

    1. Scatterplot
    2. Contingency table
    3. Regressieanalyse
    4. Staafdiagram

      Open Vragen

      Vraag 1

      Wat wordt bedoeld met het begrip de interkwartielafstand?

      Vraag 2

      Welke maat beschrijft de typische afstand tot het gemiddelde in een distributie?

      Vraag 3

      Mireille heeft in haar eerste studiejaar 8 vakken gevolgd en met succes afgerond. Hieronder zie je de eindresultaten van haar tentamens. Wat is haar gemiddelde cijfer en wat is de standaarddeviatie?

      • Inleiding in de psychologie: 8.8
      • Statistiek en methoden 1: 7.2
      • Hersenen en gedrag: 7.0
      • Ontwikkelingspsychologie: 7.4
      • Sociale psychologie: 6.4
      • Statistiek en methoden 2: 6.8
      • Psychopathologie 1: 7.8
      • Toegepaste psychologie: 7.1

      Antwoordindicatie Meerkeuzevragen

      Vraag 1

      C. De module

      Vraag 2

      A. Scatterplot

      Antwoordindicatie Open Vragen

      Vraag 1

      Het verschil tussen het eerste en derde kwartiel.

      Vraag 2

      Standaarddeviatie.

      Vraag 3

      Gemiddelde cijfer = 7.3 Standaarddeviatie = 0.01

      Hoe gebruik je kansverdelingen voor statistische inferentie? - TentamenTests 4

       

      Meerkeuzevragen

      Vraag 1

      Hoe kan de kansverdeling van een discrete variabele het beste worden weergegeven?

      1. In een histogram
      2. In een curve
      3. In een boxplot
      4. Scatterplot

      Open Vragen

      Vraag 1

      Stel dat 94% van de Nederlandse bevolking Sinterklaas viert met cadeaus en 60% geeft cadeaus met Kerstmis. Hoe groot is de kans dat iemand zowel Sinterklaas als Kerst viert met cadeaus?

      Vraag 2

      De IQ-distributie heeft een gemiddelde van 100 en een standaarddeviatie van 15. Wat is de z-score van iemand met een IQ van 120?

      Vraag 3

      Stel, er wordt een onderzoek gedaan naar het aantal keren dat fietsers in Utrecht per dag een stoplicht passeren. De steekproef bestaat uit 700 mannelijke fietsers en 800 vrouwelijke fietsers. Het gemiddelde is 20 en de standaarddeviatie is 10. Wat is de standaardfout?

      Vraag 4

      De verdeling van inkomens in India is rechtsscheef. Hoe ziet een steekproefverdeling eruit volgens de centrale limiettheorie als er een grote steekproef wordt gebruikt?

      Antwoordindicatie Meerkeuzevragen

      Vraag 1

      A. In een histogram

      Antwoordindicatie Open Vragen

      Vraag 1

      0.94 x 0.60 = 0.564 = 56,4%

      Vraag 2

      z = (100-120) / 15 = 1,33

      Vraag 3

      10: de wortel van 1500 = 0,26

      Vraag 4

      Normaalverdeeld

      Hoe maak je schattingen voor statistische inferentie? - TentamenTests 5

       

      Meerkeuzevragen

      Vraag 1

      Hoe wordt de waarde die het meest consistent is met de geobserveerde data genoemd?

      1. Puntschatting
      2. Intervalschatting
      3. Maximale waarschijnlijkheidsschatting
      4. Minimale waarschijnlijkheidsschatting

      Open Vragen

      Vraag 1

      In een marktonderzoek naar online winkelgedrag zegt 79% van een steekproef van 1200 personen regelmatig online producten te bestellen. Bereken het 95% betrouwbaarheidsinterval.

      Vraag 2

      In een onderzoek naar de houding van jongeren tegenover het vuurwerkverbod wordt een steekproef gedaan. In de steekproef van 500 middelbare scholieren is 56% voor en 44% tegen. Bereken het 99% betrouwbaarheidsinterval.

      Vraag 3

      Hoe kun je het betrouwbaarheidsinterval verkleinen?

      Vraag 4

      Een vrouwenblad plaatst een poll met de stelling ‘Mijn vriendinnen gaan voor mijn familie’. 883 lezeressen nemen deel aan de poll. Wat is de geschatte standaardfout als 36% het eens is?

      Vraag 5

      Een onderzoeker wil onderzoeken of het gemiddelde IQ van personen met een smal hoofd (mu smal) groter is dan 100. De nulhypothese wordt verworpen vanaf een gemiddelde van 107.5. Het is bekend dat de IQ scores in de populatie normaal verdeeld zijn met standaarddeviatie 15; dit geldt zowel onder de nulhypothese als onder de alternatieve hypothese. De onderzoeker heeft de beschikking over een aselecte steekproef (SRS) van n = 20 personen uit de populatie personen met een smal hoofd. Het gemiddelde IQ in de steekproef was gelijk aan 91.

      Welk significantieniveau heeft de onderzoeker hier gebruikt?

      Vraag 6

      Een beroepskeuzebureau hanteert een genormeerde IQ-test voor HAVO leerlingen uit de hoogste klas. Deze test heeft een variantie van 225. De scores die hiermee verkregen worden, zijn normaal verdeeld. Een steekproef van 25 leerlingen uit de groep die zich bij dit bureau voor advies heeft aangemeld, scoort op deze test gemiddeld 119. Wat is het 95% betrouwbaarheidsinterval van het populatiegemiddelde?

      Vraag 7

      We berekenen het gemiddelde cijfer voor het vak Inleiding in de psychologie. Dit gemiddelde bedraagt 6.5 met een standaarddeviatie van 1.67. We nemen aan dat de cijfers normaal zijn verdeeld. Hoeveel procent van de leerlingen heeft een 7 of ho-ger behaald?

      Antwoordindicatie Meerkeuzevragen

      Vraag 1

      C. Maximale waarschijnlijkheidsschatting

      Antwoordindicatie Open Vragen

      Vraag 1

      Se = wortel van (0.79)(0.21)/1200 = 0.012. Dit is de standaardfout. 0.012 x 1.96 = 0.02. Het 95% betrouwbaarheidsinterval is 0.79 ± 0.02, dus 77 tot 81% in de bevolking bestelt weleens producten online.Se = 0.012. Dit is de standaardfout. 0.012 x 1.96 = 0.02. Het 95% betrouwbaarheidsinterval is 0.79 ± 0.02, dus 77 tot 81% in de bevolking bestelt weleens producten online.

      Vraag 2

      Se = wortel van (0.56)(0.44)/500 = 0.022. Dit is de standaardfout. 0.022 x 2.58 = 0.06. Het 99% betrouwbaarheidsinterval voor het percentage jongeren dat voor het vuurwerkverbod is, is 0.56 ± 0.06, dus 50 tot 62% van de totale populatie is voor.

      Vraag 3

      Door een grotere steekproef te gebruiken.

      Vraag 4

      Se = wortel van (0.36)(0.64)/883 = 0.016

      Vraag 5

      Het significantieniveau is 0.0125

      Vraag 6

      113.12 ≤ gemiddelde ≤ 124.88

      Vraag 7

      38%

      Hoe gebruik je significantietoetsen? - TentamenTests 6

       

      Meerkeuzevragen

      Vraag 1

      Martijn wil weten of slaapproblemen verminderd kunnen worden met iedere dag een kwartier lichaamsbeweging. Hij heeft een onderzoek gedaan waaruit blijkt dat er waarschijnlijk een positief effect is, maar om een gegronde uitspraak te kunnen doen, wil hij de power van zijn toets vergroten. Wat kan hij het beste doen?

      1. Het onderzoek opnieuw uitvoeren
      2. Een andere statistiek gebruiken
      3. Een grotere steekproef gebruiken
      4. Een kleinere steekproef gebruiken

      Vraag 2

      In welk van onderstaande gevallen kun je éénzijdig toetsen?

      1. Je test of de productiviteit verandert wanneer werknemers ouder worden door drie verschillende leeftijdsgroepen te vergelijken.
      2. Je test of vrouwen meer praten dan mannen.
      3. Je test of een onderwijsprogramma effectief is in het veranderen van motivatie voor leren.
      4. Je test of de productiviteit verandert wanneer werknemers ouder worden door vijf verschillende leeftijdsgroepen te vergelijken.

      Open Vragen

      Vraag 1

      Gebruik je de t-distributie bij een significantietoets voor een gemiddelde of voor een proportie?

      Vraag 2

      Welke distributie wordt gebruikt voor proporties in een hele kleine steekproef?

      Vraag 3

      Wat betekent een type 1 fout?

      Vraag 4

      De scores van een bepaalde variabele zijn in de populatie normaal verdeeld met een standaarddeviatie van 12. Stel er wordt rechtseenzijdig getoetst met de nulhy-pothese dat het populatiegemiddelde gelijk is aan 80. Bekend is dat de nulhypothe-se verworpen wordt vanaf een steekproefgemiddelde van 82.5. Wat zal de power zijn wanneer het populatiegemiddelde 86 zou zijn?

      Vraag 5

      Voor een steekproef van 134 studenten is de affiniteit met vlees eten onderzocht. Aan de helft werd voorafgaande aan het onderzoek filmpjes getoond over hoe vlees wordt gemaakt. De andere helft keek naar een comedy film. De volgende gegevens zijn bekend: Het gemiddelde de eerste groep is 4.78 met een standaard-deviatie van 1.61.Het gemiddelde van de tweede groep bedraagt 4.54 met een standaarddeviatie van 1.56. Voer de geschikte t-toets uit op deze gegevens. Kun je de nulhypothese verwerpen wanneer je eenzijdig toetst met α = 0.05?

      Antwoordindicatie Meerkeuzevragen

      Vraag 1

      C. Een grotere steekproef gebruiken.

      Vraag 2

      B. Je test of vrouwen meer praten dan mannen.

      Antwoordindicatie Open Vragen

      Vraag 1

      Voor een gemiddelde.

      Vraag 2

      De binomiale distributie.

      Vraag 3

      Een type 1 fout betekent dat de nulhypothese wordt verworpen, terwijl deze waar is.

      Vraag 4

      0.99

      Vraag 5

      Nee, P > 0.05

      Hoe vergelijk je twee groepen met elkaar in de statistiek? - TentamenTests 7

       

      Meerkeuzevragen

      Vraag 1

      Myrthe doet onderzoek naar de kans op delirium bij chronisch alcoholgebruik. Ze vraagt participanten bij een verslavingszorginstituut op meerdere momenten deel te nemen. Wat voor soort onderzoeksdesign gebruikt ze?

      1. Cross-sectioneel
      2. Longitudinaal
      3. Experimenteel
      4. Experimenteel 2x2 design

      Vraag 2

      Peter doet onderzoek naar verschillende behandelvormen voor een eerste psychose. Hij vergelijkt de effecten van sociale vaardigheidstraining en cognitieve gedragstherapie. De eerste groep krijgt eerst 10 sessies sociale vaardigheidstraining en daarna 10 sessies cognitieve gedragstherapie, bij de tweede groep is de volgorde omgekeerd. Welke toets kan hij het beste gebruiken?

      1. Een significantietoets voor onafhankelijke groepen
      2. Een gepaarde t-toets
      3. Een vergelijking van z-scores
      4. Een z-score

      Open Vragen

      Vraag 1

      Welke nonparametrische test kun je gebruiken als je ordinale data gebruikt?

      Vraag 2

      Wanneer gebruik je McNemar’s test?

      Vraag 3

      Wat is het verschil tussen statistische significantie en praktische significantie?

      Antwoordindicatie Meerkeuzevragen

      Vraag 1

      B. Longitudinaal

      Vraag 2

      B. Een gepaarde t-toets

      Antwoordindicatie Open Vragen

      Vraag 1

      De Wilcoxon test.

      Vraag 2

      Als je gepaarde proporties wilt vergelijken.

      Vraag 3

      Een verschil dat statistisch significant is, kan in de praktijk zo klein zijn dat er geen merkbaar verschil is. Een verschil dat in de praktijk merkbaar is, is praktisch significant.

      Hoe kun je het verband tussen categorische variabelen analyseren? - TentamenTests 8

       

      Meerkeuzevragen

      Vraag 1

      Wat voor soort verdeling gebruik je als je percentages op basis van de totale groep weergeeft?

      1. Conditionele verdeling
      2. Marginale verdeling
      3. Simultane verdeling
      4. Normale verdeling

      Vraag 2

      Hoe interpreteer je de chi-kwadraattest? De hypothesen zijn: H0: de variabelen zijn statistisch onafhankelijk, Ha: de variabelen zijn statistisch afhankelijk.

      1. Hoe groter X², hoe groter het verschil tussen fe en fo. De nulhypothese wordt verworpen.
      2. Hoe groter X², hoe groter het verschil tussen fe en fo. De nulhypothese wordt aangenomen.
      3. Hoe groter X², hoe kleiner het verschil tussen fe en fo. De nulhypothese wordt verworpen.
      4. Hoe groter X², hoe kleiner het verschil tussen fe en fo. De nulhypothese wordt aangenomen.

      Open Vragen

      Vraag 1

      Wat meet je met de chi-kwadraattest van onafhankelijkheid?

      Vraag 2

      In de onderstaande tabel zie je de geobserveerde frequenties van lievelingskleuren voor jongens en meisjes.

       

      Blauw

      Rood

      Geel

      Totaal

      Jongens

      320

      70

      10

      400

      Meisjes

      580

      10

      10

      600

      Totaal

      900

      80

      20

      1000

      Bereken de verwachte frequenties.

      Vraag 3

      Voer de chi-kwadraattest voor onafhankelijkheid uit voor bovenstaande data over lievelingskleuren. Wat is je conclusie?

      Vraag 4

      Een onderzoeker bekijkt de samenhang tussen mate van alcoholgebruik en studieresultaat (allebei de variabelen hebben drie categorieën). De onderzoeker heeft 15 personen onderzocht en vindt een chi-kwadraat waarde van 1.3. Met hoeveel vrijheidsgraden moet hij toetsen?

      Vraag 5

      Om te toetsen of er een associatie is tussen geslacht en blowen (wel of niet blowen) tel je in een groep van 75 mannen en 69 vrouwen het aantal blowers en niet-blowers. Vervolgens voer je een chi-kwadraat test uit. Wat is het aantal vrijheidsgraden?

      Vraag 6

      Men wil weten of de ‘man/vrouw’-verhouding onder de werknemers van bedrijf A en B van elkaar verschillen. Op steekproefbasis stelt men vast dat de proportie man in van bedrijf A 0.40 en in bedrijf B 0.52 bedraagt. In beide gevallen zijn 100 studenten onderzocht. Toets de nulhypothese met de chikwadraattoets. Welke waarde heeft de toetsstatistiek?

      Vraag 7

      Een onderzoeker gaat na of het moment van geboorte van invloed is op of iemand een professionele turner wordt. Hiervoor zijn random 220 turners geselecteerd die de afgelopen 10 jaar hebben geturnd. Het kwartaal waarin ze geboren zijn is bepaald: eerste kwartaal 62, tweede kwartaal 69, derde kwartaal40 en het vierde kwartaal 49. Toets de nulhypothese met de chi-kwadraat-toets. Wat is de waarde van de toets statistiek?

      Antwoordindicatie Meerkeuzevragen

      Vraag 1

      C. Simultane verdeling.

      Vraag 2

      B. Hoe groter X², hoe groter het verschil tussen fe en fo. De nulhypothese wordt aangenomen.

      Antwoordindicatie Open Vragen

      Vraag 1

      In welke mate geobserveerde frequenties overeenkomen met verwachte frequenties.

      Vraag 2

      Verwachte frequenties zijn:

       

      Blauw

      Rood

      Geel

      Totaal

      Jongens

      360

      32

      8

      400

      Meisjes

      540

      48

      12

      600

      Totaal

      900

      80

      20

      1000

      Vraag 3

      X² = 83.44. Er is een significant verschil in lievelingskleur tussen jongens en meisjes.

      Vraag 4

      Hij moet 4 vrijheidsgraden toetsen.

      Vraag 5

      De variabele geslacht heeft twee klassen namelijk man en vrouw. De variabele blowen heeft er ook twee: wel blowen en niet blowen. Het aantal vrijheidsgraden is dan (2 - 1) x (2 - 1) = 1. Anders gezegd: er zijn vier mogelijke combinaties met de 2 x 2 klassen: vrouw en blowen, vrouw en niet blowen, man en blowen, en man en niet blowen. Als je de aantallen in een van de vier klassen kent, dan liggen de aantallen in de overige drie klassen vast, omdat je weet hoe groot de aantallen mannen en vrouwen zijn die je voor je toets hebt ondervraagd. Vandaar is het aantal vrijheidsgraden 1.

      Vraag 6

      2.899. Chi2 = (40-46)2/46 + (52-46)2/46 + (60-54)2/54 + (48-54)2/54
      Chi2 = 36/46 + 36/46 + 36/54 + 36/54 = .782 + .782 + .667 + 667 = 2.889

      Vraag 7

      9.20

        Hoe werken lineaire regressie en correlatie? - TentamenTests 9

         

        Meerkeuzevragen

        Vraag 1

        Welke waarde in een regressiefunctie is de constante waarde?

        1. y
        2. α
        3. β
        4. p

        Vraag 2

        Wanneer is een correlatie sterker?

        1. Als de waarde groter is
        2. Als de waarde kleiner is
        3. Als de waarde negatief is
        4. Als de waarde positief is

        Open Vragen

        Vraag 1

        Wat is het effect van een uitschieter op een lineaire regressielijn?

        Vraag 2

        Wat betekent R2 binnen de regressieanalyse?

        Vraag 3

        Waarom kun je beter niet extrapoleren met een regressieanalyse?

        Vraag 4

        Variabele X en Y hebben een R² van 0.15. Wat houdt dit in? Betekent dit een grote, een kleine of een gemiddelde correlatie?

        Vraag 5

        Welke drie eigenschappen van de relatie tussen X en Y worden er gemeten met een correlatie?

        Antwoordindicatie Meerkeuzevragen

        Vraag 1

        B. α

        Vraag 2

        A. Als de waarde groter is.

        Antwoordindicatie Open Vragen

        Vraag 1

        De regressie wordt onevenredig beïnvloed door de uitschieter, waardoor de andere waarden grotere residuen krijgen.

        Vraag 2

        R-kwadraat ofwel de determinatiecoëfficiënt. Dit is de meting van hoe goed de kleinste-kwadratenlijn ŷ = a + b(x) de y voorspelt in vergelijking tot de voorspelling van ȳ. De r2 geeft aan hoeveel procent de variantie van een conditionele distributie groter of kleiner is dan de variantie van een marginale distributie. In het kort, r2 meet hoe goed x de y voorspelt.

        Vraag 3

        Buiten het bereik van de geobserveerde data kan de vorm van de lijn anders lopen dan lineair, dus hier kunnen geen uitspraken over gedaan worden met extrapoleren.

        Vraag 4

        Dit houdt in dat het een gemiddelde correlatie is.

        Vraag 5

        De drie eigenschappen zijn 1) de richting van een relatie, 2) de vorm van een relatie en 3) de mate van een relatie.

        Welke vormen hebben multivariate verbanden? - TentamenTests 10

         

        Meerkeuzevragen

        Vraag 1

        Ilse doet onderzoek naar de erfelijkheid van intelligentie. Ze vindt een verband tussen het IQ van ouders en kinderen, maar het blijkt geen direct verband te zijn. IQ van de ouders heeft invloed op blootstelling aan educatief materiaal in de opvoeding, wat op zijn beurt invloed heeft op het IQ van het kind. Van welk soort relatie spreek je hier? Meer antwoorden zijn mogelijk:

        1. Onecht verband (spurious association)
        2. Kettingverband (chain relationship)
        3. Multipele oorzaken
        4. Onderdrukkende variabelen (suppressor variables)
        5. Statistische interactie
        6. Mediatie
        7. Moderatie

        Vraag 2

        Uit een sociaal-psychologisch onderzoek blijkt dat de hoeveelheid vrienden van een individu samenhangt met geluksgevoel. Dit verband is echter afhankelijk van persoonlijkheid: voor introverte personen geldt het verband niet zo sterk als voor extraverte personen. Van wat voor soort relatie spreek je hier?

        1. Onecht verband (spurious association)
        2. Kettingverband (chain relationship)
        3. Multipele oorzaken
        4. Onderdrukkende variabelen (suppressor variables)
        5. Statistische interactie

        Open vragen

        Vraag 1

        Een atleet gebruikt sportdrank voordat hij de 100 meter sprint op een wedstrijd loopt. Hij verbreekt zijn persoonlijke record. Waarom kun je niet stellen dat er sprake is van een causaal verband tussen het gebruik van sportdrank en de verbetering van prestatie?

        Vraag 2

        In de sociale wetenschappen is het belangrijk om controlevariabelen te gebruiken. Te veel controlevariabelen zijn echter ook niet wenselijk. Waarom?

        Vraag 3

        Wat is Simpson’s paradox?

        Antwoordindicatie Meerkeuzevragen

        Vraag 1

        Zowel B. Kettingverband (chain relationship) als F. Mediatie zijn goed.

        Vraag 2

        E. Statistische interactie

        Antwoordindicatie Open Vragen

        Vraag 1

        Een andere oorzaak kan niet uitgesloten worden, dus er kan niet met zekerheid gesproken worden van een causaal verband.

        Vraag 2

        Wanneer je veel controlevariabelen gebruikt, moet je de steekproef over veel verschillende categorieën verdelen, waardoor de steekproefgrootte per categorie erg klein wordt.

        Vraag 3

        Simpson’s paradox houdt in dat de richting van een verband verandert wanneer een controlevariabele wordt toegevoegd.

        Hoe analyseer je multipele regressie? - TentamenTests 11

         

        Meerkeuzevragen

        Vraag 1

        Welke vraag kun je niet met multipele regressie beantwoorden?

        1. Je wilt weten wat de invloed is van leeftijd, EQ en sociaal-economische status op alcoholgebruik.
        2. Je wilt weten of de relatie tussen geslacht en carrièresucces significant blijft als je corrigeert voor opleidingsniveau.
        3. Je wilt weten of er een verschil is in acceptatie van het homohuwelijk tussen verschillende culturele groepen.

        Vraag 2

        Welke analyse gebruik je als er sprake is van interactie tussen verschillende verklarende variabelen?

        1. Pearsons correlatie
        2. Partiële correlatie
        3. Cross-products
        4. Bivariate correlatie

        Vraag 3

        Met welk type correlatie kun je controleren voor extra variabelen?

        1. Partiële correlatie
        2. Bivariate correlatie
        3. Multipele correlatie
        4. Pearsons correlatie

        Vraag 4

        Multicollinariteit zorgt voor een hogere/lagere R2 waarde en is wel/niet goed wan-neer men de interactie tussen variabelen wil begrijpen.

        1. hogere, wel
        2. hogere, niet
        3. lagere, wel
        4. lagere, niet

        Open Vragen

        Vraag 1

        Hoe interpreteer je R2 in een multipele regressieanalyse?

        Vraag 2

        Wat is multicollineariteit?

        Vraag 3

        Wat is het verschil tussen de pearson correlatie en de multipele correlatie R?

        Vraag 4

        Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted R2 van 0.788 en model 2 van 0.793. Welke model is het betere model op basis van deze waarden?

        Antwoordindicatie Meerkeuzevragen

        Vraag 1

        C. Je wilt weten of er een verschil is in acceptatie van het homohuwelijk tussen verschillende culturele groepen.

        Vraag 2

        C. Cross-products

        Vraag 3

        A. Partiële correlatie

        Vraag 4

        B. hogere, niet

        Antwoordindicatie Open Vragen

        Vraag 1

        R2 geeft aan hoeveel de verklaarde variantie toeneemt als gevolg van een toegevoegde variabele. Hoe groter R2 is, hoe beter de verklarende variabelen y voorspellen.

        Vraag 2

        Multicollineariteit houdt in dat de verschillende verklarende variabelen onderling sterk correleren, waardoor ze minder verklaarde variantie toevoegen.

        Vraag 3

        Het verschil is dat de multipele correlatie altijd een waarde heeft tussen de 0 en 1. Deze correlatie kan dus niet negatief zijn. De pearson correlatie kan van -1 tot 1 lopen.

        Vraag 4

        Model 2, want die heeft een hogere R2, wat wijst om meer verklaarde variantie. Adjusted R2 is de multiple R2 plus een “straf” voor de complexiteit van het model. We zoeken modellen die het beste de data verklaren met het minst aantal verklarende variabele (simpleste model) en dat is wat de adjusted Rˆ2 doet; deze maat heeft een voorkeur voor eenvoudigere modellen. We kiezen hier dus voor model 2 omdat de grotere adjusted Rˆ2 een betere balance representeert tussen de grootte van de variantie van de rest-term en de complexiteit van het model. De adjusted Rˆ2 wordt gegeven door. AdjustedR2 =1− RSS/(n−d−1) TSS/(n−1) Met RSS de residual sum of squares en TSS de total sum of squares (sum of squares van de response variabele) Als het aantal verklarende variabele d toeneemt wordt de breuk groter en de Adjusted R2 kleiner, d is dus de straf die wordt opgelegd voor meer complexe modellen.

          Hoe werkt ANOVA? - TentamenTests 12

           

          Meerkeuzevragen

          Vraag 1

          Voor welk type variabele kun je ANOVA gebruiken?

          1. Een categorische verklarende variabele
          2. Een categorische responsvariabele
          3. Een kwantitatieve verklarende variabele
          4. Een kwantitatieve respons variabele

          Vraag 2

          Welke analyse gebruik je als je meerdere categorische verklarende variabelen hebt?

          1. Eenweg-ANOVA
          2. Tweeweg-ANOVA
          3. Multipele regressie
          4. Pearsons correlatie

          Vraag 3

          Welke methode gebruik je om meerdere vergelijkingen te maken met nauwe betrouwbaarheidsintervallen?

          1. Greenhouse-Geisser
          2. Bonferroni
          3. Mauchly
          4. Tukey

          Open Vragen

          Vraag 1

          Wat gebeurt er met de F-statistiek als het verschil tussen groepen in ANOVA kleiner wordt?

          Vraag 2

          In een ziekenhuis worden begeleidingstrajecten aangeboden voor mensen met chronische pijn. De effectiviteit van deze begeleidingstrajecten wordt onderzocht door drie condities met elkaar te vergelijken. Hieronder vind je de gemiddelde resultaten van de drie groepen. Is er sprake van significante verschillen?

          Conditie 1 (n = 6) Conditie 2 (n = 4) Conditie 3 (n = 4)

          M = 12 M = 10 M = 20

          SS = 14 SS = 9 SS = 10

          Vraag 3

          Wat zijn de drie aannames voor het uitvoeren van een ANOVA?

          Antwoordindicatie Meerkeuzevragen

          Vraag 1

          A. Een categorische verklarende variabele

          Vraag 2

          B. Tweeweg-ANOVA

          Vraag 3

          D. Tukey

          Antwoordindicatie Open Vragen

          Vraag 1

          F wordt kleiner.

          Vraag 2

          F(2, 11) = 11.5 / 3 = 3.83. Er is bij een alfaniveau van .05 geen sprake van significante verschillen.

          Vraag 3

          De drie aannames zijn: 1) homogeniteit van varianties, 2) normale verdeling van de error en 3) onafhankelijke scores

          Hoe werkt multipele regressie met zowel kwantitatieve als categorische predictoren? - TentamenTests 13

           

          Meerkeuzevragen

          Vraag 1

          Wat is er bijzonder aan covariantieanalyse?

          1. Er worden zowel kwantitatieve als categorische predictoren geanalyseerd
          2. Er is sprake van een categorische responsvariabele
          3. Er wordt gecontroleerd voor een variabele

          Vraag 2

          Hoe test je of een covariantiemodel beter past dan een andere regressielijn?

          1. Met een controlevariabele
          2. Met een gereduceerd model
          3. Met een test voor multicollineariteit
          4. Met een test voor heteroskedasticiteit

          Vraag 3

          In het model E(y) = α + βx + β1z1 + β2z2 worden er categorische dummyvariabelen gebruikt. Hoeveel categorieën zijn er?

          1. 1
          2. 2
          3. 3
          4. 4

          Vraag 4

          Er wordt een F-test gedaan om te beoordelen of een compleet model beter is of een gereduceerd model. Het complete model is E(y) = α + βx + β1z1 + β2z2 en het gereduceerde model is E(y) = α + βx. De P-waarde is 0,00003 en er wordt gekozen voor het complete model. Wat was de nulhypothese?

          1. H0 : α = 0
          2. H0 : β = 0
          3. H0 : β1 = β2 = 0
          4. H0 : z1 = z2 = 0

          Antwoordindicatie Meerkeuzevragen

          Vraag 1

          C. Er wordt gecontroleerd voor een variabele

          Vraag 2

          B. Met een gereduceerd model

          Vraag 3

          B. 2

          Vraag 4

          C. H0 : β1 = β2 = 0 is de beste manier om deze nulhypothese op te schrijven, D. H0 : z1 = z2 = 0 komt op hetzelfde neer.

          Hoe construeer je een model voor multipele regressie van extreme of sterk gecorreleerde data? - TentamenTests 14

           

          Meerkeuzevragen

          Vraag 1

          Wat weet je over de vorm van de functie als x2 positief is?

          1. Het is een bergparabool
          2. Het is een dalparabool
          3. Het is een negatieve lineaire functie
          4. Het is een exponentiële functie

          Open Vragen

          Vraag 1

          Welke vorm moet een functie hebben om te voldoen aan de assumpties van regressie?

          Vraag 2

          Jonathan doet onderzoek naar de duurzaamheid van chocolade en kijkt of het land van herkomst, de grootte van de cacaoplantage en de locatie van de fabriek toegevoegde waarde hebben voor een regressiemodel door ieder van de drie variabelen één voor één toe te voegen. Welke selectiemethode gebruikt hij?

          Vraag 3

          Carolien wil weten of het aantal historische monumenten en het aantal musea in een stad samenhangen met het aantal toeristen dat de stad bezoekt. Eerder had ze gedacht dat de gemiddelde prijs van vliegtickets en het aantal uren zon invloed hebben op het toerisme. Daarom voegt ze aan haar regressie nu de nieuwe variabelen toe en verwijdert ze de oude. Welke selectiemethode gebruikt Carolien?

          Vraag 4

          Hoe interpreteer je R2 bij polynomiale regressie?

            Antwoordindicatie Meerkeuzevragen

            Vraag 1

            A. Het is een bergparabool

            Antwoordindicatie Open Vragen

            Vraag 1

            Een lineaire functie

            Vraag 2

            Forward selection

            Vraag 3

            Stepwise regression

            Vraag 4

            Bij polynomiale modellen verwijst R² niet naar de sterkte van het verband, maar naar de vermindering van schattingsfouten.

              Hoe werkt logistische regressie? - TentamenTests 15

               

              Meerkeuzevragen

              Vraag 1

              Wat voor soort verdeling heeft de Wald statistiek?

              1. Een F-distributie.
              2. Een chi-kwadraatdistributie.
              3. Een normale verdeling.
              4. Een t-distributie.

              Vraag 2

              Bij logistische regressie is er enkel een verband tussen X en de:

              1. De odds.
              2. De kans om bij groep 1 te horen.
              3. De log(odds) (logit).
              4. De odds ratio.

              Open Vragen

              Vraag 1

              Wat test je met logistische regressie?

              Vraag 2

              Vanaf welke waarde van een gestandaardiseerd residu past een model niet bij de data?

              Vraag 3

              Wat is de belangrijkste assumptie in het proportional odds model?

              Antwoordindicatie Meerkeuzevragen

              Vraag 1

              B. Een chi-kwadraatdistributie.

              Vraag 2

              C. De log(odds) (logit).

              Antwoordindicatie Open Vragen

              Vraag 1

              Logistische regressie test of de kans van iedere categorie van een binaire responsvariabele afhankelijk is van de verklarende variabele.

              Vraag 2

              Ongeveer 3

              Vraag 3

              Dat het effect van de verklarende variabele x gelijk is voor iedere cumulatieve proportie.

               

              Image

              Access: 
              Public

              Image

              Join WorldSupporter!
              Search a summary

              Image

               

               

              Contributions: posts

              Help other WorldSupporters with additions, improvements and tips

              Add new contribution

              CAPTCHA
              This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
              Image CAPTCHA
              Enter the characters shown in the image.

              Image

              Spotlight: topics

              Check the related and most recent topics and summaries:
              Activities abroad, study fields and working areas:

              Image

              Check how to use summaries on WorldSupporter.org

              Online access to all summaries, study notes en practice exams

              How and why use WorldSupporter.org for your summaries and study assistance?

              • For free use of many of the summaries and study aids provided or collected by your fellow students.
              • For free use of many of the lecture and study group notes, exam questions and practice questions.
              • For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
              • For compiling your own materials and contributions with relevant study help
              • For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

              Using and finding summaries, notes and practice exams on JoHo WorldSupporter

              There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

              1. Use the summaries home pages for your study or field of study
              2. Use the check and search pages for summaries and study aids by field of study, subject or faculty
              3. Use and follow your (study) organization
                • by using your own student organization as a starting point, and continuing to follow it, easily discover which study materials are relevant to you
                • this option is only available through partner organizations
              4. Check or follow authors or other WorldSupporters
              5. Use the menu above each page to go to the main theme pages for summaries
                • Theme pages can be found for international studies as well as Dutch studies

              Do you want to share your summaries with JoHo WorldSupporter and its visitors?

              Quicklinks to fields of study for summaries and study assistance

              Main summaries home pages:

              Main study fields:

              Main study fields NL:

              Follow the author: Vintage Supporter
              Work for WorldSupporter

              Image

              JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

              Working for JoHo as a student in Leyden

              Parttime werken voor JoHo

              Statistics
              2284 1