TentamenTests bij de meestvoorkomende statistiekonderwerpen tijdens je studie - Bundel
- 3715 reads
Wanneer wordt logistische regressie gebruikt?
Wat voor vorm heeft de lijn van een logistische regressie?
Bij logistische regressie is er enkel een verband tussen X en de:
In een Logistische regressie model is een dichotome voorspeller opgenomen. X1 heeft een regressiecoëfficiënt van 0.568. Het model heeft een constante van -3.734. Een individu beschikt over kenmerk X1. Hoe groot is de kans dat hij bij de doelgroep hoort?
Een onderzoeker wil een logistische regressie analyse uitvoeren op zijn verkregen data over het wel of niet hebben van een depressie, uit een steekproef van 150 respondenten. De voorspellende variabelen zijn van intervalniveau en de afhankelijke variabele is dichotoom. Hij vindt onder andere dat een aantal van zijn voorspellers sterk correleren met elkaar, dat de voorspellers lineair gerelateerd zijn aan de log kansen en dat de errors afhankelijk zijn van elkaar. Is het verstandig om een LRA uit te voeren?
I. Bij dichotome variabelen wordt het aanwezig zijn van een kenmerk/variabele gecodeerd met 1 en he niet aanwezig zijn met 0.
II. LRA probeert te voorspellen tot welke groep een individu behoort door de kans te berekenen dat het individu tot de responsgroep behoort.
Hoe interpreteer je een significante omnibus-test?
Met welke test kun je het logistische regressiemodel evalueren en hoe werkt deze test?
Hoe bereken je het percentage accuraat geclassificeerde gevallen (PAC)?
Gegeven is de volgende Classification Table van een onderzoek waarin een behandeling wel/niet succesvol is geweest.
Welke percentages missen bij A en B?
Wat is logistische regressie?
Wanneer is er sprake van multinomiale logistische regressie?
Hoe kun je de niet-lineaire relatie toch lineair maken?
Wat is de R-statistiek?
Wat is de Wald statistiek?
Wat geeft de odds ratio weer?
Wanneer komen onderdrukkende effecten voor?
Wat betekent het streven naar parsimonie?
Wat is de assumptie van lineairiteit waar aan voldaan moet worden?
Wanneer ontstaat complete scheiding?
Wanneer is er sprake van overspreiding?
Wat wordt er gerapporteerd bij een logistische regressie?
Wat moet je doen om de assumptie van lineairiteit te testen bij logistische regressie?
Wat gebruik je bij multinomiale regressie om groepslidmaatschap van meer dan twee categorieën te voorspellen?
Als er een categorische afhankelijke variabele, en kwantitatieve of dichotome onafhankelijke variabelen zijn.
Een S-vorm
C
0.04
Nee, er is sprake van multicollineariteit. Dit is een aanname voor logistische regressie die dan geschonden is, dus daarom mogen we in dit geval geen logistische regressie uitvoeren.
C
De varianties van de voorspeller zijn in dit geval niet gelijk verdeeld.
Met de -2LL-test. Deze test bekijkt of de set van de onafhankelijke variabelen de afhankelijke variabelen beter dan kans kunnen voorspellen. Er wordt getoetst of tenminste één voorspeller een significante contributie, verschillend van 0, heeft. Hoe hoger de -2LL, hoe minder goed het model bij de data past.
Dit is het aantal correct geclassificeerde gevallen gedeeld door het totaal aantal geclassificeerde gevallen.
A = 66.7 / B= 64.3
Logistische regressie is multipele regressie waarbij de uitkomstvariabele categorisch is, en de predictorvariabelen continu of categorisch zijn.
Er is sprake van multinomiale logistische regressie als er meer dan twee categorieën zijn.
Je maakt de relatie lineair door het gebruik van een logaritmische transformatie.
De R-statistiek is de partiële correlatie tussen de uitkomstvariabele en elk van de voorspellervariabelen.
De Wald statistiek is de z-statistiek die gebruikt wordt om de contributie van de voorspellers aan het model te bepalen.
De odds ratio geeft de verandering in kans weer die komt door de verandering in de predictor.
Onderdrukkende effecten komen voor wanneer een voorspeller een significant effect heeft maar alleen wanneer een andere variabele constant wordt gehouden.
Streven naar parsimonie betekent dat een eenvoudige verklaring van een fenomeen te verkiezen is boven een ingewikkelde verklaring.
De assumptie houdt in dat er sprake moet zijn van een lineaire relatie tussen de continue voorspellers en de logit van de uitkomstvariabele.
Complete scheiding ontstaat als de uitkomstvariabele perfect wordt voorspeld door een voorspeller of een combinatie van voorspellers.
Er is sprake van overspreiding wanneer de geobserveerde variabele groter is dan de verwachte variabele uit een logistisch regressiemodel.
Bij logistische regressie rapporteer je de b-waardes, de standaard meetfouten en de significantie.
Je voert de logistische regressieanalyse opnieuw uit, maar voegt predictors toe die de interactie zijn van elke predictor en de log van zichzelf.
Bij multinomiale logistische regressie gebruik je ook logistische regressie om groepslidmaatschap van meer dan twee categorieën te voorspellen.
Wat is het verschil tussen een onafhankelijke en een afhankelijke variabele? Beschrijf beide begrippen.
In onderzoek worden over het algemeen verschillende soorten variabelen gemeten. Vul in welke termen ontbreken in de volgende zin:
De ......... variabele heeft invloed op de ......... variabele
Wat is een quasi-onafhankelijke variabele?
Bekijk onderstaande twee definities van het begrip prestatie-motivatie.
I. Iemand krijgt de opdracht een toren van lucifers te bouwen. Prestatie-motivatie is het aantal keren dat iemand dit probeert voordat hij/zij de poging opgeeft.
II. Prestatie-motivatie is het vermogen om jezelf te bewegen tot een bepaalde prestatie. Zijn deze definities conceptueel of operationeel?
Wat houdt correlationeel onderzoek in?
Een onderzoeker wil nagaan in welke mate hoogbegaafdheid bij kinderen op de basisschool samengaat met gedragsproblemen in de klas. Welk soort onderzoek is geschikt om deze vraagstelling te onderzoeken?
Wat is het doel van correlationeel onderzoek?
Bij een steekproef hoort een .........; bij een populatie hoort een..........
Een steekproeffout ontstaat doordat:
Een onderzoeker wil invloed van de hoeveelheid glucose in het bloed op geluksgevoel vaststellen. Hij meet concentraties van 2 mmol/L tot 10 mmol/L.
Wat zijn de absolute grenswaarden van de concentratie glucose?
Er wordt onderzoek gedaan naar de bereidheid van drugsverslaafden in Nederland om zich te laten opnemen in een kliniek. Een groep van 100 verslaafden wordt geselecteerd om vragenlijsten te beantwoorden. Wat is de populatie in dit onderzoek?
Welk soort data beschrijft de populatie?
Lydia doet onderzoek naar de invloed van kauwgum kauwen op concentratie bij jongeren. Ze selecteert deelnemers op verschillende middelbare scholen om mee te doen aan haar experiment. Wat is hier de populatie en wat is de steekproef?
Op welke formule zijn alle statistische modellen gebaseerd?
Een onafhankelijke variabele is een variabele die gemanipuleerd
.....read moreWat is de afhankelijke variabele?
Wat is een continue variabele?
Wat is het verschil tussen correlationeel en experimenteel onderzoek?
Wat is het verschil tussen variabelen en parameters?
Wat is het verschil tussen continue en discrete variabelen?
In een demografische vragenlijst wordt naar opleidingsniveau gevraagd, waarbij de antwoordopties zijn: basisschool, voortgezet onderwijs, middelbaar onderwijs en hoger onderwijs. Wat voor soort variabele is ‘opleidingsniveau’ in dit geval?
Er wordt op de Universiteit Utrecht onderzoek gedaan naar het zelfbeeld van eerstejaars studenten. Ze moeten vragen beantwoorden op een schaal van 1 (laag) tot 7 (hoog). Op wat voor niveau wordt er gemeten?
Joost doet een opiniepeiling onder studenten en trekt een steekproef op iedere universiteit in Nederland. Wat voor soort steekproeftrekking is dit?
Iemand beweert over een bepaalde variabele dat de score van Elise twee keer zo groot is als die van Adriaan. Welk meetniveau moet de variabele ten minste hebben om deze uitspraak te kunnen doen?
In een onderzoek wordt de variabele Intelligentie op de volgende manier gemeten: 1 = IQ lager dan 70 2 = IQ tussen 71 en 90 3 = IQ tussen 91 en 110 4 = IQ tussen 111 en 120 5 = IQ hoger dan 120 Welk meetniveau heeft deze variabele?
In een onderzoek wordt gekeken naar het verband tussen sekse, leeftijd en cognitieve vaardigheden. Welke van deze variabelen kunnen in psychologisch onderzoek uitsluitend een rol spelen als onafhankelijke variabele?
De afhankelijke variabele is de variabele die gezien wordt als uitkomst.
Een continue variabele is een score die iedere waarde kan aannemen die op de meetschaal wordt gebruikt.
Het verschil tussen correlationeel en experimenteel onderzoek is dat bij experimenteel onderzoek de variabelen worden gemanipuleerd en bij correlationeel onderzoek niet.
Het verschil tussen variabelen en parameters is dat parameters geschat worden, en variabelen gemeten.
Een continue variabele kan oneindig opgedeeld worden, terwijl een discrete variabele bestaat uit vaste waarden.
Een variabele is discreet wanneer de mogelijke waarden alleen bepaalde, afzonderlijke nummers zijn. Een variabele is continu wanneer de waarden alle mogelijke waarden kunnen aannemen.
B
B
A
D
Ordinaal. Een ordinale schaal bestaat uit een set van categorieën die in een duidelijke volgorde georganiseerd zijn. Je kunt deelnemers aan een zangwedstrijd bijvoorbeeld op volgorde zetten van beste tot slechtste op basis van het applaus dat ze ontvangen. We kunnen echter niet perfect
.....read moreWat zijn de drie voorwaarden voor causaliteit?
Van elf willekeurig gekozen studenten is direct na afloop van tentamen M&T nagegaan hoeveel van de 40 vragen zij goed beantwoord hebben. Deze scores zijn weergegeven in onderstaande stemplot. 0 2 6 6 1 0 8 9 2 1 3 4 6 8 9
Bepaal de waarde van de Mediaan.
Wat is de mediaan van de scores 4-6-8-10-18?
Wat is de mediaan van de volgende rij getallen: 8, 9, 14, 15?
De getallen zijn al gerangschikt van klein naar groot. Er zijn een even aantal (8) getallen. De mediaan is dan het gemiddelde van de twee middelste getallen: 9 en 14.
Welke centrummaat kun je gebruiken voor categorische variabelen?
Welke weergave kan worden gebruikt om de observaties van een kwantitatieve variabele in kaart te brengen?
Wat is de interkwartielafstand?
Welke maat beschrijft de typische afstand tot het gemiddelde in een distributie?
De volgende 5 begrippen worden veel gebruikt om kenmerken van een statistische variabele samen te vatten: minimum, maximum, 1e kwartiel, 3e kwartiel, mediaan. Wat is de goede volgorde, van klein naar groot?
Wat houdt errorvariantie in?
Hoe wordt de standaarddeviatie berekend uit de variantie?
Om een indruk te krijgen van de relatie tussen aantal gerookte sigaretten per dag en tijdsduur nodig om 2 km te joggen maak je van deze gegevens van een aantal proefpersonen een grafiek. Welke variabele zet je op de x-as?
Welke stelling is juist?
Stelling 1: Een normaal curve houdt rekening met het gemiddelde en de standaarddeviatie van de data
Stelling 2: De kernel dichtheidsplot houdt rekening met het gemiddelde en de standaarddeviatie van de data
Eigenschappen van een normaal curve zijn: (er kunnen meerdere antwoorden goed zijn)
Welke centrale tendentie maat kan gebruikt worden bij een variabele van nominaal meetniveau?
Bekijk de volgende scores:
11 15 19 26 37
Welke onderstaande uitspraak is onjuist?
Er wordt een onderzoek gedaan naar het gemiddelde IQ van kinderen op een school in Leiden. Er wordt een steekproef van 6 kinderen genomen. Hieronder staan hun scores.
Leerling 1 2 3 4 5
.....read moreWat is het verschil tussen betrouwbaarheid en validiteit, twee centrale begrippen binnen de statistiek?
Uit welke twee onderdelen bestaat de totale variantie in een dataset van scores?
Tussen welke twee waardes kan de betrouwbaarheid van een meting liggen?
Welke drie soorten betrouwbaarheid worden er onderscheiden?
Hoe wordt de split-halfbetrouwbaarheid berekend?
Wat is het verschil tussen interne en externe validiteit?
Een studie-adviseur probeert studiesucces te voorspellen. Hij neemt bij een groep eerstejaars studenten een vragenlijst af die motivatie meet. Aan het einde van hun eerste jaar bekijkt hij of studenten het jaar succesvol hebben afgesloten. Vervolgens bepaalt hij de correlatie met de score op de vragenlijst. Van welke soort validiteit is hier sprake?
Een onderzoeker heeft vastgesteld dat hogere niveaus van testosteron bij jonge mannen samenhangen met verhoogd risicovol gedrag tijdens het autorijden. In een vervolgstudie vindt hij hetzelfde verband in een steekproef jonge vrouwen. Van welke soort validiteit is dit een voorbeeld?
Wat betekent validiteit?
Wanneer is een onderzoek betrouwbaar?
De betrouwbaarheid houdt in dat het meetinstrument consistente resultaten geeft. Als je twee keer dezelfde meting doet, geeft een betrouwbaar meetinstrument twee keer hetzelfde resultaat. Validiteit beschrijft of het gemeten concept inderdaad gemeten wordt door het meetinstrument.
De totale variantie bestaat uit variantie door ware scores en variantie door meetfouten (errorvariantie en systematische variantie).
Tussen de 0 en 1.
Test-hertest betrouwbaarheid, interitem betrouwbaarheid en interbeoordelaar betrouwbaarheid.
Bij de split-halfbetrouwbaarheid worden de items over twee sets verdeeld. Daarna wordt voor elke set een totaalscore berekend. Vervolgens wordt er een correlatie tussen beide sets berekend. Als de items in beide sets hetzelfde construct meten, dan zou er een hoge correlatie tussen beide sets moeten zijn.
Bij interne validiteit gaat het erom dat een onderzoeker juiste conclusies trekt over de effecten van de onafhankelijke variabele, externe validiteit gaat over de mate waarin resultaten generaliseerbaar zijn naar andere steekproeven.
Predictieve criteriumvaliditeit. We spreken van predictieve validiteit wanneer een meetinstrument onderscheid kan maken tussen mensen op een gedragscriterium in de toekomst, dus of het instrument een goede voorspelling kan geven. Vooral in de onderwijssetting is dit van belang.
Externe validiteit. Externe validiteit gaat over de mate waarin gevonden onderzoeksresultaten generaliseerbaar zijn naar andere steekproeven
Validiteit is de mate waarin het instrument daadwerkelijk meet wat je wil meten.
Een onderzoek is betrouwbaar wanneer het instrument dezelfde uitkomst geeft bij dezelfde condities.
Wat is het gemiddelde en de standaardafwijking van de standaardnormaalverdeling?
Iemand kiest geblinddoekt 4 knikkers uit een mand met oneindig veel knikkers. De helft is rood, de andere helft groen. Hoe groot is de kans dat hij vier groene knikkers trekt?
In een aselecte steekproef van 20 eerstejaars studenten in Groningen zijn er 12 thuiswonend. Wat is het 95%-betrouwbaarheidsinterval?
Wat is de kritieke Z-waarde die je gebruikt bij de bepaling van een 92%-betrouwbaarheidsinterval voor het gemiddelde?
Er wordt gezegd dat 55% van de huwelijken in de staat Californië (USA) binnen 15 jaar eindigt in een echtscheiding. 15 jaar geleden is er een groot onderzoek gestart waarbij honderden huwelijken in Californië zijn gevolgd. Stel, er worden random 100 van deze huwelijken geselecteerd. Wat is de exacte vorm van de steekproevenverdeling (sampling distribution) van het aantal van deze huwelijken dat eindigt in een echtscheiding?
Een onderzoeker bekijkt de samenhang tussen mate van alcoholgebruik en studieresultaat (beide variabelen hebben drie categorieën. Hij heeft 15 personen onderzocht, en vindt een chi-kwadraat waarde van 1.3. Met hoeveel vrijheidsgraden moet hij toetsen?
Om te toetsen of er een associatie is tussen geslacht en rook gedrag (wel of niet roken) tel je in een groep van 75 mannen en 69 vrouwen het aantal rokers en niet-rokers. Vervolgens voer je een chi-kwadraat test uit. Wat is het aantal vrijheidsgraden?
Men wil weten of de ‘man/vrouw’-verhouding onder de werknemers van bedrijf A en B van elkaar verschillen. Op steekproefbasis stelt men vast dat de proportie man in van bedrijf A 0.40 en in bedrijf B 0.52 bedraagt. In beide gevallen zijn 100 studenten onderzocht. Toets de nulhypothese met de chikwadraattoets. Welke waarde heeft de toetsstatistiek?
Een onderzoeker gaat na of het moment van geboorte van invloed is op of iemand een professionele turner wordt. Hiervoor zijn random 220 turners geselecteerd die de afgelopen 10 jaar hebben geturnd. Het kwartaal waarin ze geboren zijn is bepaald: eerste kwartaal 62,tweede kwartaal 69, derde kwartaal40 en het vierde kwartaal 49. Toets de nulhypothese met de chi-kwadraat-toets. Wat is de waarde van de toetsstatistiek?
Waar wordt kappa voor gebruikt?
Wat is de waarde van de toetsingsgrootheid χ 2?
Stelling 1: De normaalverdeling is een symmetrische, unimodale verdeling
Stelling 2: T-scores werken met een gemiddelde van 0 en een standaarddeviatie van 1
Welke stelling is juist?
Bij een onderzoek naar het IQ van basisschoolkinderen behaalt één kind een bijzondere score: 145. Het gemiddelde IQ is 100 met een standaarddeviatie van 15. Hoeveel standaarddeviaties wijkt de score van het kind af van het gemiddelde?
Wat is het verschil tussen een parameter en een statistiek?
Welke drie soorten nonprobability samples zijn er?
In een onderzoek naar de patiënten van psychiatrische inrichtingen in Nederland wordt de steekproef als volgt getrokken. Eerst trekt men at random een aantal inrichtingen uit de complete lijst van Nederlandse psychiatrische inrichtingen. Uit elk van die inrichtingen wordt vervolgens at random een aantal patiënten getrokken. Wat voor steekproef is dit?
Een onderzoeker wil weten in hoeverre alcoholgebruik samenhangt met studieresultaten. Zij hangt op een prikbord op de universiteit een briefje waarop drinkende studenten worden opgeroepen om deel te nemen aan het onderzoek. Er melden zich 33 studenten. Wat voor steekproef is dit?
Hoe bereken je de standaardafwijking?
Wat geeft een z-score aan?
Welk kenmerk is onderscheidend van de verdeling van steekproefgemiddelden?
Wat is waar met betrekking tot de vorm van de verdeling van steekproefgemiddelden?
Welk van de volgende kenmerken wordt niet beschreven door de centrale limiettheorie?
Wat is het verschil tussen standaarddeviatie en standaardfout?
Wat is het effect van steekproefgrootte op de uitkomst van een hypothesetest?
Bereken de kans dat een steekproefgemiddelde groter is dan 100 bij een steekproef van 25 proefpersonen uit een populatie met gemiddelde 90 en standaarddeviatie 10.
Welke van de volgende stellingen is juist?
I) Als de samplegrootte toeneemt, neemt de waarde van de standaardfout ook toe.
II) De standaardfout speelt een belangrijkere rol in beschrijvende statistiek in vergelijking
met inferentiële statistiek
Aan welke voorwaarde(n) moet de verdeling van sample gemiddelden voldoen om normaal te zijn?
Noem twee invloeden op de standaardfout.
Wat is de relatie tussen betrouwbaarheid en de steekproeffout?
Wanneer gebruik je een t-score in
.....read moreEen onderzoeker wil bestuderen of een medicijn effectief is. Wat zou de nulhypothese stellen over dit medicijn?
Wat is de relatie tussen power en alfaniveau?
Hieronder staan vijf stellingen. Zijn deze stellingen goed of fout?
Welke assumpties liggen ten grondslag aan hypothesetoetsing met z-scores?
Wat is een type 1 fout?
Waarom wordt de type 1 fout als iets ernstigs gezien?
In welke situatie is het waarschijnlijk dat een type 2 fout voorkomt?
Welke factoren kunnen een hypothesetest beïnvloeden? Noem er 3.
Waarom is een statistisch significant effect niet gelijk aan een substantieel effect?
De null hypothese stelt dat het medicijn geen effect heeft.
Als het alfaniveau groter wordt, wordt de power ook groter. Oftewel: de kans op een significant effect wordt groter.
Goed, fout, fout, goed, goed
Random sampling;
Onafhankelijke observaties;
De waarde van σ verandert niet door de behandeling;
Normale sampling distributie.
Een Type I-fout betekent dat de nulhypothese verworpen wordt, terwijl die eigenlijk aangenomen had moet worden. Met andere woorden, er wordt een significant effect gerapporteerd terwijl er in werkelijkheid geen effect is.
Een onderzoeker kan het effect rapporteren en op basis daarvan kunnen foutieve beslissingen en aannames worden gemaakt.
Als het behandeleffect erg klein is; het kan dan moeilijk zijn om het effect te detecteren.
De grootte van het verschil tussen gemiddelden;
De variabiliteit van de scores en
Het aantal scores in de sample.
Statistisch significant houdt in dat het effect groter is dan op kansbasis verwacht zou worden. Kans wordt in dit geval gemeten door middel van de standaardfout, die sterk beïnvloed kan worden door de samplegrootte. Als de sample groot is, kan de standaardfout erg klein zijn, waardoor een heel klein behandeleffect nog steeds significant kan zijn, maar niet substantieel is.
Waar kan een bias voorkomen?
Welke drie typen bias kunnen ontstaan in een steekproef?
Waarom zijn uitschieters een belangrijke bron van bias?
Waarom is de aanname van lineariteit zeer belangrijk?
Wat betekent homoscedasticiteit?
Hoe kun je de assumpties van homoscedasticiteit en lineariteit tegelijk bekijken?
Wat kun je doen om bias te verminderen?
Wat wordt er bedoeld met de zogenaamde selectiebias?
Bias kan voorkomen bij de schattingen van de parameters, de standard error en het betrouwbaarheidsinterval, en de test statistieken en p-waarden.
Sampling bias, response bias en nonresponse bias
Uitschieters zijn een belangrijke bron van bias, omdat die het gemiddelde enorm omhoog of omlaag kunnen brengen.
De aanname van lineariteit is belangrijk omdat het model niet meer klopt als de variabelen geen lineair verband vertonen.
Homoscedasticiteit betekent dat alle groepen een ongeveer gelijke variantie hebben.
De assumpties van homoscedasticiteit en lineariteit kun je tegelijk bekijken door een scatterplot te gebruiken.
Om bias te verminderen kun je bepaalde extreme scores verwijderen, uitschieters vervangen door de hoogste score die geen uitschieter is, je data analyseren met robuuste methodes en de data transformeren.
Dit houdt in dat de manier waarop je je participanten selecteert, kan leiden tot een vertekend beeld. Denk bijvoorbeeld aan internet-enquêtes. Mensen die geen internet hebben selecteer je hierdoor automatisch niet.
Wat is het verschil tussen beschrijvende en inferentiële statistiek?
Myrthe kijkt naar de jaarlijkse uitgaven van gezinnen in verschillende regio’s in Nederland over de periode 1980 tot afgelopen jaar. Gebruikt zij inferentiële of beschrijvende statistiek?
Een arbeidspsycholoog doet onderzoek naar werkstress bij startende ondernemers. Hij gebruikt gegevens van de Kamer van Koophandel en vindt dat 62% van de ondernemers man is, en 38% vrouw. Van de ondernemers die aan zijn onderzoek meedoen, rapporteert 73% van de vrouwen bovengemiddelde stress, tegenover 45% van de mannen. Hij voorspelt dat vrouwelijke ondernemers vaker last zullen krijgen van burn-outklachten. Welk deel in het onderzoek is beschrijvende statistiek, en welk deel is inferentieel?
Hoe wordt de vorm van statistiek genoemd die zich bezig houdt met het trekken van conclusies?
Hoe wordt de waarde die het meest consistent is met de geobserveerde data genoemd?
In een marktonderzoek naar online winkelgedrag zegt 79% van een steekproef van 1200 personen regelmatig online producten te bestellen. Bereken het 95% betrouwbaarheidsinterval.
In een onderzoek naar de houding van jongeren tegenover het vuurwerkverbod wordt een steekproef gedaan. In de steekproef van 500 middelbare scholieren is 56% voor en 44% tegen. Bereken het 99% betrouwbaarheidsinterval.
Hoe kun je het betrouwbaarheidsinterval verkleinen?
Een vrouwenblad plaatst een poll met de stelling ‘Mijn vriendinnen gaan voor mijn familie’. 883 lezeressen nemen deel aan de poll. Wat is de geschatte standaardfout als 36% het eens is?
Beschrijvende statistiek wordt gebruikt voor het samenvatten, organiseren en vereenvoudigen van data.
Inferentiële statistiek dient om samples te bestuderen en vervolgens te generaliseren naar de populaties waaruit ze geselecteerd zijn. Dit wordt gebruikt om voorspellingen te doen.
Beschrijvende statistiek. Als ze met haar onderzoek voorspellingen zou doen over de uitgaven van gezinnen in het huidige jaar, dan zou het inferentiële statistiek zijn.
De verdeling mannelijke/vrouwelijke ondernemers is beschrijvend, evenals het percentage ondernemers in beide groepen dat bovengemiddelde stress rapporteert. De voorspelling over burn-outklachten is inferentieel.
Inferentiële statistiek.
Deze methode gaat er vanuit dat de onafhankelijke variabele effect heeft gehad, wanneer het verschil tussen de gemiddelden van de condities groter is dan dat we zouden verwachten op basis van alleen toeval. We vergelijken daarom de groepsgemiddelden die we gevonden hebben met de groepsgemiddelden die we verwachtten te vinden als er alleen sprake zou zijn van errorvariantie. Deze methode geeft helaas geen zekerheid. We kunnen alleen de kans vaststellen dat de verschillen in groepsgemiddelden het gevolg zijn van errorvariantie.
C
Se = = 0.012. Dit is de standaardfout. 0.012 x 1.96 = 0.02. Het 95% betrouwbaarheidsinterval is 0.79 ±
.....read moreWelke waarde in een regressiefunctie is de constante waarde?
y
α
β
ε
Wanneer is een correlatie sterker?
Als de waarde groter is
Als de waarde kleiner is
Als de waarde negatief is
Als de waarde positief is
Wat betekent R2 binnen de regressieanalyse? Wat is R2?
Waarom kun je beter niet extrapoleren met een regressieanalyse?
Wat houdt een positieve relatie tussen twee variabelen in?
Wat geeft de covariantie aan?
Wat is Pearson correlatie coëfficiënt?
Wat is een bivariate correlatie?
Waarom is er bij correlatie niet automatisch sprake van causaliteit?
Wat is het coëfficiënt van determinatie?
Wat is Spearman correlatie coëfficiënt?
Wanneer wordt de Kendall’s tau gebruikt?
Wanneer gebruik je de biseriële correlatie coëfficiënt?
Wat is de partiële correlatie?
Wat is het verschil tussen semi-partiële correlatie en partiële correlatie?
Wat gebruik je om correlaties te vergelijken?
Wat moet je doen om de effectgrootte te berekenen?
Wat wordt precies geanalyseerd wanneer er een regressieanalyse uitgevoerd wordt?
Wat wordt bedoeld met residuen?
Heeft een goed model een hoge F-ratio of juist een lage?
Wat betekent een regressiecoëfficiënt van 0?
Wat is een probleem bij de forwardmethode van invoer?
Wat is een probleem bij de stapsgewijze invoer?
Wat wordt bedoeld met een uitschieter?
Wat is het effect van een uitschieter op een lineaire regressielijn?
Waaraan moeten de meetniveaus van een regressieanalyse voldoen?
Wat is multicollineariteit? En welke drie problemen ontstaan er bij vergrote multicollineariteit?
Wat is homoscedasticiteit?
Wat test je met de Durbin-Watson test?
Wat is crossvalidatie? En door middel van welke twee methodes kan dit?
Wat geeft het betrouwbaarheidsinterval aan?
Wat is verklaarde variantie?
Wat zijn dummy variabelen?
Wat doet een mediërende variabele?
Wat is een modererend effect?
Welke drie eigenschappen van de relatie tussen X en Y worden er gemeten met een correlatie?
Variabele x en y hebben een r² van 0.15. Betekent dit een grote, een kleine of een gemiddelde correlatie?
Wanneer wordt de phi-coëfficiënt gebruikt?
Een bedrijfspsycholoog is voor 100 werknemers nagegaan wat hun bloeddruk (X) is en hoeveel winst (Y) hun bedrijf maakt. Voor deze gegevens berekent hij het gemiddelde, de variantie en de covariantie. Het gemiddelde van x = 80 , het gemiddelde van y = 60, sX² = 25, SY² = 36 en de Covariantie =
.....read moreWat is het verschil tussen de pearson correlatie en de multipele correlatie R?
Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted R2 van 0.788 en model 2 van 0.793. Welke model is het betere model op basis van deze waarden?
In een model zijn twee partiële correlaties gevonden tot de afhankelijke variabele: rx1y= 0.6, rx2y=0.4. De verklaarde variantie is 60%. Hoeveel variantie wordt verklaard door beide variabelen?
Gegeven is de volgende SPSS tabel:
Wat is de gestandaardiseerde vergelijking?
Wat is de betekenis van B in de tabel bij de vorige vraag?
Welke uitspraak over het evalueren van individuele voorspellers is juist?
Wat zijn de assumpties voor multipele regressie?
In een regressie analyse bij data van 150 personen is het regressiegewicht van X2 niet significant, maar de correlatie is toch hoog: 0.6. Verdere gegevens: correlatie X1 en Y = 0.8, correlatie X1 en X2 = 0.8. Wat kan hiervoor de verklaring zijn?
Welke uitspraak over (semi)-partiële correlaties is juist?
Wat is multicollineariteit?
Multicollinariteit zorgt voor een hogere/lagere R2 waarde en is wel/niet goed wanneer men de interactie tussen variabelen wil begrijpen.
Hoe kun je multicollineariteit testen?
Wanneer is er sprake van moderatie?
Welke vraag kun je niet met multipele regressie beantwoorden?
Je wilt weten wat de invloed is van leeftijd, EQ en sociaal-economische status op alcoholgebruik.
Je wilt weten of de relatie tussen geslacht en carrièresucces significant blijft als je corrigeert voor opleidingsniveau.
Je wilt weten of er een verschil is in acceptatie van het homohuwelijk tussen verschillende culturele groepen.
Hoe interpreteer je
.....read moreWanneer wordt logistische regressie gebruikt?
Wat voor vorm heeft de lijn van een logistische regressie?
Bij logistische regressie is er enkel een verband tussen X en de:
In een Logistische regressie model is een dichotome voorspeller opgenomen. X1 heeft een regressiecoëfficiënt van 0.568. Het model heeft een constante van -3.734. Een individu beschikt over kenmerk X1. Hoe groot is de kans dat hij bij de doelgroep hoort?
Een onderzoeker wil een logistische regressie analyse uitvoeren op zijn verkregen data over het wel of niet hebben van een depressie, uit een steekproef van 150 respondenten. De voorspellende variabelen zijn van intervalniveau en de afhankelijke variabele is dichotoom. Hij vindt onder andere dat een aantal van zijn voorspellers sterk correleren met elkaar, dat de voorspellers lineair gerelateerd zijn aan de log kansen en dat de errors afhankelijk zijn van elkaar. Is het verstandig om een LRA uit te voeren?
I. Bij dichotome variabelen wordt het aanwezig zijn van een kenmerk/variabele gecodeerd met 1 en he niet aanwezig zijn met 0.
II. LRA probeert te voorspellen tot welke groep een individu behoort door de kans te berekenen dat het individu tot de responsgroep behoort.
Hoe interpreteer je een significante omnibus-test?
Met welke test kun je het logistische regressiemodel evalueren en hoe werkt deze test?
Hoe bereken je het percentage accuraat geclassificeerde gevallen (PAC)?
Gegeven is de volgende Classification Table van een onderzoek waarin een behandeling wel/niet succesvol is geweest.
Welke percentages missen bij A en B?
Wat is logistische regressie?
Wanneer is er sprake van multinomiale logistische regressie?
Hoe kun je de niet-lineaire relatie toch lineair maken?
Wat is de R-statistiek?
Wat is de Wald statistiek?
Wat geeft de odds ratio weer?
Wanneer komen onderdrukkende effecten voor?
Wat betekent het streven naar parsimonie?
Wat is de assumptie van lineairiteit waar aan voldaan moet worden?
Wanneer ontstaat complete scheiding?
Wanneer is er sprake van overspreiding?
Wat wordt er gerapporteerd bij een logistische regressie?
Wat moet je doen om de assumptie van lineairiteit te testen bij logistische regressie?
Wat gebruik je bij multinomiale regressie om groepslidmaatschap van meer dan twee categorieën te voorspellen?
Als er een categorische afhankelijke variabele, en kwantitatieve of dichotome onafhankelijke variabelen zijn.
.....read moreWat is het voordeel van ANOVA boven t-toetsen?
Welke toets wordt gebruikt om de homoscedasticiteit te toetsen?
Wat zijn de drie aannames voor het uitvoeren van een ANOVA?
Hoe kan de F-waarde berekend worden uit een gegeven t-waarde?
Bezie onderstaande stellingen over de ANOVA, en geef aan welke stelling(en) juist is/zijn.
I. De sterkte van een bepaald effect in de ANOVA is R².
II. De F-waarde in een ANOVA tabel is te berekenen door de gemiddelde kwadratensom van het model te delen door de gemiddelde kwadratensom van de error.
Uit een ANOVA tabel zijn de volgende gegevens bekend. Wat is de F-waarde?
SS between groups: 400
SS within groups: 150
df between groups: 4
df within groups: 16
Uit een onderzoek naar het effect van therapie op depressie is het resultaat in onderstaande ANOVA-tabel gepresenteerd. Patiënten zijn door middel van toevalsmatige toewijzing in drie verschillende groepen ingedeeld. De patiënten uit groep 1 kregen gedragstherapie, de patiënten uit groep 2 kregen cognitieve gedragstherapie en de patiënten uit groep 3 kregen geen therapie (controle groep). De afhankelijke variabele is angstklachten na afloop van de therapie.
Blijkt uit bovenstaande tabel dat de therapieën significant verschillen in effectiviteit bij α = . 05?
In een ANOVA wordt onderzocht wat het effect is van 4 typen compost op de groei van rozen. Voor elk type compost zijn er 10 rozenplanten gekweekt en gewogen. Wat is het aantal vrijheidsgraden voor behandeling?
Waarvoor worden post-hoc toetsen gebruikt bij ANOVA?
Wat houdt het in als contrasten orthogonaal aan elkaar zijn?
Voor welk type variabele kun je ANOVA gebruiken?
Een categorische verklarende variabele
Een categorische responsvariabele
Een kwantitatieve verklarende variabele
Een kwalitatieve verklarende variabele
Wat gebeurt er met de F-statistiek als het verschil tussen groepen in ANOVA kleiner wordt?
Welke methode gebruik je om meerdere vergelijkingen te maken met nauwe betrouwbaarheidsintervallen?
Greenhouse-Geisser
Bonferroni
Mauchly
Tukey
In een ziekenhuis worden begeleidingstrajecten aangeboden voor mensen met chronische pijn. De effectiviteit van deze begeleidingstrajecten wordt onderzocht door drie condities met elkaar te vergelijken. Hieronder vind je de gemiddelde resultaten van de drie groepen. Is er sprake van significante verschillen?
Conditie 1 (n = 6) Conditie 2 (n = 4) Conditie 3 (n = 4)
M = 12 M = 10 M = 20
SS = 14 SS = 9 SS = 10
Het doel
.....read moreWanneer is sprake van een significant interactie effect?
Hoe bereken je de vrijheidsgraden voor het interatie-effect van A en B?
De volgende informatie is nodig bij het beantwoorden van de volgende twee vragen:
In 2010 is er een onderzoek uitgevoerd naar gevoelens van spijt ten aanzien van relaties en verschillen in die gevoelens tussen mannen en vrouwen. De proefgroep bestond uit 40 vrouwen en 29 mannen, gemiddelde leeftijd 19 jaar (sd = 1.18). Elke deelnemer heeft een vragenlijst ingevuld volgens de volgende instructies: Als je terugkijkt op je relatie is er dan iets waar je spijt van hebt? Iets dat je anders had willen doen. Iets waar je wel of juist geen actie had willen ondernemen. Bram en Timo moeten voor hun statistiekcursus een onderzoekje doen. Na het lezen van een artikel over het onderzoek naar spijtgevoelens hebben ze zelf een soortgelijk onderzoek gedaan. Samen hebben ze een lijstje opgesteld met potentieel genante of ongemakkelijke situaties die in relaties voorkomen (de vraag “Ben ik te dik?” met “Ja” beantwoorden, samen naar de sauna, enz.). Veertig medestudenten worden gevraagd om mee te werken aan dit onderzoek: 20 vrouwelijke studenten en 20 mannelijke studenten. Ze worden gevraagd aan te geven hoeveel spijt ze hebben van de beschreven situaties (waar 0 ‘geen spijt’ en 10 ‘heel erg veel spijt’ betekent). De helft van de vrouwen en de helft van de mannen wordt gevraagd de vragen te beantwoorden over een romantische relatie (een vaste vriend of vriendin), de andere helft wordt gevraagd dit te doen over een vriendschappelijke relatie (een goede vriend of vriendin).
SPSS output van de analyseresultaten van de verzamelde data is hieronder gegeven:
De vrijheidsgraden ontbreken in de SPSS output. Hoeveel vrijheidsgraden zijn er voor het interactie-effect tussen sekse en soort relatie?
Wat is de waarde van de toetsingsgrootheid die de verschillen in mate van spijtscores toetst tussen de romantische relaties en de vriendschappelijke relaties?
In een onderzoek naar "de mate van seksueel voorgelicht zijn door ouders" wordt een vragenlijst ingevuld over seksualiteit en promiscuïteit door zowel de jongens als de meisjes. Wanneer we de gemiddelde promiscuïteitsscores willen vergelijken tussen jongens en meisjes en tussen niet en wel voorgelichte jongeren, welke analysetechniek moeten we dan gebruiken?
Welke effectmaat wordt gebruikt bij een factoriele anova?
Is het verstandig om 4 factoren te gebruiken in een ANOVA?
Welke analyse gebruik je als je meerdere
.....read moreWaarom gebruik je bij dit experiment een ancova?
Om welke twee redenen is het handig om covariaten toe te voegen?
Wanneer wordt gewerkt met aangepaste groepsgemiddeldes?
Welke drie specifieke aannamen gelden er voor de ancova? - Geen error in de covariaat - lineaire relatie met de afhankelijke variabele - parallellisme.
Wat zijn nadelen van het gebruik van covariaten?
Wanneer voer je een ANCOVA uit?
Wat zijn covariaten?
Wat zijn de twee redenen om een covariaat mee te nemen in de analyse?
ANCOVA heeft dezelfde assumpties als ANOVA maar wat zijn de twee bijvoegingen?
Bij ANCOVA hebben we de partial eta squared, wat is dit?
Wat is de assumptie van homogeniteit van regressiecoëfficiënten?
Wanneer kan de omega squared gebruikt worden bij ANCOVA?
Waarmee kan bij ANCOVA de de effectgrootte van de contrasten berekend worden?
Het is een ANCOVA omdat het model zowel categorische als numerieke verklarende variabelen bezit
Het toevoegen van covariaten maakt het mogelijk om de effecten van factoren accurater en specifieker te testen door (1) vermindering van errorvariantie en (2) eliminatie van systematische bias (statistische controle).
Vraag 4
Covariaten moeten met mate worden gebruikt omdat ze een vrijheidsgraad kosten en moeilijk te interpreteren zijn.
Als een ANOVA een continue variabele bevat die ook effect heeft op de afhankelijke variabele kan deze in de analyse worden meegenomen als covariaat.
Continue variabelen die de uitkomstvariabele ook voorspellen.
Onafhankelijke relatie tussen het covariaat en de afhankelijke variabele en homogeniteit van regressiecoëfficiënten.
Dit is de hoeveelheid variantie in de afhankelijke variabele die door de onafhankelijke variabele wordt gedeeld maar niet door het covariaat wordt verklaard.
ω2 kan gebruikt worden bij gelijke groepsgroottes.
Met een t-toets kan de effectgrootte van de contrasten berekend worden.
Dit houdt in dat de relatie tussen de afhankelijke variabele en het covariaat binnen alle groepen gelijk moet zijn anders is het model inaccuraat.
Wanneer wordt manova gebruikt?
Wanneer is het niet slim om een manova te doen?
Een professor realiseert zich dat hij een probleem heeft, maar wil zijn ene significante resultaat toch graag publiceren. Hij corrigeert voor het feit dat hij 20 keer dit onderzoek heeft herhaald met een Bonferroni correction. Neem alpha = 0.05. Bonferroni geeft advies om de alpha te verlagen zodat voor alle experimenten samen de kans op een Type I fout onder de 0.05 blijft. Welke waarde voor alpha adviseert Bonferroni aan te houden?
Wat zijn de twee redenen voor het uitvoeren van een manova in plaats van meerdere anova’s?
Bezie onderstaande stellingen over manova, en geef aan welke stelling(en) juist is/zijn.
I. Een voordeel van een multivariaat factor ontwerp is dat het laat zien hoe onafhankelijke variabele interacteren zodat ze invloed hebben op de afhankelijke variabele.
II. De waarde van Wilk’s lambda geeft het proportie onverklaarde variantie.
Wat is het verschil tussen de manova en de discriminantanalyse (DA)?
Wat wordt er getoetst met de box-M toets?
Wat is het maximaal aantal discrimantfunctievariaten?
Wat zijn de twee belangrijkste nadelen van DA?
Wat is een MANOVA?
Waarom voeren we een MANOVA uit en geen losse ANOVA’s?
Wat is het voordeel van het uitvoeren van een MANOVA?
Welke aanvullende assumpties gelden er voor de MANOVA?
Wanneer kan er gebruik gemaakt worden van een MANOVA?
Welke stelling is juist?
1. Het nadeel bij gebruik van meerdere ANOVA’s is een grotere meetfout en een grotere kans op type I fouten.
2. Het nadeel bij gebruik van meerdere ANOVA’s is dat er niet gekeken wordt naar de relatie van de afhankelijke variabelen onderling.
Wanneer wordt een matrix een identiteitsmatrix genoemd?
Wat is het verschil tussen een random-effects en een fixed-effects model?
Waardoor wordt het verschil in effectgroottes veroorzaakt bij het vergelijken van fixed-factor modellen?
In het random-effects model, zijn in alle steekproeven de levels van de onafhankelijke variabele random genomen van de levels van de populatie. Hierdoor kunnen er generalisaties gemaakt worden over alle levels van de populatie. In het fixed-effects model worden eerst de levels van de onafhankelijke variabele geselecteerd, waarna de onderwerpen (subjects) random worden toegewezen aan de levels van de onafhankelijke variabele.
De verschillen in effectgrootte uit verschillende studies komt door random steekproeferror
Een toets die de proporties van een populatie distributie toetst noemt men:
Bij een chi-kwadraat toets wordt er verwacht dat 49% van de populatie in categorie A valt en 51% in categorie B, wat is de verwachte frequentie van categorie A bij een steekproef van 500 mensen:
Op een bepaalde middelbare school is 55 % van de populatie man en 45% vrouw, in een steekproef op een schoolfeest worden 385 mannen en 215 vrouwen geteld, wat is de waarde van χ2 voor de man-vrouw verhouding op het feest:
Een waarde van χ2 = 11,05, bij df = 5 en α = .05:
In chi-kwadraat toets for goodness of fit waarin kinderen worden onderverdeeld in lievelingskleur (rood, blauw of geel) en vervolgens elke kleur geteld, is het aantal vrijheidsgraden:
De test die frequentie-data gebruikt om de relatie tussen twee variabelen te evalueren, heet:
Bij een chi-kwadraat toets voor onafhankelijkheid, met een variabele met 3 categorieën en een variabele met 5 categorieën, is het aantal vrijheidsgraden:
Bij een chi-square test met een 2x3 matrix, gebruik je voor effect size:
Bij het bereken van Cramer’s V bij een 2 x 4 matrix, is de waarde van de vrijheidsgraden:
De assumptie(s) waaraan voldaan moet worden bij een chi-kwadraat toets voor onafhankelijkheid is/zijn:
Een onderzoeker gebruikt een goodness of fit-toets om bij 120 mensen te toetsen hoe hard ze rijden binnen de bebouwde kom op vijf verschillende plekken. Hoeveel vrijheidsgraden moet hij gebruiken?
Een onderzoeker is geïnteresseerd in de verschillen tussen jongens en meisjes op het gebied van alcoholgebruik. Ze worden ingedeeld in drie categorieën: weinig drinken, gemiddeld drinken en veel drinken. Wat voor toets kan het beste gebruikt worden om de verschillen te toetsen?
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
Op zoek naar een uitdagende job die past bij je studie? Word studentmanager bij JoHo !
Werkzaamheden: o.a.
Interesse? Reageer of informeer
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Field of study
Add new contribution