Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
- Hoe kunnen data grafisch worden weergegeven? - TentamenTests 1
- Hoe kunnen data numeriek worden beschreven? - TentamenTests 2
- Hoe werkt kansberekening? - TentamenTests 3
- Hoe kun je kansmodellen gebruiken voor discrete wilekeurige variabelen? - TentamenTests 4
- Hoe kun je kansmodellen gebruiken voor continue willekeurige variabelen? - TentamenTests 5
- Hoe kun je een goede steekproef uit de populatie verkrijgen? - TentamenTests 6
- Hoe kun je schattingen verkrijgen voor een enkele populatie? - TentamenTests 7
- Hoe kun je parameters schatten voor twee populaties? - TentamenTests 8
- Hoe kun je hypothesen opstellen voor een enkele populatie? - TentamenTests 9
- Welke testprocedures zijn er voor het verschil tussen twee populaties? - TentamenTests 10
- Hoe werkt een enkelvoudige regressie? - TentamenTests 11
- Hoe werkt een meervoudige regressie? - TentamenTests 12
- Welke andere onderwerpen zijn belangrijk in regressie analyse? - TentamenTests 13
- Hoe kun je categorische data analyseren? - TentamenTests 14
- Hoe werkt de analyse van variantie? - TentamenTests 15
- Hoe kun je data met metingen in de loop van de tijd analyseren? - TentamenTests 16
- Welke andere procedures zijn er beschikbaar voor het trekken van steekproeven? - TentamenTests 17
Hoe kunnen data grafisch worden weergegeven? - TentamenTests 1
Vragen
Geef bij vragen 1-4 aan of elk van de volgende variabelen categorisch of numeriek is. Als de variabele categorisch is, geef dan het meetniveau op. Als de variabele numeriek is, geeft u het meetniveau op en geeft aan of de variabele discreet of continu is.
Vraag 1
Het aantal aandelen van een aandeel gekocht door een makelaar
Vraag 2
De nationaliteit van een student
Vraag 3
Het gemiddelde cijfer van een student
Vraag 4
De temperatuur in graden Celsius
Vraag 5
Bij een bezoek aan een nieuw geopende H&M winkel kregen klanten een kort onderzoek. Is het antwoord op elk van de volgende vragen categorisch of numeriek? Geef, indien categorisch, het meetniveau op. Indien numeriek, is het discreet of continu?
- Is dit je eerste bezoek aan deze H&M winkel?
- Op een schaal van 1 (zeer ontevreden) tot 5 (zeer tevreden), hoe tevreden bent u met de aankoop (en) van vandaag?
- Wat waren de kosten van uw aankoop (en)?
Toeristen die Kroatië bezoeken, worden gevraagd een enquête in te vullen. Het onderzoek bestaat uit verschillende vragen over hoe zij hun vakantie hebben ervaren. De vragen worden hieronder gegeven (vraag 6 - 10). Beschrijf voor elke vraag het type verkregen gegevens.
Vraag 6
Welke van de volgende gebieden heb je bezocht?
- Kust
- Eilanden
- Bergen
- De hoofdstad (Zagreb).
Vraag 7
Heb je een zeilboot gehuurd?
- Ja
- Nee
Vraag 8
Wat was het gemiddelde bedrag dat u per dag aan eten uitgeeft?
Vraag 9
Wat zou u aanbevelen als het optimale aantal dagen voor toeristen om in Kroatië door te brengen?
Vraag 10
Hoe vaak zou u aanbevelen om Kroatië te bezoeken?
- Elk jaar
- Eens in de vijf jaar
- Een keer in het leven
- Nooit
Vraag 11
Een beheerder onderzoekt de reiskosten van faculteitsleden die verschillende congressen hebben bijgewoond. Hij ontdekte dat 36% van de reiskosten werd besteed aan transportkosten, 17% werd besteed aan accommodatie, 13% werd uitgegeven aan voedsel; 9% werd besteed aan vergaderkosten, 10% aan registratiekosten en de rest werd besteed aan diverse kosten.
- Maak een cirkeldiagram voor deze gegevens
- Maak een staafdiagram voor deze gegevens
Vraag 12
Een bedrijf heeft zeven codes gedefinieerd voor mogelijke defecten voor een van zijn producten. Construeer een Pareto-diagram voor de volgende frequenties:
Defect code | A | B | C | D | E | F | G |
Frequentie | 10 | 70 | 15 | 90 | 8 | 4 | 3 |
Vraag 13
Maak een tijdreeksplot voor de volgende gegevens van klanten die in een nieuw winkelcentrum in een bepaalde week winkelen.
Dag | Aantal klanten |
Maandag | 516 |
Dinsdag | 534 |
Woensdag | 451 |
Donderdag | 487 |
Vrijdag | 558 |
Zaterdag | 641 |
Zondag | 830 |
Vraag 14
Bepaal een geschikte intervalbreedte voor een willekeurige steekproef van 370 waarnemingen met scores die tussen 40 en 200 liggen.
Vraag 15
Maak een stam-en-bladweergave voor de volgende gegevens.
17 | 16 | 15 | 17 | 17 |
20 | 30 | 25 | 25 | 14 |
12 | 18 | 31 | 26 | 26 |
12 | 15 | 16 | 16 | 28 |
Vraag 16
Beschouw de gegevens van vraag 15. Maak een histogram voor deze gegevens.
Vraag 17
Beschouw de gegevens van vraag 15. Is de verdeling van deze gegevens symmetrisch, links scheef of rechts scheef?
Vraag 18
Maak een spreidingsplot bij de volgende gegevens.
- (3, 10)
- (2, 8)
- (3, 12)
- (4, 15)
- (6, 20)
- (5, 15)
- (4, 12)
Vraag 19
De volgende tabel toont de leeftijd van faculteitsleden die zijn gepromoveerd aan de grootste universiteit van Nederland.
Leeftijd | Percentage |
26 - 28 | 18.00 |
29 - 32 | 23.50 |
33 - 40 | 30.51 |
41 - 55 | 12.99 |
56+ | 15.00 |
Hoeveel procent van de faculteitsleden die zijn gepromoveerd, is 46 jaar of ouder?
Vraag 20
Beschouw de gegevens van vraag 19. Welk percentage van het faculteitslid dat promoveerde, is jonger dan 33 jaar?
Vraag 21
Maak een relatieve cumulatieve frequentieverdeling van de gegevens beschreven bij vraag 19.
Vraag 22
Stel dat we 200 observaties hebben. Wat zijn de cumulatieve frequenties voor de gegevens die bij vraag 18 zijn beschreven?
Vraag 23
Interpreteer de cumulatieve frequenties van vraag 22.
Vraag 24
De volgende gegevens worden gepresenteerd:
Leeftijd | 30 -40 | 40 -50 | 50 - 60 | 60 - 70 |
Number | 12 | 13 | 22 | 34 |
Beschrijf de mogelijke fouten in deze tabel.
Vraag 25
Stel dat het bedrag dat iemand per maand aan filmtickets uitgeeft (in euro's) is:
6.0, 5.3, 4.0, 5.7, 10.0, 8.4, 2.5, 10.0, 9.5, 0.0, 5.0, 10.0
Welke grafische weergave is geschikt om deze gegevens visueel weer te geven?
vraag 26
Uit een survey blijkt dat 32% van de shoppers in Duitsland met een inkomen van minder dan 50.000 online winkelt. Van de resterende 68% winkelt de helft van de particulieren nooit, en de andere helft winkelt door naar de eigenlijke winkel te gaan. Gebruik een cirkeldiagram om deze gegevens te plotten.
Vraag 27
Vier soorten betaalrekeningen worden aangeboden door een bank. Stel dat een willekeurige steekproef van 300 klanten werd ondervraagd en enkele vragen stelde. Het bleek dat 60% van de respondenten de voorkeur gaf aan "Easy Checking", 12% aan "Intelligent Checking", 18% aan "Super Checking" en de rest aan "Ultimate Checking". Van de deelnemers die Easy Checking hebben gekozen, waren er 100 vrouwen. Van degenen die voor Intelligent Checking hebben gekozen, was een derde vrouw. Van degenen die Super Checking verkozen, was de helft vrouwelijk. Ten slotte was 80% van degenen die voor Ultimate Checking hebben gekozen, vrouw. Beschrijf de gegevens met een kruistabel.Beschouw de gegevens van vraag 27. Hoeveel vrouwen zijn er in totaal en hoeveel mannen?
Vraag 28
Beschouw de gegevens van vraag 27. Hoeveel vrouwen zijn er in totaal en hoeveel mannen?
Vraag 29
Beschouw de gegevens van vraag 27. Welk type grafische weergave is geschikt voor deze gegevens?
- Histogram
- Spreidingsplot
- Tijdreeksplot
- Staafdiagram
Vraag 30
Welk type grafische weergave is geschikt voor twee numerieke variabelen?
Antwoordindicatie
Vraag 1
numeriek; interval; discreet
Vraag 2
categorisch; nominaal
Vraag 3
numeriek; ratio; continu
Vraag 4
numeriek; interval; continu
Vraag 5
a = categorisch; nominaal
b = categorisch; ordinaal
c = numeriek; continu
Vraag 6
Zowel categorisch (nominale gegevens, binair gecodeerd: ja / nee) als numeriek (discreet) door het aantal gebieden dat men heeft bezocht.
Vraag 7
categorisch; nominaal; binair gecodeerd.
Vraag 8
numeriek; interval; continu.
Vraag 9
numeriek; interval; discreet.
Vraag 10
categorisch; ordinale.
Vraag 11
a.
b.
Vraag 12
Een Pareto-diagram is geordend van de hoogste naar de laagste frequentie.
Vraag 13
Vraag 14
Volgens de beknopte handleiding kan een steekproef van 370 worden geschat door acht tot tien klassen.
Met behulp van de formule voor opbrengsten met intervalbreedte:
w = (200 - 40) / 8 = 20; of
w = (200 - 40) / 10 = 16
Een geschikte intervalbreedte ligt dus ergens tussen 16 en 20.
Vraag 15
1 | 2, 2, 4, 5, 5, 6, 6, 6, 7, 7, 7, 8
2 | 0, 5, 5, 6, 6, 8
3| 0, 1
Vraag 16
Vraag 17
Rechts-scheef verdeeld (positief scheef); the staart ligt aan de rechterkant van de distributie.
Vraag 18
Vraag 19
12.99 + 15.00 = 27.99%
Vraag 20
18.00 + 23.50 = 41.50%
Vraag 21
Leeftijd | Percentage |
26 - 28 | 18.00 |
29 - 32 | 41.50 |
33 - 40 | 72.01 |
41 - 55 | 85.00 |
56+ | 100.00 |
Vraag 22
De cumulatieve frequenties voor 200 waarnemingen zijn: 36, 82, 144, 170, 200.
Vraag 23
Voor steekproefgrootte n = 200 zijn er 36 personen die zijn gepromoveerd tussen de leeftijd van 26 en 28. Er zijn 82 personen die zijn gepromoveerd vóór de leeftijd van 33. Er zijn 144 personen die zijn gepromoveerd vóór de leeftijd van 41 , enzovoorts.
Vraag 24
Een mogelijke fout ligt in de grenzen van de frequentieklassen. Ten eerste is er geen boven- en ondergrens, waardoor (mogelijk) sommige observaties worden uitgesloten. Ten tweede is het onduidelijk uit deze frequentieverdeling, tot welke klasseobservaties zoals 30 en 40 behoren.
Vraag 25
Een tijdreeksplot zou hier geschikt zijn. Gegevens worden gegeven voor t aantal tijdpunten, met t = 12.
Vraag 26
Vraag 27
Type rekening | Vrouw | Man | Totaal |
Easy Checking | 100 | 80 | 180 |
Intelligent Checking | 12 | 24 | 36 |
Super checking | 27 | 27 | 54 |
Ultimate Checking | 24 | 6 | 30 |
Totaal | 163 | 137 | 300 |
Vraag 28
Er zijn 163 vrouwen en 137 mannen in de steekproef van 300 deelnemers.
Vraag 29
D, een staafdiagram. De andere grafieken zijn geschikt in het geval van numerieke variabelen. Hier hebben we frequenties voor twee categorische variabelen. Dit wordt het best weergegeven door een staafdiagram (of cirkeldiagram).
Vraag 30
Een spreidingsplot.
Hoe kunnen data numeriek worden beschreven? - TentamenTests 2
Vragen
Vraag 1
De volgende vijf random getallen zijn getrokken uit de populatie:
18 71 80 80 84
Bereken het gemiddelde, de mediaan en de modus.
Vraag 2
In een onderzoek worden het aantal auto's dat de grens tussen Israël en Jordanië passeert, bijeghouden. Over een periode van zes dagen worden de volgende aantallen gevonden:
16 21 12 19 1 2
Bereken het gemiddelde, de mediaan en de modus.
Vraag 3
Uit de gegevens van de Rijksuniversiteit Groningen over een periode van 12 jaar blijkt de volgende procentuele toename van het aantal ingeschreven studenten:
4.1 3.2 3.5 4.5 5.1 3.8
2.1 2.2 3.1 5.1 1.5 1.0
Bereken het gemiddelde, de mediaan en de modus
Vraag 4
De financiën van het afgelopen decennium worden herzien. De gegevens worden per jaar getoond.
2.51 3.74 4.15 5.33 6.18
6.65 7.18 6.92 6.95 7.54
Bereken het gemiddelde en de mediaan
Vraag 5
In de afgelopen jaren zijn veel landen geconfronteerd met ontvolking. We hebben gegevens verzameld voor tien landen wat betreft het aantal basisscholen dat in deze periode gesloten is:
10 6 13 5 11 5 6 3 7 9
a. Bereken het gemiddelde, de mediaan en de modus.
b. Geef de vijf-getallen samenvatting (five-number-summary).
Vraag 6
Een textielfabrikant neemt een steekproef van 50 bouten en inspecteert zorgvuldig elke bout. Op basis van deze inspectie registreert de fabrikant het aantal onvolkomenheden. De volgende contingentietabel wordt verkregen:
Aantal onvolkomenheden | 0 | 1 | 2 | 3 |
Aantal bouten | 33 | 12 | 4 | 1 |
Bereken het gemiddelde, de mediaan en de modus.
Vraag 7
Bereken de variantie en standaarddeviatie voor de volgende data:
6 8 10 12 14 9 11 7 13 11
Vraag 8
Bereken de variantie en standaarddeviatie voor de volgende data:
5 -3 0 2 -1 7 4
Vraag 9
Beschouw twee verschillende beleggingen, voorraad A en voorraad B. De gemiddelde slotkoers voor voorraad A is 4,00 en de gemiddelde slotkoers voor voorraad B is 80,00. Het gemiddelde rendement is hetzelfde voor zowel voorraad A als voorraad B. Stel nu dat de standaarddeviaties aanzienlijk verschillen, met SA = 2,00 en SB = 8,00 . Bereken de variatiecoëfficiënt voor deze voorbeeldgegevens en vergelijk deze concurrerende investeringsmogelijkheden.
Vraag 10
Bereken de variatiecoëfficiënt voor de volgende gegevens:
13 15 12 14 11
Vraag 11
Een set gegevens is bij benadering normaal verdeeld met een gemiddelde van 300 en een variantie van 144. Ongeveer welk deel van de waarnemingen is:
a. groter dan 288?
b. minder dan 324?
c. groter dan 336?
Vraag 12
Het aantal auto's dat gedurende een periode van 35 door een tunnel rijdt, is als volgt:
60 70 74 56 84 54 50
47 80 71 50 95 121 90
75 84 70 61 110 64 80
85 85 43 76 60 91 90
60 87 110 85 44 94 69
a. Wat is het gemiddelde aantal auto's?
b. Wat is de standaarddeviatie?
c. Wat is de variatiecoëfficiënt?
Vraag 13
Gebruik de gegevens van vraag 12. Maak een stam-en-blad diagram van het aantal auto's dat door de tunnel rijdt. Bepaal vervolgens het interkwartielbereik.
Vraag 14
Geef de samenvatting met vijf cijfers voor de voorbeeldgegevens van vraag 12.
Vraag 15
De dagelijkse wisselkoers van EUR naar USD voor zeven werkdagen is:
1,14 1,14 1,13 1,13 1,12 1,11
Over dezelfde periode is de dagelijkse wisselkoers van EUR van JPY:
110 110 109 109 108 109
a. Vergelijk de middelen van deze twee verdelingen.
b. Vergelijk de standaardafwijkingen van deze twee verdelingen.
Vraag 16
Een bedrijf produceert gloeilampen met een gemiddelde levensduur van 1200 uur en een standaardafwijking van 50 uur. Bereken de z-score voor een gloeilamp met een levensduur van maar 1.120.
Vraag 17
Gebruik de z-score berekend bij vraag 16. Welk percentage gloeilampen heeft een levensduur langer dan 1120 uur?
Vraag 18
Gebruik opnieuw de gegevens van vraag 16. Bereken de z-score die overeenkomt met een gloeilamp met een levensduur van 1.300 uur duurt.
Vraag 19
Welk percentage gloeilampen gaat langer dan 1300 uur mee?
Vraag 20
Stel dat een student die tijdens zijn eerste semester van de universiteit in totaal 15 ECTS heeft behaald. Hij ontving één A, één B, één C en één D. Stel nu dat een waarde van 4 wordt toegewezen aan een A, een waarde van 3 wordt toegewezen aan een B, een waarde van 2 wordt toegewezen aan een C, en een waarde van 1 wordt toegewezen aan een D. Bereken de GPA van het semester van de student.
Vraag 21
Gebruik de gegevens van vraag 20. Nu is elke cursus echter niet hetzelfde aantal studiepunten waard. De A werd behaald in een cursus met 3 studiepunten Engels, de B werd behaald in een cursus biologie van 3 studiepunten, de C werd behaald in een cursus biologie met 4 studiepunten en de D werd behaald in een cursus Spaans met 5 studiepunten. Bereken met dit gewicht opnieuw de gewogen GPA van het semester van de student.
Vraag 22
Gebruik de volgende gegevens voor vragen 22-25:
xi | wi |
4.7 | 8 |
3.8 | 7 |
5.7 | 4 |
2.6 | 3 |
5.5 | 2 |
Wat is het rekenkundig gemiddelde van de xiwaarden?
Vraag 23
Wat is het gewogen gemiddelde van de xi-waarden?
Vraag 24
Wat is de steekproefvariantie?
Vraag 25
Wat is de standaarddeviatie van de steekproef?
vraag 26
Gebruik de volgende gegevens voor vragen 26-28:
(15,45) (6,18) (11,33) (12,36) (16,48), (14,42)
(5,15) (17,51) (4,12) (19,57), (7,21)
Bereken de covariantie.
Vraag 27
Bereken de correlatiecoëfficiënt
Vraag 28
Schets een spreidingsplot om de relatie tussen de twee variabelen weer te geven.
Gebruik de volgende gegevens voor vragen 29-30.
Quiz score (x) | 4 | 3.4 | 3 | 5 | 1.1 |
Examen score (y) | 100 | 66 | 78 | 80 | 3 |
Vraag 29
Bereken de covariantie
Vraag 30
Bereken de correlatiecoëfficiënt.
Antwoordindicatie
Vraag 1
Gemiddelde = (18+71+80+80+84)/5 = 66.7; mediaan = 80; modus = 80.
Vraag 2
Gemiddelde = (16+21+12+19+1+2)/6 = 11.8; mediaan = (12+16)/2 = 14; er is geen modus.
Vraag 3
a. Gemiddelde = (4.1 + 3.2 + 3.5 + 4.5 + 5.1 + 3.8 + 2.1 + 2.2 + 3.1 + 5.1 + 1.5 + 1.0) / 12 = 3.3
b. Mediaan = 3.4
c. Modus = 5.1
Vraag 4
a. Gemiddelde = (2.51 + 3.74 + 4.15 + 5.33 + 6.18 + 6.65 + 7.18 + 6.92 + 6.95 + 7.54) / 10 = 5.7
b. Mediaan = 6.4
Vraag 5
a. Gemiddelde = 7.5; mediaan = 6.5; modus = 6.
b. Sorteer eerst de gegevens op volgorde van laagste naar hoogste waarde:
3 5 5 6 6 7 9 10 11 13
Q1 is de waarde op de 0,25 (10 + 1) de positie, dat wil zeggen de 2,75ste positie.
De tweede waarde is 5, de derde waarde is ook 5.
Q1 = 5 + 0.25*(5 - 5)
Q1 = 5 + 0
Q1 = 5
Q3 = de waarde op de 0,75 (10 + 1) de geordende positie, dat wil zeggen de 8,25e positie.
Q3 = 10 + 0.75(11 - 10)
Q3 = 10 + 0.75
Q3 = 10.75
Dus, de vijf-getallen samenvatting is: 3 (minimum); 5 (Q1); 6.5 (median); 10.75 (Q3); 13 (maximum).
Vraag 6
Gemiddelde = (0*33 + 1*12 + 2*4 + 3*1) / 50 = 23/50 = 0.46.
Mediaan = 0
Modus = 0
Vraag 7
Volg deze stappen om de steekproefvariantie en standaarddeviatie te berekenen:
Stap 1: Bereken het steekproefgemiddelde. Het steekproefgemiddelde is hier gelijk aan 10.1.
Stap 2: Zoek het verschil tussen elk van de waarden en het steekproefgemiddelde van 10.1.
Stap 3: Neem de wortel elk verschil.
De gekwadrateerde deviaties van het gemiddelde voor alle waarnemingen zijn: 16,81 4,41 0,01 3,61 15,21 1,21 0,81 9,61 8,41 en 0,81. De som van deze gekwadrateerde afwijkingen is gelijk aan 60,9. Vervolgens is s2 = (60.9) / (n -1) = 60.9 / 9 = 6.76. De variantie is dus gelijk aan 6,76. De standaarddeviatie wordt dan berekend door het wortel van de variantie. Dat wil zeggen: s = √6.76 = 2.6
Vraag 8
Voer opnieuw dezelfde stappen uit als in vraag 7. Het steekproefgemiddelde is gelijk aan 2. De gekwadrateerde deviaties van het gemiddelde voor elke waarneming zijn: 9, 25, 4, 0, 9, 25, 4. De som van deze kwadratische verschillen is gelijk aan 76. De variantie, s2 = 76/6 = 12.83. De standaarddeviatie is de wortel van de variantie, dat wil zeggen: s = √12.83 = 3.56.
Vraag 9
CVA = 2.00 / 4.00 x 100% = 50%
CVB = 8.00 / 80.00 x 100% = 10%
De marktwaarde van voorraad A fluctueert meer van periode tot periode dan de marktwaarde van voorraad B. De variatiecoëfficiënt (CV) geeft aan dat voorraad voor voorraad A, de steekproefstandaardafwijking 50% van het gemiddelde is, en voor voorraad B de standaarddeviatie van het monster is slechts 10% van het gemiddelde.
Vraag 10
Gebruik de formule:
\[CV = \frac{s}{\bar{x}} x 100\% \hspace{5mm} if \hspace{5mm} \bar{x} > 0 \]
CV = (1.58 / 13) x 100% = 12.15%
Dus, de steekproef standaard deviatie omvat 12.15% van het gemiddelde.
Vraag 11
Gebruik de formule:
\[z = \frac{x_ {i} - \mu} {\sigma} \]
De standaarddeviatie, σ, is gelijk aan de vierkantswortel van de variantie, σ2, dat wil zeggen: √144 = 12
a. z = (288 - 300) / 12 = -12/12 = -1
Volgens de empirische regel valt ongeveer 68% binnen 1 standaarddeviatie boven en onder het gemiddelde. De resterende 34% procent wordt dus links en rechts van dit interval verspreid. Dit betekent dat 0,5 * 34 = 16% van de waarnemingen onder z = -1 valt. Omgekeerd zijn 100 - 16 = 84% van de scores groter dan 288.
b. z = (324 - 300) / 12 = 24/12 = 2
Volgens de empirische regel valt ongeveer 95% binnen 2 standaarddeviaties boven en onder het gemiddelde. De ruim 5% wordt verspreid aan het hogere en lagere uiteinde van de verdeling. Aldus is 97,5% van de waarnemingen minder dan 324.
c. z = (336 - 300) / 12 = 36/12 = 3. Ongeveer alle waarnemingen zijn lager dan 336. Om de vraag te beantwoorden, zijn dus bijna geen (0,15%) waarnemingen groter dan 336.
Vraag 12
a. Gemiddelde = 75
b. Standaarddeviatie = 19,26
c. CV = (19,26 / 75) x 100% = 25,67
Vraag 13
4 | 3 4 7
5 | 0 0 4 6
6 | 0 0 0 1 4 9
7 | 0 0 1 4 5 6
8 | 0 0 4 4 5 5 5 7
9 | 0 0 1 4 5
10 |
11| 0 0
12| 1
IQR = 26.
Vraag 14
Minimum = 43; Q1 = 60; Mediaan = 75; Q3 = 86; Maximum = 121.
Vraag 15
a. De gemiddelden zijn 1.13 en 109.17
b. De standaarddeviaties zijn 0,01 en 0,75
CVA = (0,01 / 1,13) x 100% = 1,04%
CVB = (0.75 / 109.17) x 100% = 0.69%
De variatiecoëfficiënt vertelt ons dat de standaardafwijking van de steekproef voor EUR naar USD 1,04% van het gemiddelde is, terwijl de standaardafwijking van de steekproef voor EUR naar JPY 0,69% van het gemiddelde is. De wisselkoers voor EUR naar USD fluctueert dus meer van dag tot dag dan die van EUR van JPY.
Vraag 16
z = (1.120 - 1.200) / 50 = -1.6
Vraag 17
94.52% (je kunt de p-waarde die overeenkomt met deze z-score vinden in de tabel van een standaard normale verdeling).
Vraag 18
z = (1.300 - 1.200) / 50 = 2
Vraag 19
Volgens de empirische regel zijn ongeveer 2,5% van de waarnemingen meer dan twee standaarddeviaties boven het gemiddelde.
Vraag 20
\[ \bar{x} = \frac{4+3+2+1}{4} = 2.5\]
Vraag 21
Gebruik de formule voor het gewogen gemiddelde, dat is:
\[\bar{x} = \frac{\Sigma w_{i}x_{i}}{n} \]
\[\bar{x} = \frac{4*3 + 3*3 + 2*4 + 1*5}{15} = \frac{34}{15} = 2.267 \]
Vraag 22
\[\bar{x} = \frac{4.7+2.8+5.7+2.6+5.5}{5} = \frac{22.3}{5} = 4.46\]
Vraag 23
\[\bar{x} = \frac{4.7*8 + 3.8*7 + 5.7*4 + 2.6*3 + 5.5*2}{24} = \frac{105.8}{24} = 4.41 \]
Vraag 24
De variantie is 1.643.
Vraag 25
De standaard deviatie = √1.643 = 1.281
Vraag 26
De covariantie = 82.42.
Vraag 27
The correlatiecoëfficiënt tussen x en y, oftewel r = 1.0 (perfecte positieve lineaire relatie).
Vraag 28
Vraag 29
Cov(x,y) = 30.8.
Vraag 30
r = 0.83.
Hoe werkt kansberekening? - TentamenTests 3
Vragen
Vraag 1
De uitkomstenruimte S = [E1, E2, E3, E4, E5, E6]. Gegegeven A = [E1, E2, E3] en B = [E3, E4, E5].
a. Wat is A intersectie B?
b. Wat is de unie van A en B?
c. Is de unie van A en B collectief uitputtend?
Vraag 2
Gebruik voor vraag 2-6 de volgende uitkomstenruimte: S = [E1, E2, E3, E4, E5, E6, E7, E8, E9, E10].
Gegeven A = [E1, E2, E3, E4], wat is Ā?
Vraag 3
Gegeven Ā = [E1, E4, E5, E7] en B̄ (complement B) = [E2, E3, E5, E8]. Wat is A intersectie complement B?
Vraag 4
Wat is A intersectie B?
Vraag 5
Wat is de unie van A en B?
Vraag 6
Is the union of A and B collectief uitputtend?
Vraag 7
Stel dat twee letters moeten worden gekozen uit A, B, C, D en E. Verder moeten deze twee letters in volgorde worden gerangschikt. Hoeveel permutaties zijn er mogelijk?
Vraag 8
Stel dat er 8 kandidaten zijn die hebben gesolliciteerd voor een bepaalde functie. Toch zijn er slechts 4 posities beschikbaar. Van deze 8 kandidaten zijn er 5 mannen en 3 vrouwen. Als elke combinatie van kandidaten even waarschijnlijk is, wat is dan de kans dat er geen vrouwen worden aangenomen?
Vraag 9
Stel dat er 10 Apple iPads, 5 Samsung-tablets en 5 Huawei-tablets in de winkel worden aangeboden. Een persoon komt de winkel binnen en wil 3 tablets kopen. Deze tabletten worden puur toevallig geselecteerd. Wat is het totale aantal mogelijke uitkomsten in de uitkomstenruimte?
Vraag 10
Gebruik nogmaals de informatie van vraag 9. Wat is de kans dat deze persoon 2 Apple iPads en 1 Samsung-tablet selecteert?
Vraag 11
Een uitkomstenruimte bestaat uit 5 A's en 7 B's. Stel nu dat we willekeurig twee letters uit deze uitkomstenruimte willen trekken. Wat is het totale aantal mogelijke combinaties?
Vraag 12
Gebruik opnieuw de uitkomstenruimte van vraag 11. Wat is de kans dat een willekeurig geselecteerde set van 2 uitkomsten 1 A en 1 B bevat?
Vraag 13
In een gezin van 6 familieleden zijn er drie mannen en drie vrouwen. Wat is de kans dat een willekeurige steekproef van twee familieleden uit twee mannen bestaat?
Vraag 14
De volgende informatie is van toepassing op vraag 14, 15 en 16. Stel dat er 12 werknemers zijn die aan een redactionele taak kunnen worden toegewezen. Van deze 12 werknemers zijn er 7 vrouwen en 5 mannen. Twee van de mannen zijn broers. De manager van het bedrijf moet de redactionele taak willekeurig toewijzen aan één werknemer. Laat A de gebeurtenis zijn "gekozen werknemer is een man". Laat B het evenement zijn "gekozen medewerker is een van de broers". Wat is de kans op gebeurtenis A?
Vraag 15
Wat is de kans op gebeurtenis B?
Vraag 16
Wat is de kans op de intersectie van A en B?
Vraag 17
Stel, P(A) = 0.75, P(B) = 0.80, en P(A ∩ B) = 0.65. Wat is P (A ∪ B)?
Vraag 18
Gebruik de informatie uit vraag 17. wat is de conditionele kans op gebeurtenis B, gegeven dat gebeurtenis A heeft plaatsgevonden?
Vraag 19
Gebruik de informatie uit vraag 17. Wat is de gezamenlijke kans op gebeurtenis A en B?
Vraag 20
Stel, binnen Nederland wordt 54% van alle master diploma's behaald door vrouwen. Van alle master diploma's die behaald worden, wordt 20% behaald bij psychologie. Verder wordt 8% van alle master diploma's behaald door vrouwen in de psychologie. Zijn de gebeurtenissen "de diploma houder is een vrouw" en de gebeurtenis "het diploma is in psychologie" statistisch onafhankelijk?
Vraag 21
Stel dat de odds om te winnen 3 op 2 zijn. Wat is dan de kans om te winnen?
Gebruik de volgende informatie voor vragen 22-25.
Stel dat we geïnteresseerd zijn in het onderzoeken van het effect van alcohol op verkeersongevallen. Het is duidelijk onethisch om één groep bestuurders van alcohol te voorzien en hun betrokkenheid bij ongevallen te vergelijken met die van een nuchtere groep. We weten echter dat 10,3% van de nachtbestuurders heeft gedronken en dat 32,4% van de bestuurders van ongevallen met één voertuig heeft gedronken. In dit voorbeeld zijn ongevallen met één voertuig gekozen om ervoor te zorgen dat elke rijfout alleen aan de bestuurder kan worden toegewezen.
Vraag 22
Wat is op basis van deze gegevens de uitkomstenruimte?
Vraag 23
Wat is de voorwaardelijke kans dat de bestuurder heeft gedronken, gezien het feit dat hij bij een ongeval betrokken was?
Vraag 24
Wat is de voorwaardelijke kans dat de bestuurder had gedronken, gezien het feit dat hij niet betrokken was bij een ongeval?
Vraag 25
Bieden deze cijfers voldoende bewijs om te concluderen dat alcohol de kans op ongevallen verhoogt?
Vraag 26
Voor vraag 26-30, the uitkomstenruimte bestaat uit A1, A2, B1, en B2.
Gegeven dat P(A1) = 0.15, P(B1) = 0.20, en P(B1|A1) = 0.60. Wat is P(A1|B1)?
Vraag 27
Gegeven dat P(A1 ∩ B1) = 0.09 en P(B1) = 0.18. Wat is P(A1|B1)?
Vraag 28
Gegeven dat P(A2 ∩ B2) = 0.81 en P(B2) = 0.82. Wat is P(A2|B2)?
Vraag 29
Gegeven dat P(A1) = 0.10, P(B1|A1) = 0.90. Wat is P(A1 ∩ B1)?
Vraag 30
Gegeven dat P(A1) = 0.10, P(B1|A1) = 0.90, P(B2|A1) = 0.10. Wat is P(A2)?
Antwoordindicatie
Vraag 1
a. A ∩ B = [E3]
b. A ∪ B = [E1, E2, E3, E4, E5]
c. Nee, A en B zijn niet collectief uitputtend, omdat E6 niet in de unie zit.
Vraag 2
Ā = [E5, E6, E7, E8, E9, E10]
Vraag 3
A ∩ complement B = [E2, E3, E5, E8], omdat A gelijk is aan het complement van B.
Vraag 4
A ∩ B is een lege set. Er is geen uitkomst in zowel A als B, omdat ze elkaars complement zijn.
Vraag 5
A ∪ B = [E1, E2, E3, E4, E5, E6, E7, E8]
Vraag 6
Nee, A en B zijn niet collectief uitputtend, omdat E9 and E10 niet in de unie zitten.
Vraag 7
Er zijn 5 uitkomsten, dus n = 5, en er moeten twee uitkomsten worden geselecteerd, dus x = 2.
\[P^{5}_{2} = \frac{5!}{3} = \frac{120}{6}\ = 20 ].
Vraag 8
Bereken eerst het totale aantal mogelijke combinaties van vier kandidaten geselecteerd uit de acht mogelijke kandidaten. Dat is:
\[ C^{8}_{4} = \frac{8!}{4!4!} = 70 \]
Als er dan geen vrouwen worden aangenomen, betekent dit dat de vier succesvolle kandidaten van de beschikbare vijf mannen moeten komen. Dat betekent dat het aantal combinaties als volgt is:
\[ C^{5}_{4} = \frac{5!}{4!1!} = 5 \]
Concluderend, als van de 70 mogelijke combinaties waarschijnlijk wordt gekozen, is de waarschijnlijkheid dat een van de 5-alle mannelijke combinaties wordt geselecteerd 5/70 = 1/14 = 0,07 (dat wil zeggen 7%).
Vraag 9
\[N = C^{20}_{3} = \frac{20!}{3!(20-3)!} = 1,140 \]
Dus, er zijn 1,140 mogelijke uitkomsten
Vraag 10
\[ C^{10}_{2} = \frac{10!}{2!(10-2)!} = 45 \]
Op dezelfde manier kun je uitrekenen dat er 5 uitkomsten mogelijk zijn voor 1 Samsung tablet.
Dit gecombineerd betekent:
\[ N_{A} = C^{10}_{2} x C^{5}_{1} = 45 x 5 = 225 \]
Dus, de kans op gebeurtenis A (datis: 2 Apple iPads en 1 Samsung tablet] is:
\[ P_{A} = \frac{N_{A}}{N} = \frac{225}{1140} = 0.197 \]
Vraag 11
\[ C^{12}_{2} = \frac{12!}{2!10!} = 66 \]
Vraag 12
Het aantal mogelijkheden om 1 A te selecteren van de beschikbare 5 is:
\[ N_{A} = C^{12}_{2} x C^{5}_{1} = \frac{5!}{1!(5-1)!} = \frac{5!}{1!4!} = 5 \]
Het aantal mogelijkheden om 1 B te selecteren van de beschikbare 7 is:
\[ N_{A} = C^{12}_{2} x C^{7}_{1} = \frac{7!}{1-(7-1)!} = \frac{7!}{1!6!} = 7\]
Dit gecombineerd betekent dat het aantal uitkomsten dat voldoet aan gebeurtenis A (dat is, zowel 1 als 1 B selecteren) gelijk is aan:
\[N_{A} = C^{5}_{1} x C^{7}_{1} = 5 x 7 = 35 \]
Dit betekent dat de kans op gebeurtenis A gelijk is aan:
\[ P_{A} = \frac{N_{A}}{A} = \frac{35}{66} = 0.53\]
Vraag 13
\[ N = C^{6}{3} = \frac{6!}{3!3!} = \frac{720}{36} = 20 \]
Het aantal mogelijke uitkomsten voor 2 mannen is:
\[ C^{3}_{2} = \frac{3!}{2!1!} = \frac{6}{2} = 3 \]
Concluderend, de kans dat twee mannen worden geselecteerd is 3/20 = 0.15 (15%).
Vraag 14
\[P_{A} = \frac{N_{A}}{N} = \frac{5}{12} = 0.42 \]
Vraag 15
/[P_{B} = \frac{N_{B}}{N} = \frac{2}{12} = 0.17 \]
Vraag 16
A ∩ B = 0.17
Vraag 17
Gebruik the additie regel.
\[ P (A ∪ B) = P(A) + P(B) - P(A ∩ B) \]
Transformatie van deze formule resulteert in:
\[ P (A ∩ B) = P(A) + P(B) - P(A ∪ B) \]
Deze formule invullen geeft:
\[ 0.75 + 0.80 - 0.65 = 0.90 \]
Vraag 18
\[ P(B|A) = \frac{P(A ∩ B)}{P(A)} = \frac{0.65}{0.75} = 0.8667 \]
Vraag 19
Gebruik de multiplicatie regel, dat is:
\[ P(A ∩ B) = P(A|B) P(B) = (0.8125)(0.80) = 0.65 \]
Vraag 20
\[ P(A) = 0.54, P(B) = 0.20, P(A ∩ B) = 0.08 \]
Omdat
\[ P(A)P(B) = (0.54)(0.20) = 0.108 \neq 0.08 = P(A ∩ B) \]
kunnen we stellen dat deze gebeurtenissen niet onafhankelijk zijn.
De afhankelijkheid kan worden gevonden via de conditionele kans:
\[ P(A|B) = \frac{P(A ∩ B)}{P(B)} = \frac{0.08}{0.20} = 0.40 \neq 0.54 = P(A) \]
Dat betekent dat in Nederland slechts 40% van de psychologie master diploma's naar vrouwen gaat, terwijl vrouwen 54% of alle diploma ontvangers vertegenwoordigen.
Vraag 21
\[ \frac{3}{2} = \frac{P(A)}{1-P(A)} \]
\[ 3(1-P(A)) = 2P(A) \]
\[ 5P(A) = 3 \]
\[ P(A) = \frac{3}{5} = 0.6 \]
Vraag 22
A1: de automobilist heeft gedronken
A2: de automobilist heeft niet gedronken
B1: de automobilist was betrokken bij een eenzijdig ongeval
B2: de automobilist was niet betrokken bij een eenzijdig ongeval
Vraag 23
P(A1|C1) = 0.324
Vraag 24
P(A1|C2) = 0.103
Vraag 25
Gebruik de overbetrokkenheidsratio om deze vraag te beantwoorden, dat is:
\[ \frac{P(A_{1}|C_{1})}{P(A_{1}|C_{2})} = \frac{0.324}{0.103} = 3.15 \]
Deze ratio van 3.15 biedt voldoende bewijs om te kunnen concluderen dat alcohol the kans op een auto ongeluk vergroot.
Vraag 26
Via de stelling van Bayes vinden we dat: P(A1|B1) = (0.60*0.15)/(0.20) = 0.45.
Vraag 27
\[ P(A_{1}|B_{1}) = \frac{P(A_{1} ∩ B_{1})}{P(B_{1})} = \frac{0.09}{0.18} = 0.50 \]
Vraag 28
\[ P(A_{2}|B_{2}) = \frac{P(A_{2} ∩ B_{2})}{P(B_{2})} = \frac{0.81}{0.82} = 0.988 \]
Vraag 29
P(A1 ∩ B1) = 0.90 * 0.10 = 0.09
Vraag 30
Gebruik zowel:
P(A1 ∩ B1) = 0.90 * 0.10 = 0.09
als ook:
P(A1 ∩ B2) = 0.10 * 0.10 = 0.01
om te vinden dat:
P(A1) = 0.09 + 0.01 = 0.10
A2 is het complement van A1, dus A2 = 1 - A1 = 1 - 0.10 = 0.90
Hoe kun je kansmodellen gebruiken voor discrete wilekeurige variabelen? - TentamenTests 4
Vragen
Vraag 1
Een onderzoeker bestudeert het aantal uilen eieren dat in Denemarken is gevonden. Is het aantal eieren een discrete of continue willekeurige variabele?
Vraag 2
Het gewicht van studenten wordt geregistreerd als onderdeel van een nationale gezondheidsstudie. Is het gewicht van studenten een discrete of continue willekeurige variabele?
Vraag 3
Geef voor elk van de volgende aan of een discrete of continue willekeurige variabele de beste definitie biedt.
a. Het aantal zonnige dagen in Nederland.
b. Het drukniveau in de banden van een auto.
c. De hoeveelheid olie die door Saudi-Arabië in 2019 is geëxporteerd.
Vraag 4
Geef de kansverdeling van een enkele, eerlijke dobbelsteen, wanneer die één keer wordt geworpen.
Vraag 5
Wat is de kans dat je 5 of 6 gooit, wanneer je één keer met een eerlijke dobbelsteen gooit?
Gebruik voor vraag 6-10 de volgende kansverdeling:
x | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
P(x) | 0.03 | 0.15 | 0.11 | 0.19 | 0.22 | 0.26 | 0.04 |
Vraag 6
P(3 < x < 6) = ?
Vraag 7
P(x > 3) = ?
Vraag 8
P(2 < x < 5) = ?
Vraag 9
P(x < 4) = ?
Vraag 10
Wat is het gemiddelde behorend bij deze kansverdeling?
Vraag 11
Stel, de kansverdeling voor het aantal fouten per bladzijde in een economie boek is als volgt: P(0) = 0.81; P(1) = 0.17; P(2) = 0.02. Wat is het gemiddelde aantal fouten per bladzijde?
Vraag 12
Iemand is geïnteresseerd in de totale kosten van een project waarop hij van plan is te bieden. Hij schat dat het materiaal € 25.000, - kost en dat de larbor € 900, - per dag kost. Stel dat het project X dagen duurt om te voltooien. Geef de lineaire functie voor de totale kosten (C) van het project.
Vraag 13
Veronderstel nu dat de volgende kansverdeling wordt gegeven voor de doorlooptijd van het project.
Tijdsduur (x) | 10 | 11 | 12 | 13 | 14 |
P(x) | 0.1 | 0.2 | 0.3 | 0.2 | 0.1 |
Wat is het gemiddelde voor de tijdsduur om het project af te maken, x?
Vraag 14
Wat is de variantie voor de tijdsduur om het project af te maken, x?
Vraag 15
Wat is het gemiddelde voor de totale kosten, C?
Vraag 16
Wat is de standaarddeviatie voor de totale kosten, C?
Vraag 17
Stel dat een makelaar vijf contacten heeft en van mening is dat voor elk contact de kans op een verkoop 0,40 is. Wat is de kans dat de makelaar maximaal 1 verkoop doet?
Vraag 18
Wat is de kans dat de makelaar tussen de 2 en 4 verkopen doet (inclusief)?
Vraag 19
Er wordt voorspeld dat 3,5% van alle kleine bedrijven faillissement zal aanvragen in 2020. Voor een willekeurige steekproef van 100 kleine bedrijven, schat u de waarschijnlijkheid dat ten minste 3 faillissement zullen aanvragen in 2020, ervan uitgaande dat deze voorspelling correct is. Gebruik hiervoor de Poisson-verdeling.
Vraag 20
Doe nu hetzelfde met de (daadwerkelijke) binomiale verdeling. Is de Poisson-verdeling een goede schatting van de daadwerkelijke binomiale verdeling?
Vraag 21
Overweeg bij vraag 21-26 de volgende gezamenlijke kansverdeling voor twee willekeurige variabelen X en Y. Bepaal de marginale kansen.
Y teruggave | ||||
X teruggave | 0% | 5% | 10% | 15% |
0% | 0.0625 | 0.0625 | 0.0625 | 0.0625 |
5% | 0.0625 | 0.0625 | 0.0625 | 0.0625 |
10% | 0.0625 | 0.0625 | 0.0625 | 0.0625 |
15% | 0.0625 | 0.0625 | 0.0625 | 0.0625 |
Vraag 22
Zijn X en Y onafhankelijk?
Vraag 23
Wat is het gemiddelde van X?
Vraag 24
Wat is het gemiddelde van Y?
Vraag 25
Wat is de variantie van X?
Vraag 26
Wat is de variantie van Y?
Vraag 27
Overweeg de volgende gezamenlijke kansverdeling voor twee willekeurige variabelen X en Y.
X | |||
Y | 0 | 1 | |
0 | 0.25 | 0.35 | |
1 | 0.10 | 0.30 |
Bereken de marginale verdelingen voor X en Y.
Vraag 28
Overweeg de volgende informatie voor vragen 28-30. Een belegger heeft € 1000, - om te investeren en twee investeringsmogelijkheden, die elk minimaal € 500, - vereisen. De winst voor € 100, - voor de eerste investering (X) kan worden weergegeven door de volgende kansverdelingen: P (X = -5) = 0,4 en P (X = 20) = 0,6. Vervolgens wordt de winst per € 100, - van de tweede investering (Y) weergegeven door de volgende kansverdelingen: P (Y = 0) = 0,6 en P (Y = 25) = 0,4. Willekeurige variabelen X en Y zijn onafhankelijk. De belegger heeft de volgende mogelijke strategieën:
a. € 1000, - in de eerste investering
b. € 1000, - in de tweede investering
c. € 500, - per investeringZoek het gemiddelde en de variantie voor de eerste strategie.
Vraag 29
Zoek het gemiddelde en de variantie voor de eerste strategie.
Vraag 30
Zoek het gemiddelde en de variantie voor de eerste strategie.
Antwoorden op de oefenvragen
Vraag 1
Het is een discrete willekeurige variabele, omdat deze een eindig aantal telbare getallen kan aannemen.
Vraag 2
Een continue willekeurige variabele.
Vraag 3
a. discreet
b. continu
c. continu
Vraag 4
Kansverdeling van een enkele, eerlijke dobbelsteen
x P(x) 1 0.16667 2 0.16667 3 0.16667 4 0.16667 5 0.16667 6 0.16667
Vraag 5
0.1667 + 0.1667 = 0.3333
Vraag 6
P(3 < x < 6) = 0.19 + 0.22 + 0.26 = 0.67
Vraag 7
P(x > 3) = 0.19 + 0.22 + 0.26 + 0.04 = 0.71
Vraag 8
P(2 < x < 5) = 0.19 + 0.22 + 0.26 = 0.67
Vraag 9
P(x < 4) = 0.03 + 0.15 + 0.11 + 0.19 = 0.48
Vraag 10
\[ \mu_{X} = 0(0.03) + (1)(0.15) + (2)(0.11) + (3)(0.19) + (4)(0.22) + (5)(0.26) + (6)(0.04) = 3.36 \]
Vraag 11
\[ \mu_{x} = E[X] = \sum_{x} xP(x) = (0)(0.81) + (1)(0.17) + (2)(0.02) = 0.21 \]
Vraag 12
C = 25,000 + 900X
Vraag 13
\[ \mu_{X} = E[X] = \sum_{x}xP(x) = (10)(0.1) + (11)(0.3) + (12)(0.3) + (13)(0.2) + (14)(0.1) = 11.9 \]
Dus de gemiddelde tijd om het project af te ronden X is 11.9 dagen.
Vraag 14
\[ \sigma^{2}_{Y} = Var(a + bX) = b^{2}\sigma^{2}_{X} \]
\[ (10 - 11.9)^{2}(0.1) + (11 - 11.9)^{2}(0.3) + ... + (14 - 11.9)^{2}(0.1) = 1.29 \]
Dus de variantie voor de tijd om het project af te ronden is 1.29 dagen.
Vraag 15
\[ \mu_{C} = E[25,000 + 900X] = (25,000 + 900\mu_{X}) = 2500 + (900)(11.9) = €35,710,- \]
Vraag 16
\[ \sigma^{2}_{C} = Var(25,000 + 900X) = (900)^{2}\sigma^{2}_{X} = (810,000)(1.29) = €1,044,900,- \]
Vraag 17
\[ P(0) = \frac{5!}{0!5!}(0.4)^{0}(0.6)^{5} = (0.6)^{5} = 0.078 \]
\[ P(1) = \frac{5!}{1!4!}(0.4)^{1}(0.6)^{4} = 5(0.4)(0.6)^{4} = 0.259 \]
P(X < 1) = P(X = 0) + P(X = 1) = 0.078 + 0.259 = 0.337
Vraag 18
\[ P(2) = \frac{5!}{2!3!}(0.4)^{2}(0.6)^{3} = 10(0.4)^{2}(0.6)^{3} = 0.346 \]
\[ P(3) = \frac{5!}{3!2!}(0.4)^{3}(0.6)^{2} = 10(0.4)^{3}(0.6)^{2} = 0.230 \]
\[ P(4) = \frac{5!}{4!1!}(0.4)^{4}(0.6)^{1} = 5(0.4)^{4}(0.6)^{1} = 0.077 \]
P(2 < X < 4) = P(2) + P(3) + P(4) = 0.346 + 0.230 + 0.077 = 0.653
Vraag 19
De distributie van X is binomiaal met n = 100 and P = 0.0035, dus het gemiddelde is gelijk aan nP = 3.5. Vervolgens vinden we met behulp van de Poisson-verdeling de kans op minstens 3 faillissementen:
\[ P(X \geq 3) = 1 - P(X \leq 2) \]
\[ P(0) = \frac{e^{-3.5}(3.5)^{0}}{0!} = e^{-3.5} = 0.030197 \]
\[ P(1) = \frac{e^{-3.5}(3.5)^{1}}{1!} = (3.5)(0.030197) = 0.1056895 \]
\[ P(2) = \frac{e^{-3.5}(3.5)^{2}}{2!} = (6.125)(0.030197) = 0.1849566 \]
Dus,
\[ P(X \leq 2) = P(0) + P(1) + P(2) = 0.3208431 \]
\[ P(X \geq 3) = 1 - 0.3208431 = 0.6791569 \]
Vraag 20
Met behulp van de binomiale verdeling berekenen we de kans behorend bij X> 3 als: P (X> 3) = 0,684093.
De Poisson-kans is dus een goede schatting van de werkelijke binomiale verdeling.
Vraag 21
\[ P(X = 0) = \sum_{y}P(0,y) = 0.0625 + 0.0625 + 0.0625 + 0.0625 = 0.25\]
Merk op dat voor elke combinatie van waarden voor X en Y, P(x,y) = 0,0625. Daarom zijn alle marginale kansen van X 25%. Hetzelfde geldt voor de marginale kansen van Y. Merk op dat de som van de marginale kansen voor een willekeurige variabele 1 is.
Vraag 22
Om onafhankelijkheid te testen, moeten we controleren of P (x, y) = P (x) P (y) voor alle mogelijke paren van waarden x en y.
P(x,y) = 0.0625 for all possible values of x and y.
P(x) = 0.25 and P(y) = 0.25 for all possible values of x and y.
P(x,y) = 0.0625 = (0.25)(0.25) = P(x)P(y)
Dus X en Y zijn onafhankelijk
Vraag 23
\[ \mu_{X} = E[X] = \sum_{x}P(x) = 0(0.25) + 0.05(0.25) + 0.10(0.25) + 0.15(0.25) = 0.075 \]
Vraag 24
Het gemiddelde van Y is gelijk aan het gemiddelde van X en dus: 0.075.
Vraag 25
\[ \sigma^{2}_{X} = \sum_{X}(x-\mu_{X})^{2}P(x) = (0.25)[(0 - 0.075)^{2} + (0.05 - 0.075)^{2} + (0.10 - 0.075)^{2} + (0.15 - 0.075)^{2}] = 0.003125 \]
Vraag 26
De standaarddeviatie is de wortel van de variantie, dat is 0.0559016, oftewel 5.59%.
Vraag 27
\[ P(X = 0) = \sum_{y}P(0,y) = 0.25 + 0.10 = 0.35 \]
\[ P(Y = 0) = \sum_{x}P(x,0) = 0.35 + 0.20 = 0.55 \]
Vraag 28
\[ \mu_{X} = E[X] = \sum_{x}xP(x) = (-5)(0.4) + (20)(0.6) = €10,- \]
\[ \sigma^{2}_{x} = E[(X - \mu_{X})^{2}] = \sum_{x}(x - \mu)^{2} P(x) = (-5 - 10)^{2}(0.4) + (20 - 10)^{2}(0.6) = 150 \]
Strategie a heeft een gemiddelde winst van E[10Y] = €100,- met variantie Var(10Y) = 100Var(Y) = 15,000.
Vraag 29
\[ \mu_{Y} = E[Y] = \sum_{y}yP(y) = (0)(0.6) + (25)(0.4) = €10,- \]
\[ \sigma^{2}_{y} = E[(Y - \mu_{Y})^{2}] = \sum_{y}(y - \mu)^{2} P(Y) = (0 - 10)^{2}(0.6) + (25 - 10)^{2}(0.4) = 150 \]
Strategie b heeft een gemiddelde winst van E[10Y] = €100,- met variantie Var(10Y) = 100Var(Y) = 15,000.
Vraag 30
\[ E[5X + 5Y] = E[5X] + E[5Y] = 5E[X] + 5E[Y] = €100,- \]
\[ Var(5X + 5Y) = Var(5X) + Var(5Y) = 25Var(X) + 25Var(Y) = 7,500 \]De variantie van strategie c is kleiner dan die van de strategieën van a en b, als gevolg van de afname van het risico die voortvloeit uit diversificatie in een beleggingsportefeuille. De meeste beleggers geven de voorkeur aan strategie c, omdat deze strategie hetzelfde verwachte rendement oplevert als de andere twee strategieën, maar met een lager risico.
Hoe kun je kansmodellen gebruiken voor continue willekeurige variabelen? - TentamenTests 5
Vragen
Vraag 1
Beschouw de uniforme kansdichtheidsfunctie f(x) = 0.5x met een bereik van 0 tot 2. Wat is de kans dat een willekeurige variabele X tussen 1.4 en 1.8 ligt?
Vraag 2
Beschouw de uniforme kansdichtheidsfunctie f(x) = 0.5x met een bereik van 0 tot 2. Wat is de kans dat een willekeurige variabele X tussen 0.5 en 1.6 ligt?
Vraag 3
Beschouw de uniforme kansdichtheidsfunctie f(x) = 0.5x met een bereik van 0 tot 2. Wat is de kans dat een willekeurige variabele X kleiner is dan 0.8?
Vraag 4
Beschouw de uniforme kansdichtheidsfunctie f(x) = 0.5x met een bereik van 0 tot 2. Wat is de kans dat een willekeurige variabele X groter is dan 1.3?
Vraag 5
Een huiseigenaar schat de verwarmingsrekening op basis van het bereik van de waarschijnlijke temperaturen in januari. Hij verkrijgt de volgende lineaire vergelijking: Y = 290 - 5T, waarin T verwijst naar de gemiddelde temperatuur voor de maand in graden Fahrenheit. Als de gemiddelde temperatuur in januari gemiddeld 24 en standaardafwijking 4 is, wat is dan het gemiddelde en de standaardafwijking van de verwarmingsrekening van deze huiseigenaar in januari?
Vraag 6
De winst voor een productieproces is gelijk aan 6000 dollar minus drie keer het aantal geproduceerde eenheden. Het gemiddelde en de variantie voor het aantal geproduceerde eenheden zijn respectievelijk 1000 en 900. Zoek het gemiddelde en de variantie van de winst.
Vraag 7
De winst van een bepaald productieproces is gelijk aan € 2000,- minus twee keer het aantal geproduceerde eenheden. Het gemiddelde en de variantie voor het aantal geproduceerde eenheden zijn respectievelijk 500 en 900. Wat is het gemiddelde en de variantie van de winst?
Vraag 8
De winst van een bepaald productieproces is gelijk aan € 1000,- minus twee keer het aantal geproduceerde eenheden. Het gemiddelde en de variantie voor het aantal geproduceerde eenheden zijn respectievelijk 50 en 90. Wat is het gemiddelde en de variantie van de winst?
Vraag 9
Gebruik voor vragen 9-15 de standaard normaalverdeling.
P(Z < 1.16) = ?
Vraag 10
P(Z > 1.73) = ?
Vraag 11
P(Z > -2.29) = ?
Vraag 12
P(Z > -1.35) = ?
Vraag 13
P(1.16 < Z < 1.73) = ?
Vraag 14
P(-2.29 < Z < 1.26) = ?
Vraag 15
P(-2.29 < Z < -1.35) = ?
Vraag 16
Leg uit waarom het in de vorige vraag gevonden resultaat precies is wat men op intuïtieve gronden zou kunnen verwachten.
Vraag 17
De kans is 0,25 dat Z kleiner is dan welk getal?
Vraag 18
De kans is 0,2 dat Z groter is dan welk getal?
Vraag 19
De kans is 0,6 dat Z groter is dan welk getal?
Vraag 20
Laat een continue willekeurige variabele X normaal verdeeld worden met X ~ (30, 81). Wat is de kans dat X groter is dan 40?
Vraag 21
De verwachte consumptievraag in een restaurant kan worden gemodelleerd door een normale willekeurige variabele met gemiddelde 1500 pond en standaardafwijking 110 pond. Wat is de kans dat de vraag 1.300 pond zal overschrijden?
Vraag 22
Van de scores op een prestatietest is bekend dat ze willekeurig worden verdeeld met een gemiddelde van 420 en een standaardafwijking van 80. Wat is de minimale testscore die nodig is om in de top 10% van alle mensen te zitten die de test maken?
Vraag 23
Gegeven een willekeurige steekproefgrootte van n = 900 uit een binomiale kansverdeling met P = 0,30. Wat is de kans dat het aantal successen groter is dan 305?
Vraag 24
Gegeven een willekeurige steekproefgrootte van n = 900 uit een binomiale kansverdeling met P = 0,30. Wat is de kans dat het aantal successen groter is dan 305?
Vraag 25
Servicetijden voor klanten bij een informatiebalie van de bibliotheek kunnen worden gemodelleerd door een exponentiële distributie met een gemiddelde service van 5 minuten. Wat is de kans dat een klantenservice langer dan 10 minuten zal duren?
Vraag 26
Een bedrijf in Nederland met 2000 werknemers heeft een gemiddeld aantal verzuimongevallen per week gelijk aan λ = 0,4 en het aantal ongevallen na een Poisson-verdeling. Wat is de kans dat de tijd tussen ongevallen minder dan 2 weken is?
Vraag 27
Gebruik de volgende informatie voor vragen 27-30. Een belegger heeft u om hulp gevraagd bij het opstellen van een portefeuille met twee aandelen. De belegger heeft € 1000, - die in eender welke verhouding kan worden toegewezen aan twee alternatieve aandelen. Het rendement per euro van deze twee investeringen wordt aangegeven door willekeurige variabelen X en Y. Beide variabelen zijn onafhankelijk en normaal verdeeld. Investering X heeft een gemiddelde van 25 en een variantie van 81. De tweede investering heeft een gemiddelde van 40 en een variantie van 121. Deze twee aandelenkoersen hebben een negatieve correlatie, ρxy = -0,40. Definieer de lineaire vergelijking van de waarde van de portefeuille, aangegeven door W.
Vraag 28
Wat is de gemiddelde waarde voor de aandelenportefeuille?
Vraag 29
Wat is de standaarddeviatie voor de aandelenportefeuille?
Vraag 30
Wat is de kans dat de portefeuillewaarde hoger is dan 2.000?
Antwoordindicatie
Vraag 1
P(1.8 < X < 1.4) = F(1.8) - F(1.4) = (0.5)(1.8) - (0.5)(1.4) = 0.9 - 0.7 = 0.2.
Vraag 2
P(1.6 < X < 0.5) = F(1.6) - F(0.5) = (0.5)(1.6) - (0.5)(0.5) = 0.8 - 0.25 = 0.55.
Vraag 3
P(X < 0.8) = F(0.8) = (0.5)(0.8) = 0.40.
Vraag 4
P(2.0 < X < 1.3) = F(2.0) - F(1.3) = (0.5)(2.0) - (0.5)(1.3) = 1.0 - 0.65 = 0.35.
Vraag 5
\[ \mu_{Y} = 290 - 5\mu_{T} = 290 - (5)(24) = 170 \]
\[ \sigma_{Y} = |-5| \sigma_{T} = (5)(4) = 20 \]
Vraag 6
\[ Y = 6000 - 3U \]
\[\mu_{Y} = 1000 = 6000 - 3U \]
\[3U = 6000 - 1000 = 5000 \]
\[U ≈ 1667 \]
\[ \sigma_{Y} = |3|\sigma_{U} \]
\[ 900 = |3|\sigma_{U} \]
\[ \sigma_{U} = \frac{900}{3} = 300 \]
Dus, het gemiddelde en de standaarddeviatie zijn respectievelijk 1,667 en 300 dollar.
Vraag 7
\[ Y = 2000 - 2U \]
\[\mu_{Y} = 500 = 2000 - 2U \]
\[2U = 2000 - 500 = 1500\]
\[U ≈ 750 \]
\[ \sigma_{Y} = |2|\sigma_{U} \]
\[ 900 = |2|\sigma_{U} \]
\[ \sigma_{U} = \frac{900}{2} = 450 \]
Dus, het gemiddelde en de standaarddeviatie zijn respectievelijk €750,- en €450,-.
Vraag 8
\[ Y = 1000 - 2U \]
\[\mu_{Y} = 50 = 1000 - 2U \]
\[2U = 1000 - 50 = 950\]
\[U ≈ 475 \]
\[ \sigma_{Y} = |2|\sigma_{U} \]
\[ 90 = |2|\sigma_{U} \]
\[ \sigma_{U} = \frac{900}{2} = 45 \]
Dus, het gemiddelde en de standaarddeviatie zijn respectievelijk €950,- en €45,-.
Vraag 9
P(Z < 1.16) = 0.8770
Vraag 10
P(Z > 1.73) = 1 - 0.9582 = 0.0418
Vraag 11
P(Z > -2.29) = P(Z < 2.29) = 0.9890
Vraag 12
P(Z > -1.35) = P(Z > 1.35) = 0.9115
Vraag 13
P(1.16 < Z < 1.73) = 0.9582 - 0.8770 = 0.0812
Vraag 14
P(-2.29 < Z < 1.26) = 0.9890 - 0.8962 = 0.0928
Vraag 15
P(-2.29 < Z < -1.35) = 0.0855 - 0.011 = 0.0745
Vraag 16
z = 0.525
Vraag 17
z = -0.575
Vraag 18
z = -0.845
Vraag 19
z = -0.256
Vraag 20
\[ Z = \frac{X - \mu}{sigma} = \frac{40 - 30}{\sqrt{81}} = \frac{-10}{9} = -1.11 \]
P(Z > -1.11) = 1 - 0.8665 = 0.1335
Vraag 21
\[ Z = \frac{(1300 - 1,500)}{110} = -1.82 \]
P(Z > -1.82) = 0.9656
Vraag 22
Top 10% correspondeert me z = 1.185.
\[ 1.185 = \frac{X - 420}{80} \]
\[ 1.185*80 = X - 420 \]
\[ 94.5 + 420 = X\]
X = 514.8. Dus, iemand moet minimaal 515 scoren op de test om in de top 10% te vallen.
Vraag 23
nP(1 - P) = 900*0.30(1 - 0.30) = 189 > 5, dus de binomiale verdeling kan worden benaderd met de standaard normaal verdeling.
Vraag 24
\[ \mu = nP = 270 \]
\[ \sigma^{2} = 189 \]
\[ \sigma = \sqrt{189} = 13.75 \]
\[ z = \frac{305 - 270}{13.75} = 2.55 \]
P(Z > 2.55) = 1 - 0.9946 = 0.0054
Vraag 25
\[ P(T > 10) = 1 - P(T < 10) = 1 - F(10) = 1 - (1 - e^{-(0.20)(10)}) = e^{-2.0} = 0.1353 \]
Dus, de kans dat een servicetijd langer is dan 10 minuten is dus 0.1353.
Vraag 26
/[ P(T < 2) = F(2) = 1 - e^{-(0.4)(2)} = 1 - e^{-0.8} = 1 - 0.4493 = 0.5507 \]
Dus, de kans dat er minder dan 2 weken tussen twee verzuimongevallen zit is ongeveer 55%.
Vraag 27
W = 20X + 30Y
Vraag 28
W = 20*25 + 30*40 = 1,700
Vraag 29
\[ \sigma^{2}_{W} = 20^{2} \sigma^{2}_{X} 30^{2} \sigma^{2}_{Y} + 2*30 \rho_{XY} \sigma_{X} \ sigma_{Y} \]
\[ \sigma^{2}_{W} = 20^{2}*81 + 30^{2}*121 + 2*20*30*{-0.40}*9*11 = 93,780 \]
\[ \sigma = \sqrt{\sigma^{2}} = \sqrt{93,780} = 306.24 \]
Vraag 30
\[ Z = \frac{2000 - 1700}{306.24} = 0.980 \]
P(Z > 0.980) = 0.1635
Hoe kun je een goede steekproef uit de populatie verkrijgen? - TentamenTests 6
Vragen
Vraag 1
Stel dat we weten dat de jaarlijkse procentuele salarisverhoging normaal wordt verdeeld met een gemiddelde van 12,2% en een standaarddeviatie van 3,6%. Een willekeurige steekproef van 9 waarnemingen wordt verkregen van deze populatie en het steekproefgemiddelde wordt berekend. Wat is de standaardfout van het steekproefgemiddelde?
Vraag 2
Overweeg nogmaals de informatie van de vorige vraag. Wat is de kans dat het gemiddelde van de steekproef 14,4% overschrijdt?
Vraag 3
Gebruik de volgende informatie voor vragen 3-6. Gegeven een populatie met een gemiddelde van 105 en een variantie van 16, is de centrale limietstelling van toepassing wanneer de steekproefomvang n > 25 is . Een willekeurige steekproef van grootte 25 wordt verkregen. Wat zijn het gemiddelde en de variantie van de steekproefverdeling voor de steekproefgemiddelden?
Vraag 4
Wat is de kans dat x̅ > 106
Vraag 5
Wat is de kans dat 104 < x̅ < 106?
Vraag 6
Wat is de kans dat x̅ < 105.5?
Vraag 7
Gebruik de volgende informatie voor vragen 7-10. Gegeven een populatie met een gemiddelde van 150 en een variantie van 1600, is de centrale limietstelling van toepassing wanneer de steekproefgrootte n > 25 is . Een willekeurige steekproef van grootte 36 wordt verkregen. Wat zijn het gemiddelde en de variantie van de steekproefverdeling voor de steekproefgemiddelden?
Vraag 8
Wat is de kans dat x̅ > 155?
Vraag 9
Wat is de kans dat 145 < x̅ < 165?
Vraag 10
Wat is de kans dat x̅ > 165?
Vraag 11
Gebruik de volgende informatie voor vragen 11-14. De levensduur van gloeilampen die door een bedrijf worden uitgestoten, heeft een gemiddelde van 1200 uur en een standaardafwijking van 400 uur. De bevolking is normaal verdeeld. Stel dat u negen gloeilampen koopt, die als een goede steekproef uit de populatie kunnen worden beschouwd. Wat is het gemiddelde van de gemiddelde gemiddelde levensduur ?
Vraag 12
Wat is de variantie van de steekproef?
Vraag 13
Wat is de standaardfout van het voorbeeldgemiddelde?
Vraag 14
Wat is de kans dat gemiddeld die negen gloeilampen een levensduur hebben van minder dan 1050 uur?
Vraag 15
Om enig gevoel te krijgen voor mogelijke groottes van de eindige populatiecorrectiefactor, bereken het voor steekproeven van n = 20 observaties van populaties van leden: 20, 100, 10.000.
Vraag 16
Leg uit waarom het in de vorige vraag gevonden resultaat precies is wat men op intuïtieve gronden zou kunnen verwachten.
Vraag 17
Een willekeurige steekproef van 270 studenten werd genomen uit een grote populatie studenten die een statistiekexamen aflegden. Als in feite 20% van de studenten de test niet haalt, hoe groot is dan de kans dat het steekproefpercentage van de studenten die niet slagen voor de test tussen 16 en 24% zal liggen?
Vraag 18
Bereken nu dezelfde kans voor 16 tot 24%, maar gebruik dit keer een steekproef van 400 studenten.
Vraag 19
Naar schatting drinkt 43% van de studenten alcohol. Zoek de kans dat meer dan de helft van een willekeurige steekproef van 80 studenten alcohol drinkt.
Vraag 20
Stel dat 50% van alle volwassen Amerikanen eenmaal per week McDonald's eten. Wat is de kans dat meer dan 58% van een willekeurige steekproef van 250 volwassen Amerikanen eenmaal per week McDonald's eten?
Vraag 21
Stel dat 50% van alle volwassen Amerikanen eenmaal per week McDonald's eten. Wat is de kans dat meer dan 55% van een willekeurige steekproef van 250 volwassen Amerikanen eenmaal per week McDonald's eet?
Vraag 22
Gegeven is n = 6. Bepaal een bovengrens voor de steekproefvariantie zodanig dat de kans op overschrijding van deze limiet, gegeven een populatiestandaarddeviatie van 3,6, kleiner is dan 0,05. Gebruik de chi-kwadraat verdeling aan het oplossen van dit probleem .
Vraag 23
Overweeg de volgende informatie voor vragen 23-26. Er zijn zes werknemers met de volgende jaren ervaring:
2, 4, 6, 6, 7, 8
Twee van deze werknemers worden willekeurig gekozen.
Wat is de gemiddelde leeftijd voor deze zes werknemers?
Vraag 24
Hoeveel mogelijke steekproeven van twee werknemers zijn er?
Vraag 25
Maak een lijst van alle mogelijke steekproeven.
Vraag 26
Vind de steekproefverdeling van de steekproefgemiddelden.
Vraag 27
Wat is de centrale limietstelling?
Vraag 28
Overweeg de volgende informatie voor vragen 28-30. Stel dat een populatieverdeling schuin ligt met gemiddelde 100 en variantie 15. Uit deze populatie trekken we een willekeurige steekproef van n = 100. Wat is het verwachte gemiddelde van deze steekproef?
Vraag 29
Wat is de verwachte variantie van deze steekproef?
Vraag 30
Welke vorm wordt verwacht voor de steekproefverdeling?
Antwoordindicatie
Vraag 1
μ = 12,2; σ = 3,6; n = 9.
\[ \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} = \frac{3.6}{\sqrt{9}} = 1.2 \]
Vraag 2
\[ P(\bar{x} > 14.4) = P( \frac{\bar{X} - \mu}{\sigma_{\bar{x}}} > \frac{14.4 - 12.2}{1.2} ) = P(z > 1.83) = 0.0336 \]
Concluderend is de kans dat het steekproefgemiddelde 14,4% zal overschrijden slechts 0,0336.
Vraag 3
De centrale limietstelling is van toepassing, dus de steekproefverdeling heeft gemiddelde 105 en variantie 16 / √25 = 3.2.
Vraag 4
\[ Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{106 - 105}{3.2} = 0.3125\]
P(Z > 0.3125) = 1- 0.6217 = 0.3783
Vraag 5
\[ Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{104 - 105}{3.2} = -0.3125\]
P(104 < x̅ < 106) = P(-0.3125 < z < 0.3125) = 0.6217 - (1 - 0.6217) = 0.2434
Vraag 6
\[ Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{105.5 - 105}{3.2} = 0.1563\]
P(Z < 0.1563) = 0.5636
Vraag 7
De centrale limietstelling is van toepassing, dus het gemiddelde van de steekproefverdeling is 150 en de variantie 1600 / √36 = 266.67.
Vraag 8
\[ Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{155 - 150}{266.7} = 0.0188\]
P(Z > 0.0188) = 1- 0.5040 = 0.4960
Vraag 9
\[ Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{145 - 150}{266.7} = -0.06563\]
\[ Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{165 - 150}{266.7} = 0.0563\]
P(145 < x̅ < 165) = P(-0.0563 < z < 0.0563) = 0.5239 - (1 - 0.5239) = 0.5239 - 0.4761 = 0.0478
Vraag 10
P(x̅ > 165) = 1 - 0.5239 = 0.4761
Vraag 11
De bevolking is normaal verdeeld. Daarom is de steekproefverdeling van de steekproefgemiddelden normaal. Vandaar het gemiddelde van de steekproef verdeling is 1.200.
Vraag 12
De variantie is 400 / √9 = 133,33
Vraag 13
De standaardfout is √400 / √9 = 6.67.
Vraag 14
\[ Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{1050 - 1200}{133.33} = 1.1250\]
P(x̅ < 1050) = P(Z < 1.1250) = (0.8686 + 0.8708)/2 = 0.8697
Vraag 15
De eindige populatiecorrectiefactor wordt als volgt berekend: (N - n) / (N - 1).
De populatie correctiefactor voor sampl e size n = 20 voor een populatie met 20 leden is: (20-20) (20-1) = 0.
De populatie correctiefactor voor sampl e size n = 20 voor een populatie met 100 leden is : (100 - 20) (100 - 1) = 0,8081.
De populatiecorrectiefactor voor steekproefgrootte n = 20 voor een populatie met 10.000 leden is: (10.000 - 20) (10.000 - 1) = 0.9981.
Vraag 16
Het is de totale steekproefgrootte, niet de fractie van de populatie in de steekproef, die de nauwkeurigheid van de resultaten van een willekeurige steekproef bepaalt. Hoe groter het aantal leden in de populatie, hoe hoger de nauwkeurigheid van de schatting, ongeacht de grootte van een enkele steekproef.
Vraag 17
P = 0,20 en n = 270.
\[ \sigma_{\hat{p}} = \sqrt{ \frac{P(1 - P)}{n} } = \sqrt{\frac{0.20(1 - 0.20)}{270} } = 0.024 \]
De vereiste waarschijnlijkheid is:
\ [P (0.16 <\ hat {p} <0.24 = P (\ frac {0.16 - 0.20} {0.024} P (-1.67 We zien dus dat de kans 0,9050 is dat de steekproefverhouding binnen het interval [0,16 - 0,24] ligt gegeven P = 0,20 en steekproefomvang n = 270. Dit interval kan een acceptatie-interval van 90,50% worden genoemd. Merk op dat als de steekproefverhouding daadwerkelijk buiten deze interval lag, we kunnen vermoeden dat de populatiegraad P niet 0,20 is.
Vraag 18
P = 0,20; n = 400.
\ [\ sigma _ {\ hat {p}} = \ sqrt {\ frac {P (1 - P)} {n}} = \ sqrt {\ frac {0.20 (1 - 0.20)} {400} } = 0.0200 \]
De vereiste waarschijnlijkheid is:
\[ P(0.16 < \hat{p} < 0.24 = P( \frac{0.16 - 0.20}{0.024} < Z \frac{0.24 - 0.20}{0.024} ) \]
P(-1.67 < Z < 1.67) = 0.9525 - (1 - 0.9525) = 0.9050
Dit interval kan dus een acceptatie-interval van 95,44% worden genoemd (gegeven P = 0,20 en steekproefgrootte n = 400).
Vraag 19
P = 0.43; n = 80.
\[ \sigma_{\hat{p}} = \sqrt{ \frac{P(1 - P)}{n} } = \sqrt{\frac{0.43(1 - 0.43)}{80} } = 0.055 \]
\[ P(\hat{p} > 0.50) = P(Z > \frac{0.50 - 0.43}{0.055}) \]
P (Z > 1.27) = 0.1020
Vraag 20
P = 0.50; n = 250
\[ \sigma_{\hat{p}} = \sqrt{ \frac{P(1 - P)}{n} } = \sqrt{\frac{0.50(1 - 0.50)}{250} } = 0.0316 \]
\[ P(\hat{p} > 0.58) = P(Z > \frac{0.58 - 0.50}{0.0316}) = 2.5316 \]
P (Z > 2.53) = 1 - 0.9943 = 0.0057
Vraag 21
\[ P(\hat{p} > 0.55) = P(Z > \frac{0.55 - 0.50}{0.0316}) = 0.9494 \]
P (Z > 0.95) = 1 - 0.8289 = 0.1711
Vraag 22
Top 10% correspondeert me z = 1.185.
\[ 1.185 = \frac{X - 420}{80} \]
\[ 1.185*80 = X - 420 \]
\[ 94.5 + 420 = X\]
X = 514.8. Dus, iemand moet minimaal 515 scoren op de test om in de top 10% te vallen.
Vraag 23
\ [\ mu = \ frac {2 + 4 + 6 + 6 + 7 + 8} {6} = 5.5 \]
Vraag 24
Twee van deze werknemers worden willekeurig gekozen. We nemen steekproeven zonder vervanging, dus de eerste waarneming heeft een waarschijnlijkheid van 1/6 dat wordt geselecteerd, terwijl de tweede waarneming een waarschijnlijkheid heeft dat 1/5 wordt geselecteerd. Vijftien mogelijke willekeurige steekproeven van twee werknemers konden worden geselecteerd. Merk op dat sommige steekproeven (zoals 2,6) twee keer voorkomen omdat er twee werknemers met zes jaar ervaring in de bevolking zijn.
Vraag 25
2 4
2 6 (2x)
2 7
2 8
4 6 (2x)
4 7
4 8
6 6
6 7 (2x)
6 8 (2x)
7 8
Vraag 26
steekproef gemiddelde | Waarschijnlijkheid van het steekproef gemiddelde |
3.0 | 1/15 |
4.0 | 2/15 |
4.5 | 1/15 |
5.0 | 3/15 |
5.5 | 1/15 |
6.0 | 2/15 |
6.5 | 2/15 |
7.0 | 2/15 |
7.5 | 1/15 |
Vraag 27
De centrale limietstelling toont aan dat, als de steekproefgrootte groot genoeg is, het gemiddelde van een willekeurige steekproef uit een populatie met een waarschijnlijkheidsverdeling ongeveer normaal verdeeld zal zijn met gemiddelde μ en variantie σ2 / n.
Vraag 28
100
Vraag 29
σ2 / n = 15/100 = 0,15
Vraag 30
Volgens de centrale limietstelling verwachten we dat, naarmate n groter wordt, de verdeling de standaard normale verdeling nadert.
Hoe kun je schattingen verkrijgen voor een enkele populatie? - TentamenTests 7
Vragen
Vraag 1
Laat x1 , x2 , ..., xn een willekeurige steekproef zijn van een normaal verdeelde populatie met gemiddelde μ en variantie σ2. Ervan uitgaande dat een populatie normaal verdeeld is met een zeer grote populatiegrootte in vergelijking met de steekproefgrootte, moet het steekproefgemiddelde of de steekproefmediaan worden gebruikt om het populatiegemiddelde te schatten?
Vraag 2
Geef één voordeel van de mediaan ten opzichte van het gemiddelde voor het schatten van een populatiegemiddelde.
Vraag 3
Geef één nadeel van de mediaan in vergelijking met het gemiddelde voor het schatten van een populatiegemiddelde.
Vraag 4
Welke twee eigenschappen moet een schatter bezitten?
Vraag 5
Overweeg de volgende informatie voor vraag 5-8. Stel dat winkeltijden voor klanten in een lokaal winkelcentrum een normale verdeling volgen. De standaarddeviatie van de populatie is gelijk aan 20 minuten. Een steekproef van 64 shoppers in de plaatselijke supermarkt heeft een gemiddelde tijd van 75 minuten. Wat is de standaardfout?
Vraag 6
Wat is de foutmarge?
Vraag 7
Wat is het 95% betrouwbaarheidsinterval voor de populatiegemiddelde μ ?
Vraag 8
Geef een interpretatie van dit betrouwbaarheidsinterval.
Vraag 9
Hoe kan de foutenmarge worden verminderd?
Vraag 10
Welke verdeling wordt gebruikt wanneer de populatievariantie bekend is?
Vraag 11
Welke verdeling wordt gebruikt wanneer de populatievariantie onbekend is?
Vraag 12
Zoek de standaardfout voor n = 17 en s = 16.
Vraag 13
Vind de bovenste kritische waarde van de Student's t-verdeling met v = 23 vrijheidsgraden voor α = 0,05.
Vraag 14
Gebruik de volgende informatie voor vragen 14-18. Uit een willekeurige steekproef van 344 medewerkers bleek dat 261 voor een aangepast bonusplan waren. Wat is de steekproefverhouding?
Vraag 15
Wat is de betrouwbaarheidsfactor voor een betrouwbaarheidsinterval van 90%?
Vraag 16
Wat is de foutmarge voor een betrouwbaarheidsinterval van 90%?
Vraag 17
Zorg voor een betrouwbaarheidsinterval van 90%.
Vraag 18
Interpreteer het betrouwbaarheidsniveau van 90%.
Vraag 19
Wat is het getal dat met waarschijnlijkheid 0,10 wordt overschreden door een chikwadraat willekeurige variabele met 4 vrijheidsgraden?
Vraag 20
Wat is het getal dat met waarschijnlijkheid 0,05 wordt overschreden door een chikwadraat willekeurige variabele met 18 vrijheidsgraden?
Vraag 21
De volgende informatie wordt verstrekt: n = 25, s2 = 100. Wat zijn de kritische waarden voor een betrouwbaarheidsinterval van 95% met α = 0,05?
Vraag 22
Gebruik de informatie in de vorige vraag. Zoek het 95% betrouwbaarheidsinterval voor de populatievariantie.
Vraag 23
Overweeg de volgende informatie voor vragen 23-24. Stel dat er 1395 middelbare scholen in Nederland zijn. Uit een eenvoudige steekproef van 400 van deze scholen bleek dat de steekproefgemiddelde inschrijving in het afgelopen jaar voor biologiecursussen 320,8 studenten bedroeg, en de standaardafwijking van de steekproef bleek 149,7 studenten te zijn. Wat is de puntschatting voor het totale aantal inwoners, Nμ?
Vraag 24
Zoek het overeenkomende 99% betrouwbaarheidsinterval voor dit populatietotaal.
Vraag 25
Overweeg de volgende informatie voor vragen 25-26. Uit een eenvoudige steekproef van 400 van de 1.395 studenten in onze populatie blijkt dat biologie een cursus van twee semesters was in 141 van de in de steekproef opgenomen scholen. Schat het aandeel van alle scholen waarvoor de biologiecursus twee semesters lang is.
Vraag 26
Geef het betrouwbaarheidsinterval voor het aandeel van alle scholen waarvoor de biologiecursus twee semesters lang is.
Vraag 27
Stel dat we hebben: ME = 0,50; σ = 1,8; en za/2 = z0,005 = 2,576. Wat is de vereiste steekproefgrootte voor een betrouwbaarheidsinterval van 99%?
Vraag 28
Er wordt gegeven dat ME = 0,06 en za/2 = z0,025 = 1,96. Wat is de vereiste steekproefgrootte?
Vraag 29
Stel dat er een opiniepeiling wordt gehouden over de presidentsverkiezingen. De enquête zou een foutmarge van 3% hebben. De implicatie is dat een betrouwbaarheidsinterval van 95% voor het bevolkingsaandeel met een bepaalde mening het steekproefaandeel plus of min 3% is. Hoeveel burgers met stemgerechtigde leeftijd moeten worden bemonsterd om deze foutmarge van 3% te verkrijgen?
Vraag 30
Stel dat een eenvoudige steekproef van de 1.395 Nederlandse middelbare scholen wordt genomen. Wat de werkelijke verhouding ook is, een betrouwbaarheidsinterval van 95% mag zich niet verder uitstrekken dan 0,04 aan elke zijde van de steekproefverhouding. Hoeveel monsterobservaties moeten worden genomen?
Antwoordindicatie
Vraag 1
Ervan uitgaande dat een populatie normaal verdeeld is met een zeer grote populatiegrootte in vergelijking met de steekproefgrootte, is het steekproefgemiddelde een onpartijdige schatting van het populatiegemiddelde.
Vraag 2
De mediaan geeft minder gewicht aan extreme waarnemingen en is daarom minder gevoelig voor uitbijters.
Vraag 3
De relatieve efficiëntie van de mediaan is lager dan die van het gemiddelde.
Vraag 4
Ongekunsteld en de meest efficiënte.
Vraag 5
Standaardfout = σ/√n = 20 / √64 = 2.5
Vraag 6
De foutmarge = zα/2 * (σ / √n) = 1,96 * 2,5 = 4,9
Vraag 7
Het betrouwbaarheidsinterval van 95% loopt van 75 - 4,9 tot 75 + 4,9, dat wil zeggen: [70,1 - 79,9].
Vraag 8
Op de lange termijn bevat 95% van de op deze manier gevonden intervallen de werkelijke waarde van het populatiegemiddelde.
Vraag 9
Verlaag de standaarddeviatie van de populatie, of vergroot de steekproefomvang of verlaag het betrouwbaarheidsinterval.
Vraag 10
De standaard normale verdeling (z-verdeling).
Vraag 11
Student's t distributie.
Vraag 12
Standaardfout = s / √n = 16 / √17 = 3.88
Vraag 13
Gebruik tabel 8 (bijlage) om te bepalen dat de bovenste kritische waarde 1.714 is.
Vraag 14
\[ \hat{p} = 261/344 = 0.759 \]
Vraag 15
\[ z_{\alpha/2} = z_{0.05} = 1.645\]
Vraag 16
\[ 1.645 \sqrt{(0.759)(0.241)}{344} = 0.038 \]
Vraag 17
0.759 +/- 0.038 = [0.721; 0.797
Vraag 18
Stel dat je een zeer groot aantal onafhankelijke willekeurige steekproeven met grootte n = 344 uit deze populatie neemt en een betrouwbaarheidsinterval van 90% voor elk steekproefresultaat berekent. Vervolgens impliceert het betrouwbaarheidsniveau van het interval dat op de lange termijn 90% van de op deze manier gevonden intervallen de werkelijke waarde van het bevolkingsaandeel bevat.
Vraag 19
7,779
Vraag 20
28,869
Vraag 21
\[ X^{2}_{n-1,1-\alpha/2} = \chi^{2}_{24,0.975} = 12.401 \]
\[ X^{2}_{n-1,\alpha/2} = \chi^{2}_{24,0.025} = 39.364 \]
Vraag 22
\[ LCL = \frac{(n - 1) s^{2}}{\chi^{2}_{n - 1,\alpha/2} } = \frac{(24)(100)}{39.364} = 60.97 \]
\[ UCL = \frac{(n - 1) s^{2}}{\chi^{2}_{n - 1,1 - \alpha/2} } = \frac{(24)(100)}{12.401} = 193.53 \]
Het betrouwbaarheidsinterval van 95% is dus: [60,97; 193,53]
Vraag 23
Nx̄ = (1.395) (320.8) = 447.516. We schatten dus dat in totaal 447.516 studenten zullen worden ingeschreven voor biologiecursussen.
Vraag 24
\[ N\hat{\sigma}_{\bar{x}} = \frac{Ns}{\sqrt{n}} \sqrt{ (\frac{N - n}{N - 1}) } = \frac{(1,395)(149.7)}{\sqrt{400}} = 8,821.6 \]
Omdat de steekproefomvang groot is, kunnen we de centrale limietstelling met z α / 2 = 2,58 gebruiken voor een betrouwbaarheidsinterval van 99%. Vandaar:
\[ N\bar{x} \pm z_{\alpha/2} N \hat{\sigma}_{\bar{x}} \]
\[ 447,516 \pm 2.58(8.821.6) \]
\[ 447,516 \pm 22,760 \]
Het betrouwbaarheidsinterval van 99% loopt dus van 424.756 tot 470.276 studenten.
Vraag 25
N = 1,395; n = 400.
\[ \hat{p} = \frac{141}{400} = 0.3525 \]
De puntschatting van de populatie proportie P is eenvoudigweg gelijk aan deze populatie proportie, dat wil zeggen: 0,3525.
Vraag 26
\[ \hat{\sigma}^{2}_{\hat{p}} = \frac{\hat{p} (1 - \hat{p}}{n - 1} ( \frac{N - n}{N - 1} ) = \frac{(0.3525)(0.6475)}{400} = 0.0004073 \]
zodat
\[ \hat{\sigma}_{\hat{p}} = \sqrt{0.0004073} = 0.0202 \]
For a 90% confidence interval: za/2 = 1.645.
\[ ME = z_{\alpha/2} \hat{\sigma}_{\hat{p}} = 1.645(0.0202) ≅ 0.0332 \]
Voor een betrouwbaarheidsinterval van 90%: za/2 = 1.645.
\[ ME = z_{\alpha/2} \hat{\sigma}_{\hat{p}} = 1.645(0.0202) ≅ 0.0332 \]
Het betrouwbaarheidsinterval van 90% loopt dus van 0,3525 +/- 0,0332. Dat wil zeggen van 31,93% tot 38,57%.
Vraag 27
\[ n = \frac{z^{2}_{\alpha/2}} \sigma^{2}{ME^{2}} = \frac{ (2.576)^{2} (1.8)^{2} }{(0.5)^{2}} ≈ 86 \]
Vraag 28
\[ n = \frac{0.25 (z_{\alpha/2})^{2}}{(ME)^{2}} = \frac{0.25(1.96)^{2}}{(0.06)^{2}} = 267 \]
Vraag 29
\[ n = \frac{0.25 (z_{\alpha/2})^{2}}{(ME)^{2}} = \frac{(0.25)(1.96)^{2}}{(0.03)^{2}} = 1067.11 = 1068 \]
Vraag 30
\[ 1.96 \sigma_{\hat{p}} = 0.04 \]
\[ \sigma_{\hat{p}} = 0.020408 \]
\[ n_{max} = \frac{0.25N}{(N - 1) \sigma^{2}_{\hat{p}} + 0.25 } = \frac{(0.25)(1,395)}{(1,394)(0.020408)^{2} + 0.25} = 419.88 = 420 \]
Hoe kun je parameters schatten voor twee populaties? - TentamenTests 8
Vragen
Vraag 1
De volgende informatie wordt verstrekt voor een afhankelijke willekeurige steekproef van twee normaal verdeelde populaties:
\[ n = 11 \ hspace {3mm} \ bar {d} = 28.5 \ hspace {3mm} s_ {d} = 3.3 \]
Zoek het 98% betrouwbaarheidsinterval voor het verschil tussen de gemiddelden van de twee populaties.
Vraag 2
Wat is de foutmarge voor een betrouwbaarheidsinterval van 98% voor het verschil tussen de gemiddelden van de twee populaties van de vorige vraag?
Vraag 3
Wat concludeer je op basis van het betrouwbaarheidsinterval van vraag 1?
Vraag 4
Overweeg de volgende gegevens voor vraag 4-6:
Voor | Na |
6 12 8 10 6 | 8 14 9 13 7 |
Welke type afhankelijke steekproef is hier weergegeven?
Vraag 5
Wat is het steekproefgemiddelde van de verschillen?
Vraag 6
Er wordt aangegeven dat het gemiddelde verschil gelijk is aan 7,7 met standaarddeviatie sd = 43.68901. Bereken het 95% betrouwbaarheidsinterval met de normale benadering.
Vraag 7
Gebruik de volgende informatie voor vragen 7-13. Een educatieve studie wordt uitgevoerd om de effectiviteit van een wiskundig leesprogramma van basisschoolkinderen te onderzoeken. Elk kind kreeg een pre- en posttest (voor- en nameting). Hogere scores duiden op verbetering van de wiskunde. Van een zeer grote populatie werd een willekeurige steekproef getrokken. De gegevens die uit deze steekproef zijn verkregen, staan in de onderstaande tabel. Wat is de gemiddelde verschilscore?
Kind | Voormeting | Nameting |
1 2 3 4 5 6 7 | 40 36 32 38 33 | 48 42 36 |
Vraag 8
Wat is de standaarddeviatie van de verschilscores?
Vraag 9
Zoek de t-waarde die overeenkomt met een betrouwbaarheidsinterval van 95%.
Vraag 10
Bereken een betrouwbaarheidsinterval van 95%.
Vraag 11
Kunnen we op basis van dit betrouwbaarheidsinterval van 95% concluderen dat er een significante verbetering is in de wiskunde?
Vraag 12
Bereken een betrouwbaarheidsinterval van 95% met de normale benadering.
Vraag 13
Wat concluderen we op basis van dit interval?
Vraag 14
Er is een onderzoek naar de GPA (het gemiddelde) van studenten uitgevoerd. Uit een zeer grote universiteit werden onafhankelijke steekproeven van 120 studenten met een hoofdvak economie en 90 studenten met een hoofdvak financiën geselecteerd. De gemiddelde GPA voor de willekeurige steekproef van economische majors bleek 3,08 te zijn. De gemiddelde GPA voor de willekeurige steekproef van financiële majors bleek 2,88 te zijn. Uit vergelijkbare eerdere onderzoeken is de populatiestandaarddeviatie voor de financiële majors 0,64. Geef het populatiegemiddelde voor economie aan met μx en het populatiegemiddelde voor financiën met μy. Met welk scenario hebben we hier te maken?
a. populatievariaties bekend
b. populatievarianties onbekend, maar aangenomen gelijk te zijn
c. populatievarianties onbekend en niet gelijk geacht
Vraag 15
Bereken het 95% betrouwbaarheidsinterval voor de verschilscore voor de informatie in de vorige vraag.
Vraag 16
Wat concluderen we op basis van dit 95% betrouwbaarheidsinterval (uit vraag 15)?
Vraag 17
Overweeg de volgende gegevens voor vragen 17-21:
X | 100 | 125 | 135 | 128 | 140 | 142 | 128 | 137 | 156 | 142 |
Y | 95 | 87 | 100 | 75 | 110 | 105 | 85 | 95 |
Stel dat dit onafhankelijke steekproeven zijn met onbekende varianties, maar de varianties worden
verondersteld gelijk te zijn. Geef nx, ny, x̄, ȳ, σ2x and σ2y.
Vraag 18
Bereken de gepoolde variantie.
Vraag 19
Wat zijn de vrijheidsgraden?
Vraag 20
Zoek de t-waarde die overeenkomt met een betrouwbaarheidsinterval van 95%.
Vraag 21
Bereken het betrouwbaarheidsinterval van 95%.
Vraag 22
Uitgaande van gelijke populatievarianties, bepaal het aantal graden voor:
nx = 16; s2x = 30
ny = 9; s2x = 36
Vraag 23
Bereken de gepoolde steekproefvariantie voor de informatie in de vorige vraag.
Vraag 24
Uitgaande van gelijke populatievarianties, bepaal het aantal graden voor:
nx = 12; s2x = 30
ny = 14; s2x = 36
Vraag 25
Bereken de gepoolde steekproefvariantie voor de informatie in de vorige vraag.
Vraag 26
Uitgaande van gelijke populatievarianties, bepaal het aantal graden voor:
nx = 20; s2x = 16
ny = 8; s2x = 25
Vraag 27
Bereken de gepoolde steekproefvariantie voor de informatie in de vorige vraag.
Vraag 28
De volgende informatie wordt verstrekt:
\[n_{x} = 120; \hat {p}_{y} = 0.892 \]
\[n_{y} = 141; \hat {p}_{y} = 0.518 \]
Bereken een betrouwbaarheidsinterval van 95% voor het populatieverschil (Px - Py)
Vraag 29
Bereken de foutmarge voor een betrouwbaarheidsinterval van 95% met:
\[n_{x} = 300; \hat {p}_{y} = 0.62 \]
\[n_{y} = 350; \hat {p}_{y} = 0.72 \]
Vraag 30
Bereken de foutmarge voor een betrouwbaarheidsinterval van 95% met:
\[n_{x} = 100; \hat {p}_{y} = 0.44 \]
\[n_{y} = 150; \hat {p}_{y} = 0.55 \]
Antwoordindicatie
Vraag 1
\[ \bar{d} \pm t_{n-1,\alpha/2} \frac{s_{d}}{\sqrt{n}} = 28.5 \pm 2.764 \frac{3.3}{\sqrt{11}} = 28.5 \pm 2.7502 \]
Het 98% betrouwbaarheidsinterval is: [25.75; 31.25].
Vraag 2
ME = 2.7502
Vraag 3
Op basis van deze voorbeeldgegevens concluderen we dat er voldoende bewijs is om te suggereren dat er een significant verschil is tussen de twee populaties.
Vraag 4
Herhaalde metingen (repeated measurements)
Vraag 5
\[ \bar{d} = \frac{2 + 2 + 1 + 3 + 1}{5} = 1.8 \]
Vraag 6
tn-1,a/2 = t139,0.025 ≅ 1.96.
\[ \bar{d} \pm t_{n-1,\alpha/2} \frac{s_{d}}{\sqrt{n}} \]
\[ 7.7 \pm 1.96 \frac{43.68901}{\sqrt{140}} \]
\[ 7.7 \pm 7.2 \]
Dit resulteert in het volgende 95% betrouwbaarheidsinterval: [70.5; 84.9]
Vraag 7
\[ \bar{d} = \frac{8 + 6 -2 + 5 + 10}{5} = 5.4 \]
Vraag 8
sd ≅ 4.56
Vraag 9
t4,0.025 = 2.776
Vraag 10
\[ \bar{d} \pm t_{n-1,\alpha/2} \frac{s_{d}}{\sqrt{n}} \]
\[ 5.4 \pm 2.776 \frac{4.56}{\sqrt{5}} \]
\[ 5.4 \pm 5.6620 \]
Dit resulteert in het volgende 95% betrouwbaarheidsinterval: [-0.26; 11.620]
Vraag 11
Nee, omdat de nul binnen het bereik van het betrouwbaarheidsinterval ligt. Er is dus onvoldoende bewijs om te concluderen dat er een significant verschil is.
Vraag 12
Met behulp van de normale benadering vervangen we t door z, dat wil zeggen: z = 1,96.
\[ 5.4 \pm 1.96 \frac{4.56}{\sqrt{5}} \]
\[ 5.4 \pm 3.9976 \]
Het 95% betrouwbaarheidsinterval is: [1.40; 9.40]
Vraag 13
Op basis van het 95% betrouwbaarheidsinterval berekend door de normale benadering, zouden we concluderen dat er een significante verbetering is in de wiskundescores. Merk echter op dat het hier om een afhankelijke steekproef gaat (herhaalde metingen). Daarom is de normale benadering geen geldige procedure. Het is echter belangrijk om het verschil te zien dat de verdeling kan maken op de statistische inferenties.
Vraag 14
a. populatievariaties bekend
Vraag 15
\[ (\bar{x} - \bar{y}) \pm z_{\alpha/2} + \sqrt{\frac{\sigma^{2}_{x}}{n_{x}} + \frac{\sigma^{2}_{y}}{n_{y}}} \]
\[ (3.08 - 2.88) \pm 1.96 \sqrt{ \frac{(0.42)^{2}}{120}} + \frac{(0.64)^{2}}{90} = 0.20 \pm 0.1521 \]
Dus het 95% betrouwbaarheidsinterval loopt van 0.0479 tot 0.3521
Vraag 16
Het betrouwbaarheidsinterval omvat niet de nul, dus concluderen we dat er een significant verschil is in de gemiddelde GPA van studenten met een hoofdvak economie en studenten met een hoofdvak in financiën. Nauwkeuriger gezegd, gemiddeld is de gemiddelde GPA van studenten met een hoofdvak in economie hoger dan de GPA van studenten met een hoofdvak in financiën.
Vraag 17
nx = 10; x̄ = 133.30; σ2x = 218.0111
ny = 8; ȳ = 94.00; σ2y = 129.4286
Vraag 18
\[ s^{2}_{p} = \frac{ (n_{x} - 1)s^{2}_{x} + (n_{y} - 1)s^{2}_{y} }{n_{x} + n_{y} - 2} = \frac{(10 - 1)(218.0111) + (8 - 1)(129.4286) }{10 + 8 -2} = 19.2563 \]
Vraag 19
df = nx + ny - 2 = 10 + 8 - 2 = 16
Vraag 20
t16,0.025 = 2.12
Vraag 21
\[ (\bar{x} - \bar{y}) \pm t_{n_{x} + n_{y} - 2, a/2} + \sqrt{\frac{s^{2}_{p}}{n_{x}} + \frac{s^{2}_{p}}{n_{y}}} \]
\[ 39.3 \pm (2.21) \sqrt{ \frac{179.2563}{10} + \frac{179.2563}{8} } \]
\[ 39.3 \pm 13.46 \]
Dus het 95% betrouwbaarheidsinterval is: [25.84; 52.76]
Vraag 22
df = nx + ny - 2 = 16 + 9 - 2 = 23
Vraag 23
\[ s^{2}_{p} = \frac{ (n_{x} - 1)s^{2}_{x} + (n_{y} - 1)s^{2}_{y} }{n_{x} + n_{y} - 2} \]
\[ s^{2}_{p} = \frac{ (16-1)30 + (9 - 1)36}{16 + 9 - 2} = \frac{738}{23} = 32.08 \]
Vraag 24
df = nx + ny - 2 = 12 + 14 - 2 = 24
Vraag 25
\[ s^{2}_{p} = \frac{ (12-1)30 + (14 - 1)36}{12 + 14 - 2} = \frac{798}{24} = 33.25 \]
Vraag 26
df = nx + ny - 2 = 20 + 8 - 2 = 26
Vraag 27
\[ s^{2}_{p} = \frac{ (20-1)16 + (8 - 1)25}{20 + 8 - 2} = \frac{479}{26} = 18.42 \]
Vraag 28
\[ (\hat{p}_{x} - \hat{p}_{y}) \pm z_{\alpha/2} = \sqrt{ \frac{ \hat{p}_{x} (1 - \hat{p}_{x} ) }{n_{x}} + \frac{ \hat{p}_{y} (1 - \hat{p}_{y} ) }{n_{y}} } \]
\[ (0.892 - 0.518) \pm 1.96 \sqrt{ \frac{(0.892)(0.108)}{120} + \frac{(0.518)(0.482)}{141} } \]
Dus het 95% betrouwbaarheidsinterval loopt van 0.274 tot 0.473.
Vraag 29
\[ ME = z_{\alpha/2} = \sqrt{ \frac{ \hat{p}_{x} (1 - \hat{p}_{x} ) }{n_{x}} + \frac{ \hat{p}_{y} (1 - \hat{p}_{y} ) }{n_{y}} } \]
\[ 1.96 \sqrt{ \frac{(0.62)(0.38)}{300} + \frac{(0.72)(0.28)}{350} } \]
ME = 0.0733
Vraag 30
\[ ME = z_{\alpha/2} = \sqrt{ \frac{ \hat{p}_{x} (1 - \hat{p}_{x} ) }{n_{x}} + \frac{ \hat{p}_{y} (1 - \hat{p}_{y} ) }{n_{y}} } \]
\[ 1.96 \sqrt{ \frac{(0.44)(0.56)}{100} + \frac{(0.55)(0.45)}{120} } \]
ME = 0.1329
Hoe kun je hypothesen opstellen voor een enkele populatie? - TentamenTests 9
Vragen
Vraag 1
Kees wil de resultaten van een steekproefsgewijs marktonderzoek gebruiken om sterk bewijs te zoeken dat zijn graanmerk meer dan 20% van de totale markt heeft. Formuleer de nulhypothese en alternatieve hypothese met behulp van P als het populatiepercentage.
Vraag 2
Is de alternatieve hypothese die u formuleerde voor vraag 1 een eenzijdige of tweezijdige samengestelde alternatieve hypothese?
Vraag 3
Een autofabriek heeft een proces voorgesteld om de diameter van zuigers volgens een regelmatig schema te controleren. Ze willen testen of de diameter gelijk is aan 3800. Formuleer de nulhypothese en alternatieve hypothese.
Vraag 4
Is de alternatieve hypothese die u formuleerde voor vraag 1 een eenzijdige of tweezijdige samengestelde alternatieve hypothese?
Vraag 5
Wat is een type I-fout?
Vraag 6
Wat is een type II-fout?
Vraag 7
Overweeg de volgende informatie voor vragen 7-10. Een willekeurige steekproef wordt verkregen uit een populatie met variantie σ 2 = 625. Het steekproefgemiddelde wordt berekend. Test de nulhypothese H0 : μ = 100 versus de alternatieve hypothese H1 : μ > 100 met α = 0,05. Bereken de kritische waarde x̅c en vermeld uw beslissingsregel voor een steekproefgrootte van n = 25.
Vraag 8
Doe hetzelfde voor n = 16.
Vraag 9
Doe hetzelfde voor n = 44.
Vraag 10
Doe hetzelfde voor n = 32.
Vraag 11
Overweeg de volgende informatie voor vragen 11-14. Een willekeurige steekproef van n = 25 wordt verkregen uit een populatie met bekende variantie. Het steekproefgemiddelde wordt berekend. Test de nulhypothese: H0 : μ = 120 versus de alternatieve hypothese H1 : μ > 120 met α = 0,10. Bereken de kritische waarde x̅c en vermeld uw beslissingsregel met betrekking tot de populatievariantie σ2 = 196.
Vraag 12
Doe hetzelfde voor σ 2 = 625.
Vraag 13
Doe hetzelfde voor σ 2 = 900.
Vraag 14
Doe hetzelfde voor σ 2 = 500.
Vraag 15
Test de hypothesen: H0 : μ = 100 en H1 = μ > 100, met behulp van een willekeurige steekproef van n = 31, een waarschijnlijkheid van type I-fout gelijk aan 0,05 en de volgende steekproefstatistieken: x̅ = 108; s = 20.
Vraag 16
Test de hypothesen: H0 : μ = 100 en H 1 = μ > 100, met behulp van een willekeurige steekproef van n = 31, een waarschijnlijkheid van type I-fout gelijk aan 0,05 en de volgende steekproefstatistieken: x̅ = 104; s = 10.
Vraag 17
Test de hypothesen: H0 : μ = 100 en H 1 = μ > 100, met behulp van een willekeurige steekproef van n = 31, een waarschijnlijkheid van type I-fout gelijk aan 0,05 en de volgende steekproefstatistieken: x̅̅ = 96; s = 10.
Vraag 18
Noem vier voorwaarden die de powerfunctie verhogen.
Vraag 19
Veronderstel dat we de waarschijnlijkheid van een type II-fout vinden bij het falen om de nulhypothese te verwerpen wanneer de werkelijke proportie 0,56 is β = 0,31 met een significantieniveau van α = 0,05. Wat is de power?
Vraag 20
Veronderstel dat we de waarschijnlijkheid van een type II-fout vinden bij het falen om de nulhypothese te verwerpen wanneer de werkelijke proportie 0,66 is β = 0,25 met een significantieniveau van α = 0,10. Wat is de power?
Vraag 21
Gebruik de volgende informatie voor vragen 21-25. Een willekeurige steekproef van 20 producten wordt verkregen en het gewicht van elk product wordt gemeten. De steekproefvariantie wordt berekend als 6,62. De hypothese wordt getest dat het gewicht van de producten niet kan overschrijden. Formuleer de nulhypothese en alternatieve hypothese.
Vraag 22
Wat zijn de vrijheidsgraden?
Vraag 23
Wat is de kritische waarde?
Vraag 24
Wat is de teststatistiek?
Vraag 25
Kunnen we op basis van deze voorbeeldgegevens de nulhypothese verwerpen?
Vraag 26
Gebruik de volgende informatie voor vragen 26-30. Stel dat we de volgende hypotheses testen:
H0 : μ < 100 H1 : μ > 100 met een willekeurige steekproef van n = 49, een kans op type I-fout gelijk aan 0,05. Stel dat de populatievarianties onbekend zijn, welke distributie moet u gebruiken?
Vraag 27
Test de hypothesen met behulp van de volgende teststatistieken: x̅ = 108; s = 20
Vraag 28
Test de hypothesen met behulp van de volgende teststatistieken: x̅̅ = 104; s = 10
Vraag 29
Test de hypothesen met behulp van de volgende teststatistieken: x̅ = 96; s = 10
Vraag 30
Test de hypothesen met behulp van de volgende teststatistieken: x̅ = 95; s = 8
Antwoordindicatie
Vraag 1
H0 : P = 0,20
H1 : P> 0,20
Vraag 2
Een eenzijdige samengestelde alternatieve hypothese.
Vraag 3
H0 : μ = 3800 H1 : μ ≠ 3800
Vraag 4
Een tweezijdige samengestelde alternatieve hypothese.
Vraag 5
Een type I-fout verwijst naar het verwerpen van de nulhypothese, terwijl de nulhypothese waar is.
Vraag 6
Een type II-fout verwijst naar het niet afwijzen van de nulhypothese, terwijl de nulhypothese onjuist is.
Vraag 7
\[ x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 100 + 1.96 x (25 / \sqrt{25}) = 109.80 \]
De beslissingsregel is: verwerp H0 als x̅̅ > 109.80
Vraag 8
\[ x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 100 + 1.96 x (25 / \sqrt{16}) = 112.50 \]
De beslissingsregel is: afwijzen H0 als x̅̅ > 112,50
Vraag 9
\[ x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 100 + 1.96 x (25 / \sqrt{44}) = 107.39 \]
De beslissingsregel is: afwijzen H0 als x̅̅ > 107.39
Vraag 10
\[ x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 100 + 1.96 x (25 / \sqrt{32}) = 108.62 \]
De beslissingsregel is: afwijzen H0 als x̅̅ > 108,62
Vraag 11
Voor een eenzijdige hypothesetest met significantieniveau α = 0,05, de waarde van zα = 1,282 uit de standaard normale tabel. De variantie is 196, dus de standaardafwijking is √196 = 14.
\[ x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 120 + 1.282 x (14 / \sqrt{25}) = 123.59 \]
De beslissingsregel is: verwerp H0 als x̅̅ > 123.59
Vraag 12
\[ x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 120 + 1.282 x (\sqrt{625} / \sqrt{25}) = 121.28 \]
De beslissing regel is: verwerp H0 als x̅̅ > 121.28
Vraag 13
\[ x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 120 + 1.282 x (\sqrt{900} / \sqrt{25}) = 127.69 \]
De beslissing regel is: verwerp H0 als x̅̅ > 127.69
Vraag 14
\[ x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 120 + 1.282 x (\sqrt{500} / \sqrt{25}) = 125.73 \]
De beslissing regel is: verwerp H0 als x̅̅ > 125.73
Vraag 15
t30,0.05 = 1.697
\[ t = \frac{\bar{x} - \mu_{0}}{s / \sqrt(n)} = \frac{108 - 100}{20 / \sqrt{31}} = 2.23 \]
Dus t> t 30,0.05. Op basis van dit resultaat verwerpen we de nulhypothese ten gunste van de alternatieve hypothese.
Vraag 16
t30,0.05 = 1.697
\ [ t = \ frac {\ bar {x} - \ mu_ {0}} {s / \ sqrt (n)} = \ frac {104 - 100} {10 / \ sqrt {31} } = 2.23 \]
Dus t > t30,0.05 . Op basis van dit resultaat verwerpen we de nulhypothese ten gunste van de alternatieve hypothese. De t-waarde is eigenlijk dezelfde als in de vorige vraag, omdat zowel de nominator als de noemer de helft van de oorspronkelijke waarde zijn en dus dezelfde uitkomst opleveren.
Vraag 17
t30,0.05 = 1.697
\[ t = \frac{\bar{x} - \mu_{0}}{s / \sqrt(n)} = \frac{96 - 100}{10 / \sqrt{31}} = -2.23 \]
Dus t < t30,0.05 . Omdat we een eenzijdige alternatieve hypothese testen met H 1 : μ> μ0 , kunnen we de nulhypothese hier niet verwerpen (houd er rekening mee dat het steekproefgemiddelde lager is dan de parameter van belang, in plaats van hoger dan de parameter).
Vraag 18
(1) het werkelijke gemiddelde is verder verwijderd van het hypothetische gemiddelde μ0 ; (2) het significantieniveau is hoger; (3) de populatievariantie is lager; (4) de steekproefomvang is groter.
Vraag 19
Power = 1 - β = 1 - 0.31 = 0.69
Vraag 20
Power = 1 - β = 1 - 0,25 = 0,75
Vraag 21
H0: σ2 < σ20 = 4
H1: σ2 > 4
Vraag 22
df = n - 1 = 20 - 1 = 19
Vraag 23
Voor deze test met een significantieniveau van α = 0,05 en 19 vrijheidsgraden, is de kritische waarde van de chikwadraatvariabele 30.144 (zie Bijlage Tabel 7 van het boek).
Vraag 24
\ [\ frac {(n - 1) s ^ {2}} {\ sigma ^ {2} _ {0}} = \ frac {20 -1) (6.62)} {4} = 31.445 \]
Vraag 25
31.445> 30.144. Daarom kunnen we de nulhypothese verwerpen en concluderen dat de variabiliteit van het gewicht van de producten de norm overtreft.
Vraag 26
Student t distributie
Vraag 27
De kritische t-waarde is: tc = 1.684
\[ t = \frac{108 - 100}{20 / \sqrt{49}} = 2.8 \]
t > tc , daarom kunnen we de nulhypothese verwerpen.
Vraag 28
\[ t = \frac{104 - 100}{20 / \sqrt{10}} = 2.8 \]
t > tc , daarom kunnen we de nulhypothese verwerpen.
Vraag 29
\[ t = \frac{96 - 100}{10 / \sqrt{49}} = -2.8 \]
t < tc , maar we testen t > tc. Daarom kunnen we de nulhypothese niet verwerpen ("verkeerde kant") .
Vraag 30
\[ t = \frac{95 - 100}{8 / \sqrt{49}} = 4.38 \]
t < tc , maar we testen t > tc. Daarom kunnen we de nulhypothese niet verwerpen ("verkeerde kant") .
Welke testprocedures zijn er voor het verschil tussen twee populaties? - TentamenTests 10
Vragen
Vraag 1
Gebruik de volgende informatie voor vragen 1-5. Een onderzoeker wil bepalen of twee verschillende productieprocessen een verschillend gemiddeld aantal producten per uur hebben. Het gemiddelde van productieproces 1 wordt gedefinieerd als μ1 en het gemiddelde van productieproces 2 wordt gedefinieerd als μ2. De nul- en alternatieve hypotheses zijn als volgt: H0: μ1 - μ2 = 0 en H1: μ1 - μ2 > 0. Uit de populaties wordt een willekeurige steekproef getrokken van 25 gematchte paren. De steekproefgemiddelden zijn respectievelijk 50 en 60 voor populaties 1 en 2. Geef de beslisregel met een kans op type I-fout α = 0,05.
Vraag 2
Kun je de nulhypothese verwerpen als de standaarddeviatie van het verschil van het verschil 20 is?
Vraag 3
Kun je de nulhypothese verwerpen wanneer je toets met een kans op type I-fout α = 0,05 als de standaarddeviatie van het steekproefverschil 30 is?
Vraag 4
Kun je de nulhypothese verwerpen wanneer je toets met een kans op type I-fout α = 0,05 als de standaarddeviatie van het steekproefverschil 15 is?
Vraag 5
Kun je de nulhypothese verwerpen wanneer je toets met een kans op type I-fout α = 0,05 als de standaarddeviatie van het steekproefverschil 40 is?
Vraag 6
Gebruik de volgende informatie voor vraag 6-10. Een onderzoeker wil bepalen of twee verschillende productieprocessen een verschillend gemiddeld aantal producten per uur hebben. Het gemiddelde van productieproces 1 wordt gedefinieerd als μ1 en het gemiddelde van productieproces 2 wordt gedefinieerd als μ2. De nul- en alternatieve hypotheses zijn als volgt: H0: μ1 - μ2 = 0 en H1: μ1 - μ2 < 0. Uit de populaties wordt een willekeurige steekproef getrokken van 25 gematchte paren. De standaarddeviatie van het verschil tussen de steekproefgemiddelden is 25. Geef de beslisregel wanneer je toets met een kans op type I-fout α = 0,05.
Vraag 7
Kun je de nulhypothese verwerpen met een kans op type I-fout α = 0,05 als de steekproefgemiddelden respectievelijk 56 en 50 zijn voor populaties 1 en 2?
Vraag 8
Kun je de nulhypothese verwerpen met een kans op type I-fout α = 0,05 als de steekproefgemiddelden respectievelijk 59 en 50 zijn voor populaties 1 en 2?
Vraag 9
Kun je de nulhypothese verwerpen met een kans op type I-fout α = 0,05 als de steekproefgemiddelden respectievelijk 56 en 48 zijn voor populaties 1 en 2?
Vraag 10
Kun je de nulhypothese verwerpen met een kans op type I-fout α = 0,05 als de steekproefgemiddelden respectievelijk 54 en 50 zijn voor populaties 1 en 2?
Vraag 11
Gebruik de volgende informatie voor vragen 11-13. Een onderzoeker wil een hypothesetest uitvoeren voor het verschil in gemiddelde tussen twee populaties met onafhankelijke steekproeven. De volgende informatie wordt verstrekt:
nx = 25; x̅ = 115; σx2 = 625
ny = 25; y̅ = 100; σy2 = 400
Bereken de test statistiek
Vraag 12
De onderzoeker besluit te testen met een significantieniveau van α = 0,05. Bepaal de kritieke z-waarde.
Vraag 13
Vergelijk de kritieke z-waarde met de teststatistiek. Kan de onderzoeker de nulhypothese verwerpen?
Vraag 14
Hoe groot moet de steekproefgrootte zijn om een goede benadering te krijgen als we de populatievarianties vervangen door de steekproefvarianties?
Vraag 15
Gebruik de volgende informatie voor vragen 15-20.
nx = 25; x̅ = 1078; sx = 633
ny = 25; y̅ = 908.2; sy = 469.8
We zijn geïnteresseerd in het testen van het verschil in populatiegemiddelden tussen X en Y. De alternatieve hypothese stelt dat het gemiddelde van populatie 2 groter is dan het gemiddelde van populatie 1. Voor deze hypothesetest gebruiken we een significantieniveau van α = 0,05. Merk op dat de populatievarianties onbekend zijn en dat de steekproefvarianties worden gegeven.
Vraag 16
Formuleer de nulhypothese en alternatieve hypothese.
Vraag 17
Bereken de gepoolde variatieschatting.
Vraag 18
Wat zijn het aantal vrijheidsgraden?
Vraag 19
Wat is de kritische waarde van t?
Vraag 20
Bereken de teststatistiek.
Vraag 21
Geef de beslisregel voor deze hypothesetest.
Vraag 22
Kan de nulhypothese worden verworpen?
Vraag 23
Hoe groot moet de steekproefgrootte zijn om de standaard normale verdeling te kunnen gebruiken voor het testen van de gelijkheid van twee populatieverhoudingen?
Vraag 24
Overweeg de volgende informatie voor vragen 23-27:
nx = 270; px (steekproef) = 0.185
ny = 203; py (steekproef) = 0.399
Bereken de schatting van de gemeenschappelijke variantie, P0, volgens de nulhypothese.
Vraag 25
Bereken de teststatistiek.
Vraag 26
Stel dat we testen met de alternatieve hypothese: H1: Px < Py. Voor deze test gebruiken we een significantieniveau van α = 0,05. Wat is de kritische waarde?
Vraag 27
Formuleer de beslisregel.
Vraag 28
Kunnen we de nulhypothese verwerpen?
Vraag 29
Overweeg de volgende informatie voor vragen 28-30.
nx = 17; sx = 123,35
ny = 11; sy = 8,02
Vraag 30
Wat zijn de vrijheidsgraden voor de F-verdeling?
Antwoordindicatie
Vraag 1
tn-1,a = t24,0.05 = 711
De algemene beslisregel hier is: verwerp H0 als t > t24,0.05 = 711.
Vraag 2
\[ t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{10}{20 / \sqrt{25}} = 5 \]
t > t24,0.05 en dus kunnen we de nulhypothese verwerpen.
Vraag 3
\[ t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{10}{30 / \sqrt{25}} = 1.67 \]
t < t24,0.05 en dus kunnen we de nulhypothese niet verwerpen.
Vraag 4
\[ t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{10}{15 / \sqrt{25}} = 3.33 \]
t > t24,0.05 en dus kunnen we de nulhypothese verwerpen.
Vraag 5
\[ t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{10}{40 / \sqrt{25}} = 1.25 \]
t < t24,0.05 en dus kunnen we de nulhypothese niet verwerpen.
Vraag 6
tn-1,a = t24,0.05 = -1.711
De algemene beslisregel hier is: verwerp H0 als t < t24,0.05 = -1.711.
Vraag 7
\[ t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{-6}{25 / \sqrt{25}} = -3.8 \]
t < t24,0.05 en dus kunnen we de nulhypothese verwerpen..
Vraag 8
\[ t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{-9}{25 / \sqrt{25}} = -1.8 \]
t < t24,0.05 en dus kunnen we de nulhypothese verwerpen.
Vraag 9
\[ t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{-8}{25 / \sqrt{25}} = -1.6 \]
t > t24,0.05 en dus kunnen we de nulhypothese niet verwerpen.
Vraag 10
\[ t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{-4}{25 / \sqrt{25}} = -0.8 \]
t > t24,0.05 en dus kunnen we de nulhypothese niet verwerpen.
Vraag 11
\[ z = \frac{115 - 100}{\sqrt{\frac{625}{25} + \frac{400}{25}}} = 2.34 \]
Vraag 12
Z0.05 = 1.645
Vraag 13
z > z0.05 dus de nulhypothese kan worden verworpen
Vraag 14
De steekproefgrootte moet groter zijn dan 100.
Vraag 15
H0: μx – μy = 0
H1: μx – μy < 0
Vraag 16
\[ s^{2}_{p} = \frac{ (25-1)(633)^{2} + (25 – 1)(469.8)^{2} }{25 + 25 - 2} = 310,700 \]
Vraag 17
df = 25 + 25 – 2 = 48
Vraag 18
t48,0.05 = 1.677
Vraag 19
\[ t = \frac{1078 – 908.2}{ \sqrt{ \frac{310,700}{25} + \frac{310,700}{25}}} = 1.08 \]
Vraag 20
Verwerp H0 als t > t48,0.05 = 1.677
Vraag 21
Nee, de teststatistiek is kleiner dan de kritieke waarde, dus er is onvoldoende bewijs om de nulhypothese te verwerpen.
Vraag 22
nP0(1 – P0) > 5
Vraag 23
\[ \hat{p}_{0} = \frac{n_{x} \hat{p}_{x} + n_{y} \hat{p}_{y}}{n_{x} + n_{y}} = \frac{(270)(0.185) + (203)(0.399)}{270 + 203} = 0.277 \]
Vraag 24
\[ \frac{0.185 – 0.399}{ \sqrt{ \frac{ (0.277)(1 – 0.277) }{270} + \frac{ (0.277)(1 – 0.277) }{203} } } = -5.15 \]
Vraag 25
–z0.05 = -1.645
Vraag 26
Verwerp H0 als z < –z0.05 = -1.645
Vraag 27
Ja, we kunnen de nulhypothese verwerpen omdat -5.15 < -1.645.
Vraag 28
dfteller = (nx - 1) = 17 – 1 = 16 and dfnoemer = (ny - 1) = 11 – 1 = 10.
Vraag 29
Uit Appendix Tabel 9 (in het boek) volgt dat: F16,10,0.01 = 4.520
Vraag 30
\[ F = \frac{s^{2}_{x}}{s^{2}_{y}} = \frac{123.35}{8.02} = 15.380 \]
Het is duidelijk dat de teststatistiek van F(15.380) de kritieke waarde (4.520) overschrijdt. Daarom kan de nulhypothese worden verworpen ten gunste van de alternatieve hypothese.
Hoe werkt een enkelvoudige regressie? - TentamenTests 11
Vragen
Vraag 1
Gebruik de volgende informatie voor vragen 1-4. Stel dat we geïnteresseerd zijn in de relatie tussen het aantal werknemers (aangegeven met X) en het aantal geproduceerde tafels per uur (Y). Een steekproef van 10 werknemers wordt verstrekt. De volgende beschrijvende statistieken worden verkregen:
\[Cov(x,y) = 106.93 \hspace{5mm} s^{2}_{x} = 42.01 \hspace{5mm} \bar{y} = 41.2 \hspace{5mm} \bar{x} = 21.3 \]
Bereken de helling van de steekproefregressie.
Vraag 2
Bereken het y-intercept voor de steekproefregressie.
Vraag 3
Wat is de vergelijking van de regressielijn?
Vraag 4
Als het management besluit 25 werknemers in dienst te nemen, hoeveel tafels verwachten we dan te produceren?
Vraag 5
De volgende regressievergelijking wordt gegeven: Y = 559 + 0.3815X.
Wat is de verwachte waarde van Y voor X = 55.000?
Vraag 6
Gebruik de volgende regressievergelijking voor vragen 6-11.
Y = 100 + 21X
Interpreteer de helling van de regressielijn.
Vraag 7
Wat is de verandering in Y als X met +5 verandert?
Vraag 8
Wat is de verandering in Y wanneer X met -7 verandert?
Vraag 9
Wat is de voorspelde waarde van Y wanneer X = 14?
Vraag 10
Wat is de voorspelde waarde van Y wanneer X = 27?
Vraag 11
Bewijst deze vergelijking dat een verandering in X een verandering in Y veroorzaakt?
Vraag 12
Gebruik de volgende informatie voor vragen 12-15. Gezien de regressievergelijking
Y = 107 + 10X
Wat is de verandering in Y wanneer X met +2 verandert?
Vraag 13
Wat is de verandering in Y wanneer X met -4 verandert?
Vraag 14
Wat is de voorspelde waarde van Y als X = 15?
Vraag 15
Wat is de voorspelde waarde van Y als X = 22?
Vraag 16
Bereken de coëfficiënten voor een regressievergelijking van de kleinste kwadraten en schrijf de vergelijking op basis van de volgende steekproefgegevens: x̅ = 10; ȳ = 50; sx = 80; sy = 75; rxy = 0.4; n = 60.
Vraag 17
Bereken de coëfficiënten voor een regressievergelijking van de kleinste kwadraten en schrijf de vergelijking op basis van de volgende steekproefgegevens: x̅ = 60; ȳ = 50; sx = 80; sy = 65; rxy = 0.7; n = 60.
Vraag 18
Bereken de coëfficiënten voor een regressievergelijking van de kleinste kwadraten en schrijf de vergelijking op basis van de volgende steekproefgegevens: x̅ = 90; ȳ = 100; sx = 60; sy = 70; rxy = 0.4; n = 60.
Vraag 19
De volgende informatie wordt verstrekt: SSE = 17,89 en SST = 68,22. Wat is de procentuele verklaarde variabiliteit?
Vraag 20
Welke absolute waarde van de t-statistiek duidt op een relatie tussen twee variabelen wanneer we een tweezijdige test gebruiken met α = 0,05 en n> 60?
Vraag 21
Gegegeven het enkelvoudige regressiemodel
\ [Y = \ beta_ {0} + \ beta_ {1} X \]
en de regressieresultaten die volgen, test de nulhypothese dat de hellingcoëfficiënt nul is versus de alternatieve hypothese dat de hellingcoëfficiënt van nul verschilt met behulp van de kans op een type I fout gelijk aan 0,005 en bepaal het tweezijdige 99% betrouwbaarheidsinterval. De volgende steekproefgegevens worden verstrekt: n = 22; b1 = 0,3815; sb1 = 0,0253.
Vraag 22
Gebruik het anwoord op de vorige vraag. Wat kun je concluderen op basis van dit resultaat over de hellingscoëfficiënt?
Vraag 23
Welke vier factoren resulteren in smallere voorspellingsintervallen?
Vraag 24
Gebruik de volgende informatie voor vragen 24-26. Stel dat we H0 willen testen: ρ = 0 tegen H1: ρ > 0 met behulp van de voorbeeldinformatie: n = 49 en r = 0,42.
Wat is de teststatistiek?
Vraag 25
Wat is de kritische waarde als we testen op een significantieniveau van 0,05%?
Vraag 26
Wat concluderen we op basis hiervan over de populatiecorrelatie?
Vraag 27
Stel dat we de volgende informatie hebben: n = 25. Gebruikmakend van de vuistregel voor het testen van de hypothese dat de populatiecorrelatie nul is, wat moet dan de absolute waarde zijn van de steekproefcorrelatie die moet worden overschreden om deze nulhypothese te verwerpen?
Vraag 28
Stel dat we de volgende informatie hebben: n = 64. Gebruik de vuistregel voor het testen van de hypothese dat de populatiecorrelatie nul is, wat moet de absolute waarde zijn van de steekproefcorrelatie die moet worden overschreden om deze nulhypothese te verwerpen?
Vraag 29
Welke twee factoren kunnen de geschatte regressievergelijking beïnvloeden?
Vraag 30
Punten met een hoge leverage hebben een .... standaardfout van het residu.
Antwoordindicatie
Vraag 1
\[ b_{1} = \frac{Cov(x,y)}{s^{2}_{x}} = r \frac{s_{y}}{s_{x}} = \frac{106.93}{42.01} = 2.545 \]
Vraag 2
\[ b_{0} = \bar{y} - b_{1}\bar{x} = 41.2 - 2.545(21.3) = -13.02 \]
Vraag 3
\[ \bar{y} = b_{0} + b_{1}x = -13.02 + 2.545x \]
Vraag 4
\[ \hat{y} = -13.02 + 2.545(25) = 50.605 \]
Vraag 5
Y = 559 + 0.3815*55,000 = 21,542
Vraag 6
Voor elke wijziging van één eenheid in X, verandert Y met 21.
Vraag 7
Als X met +5 verandert, verandert Y met (21)(5) = 105
Vraag 8
Als X met -7 verandert, verandert Y met (21)(-7) = -147
Vraag 9
Y = 100 + (21)(14) = 394
Vraag 10
Y = 100 + (21)(27) = 667
Vraag 11
Nee, regressieresultaten vatten de informatie in de data samen. Ze bewijzen geen oorzakelijk verband.
Vraag 12
Als X verandert met +2, verandert Y met (10)(2) = 20
Vraag 13
Als X met -4 verandert, verandert Y met (10)(-4) = 40
Vraag 14
Y = 107 + (10)(15) = 257
Vraag 15
Y = 107 + (10)(22) = 327
Vraag 16
\[ b_{1} = r\frac{s_{Y}}{s_{X}} = 0.4 \frac{75}{80} = 0.375 \]
\[ b_{0} = \bar{y} = b_{1}\bar{x} = 50 - 0.43(10) = 46.25 \]
\[ \hat{y}_{i} = 46.25 + 0.375x_{i} \]
Vraag 17
\[ b_{1} = r\frac{s_{Y}}{s_{X}} = 0.7 \frac{65}{80} = 0.8125 \]
\[ b_{0} = \bar{y} = b_{1}\bar{x} = 50 - 0.8125(60) = 1.25 \]
\[ \hat{y}_{i} = 1.25 + 0.8125x_{i} \]
Vraag 18
\[ b_{1} = r\frac{s_{Y}}{s_{X}} = 0.4 \frac{70}{60} = 0.467 \]
\[ b_{0} = \bar{y} = b_{1}\bar{x} = 100 - 0.467(90) = 58 \]
\[ \hat{y}_{i} = 58 + 0.467x_{i} \]
Vraag 19
\[ R^{2} = 1 - \frac{SSE}{SST} = 1 - \frac{17.89}{68.22} = 0.738 \]
Aldus wordt 73,80% van de variabiliteit verklaard door het regressiemodel.
Vraag 20
Volgens de vuistregel moet de absolute waarde van de t-statistiek van de student groter zijn dan 2,0 om aan te geven dat er een relatie is.
Vraag 21
Voor een betrouwbaarheidsinterval van 99% hebben we 1 - α = 0,05 en n - 2 = 22 - 2 = 20 vrijheidsgraden. Uit bijlage Tabel 8 (zie boek) volgt dus dat:
\[ t_{n-2,\alpha/2} = t_{20,0.005} = 2.845 \]
Dus, het 99% betrouwbaarheidsinterval is:
\[ 0.3815 - (2.845)(0.0253) < \beta_{1} < 0.381 + (2.845)(0.0253) \]
\[ 0.3095 < \beta_{1} < 0.4535 \]
Vraag 22
Het betrouwbaarheidsinterval omvat niet de nul, daarom kunnen we de nulhypothese verwerpen en concluderen dat de hellingscoëfficiënt niet gelijk is aan nul.
Vraag 23
1. Een grotere steekproefgrootte (n)
2. Een kleinere waarde van s2e
3. Een grote spreiding van de waarnemingen van de onafhankelijke variabele
4. Een kleinere waarde van de eenheid (xn+1 - x̅)2
Vraag 24
\[ t = \frac{0.43 \sqrt{(49 - 2)}}{\sqrt{1 - (0.43)^{2}}} = 3.265 \]
Vraag 25
Aangezien er (n - 2) = 47 vrijheidsgraden is, volgt uit aanhangsel tabel 8 dat t47,0.005 = 2.704
Vraag 26
t47,0.005 = 2.704 < t. Daarom kunnen we de nulhypothese verwerpen. Er zijn sterke aanwijzingen voor een positief lineair verband tussen de twee variabelen. Merk echter op dat we uit dit resultaat niet kunnen concluderen dat de ene variabele de andere heeft veroorzaakt, maar alleen dat ze gerelateerd zijn.
Vraag 27
\[ |r| > \frac{2}{\sqrt{n}} = \frac{2}{\sqrt{25}} > 0.4 \]
Vraag 28
\[ |r| > \frac{2}{\sqrt{n}} = \frac{2}{\sqrt{64}} > 0.25 \]
Vraag 29
Punten met een hoge leverage en uitbijters.
Vraag 30
Kleiner
Hoe werkt een meervoudige regressie? - TentamenTests 12
Vragen
Vraag 1
Gebruik het volgende geschatte lineaire model voor vragen 1 - 4:
\[ \hat{y} = 12 + 5_{x1} + 6_{x2} + 2_{x3} \]
Bereken de verwachte waarde van y wanneer x1 = 11, x2 = 24, en x3 = 27.
Vraag 2
Bereken de verwachte waarde van y wanneer x1 = 31, x2 = 20, en x3 = 17.
Vraag 3
Bereken de verwachte waarde van y wanneer x1 = 32, x2 = 29, en x3 = 13.
Vraag 4
Bereken de verwachte waarde van y wanneer x1 = 30, x2 = 26, en x3 = 29.
Vraag 5
Gebruik het volgende geschatte lineaire model voor vragen5 - 8:
\[ \hat{y} = 10 + 5_{x1} + 4_{x2} + 2_{x3} \]
Bereken de verwachte waarde van y wanneer x1 = 20, x2 = 11, en x3 = 10.
Vraag 6
Bereken de verwachte waarde van y wanneer x1 = 15, x2 = 14, en x3 = 20.
Vraag 7
Bereken de verwachte waarde van y wanneer x1 = 35, x2 = 19, en x3 = 25.
Vraag 8
Bereken de verwachte waarde van y wanneer x1 = 10, x2 = 17, en x3 = 30.
Vraag 9
Gebruik het volgende geschatte lineaire model voor vragen9-11:
\[ \hat{y} = 10 - 2_{x1} - 14_{x2} + 6_{x3} \]
Wat is de verandering in y wanneer x1 stijgt met 4?
Vraag 10
Wat is de verandering in y wanneer x3 stijgt met 1?
Vraag 11
Wat is de verandering in y wanneer x2 stijgt met 2?
Vraag 12
Wat is de vijfde assumptie van een meervoudig lineair regressiemodel?
Vraag 13
Bereken de regressiecoëfficiënt b1 voor het volgende regressiemodel:
\[ \hat{y}_{i} = b_{0} + b_{1}x_{1i} + b_{2}x_{x2i} \]
gegeven de volgende steekproefgegevens:
rx1y = 0.80, rx2y = 0.30, rx1x2 - 0.90, sx1 = 500, sx2 = 400, sy = 100
Vraag 14
Bereken de regressiecoëfficiënt b2 voor het regressiemodel van de vorige vraag.
Vraag 15
De volgende gegevens zijn beschikbaar: n = 25; K = 2; SSE = 0,0625; SST = 0,4640.
Bereken de aangepaste bepalingscoëfficiënt.
Vraag 16
Wanneer heeft de aangepaste bepalingscoëfficiënt de voorkeur boven de standaard bepalingscoëfficiënt?
Vraag 17
Hoe is de meervoudige correlatiecoëfficiënt gerelateerd aan de meervoudige bepalingscoëfficiënt?
Vraag 18
Gebruik de volgende gegevens voor vragen 18-20:
b1 = 0.2372; sb1 = 0.0556; b2 = -0.000249; sb2 = 0.00003205.
Wat is de kritieke t waarde voor een tweezijdige toets met een 99% betrouwbaarheidsinterval?
Vraag 19
Geef het 99% betrouwbaarheidsinterval voor β1.
Vraag 20
Geef het 99% betrouwbaarheidsinterval voor β2.
Vraag 21
Overweeg de volgende informatie voor vragen 21-24. Een onderzoeker test de invloed van vier onafhankelijke variabelen op een bepaalde afhankelijke variabele met behulp van multiple regressie (n = 88). Hij vindt, voor het complete model met vier voorspellende variabelen, dat SSE = 1.149,14. Voor een meervoudig regressiemodel met slechts twee van de vier voorspellende variabelen, vindt hij: SSE = 1.426.93. De variantieschatter is s2e = 13.52. Bereken de F-statistiek.
Vraag 22
Hoeveel vrijheidsgraden heeft de F-statistiek?
Vraag 23
Wat is de kritische waarde voor F met een significantieniveau van 0,01?
Vraag 24
Wat is een dummy-variabele?
Vraag 25
Formuleer de nulhypothese en de alternatieve hypothese voor het testen van de hellingscoëfficiënt in het geval van dummy variabelen.
Vraag 26
Wat is de modelconstante wanneer de dummy variabele gelijk is aan 1 in de volgende vergelijking, waarbij x1 een continue variabele is en x2 een dummy variabele is?
\[ \hat{y} = 9 + 6x_{1} + 9x_{2} \]
Vraag 27
Wat is de modelconstante wanneer de dummy variabele gelijk is aan 1 in de volgende vergelijking, waarbij x1 een continue variabele is en x2 een dummy variabele is?
\[ \hat{y} = 7 + 4x_{1} + 2x_{2} \]
Vraag 28
Wat is de modelconstante wanneer de dummy variabele gelijk is aan 1 in de volgende vergelijking, waarbij x1 een continue variabele is en x2 een dummy variabele is?
\[ \hat{y} = 4 + 4x_{1} + 8x_{2} + 9x_{1}x_{2} \]
Vraag 29
Overweeg de volgende vergelijking: yi = 2x1.4
Bereken de waarde van yi wanneer xi = 1
Vraag 30
Overweeg de volgende vergelijking: yi = 2x1.4
Bereken de waarde van yi wanneer xi = 1
Antwoordindicatie
Vraag 1
\[ \hat{y} = 12 + (5)(11) + (6)(24) + (2)(27) = 265 \]
Vraag 2
\[ \hat{y} = 12 + (5)(31) + (6)(20) + (2)(17) = 321 \]
Vraag 3
\[ \hat{y} = 12 + (5)(32) + (6)(29) + (2)(13) = 372 \]
Vraag 4
\[ \hat{y} = 12 + (5)(30) + (6)(26) + (2)(9) = 336 \]
Vraag 5
\[ \hat{y} = 10 + (5)(20) + (4)(11) + (2)(10) = 174 \]
Vraag 6
\[ \hat{y} = 10 + (5)(15) + (4)(14) + (2)(20) = 181 \]
Vraag 7
\[ \hat{y} = 10 + (5)(35) + (4)(19) + (2)(25) = 311 \]
Vraag 8
\[ \hat{y} = 10 + (5)(10) + (4)(17) + (2)(30) = 188 \]
Vraag 9
De verandering in y wanneer x1 stijgt met 4 is (2)(4) = 8.
Vraag 10
De verandering in y wanneer x3 stijgt met 1 is (6)(1) = 6.
Vraag 11
De verandering in y wanneer x2 stijgt met 2 is (14)(2) = 28.
Vraag 12
Er is geen direct lineair verband tussen de onafhankelijke variabelen.
Vraag 13
\[ b_{1} = \frac{ s_{y} (r_{x1y} - r_{x1x2}r_{x2y} ) }{s_{x1} (1 - r^{2}_{x1x2})} = \frac{100 (0.80 - 0.90*0.30)}{500 (1 - 0.90^{2}) = 0.56 } \]
Vraag 14
\[ b_{2} = \frac{s_{y} (r_{x2y} - r_{x1x2} r_{x1y} ) }{s_{x2} (1 - r^{2}_{x1x2})} =
\frac{100 (0.30 - 0.90*0.80)}{400 (1 - 0.90^{2}) = -0.55 } \]
Vraag 15
\[ \bar{R}^{2} = 1 - \frac{0.0625/22}{0.4640/24} = 0.853 \]
Vraag 16
De aangepaste bepalingscoëfficiënt corrigeert voor het feit dat niet-relevante onafhankelijke variabelen resulteren in een (kleine) vermindering van de foutensom van vierkanten (SSE). Als gevolg hiervan biedt de aangepaste bepalingscoëfficiënt een betere vergelijking tussen meerdere regressiemodellen met verschillende aantallen onafhankelijke variabelen.
Vraag 17
De coëfficiënt van meervoudige correlatie is gelijk aan de wortel van de meervoudige bepalingscoëfficiënt.
Vraag 18
tn-K-1,a/2 = t22,0.005 = 2.819
Vraag 19
0.237 - (2.819)(0.05556) < β1 < 0.237 + (2.819)(0.05556)
0.80 < β1 < 0.394
Vraag 20
-0.000249 - (2.819)(0.0000320) < β2 < -0.000249 + (2.819)(0.0000320)
-0.000339 < β2 < -0.000159
Vraag 21
\[ F = \frac{(1426.93 - 1149.14)/2}{13.52} = 10.27 \]
Vraag 22
De F-statistiek heeft 2 vrijheidsgraden (d.w.z. voor de twee gelijktijdig geteste variabelen) voor de teller en 85 vrijheidsgraden voor de noemer.
Vraag 23
F* = 4.9 (zie Appendix Tabel 9)
Vraag 24
Een dummy variabele is een variabele met twee mogelijke uitkomsten: 0 en 1.
Vraag 25
\[ H_{0}: \beta_{3} = 0 | \beta_{1} \neq 0, \beta_{2} \neq 0 \]
\[ H_{1}: \beta_{3} \neq 0 | \beta_{1} \neq 0, \beta_{2} \neq 0 \]
Vraag 26
18
Vraag 27
9
Vraag 28
12
Vraag 29
2.64
Vraag 30
5.28
Welke andere onderwerpen zijn belangrijk in regressie analyse? - TentamenTests 13
Vragen
Vraag 1
Wat zijn de vier fasen van modelbouw?
Vraag 2
Als het model niet kan worden geverifieerd, wat moet je dat doen?
Vraag 3
In een experimenteel ontwerp wordt de experimentele uitkomst (Y) gemeten op specifieke combinaties van niveaus voor ... en ... variabelen.
Vraag 4
Als een blokkeervariabele 4 niveaus heeft, hoeveel dummy-variabelen moeten dan worden aangemaakt?
Vraag 5
Wat is een behandelingsvariabele?
Vraag 6
Wat is een blokkeervariabele?
Vraag 7
Wat wordt er bedoeld met een vertraagde waarde?
Vraag 8
Wat is multicollineariteit?
Vraag 9
Stel, alle coëfficient student t statistieken zijn klein, maar de F statistiek is desalniettemin hoog. Waar is dit een indicatie voor?
Vraag 10
Geef drie manier om te corrigeren voor multicollineariteit.
Vraag 11
Wat is het gevaar van het corrigeren van multicollineariteit door een of meer sterk gecorreleerde onafhankelijke variabelen te verwijderen?
Vraag 12
Wat zijn de vier assumpties in een enkelvoudige lineaire regressieanalyse?
Vraag 13
Wat is de vijfde assumptie die wordt toegevoegd voor meervoudige regressieanalyse?
Vraag 14
Wat is heteroscedasticiteit?
Vraag 15
Beschrijf een procedure om te controleren op heteroscedasticiteit.
Vraag 16
Gebruik de volgende informatie voor vragen 16-18. Uit de regressie van de gekwadrateerde residuen op de voorspelde waarden, verkrijgen we het volgende geschatte model (voor n = 25):
\[ e^{2} = 0.00621 - 0.00550 \hat{y} \hspace{2mm} met \hspace{2mm} R^{2} = 0.066 \]
Bereken de teststatistiek.
Vraag 17
Wat is de kritische waarde als we testen met een significantieniveau van 10%?
Vraag 18
Kunnen we de nulhypothese verwerpen dat het regressiemodel een uniforme variantie heeft?
Vraag 19
Wat is de betekenis van ρ voor (auto) gecorreleerde fouten?
Vraag 20
Wat betekent het als ρ = 0?
Vraag 21
Wat betekent het als ρ = 0.3?
Vraag 22
Wat betekent het als als ρ = 0.9?
Vraag 23
Wat is de meest gebruikte test om mogelijke autocorrelatie van fouttermen te controleren?
Vraag 24
Formuleer de nulhypothese van deze test.
Vraag 25
Geef de beslissingsregels voor het toetsen van de nulhypothese aan de alternatieve hypothese: H1: ρ> 0.
Vraag 26
Geef de beslissingsregels voor het toetsen van de nulhypothese aan de alternatieve hypothese: H1: ρ <0.
Vraag 27
Stel dat we d = 0,2015 vinden, wat een positieve autocorrelatie aangeeft. Schat de seriële correlatie.
Vraag 28
Stel dat we d = 0,5213 vinden, wat een positieve autocorrelatie aangeeft. Schat de seriële correlatie.
Vraag 29
Bij het bepalen of de fouten in een regressiemodel positief gecorreleerd zijn voor het model
\[ y_{t} = \beta_{0} + \beta_{1}x_{1t} + \epsilon_{t} \]
bepalen we
\[ \sum^{30}_{t = 1}e^{2}_{t} = 7587.9154 \]
en
\[ \sum^{30}_{t = 2} (e_{t} - e_{t - 1})^{2} = 8195.2065 \]
Formuleer de nul- en alternatieve hypothese voor de genoemde analyse.
Vraag 30
Bereken de Durbin-Watson-statistiek.
Antwoordindicatie
Vraag 1
Modelbouw bestaat uit vier fasen: (1) modelspecificatie; (2) coëfficiëntschatting; (3) modelverificatie, en; (4) interpretatie en gevolgtrekking.
Vraag 2
Ga terug naar de eerste fase: modelspecificatie.
Vraag 3
In een experimenteel ontwerp wordt de experimentele uitkomst (Y) gemeten op specifieke combinaties van niveaus voor behandeling- en blokkeervariabelen.
Vraag 4
3
Vraag 5
Een behandelingsvariabele is een variabele waarvan we het effect willen schatten met minimale variantie. We willen bijvoorbeeld graag weten welke van de vijf verschillende productiemachines de hoogste productiviteit per uur biedt. Voor dit voorbeeld is de behandelingsvariabele de productiemachine, vertegenwoordigd door een categorische variabele met vier niveaus.
Vraag 6
Een blokkerende variabele is een variabele die deel uitmaakt van de omgeving. Daarom kan het variabele niveau van een dergelijke variabele niet vooraf worden geselecteerd.
Vraag 7
Wanneer tijdreeksen worden geanalyseerd (d.w.z. wanneer metingen in de loop van de tijd worden genomen) zijn vertraagde waarden van de afhankelijke variabele een belangrijk probleem. Vaak is in tijdreeksgegevens de afhankelijke variabele in tijdsperiode t gerelateerd aan de waarde die door deze afhankelijke variabele wordt genomen in een eerdere tijdsperiode, dat is yt-1. De vertraagde waarde is dan de waarde van de afhankelijke variabele in deze vorige periode.
Vraag 8
Multicollineariteit verwijst naar een toestand van zeer hoge intercorrelaties tussen de onafhankelijke variabelen.
Vraag 9
Multicollineariteit.
Vraag 10
1. Verwijder een of meer van de sterk gecorreleerde onafhankelijke variabelen.
2. Wijzig de modelspecificatie, inclusief mogelijk een nieuwe onafhankelijke variabele die een functie is van verschillende gecorreleerde onafhankelijke variabelen.
3. Verkrijg aanvullende gegevens die niet dezelfde sterke correlaties hebben tussen de onafhankelijke variabelen.
Vraag 11
Dit kan leiden tot een vertekening (bias) van de coëfficiëntschatting.
Vraag 12
1. De Y's zijn lineaire functies van X, plus een willekeurige foutterm.
2. De x-waarden zijn een vast getal dat onafhankelijk is van de fouttermen.
3. De fouttermen worden verondersteld willekeurige variabelen te zijn met een gemiddelde van nul en een covariantie van σ2.
4. De willekeurige fouttermen zijn niet met elkaar gecorreleerd.
Vraag 13
Er is geen direct lineair verband tussen de onafhankelijke variabelen Xj.
Vraag 14
Heteroscedasticiteit verwijst naar de situatie waarin de fouttermen geen uniforme variantie hebben.
Vraag 15
Een mogelijkheid om te controleren op heteroscedasticiteit is door een spreidingsdiagram van de residuen versus de onafhankelijke variabele te onderzoeken. Als de grootte van de fouttermen de neiging heeft toe te nemen (of af te nemen) voor toenemende waarden van de onafhankelijke variabele, geeft dit aan dat de fouten varianties niet constant zijn.
Vraag 16
\[ nR^{2} = (25)(0.066) = 1.65 \]
Vraag 17
Uit Appendix Tabel 7 (zie het boek) blijkt dat de kritieke waarde voor een significantieniveau van 10% is: X21,0.10 = 2.706
Vraag 18
De teststatistiek overschrijdt de kritische waarde niet en daarom kan de nulhypothese niet worden afgewezen.
Vraag 19
Deze ρ is de correlatiecoëfficiënt (bereik -1 tot +1) tussen de fout in tijd t en de fout in het vorige tijdstip, dat wil zeggen t - 1.
Vraag 20
Als ρ = 0, betekent dit dat er geen autocorrelatie in de fouten is.
Vraag 21
Er is een relatief zwakke autocorrelatie.
Vraag 22
Er is een vrij sterke autocorrelatie.
Vraag 23
Durbin-Watson test.
Vraag 24
H0: ρ = 0.
Vraag 25
Verwerp H0 als d > dL. Accepteer H0 als d > du. Test is niet overtuigend als dL < d < dU.
Vraag 26
Verwerp H0 als d > 4 - dL. Accepteer H0 als d < 4 - du. Test is niet overtuigend als 4 - dL > d > 4 - dU
Vraag 27
\[ r = 1 - \frac{d}{2} = 1 - \frac{0.2015}{2} = 0.90 \]
Vraag 28
\[ r = 1 - \frac{d}{2} = 1 - \frac{0.5213}{2} = 0.74 \]
Vraag 29
H0: ρ = 0 and H0: ρ > 0.
Vraag 30
\[ d = \frac{ \sum^{n}_{t = 2} (e_{t} - e_{t-1})^{2} }{\sum^{n}_{t=1} e^{2}_{t}} = \frac{8195.2065}{7587.9154} = 1.08 \]
Hoe kun je categorische data analyseren? - TentamenTests 14
Vragen
Gebruik de volgende gegevens voor vraag 1-4:
Categorie | A | B | C | D | Totaal |
Geobserveerde frequenties | 43 | 53 | 60 | 44 | 200 |
Kans (onder H0) | 1/4 | 1/4 | 1/4 | 1/4 | 1 |
Verwachte frequenties (onder H0) | 50 | 50 | 50 | 50 | 200 |
Vraag 1
Bereken de chi-kwadraat teststatistiek.
Vraag 2
Wat zijn de vrijheidsgraden voor de kritische teststatistiek?
Vraag 3
Geef het bereik van de teststatistiek met waarschijnlijkheid .10 en .90 met behulp van tabel 7a en 7b.
Vraag 4
Kunnen we de nulhypothese verwerpen dat er geen voorkeur is voor een van de vier categorieën?
Overweeg de volgende gegevens voor vraag 5-9.
Categorie | A | B | C | D | Totaal |
Geobserveerde frequenties | 50 | 93 | 45 | 12 | 200 |
Kans (onder H0) | 0.30 | 0.50 | 0.15 | 0.05 | 1 |
Verwachte frequenties (onder H0) | 200 |
Vraag 5
Bereken de verwachte waarden op basis van de nulhypothese die in de tabel is opgegeven.
Vraag 6
Bereken de chi-kwadraat teststatistiek.
Vraag 7
Hoeveel vrijheidsgraden zijn er?
Vraag 8
Uit Bijlage 7 met K - 1 vrijheidsgraden blijkt dat de teststatistiek tussen .... en .... valt
Vraag 9
Kan de nulhypothese worden afgewezen?
Overweeg de volgende gegevens voor vragen 10-14.
Categorie | A | B | C | D | Totaal |
Geobserveerde frequenties | 287 | 49 | 30 | 34 | 400 |
Kans (onder H0) | 0.80 | 0.10 | 0.06 | 0.04 | 1 |
Verwachte frequenties onder H0 | 400 |
Vraag 10
Bereken de verwachte waarden op basis van de nulhypothese die in de tabel is opgegeven.
Vraag 11
Bereken de chi-kwadraat teststatistiek.
Vraag 12
Hoeveel vrijheidsgraden zijn er?
Vraag 13
Zoek de kritische waarde met een significantieniveau van 0,001.
Vraag 14
Kan de nulhypothese worden afgewezen?
Er wordt getest of de populatieverdeling Poisson is. Overweeg de volgende gegevens voor vragen 15-18:
Aantal gebeurtenissen | 0 | 1 | 2 | 3+ |
Geobserveerde frequenties | 156 | 63 | 29 | 14 |
Verwachte frequenties onder H0 | 135.4 | 89.4 | 29.5 | 7.7 |
Vraag 15
Bereken de teststatistiek.
Vraag 16
Hoeveel vrijheidsgraden zijn er?
Vraag 17
Zoek de bijbehorende kritieke waarde met een significantieniveau van 0,001.
Vraag 18
Kan de nulhypothese dat de populatieverdeling Poisson is, worden afgewezen?
Vraag 19
Stel dat we geïnteresseerd zijn of mensen de voorkeur geven aan ananas op hun pizza. We nemen steekproef van 7 deelnemers onder de nulhypothese H0: P = 0,5. Wat is de kans om niet meer dan 2 personen met een voorkeur voor ananas op hun pizza te krijgen?
Vraag 20
Als onze teststatistiek voor een Sign-test gelijk is aan S = 2. Kunnen we de nulhypothese verwerpen?
Vraag 21
Gebruik de volgende informatie voor vragen 21-25. Een willekeurige steekproef van 100 studenten werd gevraagd om twee nieuwe ijssmaken te vergelijken: gegrilde BBQ en bubblegumverrassing. Na het testen van beide smaken, gaven 65 studenten de voorkeur aan gegrilde BBQ, 40 studenten aan de smaak van bubblegum en 4 gaven geen voorkeur uit. Gebruik de normale benadering om het gemiddelde en de standaarddeviatie te bepalen voor het prefereren van bubblegumverrassing.
Bereken de teststatistiek met behulp van de normale benadering en de continuïteitscorrectie.
Vraag 22
Zoek de geschatte p-waarde.
Vraag 23
Kunnen we de nulhypothese verwerpen?
Vraag 24
Wat wordt de teststatistiek als de continuïteitscorrectie niet wordt gebruikt?
Vraag 25
Gegeven een willekeurige steekproef van n = 31 gematchte paren, bereken het gemiddelde en de standaarddeviatie voor de Wilcoxon-statistiek onder de nulhypothese.
Vraag 26
Stel nu dat we ontdekken dat de waargenomen waarde van de statistiek T = 189 is. Als we de nulhypothese toetsen aan een lagere-staart alternatieve hypothese met significantieniveau 0,05, wat kunnen we dan concluderen over de nulhypothese?
Vraag 27
Twee onafhankelijke monsters worden beschouwd met n1 = 10, n2 = 12 en R1 = 93.5.
Vraag 28
Bereken het gemiddelde en de variantie voor de Mann-Whitney-statistiek.
Vraag 29
Bereken de Mann-Whitney U-statistiek.
Antwoordindicatie
Vraag 1
X2 = 3.88
Vraag 2
df = K - 1 = 4 - 1 = 3.
Vraag 3
Onderste kritische waarde (Appendix Tabel 7b) X23,0.90 = 0.584
Bovenste kritische waarde (Appendix Tabel 7a) X23,0.10 = 6.251
Vraag 4
Het blijkt dat de teststatistiek van 3,88 tussen 0,584 en 6,251 ligt; hieruit volgt dat 0,10
Vraag 5
EA = nPA = 200(0.30) = 60
EB = nPB = 200(0.50) = 100
EC = nPC = 200(0.15) = 30
ED = nPD = 200(0.05) = 10
Vraag 6
X2 = 10.06
Vraag 7
df = K - 1 = 4 - 1 = 3.
Vraag 8
Uit Appendix Bijlage 7 met K - 1 vrijheidsgraden blijkt dat de teststatistiek tussen 9.348 en 11.345 ligt.
Vraag 9
0.001 < p-waarde < 0.025. Dus, de nulhypothese kan worden verworpen.
Vraag 10
EA = nPA = 400(0.80) = 320
EB = nPB = 400(0.10) = 40
EC = nPC = 400(0.06) = 24
ED = nPD = 400(0.04) = 16
Vraag 11
X2 = 27.178
Vraag 12
df = K - 1 = 4 - 1 = 3.
Vraag 13
Uit Appendix Bijlage 7 met K - 1 vrijheidsgraden blijkt dat de teststatistiek gelijk is aan X23,0.001 = 16.266
Vraag 14
De test statistiek is veel groter dan de kritische waarde, dus de nulhypothese kan worden verworpen.
Vraag 15
X2 = 16.08
Vraag 16
df = K - m - 1 = 4 - 1 - 1 = 2
Vraag 17
X22,0.001 = 13.816
Vraag 18
De teststatistiek overschrijdt de kritische waarde, dus de nulhypothese dat de populatieverdeling Poisson is, kan worden afgewezen op het significantieniveau van 0,01%.
Vraag 19
p-waarde = P(x < 2) = 0.227 (ziee Appendix Tabel 3)
Vraag 20
Nee, met een p-waarde zo groot kan de nulhypothese niet worden afgewezen.
Vraag 21
Laat P de populatie zijn die de voorkeur geeft aan bubblegum-verrassing, gegeven S = 40.
\[ \mu = np = 0.5n = 0.5(96) = 48 \]
\[ \sigma = 0.5 \sqrt{96} = 4.899 \]
Vraag 22
Since 40 < 48, S* = 40.5
\[ z = \frac{S* - \mu}{\sigma} = \frac{40.5 - 48}{4.899} = -1.53 \]Uit de standaard normale verdeling volgt dat de geschatte p-waarde = 2 (0,0630) = 0,126
Vraag 23
De nulhypothese kan worden afgewezen op alle significantieniveaus van meer dan 12,6%.
Vraag 24
Als geen continuïteitscorrectiefactor wordt gebruikt, wordt de waarde voor de teststatistiek Z = -1.633, wat een iets kleinere p-waarde van 0,1024 oplevert.
Vraag 25
\[ \mu_{T} = \frac{n(n + 1)}{4} = \frac{(31)(32)}{4} = 248 \]
\[ Var(T) = \sigma^{2}_{T} = \frac{n(n + 1)(2n + 1)}{24} = \frac{ (31)(32)(63) }{24} = 2604 \]
\[ \sigma_{T} = \sqrt{2604} = 51.03 \]
Vraag 26
\[ Z = \frac{T - \mu_{T}}{\sigma_{T}} = \frac{189 - 248}{51.03} = \frac{-59}{51.03} = -1.16 \]
Voor α = 0.05, zα = -1.645
De teststatistiek overschrijdt de kritieke waarde niet, daarom is er onvoldoende bewijs om de nulhypothese te verwerpen.
Vraag 27
\[ E(U) = \mu_{U} = \frac{n1n2}{2} = \frac{ (10)(12) }{2} = 60 \]
\[ Var(U) = \sigma^{2}_{U} = \frac{ n1n2 (n1 + n2 + 1) }{12} = \frac{ (10)(12)(23) }{12} = 230 \]
Vraag 28
\[ Z = \frac{U - \mu{U}}{\sigma_{U}} = \frac{81.5 - 60}{ \sqrt{230} } = 1.42 \]
Vraag 29
De bijbehorende p-waarde = 0,1556. Met een significantieniveau van 0,05 is dit testresultaat niet voldoende om te concluderen dat de nulhypothese kan worden verworpen.
Hoe werkt de analyse van variantie? - TentamenTests 15
Vragen
Vraag 1
Wat is de nulhypothese van een eenwegs ANOVA?
Vraag 2
Stel dat we de volgende gegevens hebben gevonden: SSW = 12.18, n = 20, k = 3. Bereken een schatting van het gemiddelde binnen de groepen.
Vraag 3
Stel dat we de volgende gegevens hebben gevonden: SSG = 21.55, n = 20, k = 3. Bereken een schatting van het gemiddelde tussen de groepen.
Vraag 4
Bereken de F ratio voor de MSW en MSG berekenen in de vorige twee vragen.
Vraag 5
Wat zijn de vrijheidsgraden die overeenkomen met de informatie in vraag 2 en 3.
Vraag 6
Wat is de kritische F waarde als we testen met een significantieniveau van 1%?
Vraag 7
Wat kunnen we concluderen over de populatiegemiddelden op basis van deze F-ratio?
Beschouw de volgende variantie-analyse voor vraag 8-13.
Bron van variantie | SS | Vrijheidsgraden | MS | F-ratio |
Tussen groepen | 1728 | 4 | ||
Binnen groepen | 624 | .. | ||
Totaal | 2352 | 17 |
Vraag 8
Hoeveel vrijheidsgraden heeft de binnen groepen SS?
Vraag 9
Bereken de tussen groepen MS.
Vraag 10
Bereken de binnen groepen MS.
Vraag 11
Bereken de F-ratio.
Vraag 12
Zoek de kritische F-waarde die overeenkomt met een significantieniveau van 0,05.
Vraag 13
Wat kan worden geconcludeerd over de nulhypothese?
Beschouw de volgende variantieanalyse voor vragen 14-19.
Bron van variantie | SS | Vrijheidsgraden | MS | F-ratio |
Tussen groepen | 879 | .. | ||
Binnen groepen | 798 | 16 | ||
Totaal | 1677 | 19 |
Vraag 14
Hoeveel vrijheidsgraden heeft de tussen groepen SS?
Vraag 15
Bereken de tussen groepen MS.
Vraag 16
Bereken de binnen groepen MS.
Vraag 17
Bereken de F-ratio.
Vraag 18
Zoek de kritische F-waarde die overeenkomt met een significantieniveau van 0,05.
Vraag 19
Wat kan worden geconcludeerd over de nulhypothese?
Overweeg voor vraag 20-28 een tweewegs ANOVA met één waarneming per cel en gerandomiseerde blokken met de volgende resultaten:
Bron van variantie | SS | Vrijheidsgraden | MS | F-ratio |
Tussen groepen | 3636 | 33 | MSG = SSG / (K - 1) | |
Tussen blokken | 7575 | 66 | MSB = SSB / (H - 1) | |
Fout (error) | 9999 | 1818 | MSE = SSE / ((K - 1) (H - 1)) | |
Totaal | 210210 | 2727 |
Vraag 20
Bereken de MS tussen groepen.
Vraag 21
Bereken de MS binnen groepen.
Vraag 22
Bereken de MS voor de foutenterm.
Vraag 23
Bereken de F-ratio MSG / MSE.
Vraag 24
Zoek de kritische waarde voor de hypothesetest dat de gemiddelden tussen de groepen gelijk zijn met een significantieniveau van 5%.
Vraag 25
Wat kunnen we concluderen over de nulhypothese dat de gemiddelden tussen groepen gelijk zijn?
Vraag 26
Bereken de F-ratio MSB / MSE.
Vraag 27
Zoek de kritische waarde voor de hypothesetest dat de tussenblokgemiddelden gelijk zijn met een significantieniveau van 5%.
Vraag 28
Wat kunnen we concluderen over de nulhypothese dat de tussenblokgemiddelden gelijk zijn?
Overweeg de volgende gegevens voor vragen 29-30.
Bron van variantie | SS | Vrijheidsgraden | MS | F-ratio |
Tussen groepen | 62.04 | 1 | 62.04 | |
Tussen blokken | 0.06 | 1 | 0.06 | |
Interactie | 1.85 | ... | 1.85 | |
Fout (error) | 23.31 | 63 | 0.37 | |
Totaal | 87.26 | 66 |
Vraag 29
Bereken het aantal vrijheidsgraden voor de interactie term.
Vraag 30
Bereken de F-ratio voor de interactie term.
Antwoordindicatie
Vraag 1
Alle populatie gemiddelden zijn gelijk aan elkaar: H0: μ1 = μ2 = ... = μk voor K populaties.
Vraag 2
MSW = (12.18) / (20 - 3) = 0.72
Vraag 3
MSG = (21.55) / (3 - 1) = 10.78
Vraag 4
F = MSG / MSW = 10.78 / 0.72 = 15.039
Vraag 5
df = (K - 1) = 3 - 1 = 2 voor de teller.
df = (n - K) = 20 - 3 = 17 voor de noemer
Vraag 6
F2,17,0.01 = 6.112 (Appendix Tabel 9)
Vraag 7
De testwaarde (15.039) overschrijdt de kritische waarde (6.112), daarom kunnen we de nulhypothese verwerpen dat het populatiegemiddelde hetzelfde is voor alle drie groepen.
Vraag 8
K - 1 = 4 is, dus K = 5.
n - 1 = 17 , dus n = 18.
df = N - k = 18 - 5 = 13.
Vraag 9
MSG = SSG / (K - 1) = 1728 / 4 = 432
Vraag 10
MSW = SSW / (n - K) = 624 / 13 = 48
Vraag 11
F = MSG / MSW = 246.86 / 48 = 9
Vraag 12
F4,13,0.05 = 3.179
Vraag 13
F > F4,13,0.05 , dus we kunnen de nulhypothese van gelijke populatie gemiddelden niet verwerpen.
Vraag 14
n - 1 = 19 --> n = 20
n - k = 16 --> 20 - k = 16 --> k = 4
df = k - 1 = 4 - 1 = 3
Vraag 15
MSG = SSG / (K - 1) = 879 / 3 = 293
Vraag 16
MSW = SSW / (n - K) = 798 / 16 = 49.875
Vraag 17
F = MSG / MSW = 293 / 49.875 = 5.875
Vraag 18
F3,16,0.05 = 3.239
Vraag 19
F < F3,16,0.05 , dus we kunnen de nulhypothese van gelijke populatie gemiddelden niet verwerpen.
Vraag 20
MSG = SSG / (K - 1) = 3636 / 33 = 110.18
Vraag 21
MSB = SSB / (H - 1) = 7575 / 66 = 114.77
Vraag 22
MSE = SSE / ((K - 1) (H - 1)) = 9999 / 1818 = 5.5
Vraag 23
F = MSG / MSE = 110.18 / 5.5 = 20.03
Vraag 24
F33,1818,0.05 = 1.676
Vraag 25
De teststatistiek overschrijdt de kritische waarde, daarom kunnen we de nulhypothese verwerpen dat de gemiddelden tussen blokken gelijk zijn.
Vraag 26
F = MSB / MSE = 114.77 / 5.5 = 20.87
Vraag 27
F66,9999,0.05 = 1.676
Vraag 28
De teststatistiek overschrijdt de kritische waarde, daarom kunnen we de nulhypothese verwerpen dat de gemiddelden tussen blokken gelijk zijn.
Vraag 29
df = 1
Vraag 30
F = MSI / MSE = 1.85 / 0.37 = 5.
Hoe kun je data met metingen in de loop van de tijd analyseren? - TentamenTests 16
Vragen
Vraag 1
Wat wordt bedoeld met een tijdreeks?
Vraag 2
Wat zijn de vier componenten van een tijdreeks?
Vraag 3
Laat de schattingen van niveau en trend in jaar 5 als volgt zijn:
\[ \hat{x}_{5} = 347 \]
\[ T_{5} = 13 \]
Wat is de verwachting voor het volgende jaar met de Holt-Winters-methode?
Vraag 4
Wat is de voorspelling voor jaar 7 met de Holt-Winters-methode voor niet-seizoensgebonden series?
Vraag 5
Wat is de voorspelling voor jaar 8 met behulp van de Holt-Winters-methode voor niet-seizoensgebonden series?
Vraag 6
Wat is de voorspelling voor jaar 9 met de Holt-Winters-methode voor niet-seizoensgebonden series?
Vraag 7
Stel dat we 32 waarnemingen hebben en een seizoensfactor s = 4 die kwartaalgegevens aangeeft. Noteer de vergelijking voor de voorspelling van de volgende waarneming na het einde van de reeks. Gebruik hiervoor de door Holt-Winters ontwikkelde methode voor seizoensreeksen.
Vraag 8
Wat is de nulhypothese in een autoregressief model?
Vraag 9
Geef de algemene vergelijking die een reeks weergeeft volgens het autoregressieve model.
Vraag 10
Welk algoritme wordt gebruikt om de parameters voor het autoregressieve model te verkrijgen?
Antwoordindicatie
Vraag 1
Een tijdreeks is een reeks metingen, geordend in de tijd, voor een bepaalde hoeveelheid interesse. In een tijdreeks is de volgorde van waarnemingen belangrijk.
Vraag 2
Tt: trend component
St: seizoensgebonden component
Ct: Cyclische component
It: Onregelmatige component
Vraag 3
\[ \hat{x}_{6} = 347 + 13 = 360 \]
Vraag 4
\[ \hat{x}_{7} = 347 + (2)(13) = 373 \]
Vraag 5
\[ \hat{x}_{8} = 347 + (3)(13) = 386 \]
Vraag 6
\[ \hat{x}_{8} = 347 + (4)(13) = 399 \]
Vraag 7
\[ \hat{x}_{n+h} = ( \hat{x}_{n} + hT_{n} ) F_{n+h-s} = \hat{x}_{33} = (\hat{x}_{32} + T_{32}) F_29 \]
Vraag 8
H0: Φp = 0
Vraag 9
\[ x_{t} = \gamma + \phi_{1}x_{t - 1} + \gamma + \phi_{2}x_{t - 2} + ... + \gamma + \phi_{p}x_{t - p} + \epsilon_{t} \]
Vraag 10
Het least squares (kleinste kwadraten) algoritme.
Welke andere procedures zijn er beschikbaar voor het trekken van steekproeven? - TentamenTests 17
Vragen
Vraag 1
Stel dat we een gestratificeerde steekproeftrekkingsprocedure hebben uitgevoerd. Gebruik de volgende informatie voor vraag 1-7:
N1 = 75; N2 = 30; N3 = 125.
n1 = 15; n2 = 8; n3 = 25.
x̄1 = 21.2; s1 = 12.8.
x̄2 = 13.3; s2 = 11.4.
x̄3 = 26.1; s3 = 9.2.
Bereken de puntschatting van het populatiegemiddelde.
Vraag 2
Bereken de puntschatting van de variantie voor het eerste stratum.
Vraag 3
Bereken de puntschatting van de variantie voor het tweede stratum.
Vraag 4
Bereken de puntschatting van de variantie voor het derde stratum.
Vraag 5
Bereken de puntschatting van de variantie voor het populatiegemiddelde.
Vraag 6
Bereken de puntschatting van de standaarddeviatie voor het populatiegemiddelde.
Vraag 7
Bereken een betrouwbaarheidsinterval van 95% voor het populatiegemiddelde.
Vraag 8
Stel dat we een gestratificeerde steekproeftrekkingsprocedure hebben uitgevoerd. Gebruik de volgende informatie voor vraag 8 - 13:
N1 = 364; N2 = 1031.
n1 = 40; n2 = 60.
p(geschat)1 = 7/40 = 0.175
p(geschat)2 = 13/60 = 0.217
Bereken de puntschatting van de populatie proportie.
Vraag 9
Bereken de puntschatting van de variantie van de proportie voor het eerste stratum.
Vraag 10
Bereken de puntschatting van de variantie van de proportie voor het tweede stratum.
Vraag 11
Bereken de puntschatting van de variantie van de proportie voor de populatie.
Vraag 12
Bereken de puntschatting van de standaarddeviatie van de populatie proportie.
Vraag 13
Bereken het 90% betrouwbaarheidsinterval voor het populatiepercentage uit deze gestratificeerde steekproeven.
Vraag 14
Gebruik de volgende informatie voor vragen 14-16. Stel dat we een totaal van N = 125 hebben dat is verdeeld in drie strata met N1 = 75, N2 = 30 en N3 = 20. Stel nu dat we een steekproef willen selecteren met n = 25. Bereken de steekproefgrootte voor het eerste stratum met behulp van proportionele toewijzing.
Vraag 15
Bereken de steekproefgrootte voor het tweede stratum met behulp van proportionele toewijzing.
Vraag 16
Bereken de steekproefgrootte voor het derde stratum met behulp van proportionele toewijzing.
Vraag 17
Gebruik de volgende informatie voor vragen 17-19. Stel dat we in totaal N = 225 hebben die is verdeeld in drie lagen met N1 = 100, N2 = 75 en N3 = 50. Stel nu dat we een steekproef willen selecteren met n = 50. Bereken de steekproefgrootte voor het eerste stratum met behulp van proportionele toewijzing.
Vraag 18
Bereken de steekproefgrootte voor het tweede stratum met behulp van proportionele toewijzing.
Vraag 19
Bereken de steekproefgrootte voor het derde stratum met behulp van proportionele toewijzing.
Vraag 20
Gebruik de volgende informatie voor vragen 20-22. Stel dat we in totaal N = 225 hebben die is verdeeld in drie lagen met N1 = 250, N2 = 100 en N3 = 150. Stel nu dat we een steekproef willen selecteren met n = 50.Bereken de steekproefgrootte voor het eerste stratum met behulp van proportionele toewijzing.
Vraag 21
Bereken de steekproefgrootte voor het tweede stratum met behulp van proportionele toewijzing.
Vraag 22
Bereken de steekproefgrootte voor het derde stratum met behulp van proportionele toewijzing.
Vraag 23
Gebruik de volgende informatie voor vragen 23-25. Stel dat we in totaal N = 225 hebben die is verdeeld in drie lagen met N1 = 250, N2 = 100 en N3 = 150. Stel nu dat we een steekproef willen selecteren met n = 50. Bereken de steekproefgrootte voor het eerste stratum met behulp van proportionele toewijzing.
Vraag 24
Bereken de steekproefgrootte voor het tweede stratum met behulp van proportionele toewijzing.
Vraag 25
Bereken de steekproefgrootte voor het derde stratum met behulp van proportionele toewijzing.
Vraag 26
Wat is het verschil tussen proportionele allocatie en optimale allocatie qua steekproefinspanning?
Vraag 27
Wat is het verschil tussen de proportionele allocatie en de optimale allocatie bij het schatten van de steekproefomvang voor strata voor populatieverhoudingen?
Vraag 28
Wat is het verschil tussen gestratificeerde steekproeftrekking en clustersteekproeftrekking?
Vraag 29
Noem één voordeel en één nadeel van clustersteekproeftrekking.
Vraag 30
Noem één voordeel en één nadeel van steekproeftrekking in twee fasen.
Antwoordindicatie
Vraag 1
\[ \bar{x}_{st} = \frac{1}{N} \ sum^{K}_{j = 1} N_{j}\bar{x}_{j} = \frac{ (75)(21.2) + (30)(13.3) + (20)(26.1) }{125} = 20.09 \]
Vraag 2
\[ \hat{\sigma}^{\frac{2}{x_{1}}} = \frac{ s^{2}_{1} }{n_{1}} x \frac{ (N_{1} - n_{1} ) }{N_{1} - 1 } = \frac{s^{2}_{1}}{n_{1}} x \frac{ (N_{1} - n_{1}) }{N_{1} - 1} = \frac{(12.8)^{2}}{15} x \frac{60}{74} = 8.856 \]
Vraag 3
\[ \hat{\sigma}^{\frac{2}{x_{2}}} = \frac{ s^{2}_{2} }{n_{2}} x \frac{ (N_{2} - n_{2} ) }{N_{2} - 1 } = \frac{s^{2}_{1}}{n_{1}} x \frac{ (N_{1} - n_{1}) }{N_{1} - 1} = \frac{(11.4)^{2}}{8} x \frac{22}{29} = 12.324 \]
Vraag 4
\[ \hat{\sigma}^{\frac{2}{x_{3}}} = \frac{ s^{2}_{3} }{n_{3}} x \frac{ (N_{3} - n_{3} ) }{N_{3} - 1 } = \frac{s^{2}_{1}}{n_{1}} x \frac{ (N_{1} - n_{1}) }{N_{1} - 1} = \frac{(9.2)^{2}}{2} x \frac{18}{19} = 40.093 \]
Vraag 5
\[ \hat{\sigma}^{\frac{2}{st}} = \frac{1}{N^{2}} \ sum^{K}_{j = 1} N^{2}_{j} \hat{\sigma}^{2}_{x_{j}} = \frac{ (75)^{2}(8.856) + (30)^{2}(12.324) + (20)^{2}(40.093) }{125^{2}} = 4.924 \]
Vraag 6
\[ \hat{\sigma}_{\bar{x}_{st}} = \sqrt{4.924} = 2.22 \]
Vraag 7
20.09 +/- (1.96)(2.22) = [15.74; 24.44]
Vraag 8
\[ \hat{p}_{st} = \frac{1}{N} = \sum^{K}_{j = 1} N_{j} \hat{p}_{j} = \frac{ (364)(0.175) + (1031)(0.217) }{1395} = 0.206 \]
Vraag 9
\[ \hat{\sigma}^{2}_{p_{st}} = \frac{ \hat{p}_{j} (1 - \hat{p}_{j}) }{n_{j} - 1} x \frac{ (N_{j} - n_{j}) }{N_{j} - 1} = \frac{ (0.175)(0.825) }{39} x \frac{324}{363} = 0.003304 \]
Vraag 10
\[ \hat{\sigma}^{2}_{p_{st}} = \frac{ \hat{p}_{j} (1 - \hat{p}_{j}) }{n_{j} - 1} x \frac{ (N_{j} - n_{j}) }{N_{j} - 1} = \frac{ (0.217)(0.783) }{59} x \frac{971}{1030} = 0.002715 \]
Vraag 11
\[ \hat{\sigma}^{2}_{\hat{p}_{st}} = \frac{1}{N^{2}} \sum^{K}{j = 1} N^{2}_{j} \ hat{\sigma}^{2}_{\hat{p}_{j}} = \frac{ (364)^{2}(0.003304) + (1031)^{2}(0.002715) }{ (1395)^{2} } = 0.001708 \]
Vraag 12
\[ \hat{\sigma}_{\hat{p}_{st}} = 0.0413 \]
Vraag 13
(0.206) +/- (1.645)(0.0413) = [0.138; 0. 274]
Vraag 14
\[ n_{1} = \frac{75}{125} x 25 = 12 \]
Vraag 15
\[ n_{2} = \frac{30}{125} x 25 = 5 \]
Vraag 16
\[ n_{3} = \frac{20}{125} x 25 = 6 \]
Vraag 17
\[ n_{1} = \frac{100}{225} x 50 = 22 \]
Vraag 18
\[ n_{2} = \frac{75}{225} x 50 = 17 \]
Vraag 19
\[ n_{3} = \frac{50}{225} x 50 = 11 \]
Vraag 20
\[ n_{1} = \frac{250}{500} x 50 = 25 \]
Vraag 21
\[ n_{2} = \frac{100}{500} x 50 = 10 \]
Vraag 22
\[ n_{3} = \frac{150}{500} x 50 = 15 \]
Vraag 23
\[ n_{1} = \frac{250}{500} x 100 = 50 \]
Vraag 24
\[ n_{2} = \frac{100}{500} x 100 = 20 \]
Vraag 25
\[ n_{3} = \frac{150}{500} x 100 = 30 \]
Vraag 26
Optimale allocatie wijst relatief meer steekproefinspanning toe aan strata waarin de populatievariantie het grootst is.
Vraag 27
Optimale toewijzing wijst meer steekproefwaarnemingen toe aan strata waarin de werkelijke populatieverhoudingen het dichtst bij 0,50 liggen.
Vraag 28
Bij gestratificeerde willekeurige steekproeftrekking wordt een steekproef genomen van elke stratum van de populatie in een poging om ervoor te zorgen dat belangrijke segmenten van de populatie een overeenkomstig gewicht krijgen. Bij clustersteekproeven wordt een willekeurige steekproef van clusters genomen, zodat sommige clusters geen leden in de steekproef hebben.
Vraag 29
Voordeel: gemak. Nadeel: de extra onnauwkeurigheid in de steekproeframingen.
Vraag 30
Voordeel: het stelt de onderzoeker in staat om de enquête tegen lage kosten uit te proberen. Nadeel: tijdrovend.
Contributions: posts
Spotlight: topics
Online access to all summaries, study notes en practice exams
- Check out: Register with JoHo WorldSupporter: starting page (EN)
- Check out: Aanmelden bij JoHo WorldSupporter - startpagina (NL)
How and why would you use WorldSupporter.org for your summaries and study assistance?
- For free use of many of the summaries and study aids provided or collected by your fellow students.
- For free use of many of the lecture and study group notes, exam questions and practice questions.
- For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
- For compiling your own materials and contributions with relevant study help
- For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.
Using and finding summaries, study notes and practice exams on JoHo WorldSupporter
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
- Use the menu above every page to go to one of the main starting pages
- Starting pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
- Use the topics and taxonomy terms
- The topics and taxonomy of the study and working fields gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
- Check or follow your (study) organizations:
- by checking or using your study organizations you are likely to discover all relevant study materials.
- this option is only available trough partner organizations
- Check or follow authors or other WorldSupporters
- by following individual users, authors you are likely to discover more relevant study materials.
- Use the Search tools
- 'Quick & Easy'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject.
- The search tool is also available at the bottom of most pages
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
- Check out: Why and how to add a WorldSupporter contributions
- JoHo members: JoHo WorldSupporter members can share content directly and have access to all content: Join JoHo and become a JoHo member
- Non-members: When you are not a member you do not have full access, but if you want to share your own content with others you can fill out the contact form
Quicklinks to fields of study for summaries and study assistance
Field of study
- All studies for summaries, study assistance and working fields
- Communication & Media sciences
- Corporate & Organizational Sciences
- Cultural Studies & Humanities
- Economy & Economical sciences
- Education & Pedagogic Sciences
- Health & Medical Sciences
- IT & Exact sciences
- Law & Justice
- Nature & Environmental Sciences
- Psychology & Behavioral Sciences
- Public Administration & Social Sciences
- Science & Research
- Technical Sciences
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
2908 | 1 |
Add new contribution