TentamenTest bij de 9e druk van Statistics for Business and Economics van Newbold

Hoe kunnen data grafisch worden weergegeven? - TentamenTests 1
Hoe kunnen data numeriek worden beschreven? - TentamenTests 2
Hoe werkt kansberekening? - TentamenTests 3
Hoe kun je kansmodellen gebruiken voor discrete wilekeurige variabelen? - TentamenTests 4
Hoe kun je kansmodellen gebruiken voor continue willekeurige variabelen? - TentamenTests 5
Hoe kun je een goede steekproef uit de populatie verkrijgen? - TentamenTests 6
Hoe kun je schattingen verkrijgen voor een enkele populatie? - TentamenTests 7
Hoe kun je parameters schatten voor twee populaties? - TentamenTests 8
Hoe kun je hypothesen opstellen voor een enkele populatie? - TentamenTests 9
Welke testprocedures zijn er voor het verschil tussen twee populaties? - TentamenTests 10
Hoe werkt een enkelvoudige regressie? - TentamenTests 11
Hoe werkt een meervoudige regressie? - TentamenTests 12
Welke andere onderwerpen zijn belangrijk in regressie analyse? - TentamenTests 13
Hoe kun je categorische data analyseren? - TentamenTests 14
Hoe werkt de analyse van variantie? - TentamenTests 15
Hoe kun je data met metingen in de loop van de tijd analyseren? - TentamenTests 16
Welke andere procedures zijn er beschikbaar voor het trekken van steekproeven? - TentamenTests 17

Hoe kunnen data grafisch worden weergegeven? - TentamenTests 1

Vragen

Geef bij vragen 1-4 aan of elk van de volgende variabelen categorisch of numeriek is. Als de variabele categorisch is, geef dan het meetniveau op. Als de variabele numeriek is, geeft u het meetniveau op en geeft aan of de variabele discreet of continu is.

Vraag 1

Het aantal aandelen van een aandeel gekocht door een makelaar

Vraag 2

De nationaliteit van een student

Vraag 3

Het gemiddelde cijfer van een student

Vraag 4

De temperatuur in graden Celsius

Vraag 5

Bij een bezoek aan een nieuw geopende H&M winkel kregen klanten een kort onderzoek. Is het antwoord op elk van de volgende vragen categorisch of numeriek? Geef, indien categorisch, het meetniveau op. Indien numeriek, is het discreet of continu?

Is dit je eerste bezoek aan deze H&M winkel?
Op een schaal van 1 (zeer ontevreden) tot 5 (zeer tevreden), hoe tevreden bent u met de aankoop (en) van vandaag?
Wat waren de kosten van uw aankoop (en)?

Toeristen die Kroatië bezoeken, worden gevraagd een enquête in te vullen. Het onderzoek bestaat uit verschillende vragen over hoe zij hun vakantie hebben ervaren. De vragen worden hieronder gegeven (vraag 6 - 10). Beschrijf voor elke vraag het type verkregen gegevens.

Vraag 6

Welke van de volgende gebieden heb je bezocht?

Kust
Eilanden
Bergen
De hoofdstad (Zagreb).

Vraag 7

Heb je een zeilboot gehuurd?

Vraag 8

Wat was het gemiddelde bedrag dat u per dag aan eten uitgeeft?

Vraag 9

Wat zou u aanbevelen als het optimale aantal dagen voor toeristen om in Kroatië door te brengen?

Vraag 10

Hoe vaak zou u aanbevelen om Kroatië te bezoeken?

Elk jaar
Eens in de vijf jaar
Een keer in het leven
Nooit

Vraag 11

Een beheerder onderzoekt de reiskosten van faculteitsleden die verschillende congressen hebben bijgewoond. Hij ontdekte dat 36% van de reiskosten werd besteed aan transportkosten, 17% werd besteed aan accommodatie, 13% werd uitgegeven aan voedsel; 9% werd besteed aan vergaderkosten, 10% aan registratiekosten en de rest werd besteed aan diverse kosten.

Maak een cirkeldiagram voor deze gegevens
Maak een staafdiagram voor deze gegevens

Vraag 12

Een bedrijf heeft zeven codes gedefinieerd voor mogelijke defecten voor een van zijn producten. Construeer een Pareto-diagram voor de volgende frequenties:

Defect code	A	B	C	D	E	F	G
Frequentie	10	70	15	90	8	4	3

Vraag 13

Maak een tijdreeksplot voor de volgende gegevens van klanten die in een nieuw winkelcentrum in een bepaalde week winkelen.

Dag	Aantal klanten
Maandag	516
Dinsdag	534
Woensdag	451
Donderdag	487
Vrijdag	558
Zaterdag	641
Zondag	830

Vraag 14

Bepaal een geschikte intervalbreedte voor een willekeurige steekproef van 370 waarnemingen met scores die tussen 40 en 200 liggen.

Vraag 15

Maak een stam-en-bladweergave voor de volgende gegevens.

17	16	15	17	17
20	30	25	25	14
12	18	31	26	26
12	15	16	16	28

Vraag 16

Beschouw de gegevens van vraag 15. Maak een histogram voor deze gegevens.

Vraag 17

Beschouw de gegevens van vraag 15. Is de verdeling van deze gegevens symmetrisch, links scheef of rechts scheef?

Vraag 18

Maak een spreidingsplot bij de volgende gegevens.

(3, 10)
(2, 8)
(3, 12)
(4, 15)
(6, 20)
(5, 15)
(4, 12)

Vraag 19

De volgende tabel toont de leeftijd van faculteitsleden die zijn gepromoveerd aan de grootste universiteit van Nederland.

Leeftijd	Percentage
26 - 28	18.00
29 - 32	23.50
33 - 40	30.51
41 - 55	12.99
56+	15.00

Hoeveel procent van de faculteitsleden die zijn gepromoveerd, is 46 jaar of ouder?

Vraag 20

Beschouw de gegevens van vraag 19. Welk percentage van het faculteitslid dat promoveerde, is jonger dan 33 jaar?

Vraag 21

Maak een relatieve cumulatieve frequentieverdeling van de gegevens beschreven bij vraag 19.

Vraag 22

Stel dat we 200 observaties hebben. Wat zijn de cumulatieve frequenties voor de gegevens die bij vraag 18 zijn beschreven?

Vraag 23

Interpreteer de cumulatieve frequenties van vraag 22.

Vraag 24

De volgende gegevens worden gepresenteerd:

Leeftijd	30 -40	40 -50	50 - 60	60 - 70
Number	12	13	22	34

Beschrijf de mogelijke fouten in deze tabel.

Vraag 25

Stel dat het bedrag dat iemand per maand aan filmtickets uitgeeft (in euro's) is:
6.0, 5.3, 4.0, 5.7, 10.0, 8.4, 2.5, 10.0, 9.5, 0.0, 5.0, 10.0
Welke grafische weergave is geschikt om deze gegevens visueel weer te geven?

vraag 26

Uit een survey blijkt dat 32% van de shoppers in Duitsland met een inkomen van minder dan 50.000 online winkelt. Van de resterende 68% winkelt de helft van de particulieren nooit, en de andere helft winkelt door naar de eigenlijke winkel te gaan. Gebruik een cirkeldiagram om deze gegevens te plotten.

Vraag 27

Vier soorten betaalrekeningen worden aangeboden door een bank. Stel dat een willekeurige steekproef van 300 klanten werd ondervraagd en enkele vragen stelde. Het bleek dat 60% van de respondenten de voorkeur gaf aan "Easy Checking", 12% aan "Intelligent Checking", 18% aan "Super Checking" en de rest aan "Ultimate Checking". Van de deelnemers die Easy Checking hebben gekozen, waren er 100 vrouwen. Van degenen die voor Intelligent Checking hebben gekozen, was een derde vrouw. Van degenen die Super Checking verkozen, was de helft vrouwelijk. Ten slotte was 80% van degenen die voor Ultimate Checking hebben gekozen, vrouw. Beschrijf de gegevens met een kruistabel.Beschouw de gegevens van vraag 27. Hoeveel vrouwen zijn er in totaal en hoeveel mannen?

Vraag 28

Beschouw de gegevens van vraag 27. Hoeveel vrouwen zijn er in totaal en hoeveel mannen?

Vraag 29

Beschouw de gegevens van vraag 27. Welk type grafische weergave is geschikt voor deze gegevens?

Histogram
Spreidingsplot
Tijdreeksplot
Staafdiagram

Vraag 30

Welk type grafische weergave is geschikt voor twee numerieke variabelen?

Antwoordindicatie

Vraag 1

numeriek; interval; discreet

Vraag 2

categorisch; nominaal

Vraag 3

numeriek; ratio; continu

Vraag 4

numeriek; interval; continu

Vraag 5

a = categorisch; nominaal
b = categorisch; ordinaal
c = numeriek; continu

Vraag 6

Zowel categorisch (nominale gegevens, binair gecodeerd: ja / nee) als numeriek (discreet) door het aantal gebieden dat men heeft bezocht.

Vraag 7

categorisch; nominaal; binair gecodeerd.

Vraag 8

numeriek; interval; continu.

Vraag 9

numeriek; interval; discreet.

Vraag 10

categorisch; ordinale.

Vraag 11

Vraag 12

Een Pareto-diagram is geordend van de hoogste naar de laagste frequentie.

Vraag 13

Vraag 14

Volgens de beknopte handleiding kan een steekproef van 370 worden geschat door acht tot tien klassen.
Met behulp van de formule voor opbrengsten met intervalbreedte:
w = (200 - 40) / 8 = 20; of
w = (200 - 40) / 10 = 16

Een geschikte intervalbreedte ligt dus ergens tussen 16 en 20.

Vraag 15

1 | 2, 2, 4, 5, 5, 6, 6, 6, 7, 7, 7, 8
2 | 0, 5, 5, 6, 6, 8
3| 0, 1

Vraag 16

Vraag 17

Rechts-scheef verdeeld (positief scheef); the staart ligt aan de rechterkant van de distributie.

Vraag 18

Vraag 19

12.99 + 15.00 = 27.99%

Vraag 20

18.00 + 23.50 = 41.50%

Vraag 21

Leeftijd	Percentage
26 - 28	18.00
29 - 32	41.50
33 - 40	72.01
41 - 55	85.00
56+	100.00

Vraag 22

De cumulatieve frequenties voor 200 waarnemingen zijn: 36, 82, 144, 170, 200.

Vraag 23

Voor steekproefgrootte n = 200 zijn er 36 personen die zijn gepromoveerd tussen de leeftijd van 26 en 28. Er zijn 82 personen die zijn gepromoveerd vóór de leeftijd van 33. Er zijn 144 personen die zijn gepromoveerd vóór de leeftijd van 41 , enzovoorts.

Vraag 24

Een mogelijke fout ligt in de grenzen van de frequentieklassen. Ten eerste is er geen boven- en ondergrens, waardoor (mogelijk) sommige observaties worden uitgesloten. Ten tweede is het onduidelijk uit deze frequentieverdeling, tot welke klasseobservaties zoals 30 en 40 behoren.

Vraag 25

Een tijdreeksplot zou hier geschikt zijn. Gegevens worden gegeven voor t aantal tijdpunten, met t = 12.

Vraag 26

Vraag 27

Type rekening	Vrouw	Man	Totaal
Easy Checking	100	80	180
Intelligent Checking	12	24	36
Super checking	27	27	54
Ultimate Checking	24	6	30
Totaal	163	137	300

Vraag 28

Er zijn 163 vrouwen en 137 mannen in de steekproef van 300 deelnemers.

Vraag 29

D, een staafdiagram. De andere grafieken zijn geschikt in het geval van numerieke variabelen. Hier hebben we frequenties voor twee categorische variabelen. Dit wordt het best weergegeven door een staafdiagram (of cirkeldiagram).

Vraag 30

Een spreidingsplot.

Hoe kunnen data numeriek worden beschreven? - TentamenTests 2

Vragen

Vraag 1

De volgende vijf random getallen zijn getrokken uit de populatie:
18 71 80 80 84
Bereken het gemiddelde, de mediaan en de modus.

Vraag 2

In een onderzoek worden het aantal auto's dat de grens tussen Israël en Jordanië passeert, bijeghouden. Over een periode van zes dagen worden de volgende aantallen gevonden:
16 21 12 19 1 2
Bereken het gemiddelde, de mediaan en de modus.

Vraag 3

Uit de gegevens van de Rijksuniversiteit Groningen over een periode van 12 jaar blijkt de volgende procentuele toename van het aantal ingeschreven studenten:
4.1 3.2 3.5 4.5 5.1 3.8
2.1 2.2 3.1 5.1 1.5 1.0
Bereken het gemiddelde, de mediaan en de modus

Vraag 4

De financiën van het afgelopen decennium worden herzien. De gegevens worden per jaar getoond.
2.51 3.74 4.15 5.33 6.18
6.65 7.18 6.92 6.95 7.54
Bereken het gemiddelde en de mediaan

Vraag 5

In de afgelopen jaren zijn veel landen geconfronteerd met ontvolking. We hebben gegevens verzameld voor tien landen wat betreft het aantal basisscholen dat in deze periode gesloten is:
10 6 13 5 11 5 6 3 7 9
a. Bereken het gemiddelde, de mediaan en de modus.
b. Geef de vijf-getallen samenvatting (five-number-summary).

Vraag 6

Een textielfabrikant neemt een steekproef van 50 bouten en inspecteert zorgvuldig elke bout. Op basis van deze inspectie registreert de fabrikant het aantal onvolkomenheden. De volgende contingentietabel wordt verkregen:

Aantal onvolkomenheden	0	1	2	3
Aantal bouten	33	12	4	1

Bereken het gemiddelde, de mediaan en de modus.

Vraag 7

Bereken de variantie en standaarddeviatie voor de volgende data:
6 8 10 12 14 9 11 7 13 11

Vraag 8

Bereken de variantie en standaarddeviatie voor de volgende data:
5 -3 0 2 -1 7 4

Vraag 9

Beschouw twee verschillende beleggingen, voorraad A en voorraad B. De gemiddelde slotkoers voor voorraad A is 4,00 en de gemiddelde slotkoers voor voorraad B is 80,00. Het gemiddelde rendement is hetzelfde voor zowel voorraad A als voorraad B. Stel nu dat de standaarddeviaties aanzienlijk verschillen, met S_A = 2,00 en S_B = 8,00 . Bereken de variatiecoëfficiënt voor deze voorbeeldgegevens en vergelijk deze concurrerende investeringsmogelijkheden.

Vraag 10

Bereken de variatiecoëfficiënt voor de volgende gegevens:
13 15 12 14 11

Vraag 11

Een set gegevens is bij benadering normaal verdeeld met een gemiddelde van 300 en een variantie van 144. Ongeveer welk deel van de waarnemingen is:
a. groter dan 288?
b. minder dan 324?
c. groter dan 336?

Vraag 12

Het aantal auto's dat gedurende een periode van 35 door een tunnel rijdt, is als volgt:
60 70 74 56 84 54 50
47 80 71 50 95 121 90
75 84 70 61 110 64 80
85 85 43 76 60 91 90
60 87 110 85 44 94 69

a. Wat is het gemiddelde aantal auto's?
b. Wat is de standaarddeviatie?
c. Wat is de variatiecoëfficiënt?

Vraag 13

Gebruik de gegevens van vraag 12. Maak een stam-en-blad diagram van het aantal auto's dat door de tunnel rijdt. Bepaal vervolgens het interkwartielbereik.

Vraag 14

Geef de samenvatting met vijf cijfers voor de voorbeeldgegevens van vraag 12.

Vraag 15

De dagelijkse wisselkoers van EUR naar USD voor zeven werkdagen is:
1,14 1,14 1,13 1,13 1,12 1,11
Over dezelfde periode is de dagelijkse wisselkoers van EUR van JPY:
110 110 109 109 108 109
a. Vergelijk de middelen van deze twee verdelingen.
b. Vergelijk de standaardafwijkingen van deze twee verdelingen.

Vraag 16

Een bedrijf produceert gloeilampen met een gemiddelde levensduur van 1200 uur en een standaardafwijking van 50 uur. Bereken de z-score voor een gloeilamp met een levensduur van maar 1.120.

Vraag 17

Gebruik de z-score berekend bij vraag 16. Welk percentage gloeilampen heeft een levensduur langer dan 1120 uur?

Vraag 18

Gebruik opnieuw de gegevens van vraag 16. Bereken de z-score die overeenkomt met een gloeilamp met een levensduur van 1.300 uur duurt.

Vraag 19

Welk percentage gloeilampen gaat langer dan 1300 uur mee?

Vraag 20

Stel dat een student die tijdens zijn eerste semester van de universiteit in totaal 15 ECTS heeft behaald. Hij ontving één A, één B, één C en één D. Stel nu dat een waarde van 4 wordt toegewezen aan een A, een waarde van 3 wordt toegewezen aan een B, een waarde van 2 wordt toegewezen aan een C, en een waarde van 1 wordt toegewezen aan een D. Bereken de GPA van het semester van de student.

Vraag 21

Gebruik de gegevens van vraag 20. Nu is elke cursus echter niet hetzelfde aantal studiepunten waard. De A werd behaald in een cursus met 3 studiepunten Engels, de B werd behaald in een cursus biologie van 3 studiepunten, de C werd behaald in een cursus biologie met 4 studiepunten en de D werd behaald in een cursus Spaans met 5 studiepunten. Bereken met dit gewicht opnieuw de gewogen GPA van het semester van de student.

Vraag 22

Gebruik de volgende gegevens voor vragen 22-25:

x_i	w_i
4.7	8
3.8	7
5.7	4
2.6	3
5.5	2

Wat is het rekenkundig gemiddelde van de x_iwaarden?

Vraag 23

Wat is het gewogen gemiddelde van de x_i-waarden?

Vraag 24

Wat is de steekproefvariantie?

Vraag 25

Wat is de standaarddeviatie van de steekproef?

vraag 26

Gebruik de volgende gegevens voor vragen 26-28:
(15,45) (6,18) (11,33) (12,36) (16,48), (14,42)
(5,15) (17,51) (4,12) (19,57), (7,21)

Bereken de covariantie.

Vraag 27

Bereken de correlatiecoëfficiënt

Vraag 28

Schets een spreidingsplot om de relatie tussen de twee variabelen weer te geven.

Gebruik de volgende gegevens voor vragen 29-30.

Quiz score (x)	4	3.4	3	5	1.1
Examen score (y)	100	66	78	80	3

Vraag 29

Bereken de covariantie

Vraag 30

Bereken de correlatiecoëfficiënt.

Antwoordindicatie

Vraag 1

Gemiddelde = (18+71+80+80+84)/5 = 66.7; mediaan = 80; modus = 80.

Vraag 2

Gemiddelde = (16+21+12+19+1+2)/6 = 11.8; mediaan = (12+16)/2 = 14; er is geen modus.

Vraag 3

a. Gemiddelde = (4.1 + 3.2 + 3.5 + 4.5 + 5.1 + 3.8 + 2.1 + 2.2 + 3.1 + 5.1 + 1.5 + 1.0) / 12 = 3.3
b. Mediaan = 3.4
c. Modus = 5.1

Vraag 4

a. Gemiddelde = (2.51 + 3.74 + 4.15 + 5.33 + 6.18 + 6.65 + 7.18 + 6.92 + 6.95 + 7.54) / 10 = 5.7
b. Mediaan = 6.4

Vraag 5

a. Gemiddelde = 7.5; mediaan = 6.5; modus = 6.
b. Sorteer eerst de gegevens op volgorde van laagste naar hoogste waarde:
3 5 5 6 6 7 9 10 11 13
Q1 is de waarde op de 0,25 (10 + 1) de positie, dat wil zeggen de 2,75ste positie.
De tweede waarde is 5, de derde waarde is ook 5.
Q1 = 5 + 0.25*(5 - 5)
Q1 = 5 + 0
Q1 = 5

Q3 = de waarde op de 0,75 (10 + 1) de geordende positie, dat wil zeggen de 8,25e positie.
Q3 = 10 + 0.75(11 - 10)
Q3 = 10 + 0.75
Q3 = 10.75

Dus, de vijf-getallen samenvatting is: 3 (minimum); 5 (Q1); 6.5 (median); 10.75 (Q3); 13 (maximum).

Vraag 6

Gemiddelde = (0*33 + 1*12 + 2*4 + 3*1) / 50 = 23/50 = 0.46.
Mediaan = 0
Modus = 0

Vraag 7

Volg deze stappen om de steekproefvariantie en standaarddeviatie te berekenen:
Stap 1: Bereken het steekproefgemiddelde. Het steekproefgemiddelde is hier gelijk aan 10.1.
Stap 2: Zoek het verschil tussen elk van de waarden en het steekproefgemiddelde van 10.1.
Stap 3: Neem de wortel elk verschil.
De gekwadrateerde deviaties van het gemiddelde voor alle waarnemingen zijn: 16,81 4,41 0,01 3,61 15,21 1,21 0,81 9,61 8,41 en 0,81. De som van deze gekwadrateerde afwijkingen is gelijk aan 60,9. Vervolgens is s2 = (60.9) / (n -1) = 60.9 / 9 = 6.76. De variantie is dus gelijk aan 6,76. De standaarddeviatie wordt dan berekend door het wortel van de variantie. Dat wil zeggen: s = √6.76 = 2.6

Vraag 8

Voer opnieuw dezelfde stappen uit als in vraag 7. Het steekproefgemiddelde is gelijk aan 2. De gekwadrateerde deviaties van het gemiddelde voor elke waarneming zijn: 9, 25, 4, 0, 9, 25, 4. De som van deze kwadratische verschillen is gelijk aan 76. De variantie, s2 = 76/6 = 12.83. De standaarddeviatie is de wortel van de variantie, dat wil zeggen: s = √12.83 = 3.56.

Vraag 9

CV_A = 2.00 / 4.00 x 100% = 50%
CV_B = 8.00 / 80.00 x 100% = 10%
De marktwaarde van voorraad A fluctueert meer van periode tot periode dan de marktwaarde van voorraad B. De variatiecoëfficiënt (CV) geeft aan dat voorraad voor voorraad A, de steekproefstandaardafwijking 50% van het gemiddelde is, en voor voorraad B de standaarddeviatie van het monster is slechts 10% van het gemiddelde.

Vraag 10

Gebruik de formule:

$CV = \frac{s}{\bar{x}} x 100\% \hspace{5mm} if \hspace{5mm} \bar{x} > 0$
CV = (1.58 / 13) x 100% = 12.15%
Dus, de steekproef standaard deviatie omvat 12.15% van het gemiddelde.

Vraag 11

Gebruik de formule:

$z = \frac{x_ {i} - \mu} {\sigma}$
De standaarddeviatie, σ, is gelijk aan de vierkantswortel van de variantie, σ2, dat wil zeggen: √144 = 12
a. z = (288 - 300) / 12 = -12/12 = -1
Volgens de empirische regel valt ongeveer 68% binnen 1 standaarddeviatie boven en onder het gemiddelde. De resterende 34% procent wordt dus links en rechts van dit interval verspreid. Dit betekent dat 0,5 * 34 = 16% van de waarnemingen onder z = -1 valt. Omgekeerd zijn 100 - 16 = 84% van de scores groter dan 288.
b. z = (324 - 300) / 12 = 24/12 = 2
Volgens de empirische regel valt ongeveer 95% binnen 2 standaarddeviaties boven en onder het gemiddelde. De ruim 5% wordt verspreid aan het hogere en lagere uiteinde van de verdeling. Aldus is 97,5% van de waarnemingen minder dan 324.
c. z = (336 - 300) / 12 = 36/12 = 3. Ongeveer alle waarnemingen zijn lager dan 336. Om de vraag te beantwoorden, zijn dus bijna geen (0,15%) waarnemingen groter dan 336.

Vraag 12

a. Gemiddelde = 75
b. Standaarddeviatie = 19,26
c. CV = (19,26 / 75) x 100% = 25,67

Vraag 13

4 | 3 4 7
5 | 0 0 4 6
6 | 0 0 0 1 4 9
7 | 0 0 1 4 5 6
8 | 0 0 4 4 5 5 5 7
9 | 0 0 1 4 5
10 |
11| 0 0
12| 1
IQR = 26.

Vraag 14

Minimum = 43; Q1 = 60; Mediaan = 75; Q3 = 86; Maximum = 121.

Vraag 15

a. De gemiddelden zijn 1.13 en 109.17
b. De standaarddeviaties zijn 0,01 en 0,75
CV_A = (0,01 / 1,13) x 100% = 1,04%
CV_B = (0.75 / 109.17) x 100% = 0.69%
De variatiecoëfficiënt vertelt ons dat de standaardafwijking van de steekproef voor EUR naar USD 1,04% van het gemiddelde is, terwijl de standaardafwijking van de steekproef voor EUR naar JPY 0,69% van het gemiddelde is. De wisselkoers voor EUR naar USD fluctueert dus meer van dag tot dag dan die van EUR van JPY.

Vraag 16

z = (1.120 - 1.200) / 50 = -1.6

Vraag 17

94.52% (je kunt de p-waarde die overeenkomt met deze z-score vinden in de tabel van een standaard normale verdeling).

Vraag 18

z = (1.300 - 1.200) / 50 = 2

Vraag 19

Volgens de empirische regel zijn ongeveer 2,5% van de waarnemingen meer dan twee standaarddeviaties boven het gemiddelde.

Vraag 20

$\bar{x} = \frac{4+3+2+1}{4} = 2.5$

Vraag 21

Gebruik de formule voor het gewogen gemiddelde, dat is:

$\bar{x} = \frac{\Sigma w_{i}x_{i}}{n}$

$\bar{x} = \frac{4*3 + 3*3 + 2*4 + 1*5}{15} = \frac{34}{15} = 2.267$

Vraag 22

$\bar{x} = \frac{4.7+2.8+5.7+2.6+5.5}{5} = \frac{22.3}{5} = 4.46$

Vraag 23

$\bar{x} = \frac{4.7*8 + 3.8*7 + 5.7*4 + 2.6*3 + 5.5*2}{24} = \frac{105.8}{24} = 4.41$

Vraag 24

De variantie is 1.643.

Vraag 25

De standaard deviatie = √1.643 = 1.281

Vraag 26

De covariantie = 82.42.

Vraag 27

The correlatiecoëfficiënt tussen x en y, oftewel r = 1.0 (perfecte positieve lineaire relatie).

Vraag 28

Vraag 29

Cov(x,y) = 30.8.

Vraag 30

r = 0.83.

Hoe werkt kansberekening? - TentamenTests 3

Vragen

Vraag 1

De uitkomstenruimte S = [E₁, E₂, E₃, E₄, E₅, E₆]. Gegegeven A = [E₁, E₂, E₃] en B = [E₃, E₄, E₅].
a. Wat is A intersectie B?
b. Wat is de unie van A en B?
c. Is de unie van A en B collectief uitputtend?

Vraag 2

Gebruik voor vraag 2-6 de volgende uitkomstenruimte: S = [E₁, E₂, E₃, E₄, E₅, E₆, E₇, E₈, E₉, E₁₀].
Gegeven A = [E₁, E₂, E₃, E₄], wat is Ā?

Vraag 3

Gegeven Ā = [E₁, E₄, E₅, E₇] en B̄ (complement B) = [E₂, E₃, E₅, E₈]. Wat is A intersectie complement B?

Vraag 4

Wat is A intersectie B?

Vraag 5

Wat is de unie van A en B?

Vraag 6

Is the union of A and B collectief uitputtend?

Vraag 7

Stel dat twee letters moeten worden gekozen uit A, B, C, D en E. Verder moeten deze twee letters in volgorde worden gerangschikt. Hoeveel permutaties zijn er mogelijk?

Vraag 8

Stel dat er 8 kandidaten zijn die hebben gesolliciteerd voor een bepaalde functie. Toch zijn er slechts 4 posities beschikbaar. Van deze 8 kandidaten zijn er 5 mannen en 3 vrouwen. Als elke combinatie van kandidaten even waarschijnlijk is, wat is dan de kans dat er geen vrouwen worden aangenomen?

Vraag 9

Stel dat er 10 Apple iPads, 5 Samsung-tablets en 5 Huawei-tablets in de winkel worden aangeboden. Een persoon komt de winkel binnen en wil 3 tablets kopen. Deze tabletten worden puur toevallig geselecteerd. Wat is het totale aantal mogelijke uitkomsten in de uitkomstenruimte?

Vraag 10

Gebruik nogmaals de informatie van vraag 9. Wat is de kans dat deze persoon 2 Apple iPads en 1 Samsung-tablet selecteert?

Vraag 11

Een uitkomstenruimte bestaat uit 5 A's en 7 B's. Stel nu dat we willekeurig twee letters uit deze uitkomstenruimte willen trekken. Wat is het totale aantal mogelijke combinaties?

Vraag 12

Gebruik opnieuw de uitkomstenruimte van vraag 11. Wat is de kans dat een willekeurig geselecteerde set van 2 uitkomsten 1 A en 1 B bevat?

Vraag 13

In een gezin van 6 familieleden zijn er drie mannen en drie vrouwen. Wat is de kans dat een willekeurige steekproef van twee familieleden uit twee mannen bestaat?

Vraag 14

De volgende informatie is van toepassing op vraag 14, 15 en 16. Stel dat er 12 werknemers zijn die aan een redactionele taak kunnen worden toegewezen. Van deze 12 werknemers zijn er 7 vrouwen en 5 mannen. Twee van de mannen zijn broers. De manager van het bedrijf moet de redactionele taak willekeurig toewijzen aan één werknemer. Laat A de gebeurtenis zijn "gekozen werknemer is een man". Laat B het evenement zijn "gekozen medewerker is een van de broers". Wat is de kans op gebeurtenis A?

Vraag 15

Wat is de kans op gebeurtenis B?

Vraag 16

Wat is de kans op de intersectie van A en B?

Vraag 17

Stel, P(A) = 0.75, P(B) = 0.80, en P(A ∩ B) = 0.65. Wat is P (A ∪ B)?

Vraag 18

Gebruik de informatie uit vraag 17. wat is de conditionele kans op gebeurtenis B, gegeven dat gebeurtenis A heeft plaatsgevonden?

Vraag 19

Gebruik de informatie uit vraag 17. Wat is de gezamenlijke kans op gebeurtenis A en B?

Vraag 20

Stel, binnen Nederland wordt 54% van alle master diploma's behaald door vrouwen. Van alle master diploma's die behaald worden, wordt 20% behaald bij psychologie. Verder wordt 8% van alle master diploma's behaald door vrouwen in de psychologie. Zijn de gebeurtenissen "de diploma houder is een vrouw" en de gebeurtenis "het diploma is in psychologie" statistisch onafhankelijk?

Vraag 21

Stel dat de odds om te winnen 3 op 2 zijn. Wat is dan de kans om te winnen?

Gebruik de volgende informatie voor vragen 22-25.
Stel dat we geïnteresseerd zijn in het onderzoeken van het effect van alcohol op verkeersongevallen. Het is duidelijk onethisch om één groep bestuurders van alcohol te voorzien en hun betrokkenheid bij ongevallen te vergelijken met die van een nuchtere groep. We weten echter dat 10,3% van de nachtbestuurders heeft gedronken en dat 32,4% van de bestuurders van ongevallen met één voertuig heeft gedronken. In dit voorbeeld zijn ongevallen met één voertuig gekozen om ervoor te zorgen dat elke rijfout alleen aan de bestuurder kan worden toegewezen.

Vraag 22

Wat is op basis van deze gegevens de uitkomstenruimte?

Vraag 23

Wat is de voorwaardelijke kans dat de bestuurder heeft gedronken, gezien het feit dat hij bij een ongeval betrokken was?

Vraag 24

Wat is de voorwaardelijke kans dat de bestuurder had gedronken, gezien het feit dat hij niet betrokken was bij een ongeval?

Vraag 25

Bieden deze cijfers voldoende bewijs om te concluderen dat alcohol de kans op ongevallen verhoogt?

Vraag 26

Voor vraag 26-30, the uitkomstenruimte bestaat uit A₁, A₂, B₁, en B_2.
Gegeven dat P(A₁) = 0.15, P(B₁) = 0.20, en P(B₁|A₁) = 0.60. Wat is P(A₁|B₁)?

Vraag 27

Gegeven dat P(A₁ ∩ B₁) = 0.09 en P(B₁) = 0.18. Wat is P(A₁|B₁)?

Vraag 28

Gegeven dat P(A₂ ∩ B₂) = 0.81 en P(B₂) = 0.82. Wat is P(A₂|B₂)?

Vraag 29

Gegeven dat P(A₁) = 0.10, P(B₁|A₁) = 0.90. Wat is P(A₁ ∩ B₁)?

Vraag 30

Gegeven dat P(A₁) = 0.10, P(B₁|A₁) = 0.90, P(B₂|A₁) = 0.10. Wat is P(A₂)?

Antwoordindicatie

Vraag 1

a. A ∩ B = [E₃]
b. A ∪ B = [E₁, E₂, E₃, E₄, E₅]
c. Nee, A en B zijn niet collectief uitputtend, omdat E₆ niet in de unie zit.

Vraag 2

Ā = [E₅, E₆, E₇, E₈, E₉, E₁₀]

Vraag 3

A ∩ complement B = [E₂, E₃, E₅, E₈], omdat A gelijk is aan het complement van B.

Vraag 4

A ∩ B is een lege set. Er is geen uitkomst in zowel A als B, omdat ze elkaars complement zijn.

Vraag 5

A ∪ B = [E₁, E₂, E₃, E₄, E₅, E₆, E₇, E₈]

Vraag 6

Nee, A en B zijn niet collectief uitputtend, omdat E₉ and E₁₀ niet in de unie zitten.

Vraag 7

Er zijn 5 uitkomsten, dus n = 5, en er moeten twee uitkomsten worden geselecteerd, dus x = 2.
\[P^{5}_{2} = \frac{5!}{3} = \frac{120}{6}\ = 20 ].

Vraag 8

Bereken eerst het totale aantal mogelijke combinaties van vier kandidaten geselecteerd uit de acht mogelijke kandidaten. Dat is:

$C^{8}_{4} = \frac{8!}{4!4!} = 70$
Als er dan geen vrouwen worden aangenomen, betekent dit dat de vier succesvolle kandidaten van de beschikbare vijf mannen moeten komen. Dat betekent dat het aantal combinaties als volgt is:

$C^{5}_{4} = \frac{5!}{4!1!} = 5$
Concluderend, als van de 70 mogelijke combinaties waarschijnlijk wordt gekozen, is de waarschijnlijkheid dat een van de 5-alle mannelijke combinaties wordt geselecteerd 5/70 = 1/14 = 0,07 (dat wil zeggen 7%).

Vraag 9

$N = C^{20}_{3} = \frac{20!}{3!(20-3)!} = 1,140$
Dus, er zijn 1,140 mogelijke uitkomsten

Vraag 10

$C^{10}_{2} = \frac{10!}{2!(10-2)!} = 45$
Op dezelfde manier kun je uitrekenen dat er 5 uitkomsten mogelijk zijn voor 1 Samsung tablet.
Dit gecombineerd betekent:

$N_{A} = C^{10}_{2} x C^{5}_{1} = 45 x 5 = 225$
Dus, de kans op gebeurtenis A (datis: 2 Apple iPads en 1 Samsung tablet] is:

$P_{A} = \frac{N_{A}}{N} = \frac{225}{1140} = 0.197$

Vraag 11

$C^{12}_{2} = \frac{12!}{2!10!} = 66$

Vraag 12

Het aantal mogelijkheden om 1 A te selecteren van de beschikbare 5 is:

$N_{A} = C^{12}_{2} x C^{5}_{1} = \frac{5!}{1!(5-1)!} = \frac{5!}{1!4!} = 5$
Het aantal mogelijkheden om 1 B te selecteren van de beschikbare 7 is:

$N_{A} = C^{12}_{2} x C^{7}_{1} = \frac{7!}{1-(7-1)!} = \frac{7!}{1!6!} = 7$
Dit gecombineerd betekent dat het aantal uitkomsten dat voldoet aan gebeurtenis A (dat is, zowel 1 als 1 B selecteren) gelijk is aan:

$N_{A} = C^{5}_{1} x C^{7}_{1} = 5 x 7 = 35$
Dit betekent dat de kans op gebeurtenis A gelijk is aan:

$P_{A} = \frac{N_{A}}{A} = \frac{35}{66} = 0.53$

Vraag 13

$N = C^{6}{3} = \frac{6!}{3!3!} = \frac{720}{36} = 20$
Het aantal mogelijke uitkomsten voor 2 mannen is:

$C^{3}_{2} = \frac{3!}{2!1!} = \frac{6}{2} = 3$
Concluderend, de kans dat twee mannen worden geselecteerd is 3/20 = 0.15 (15%).

Vraag 14

$P_{A} = \frac{N_{A}}{N} = \frac{5}{12} = 0.42$

Vraag 15

/[P_{B} = \frac{N_{B}}{N} = \frac{2}{12} = 0.17 \]

Vraag 16

A ∩ B = 0.17

Vraag 17

Gebruik the additie regel.

$P (A ∪ B) = P(A) + P(B) - P(A ∩ B)$
Transformatie van deze formule resulteert in:

$P (A ∩ B) = P(A) + P(B) - P(A ∪ B)$
Deze formule invullen geeft:

$0.75 + 0.80 - 0.65 = 0.90$

Vraag 18

$P(B|A) = \frac{P(A ∩ B)}{P(A)} = \frac{0.65}{0.75} = 0.8667$

Vraag 19

Gebruik de multiplicatie regel, dat is:

$P(A ∩ B) = P(A|B) P(B) = (0.8125)(0.80) = 0.65$

Vraag 20

$P(A) = 0.54, P(B) = 0.20, P(A ∩ B) = 0.08$
Omdat

$P(A)P(B) = (0.54)(0.20) = 0.108 \neq 0.08 = P(A ∩ B)$
kunnen we stellen dat deze gebeurtenissen niet onafhankelijk zijn.
De afhankelijkheid kan worden gevonden via de conditionele kans:

$P(A|B) = \frac{P(A ∩ B)}{P(B)} = \frac{0.08}{0.20} = 0.40 \neq 0.54 = P(A)$
Dat betekent dat in Nederland slechts 40% van de psychologie master diploma's naar vrouwen gaat, terwijl vrouwen 54% of alle diploma ontvangers vertegenwoordigen.

Vraag 21

$\frac{3}{2} = \frac{P(A)}{1-P(A)}$

$3(1-P(A)) = 2P(A)$

$5P(A) = 3$

$P(A) = \frac{3}{5} = 0.6$

Vraag 22

A₁: de automobilist heeft gedronken
A₂: de automobilist heeft niet gedronken
B₁: de automobilist was betrokken bij een eenzijdig ongeval
B₂: de automobilist was niet betrokken bij een eenzijdig ongeval

Vraag 23

P(A₁|C₁) = 0.324

Vraag 24

P(A₁|C₂) = 0.103

Vraag 25

Gebruik de overbetrokkenheidsratio om deze vraag te beantwoorden, dat is:

$\frac{P(A_{1}|C_{1})}{P(A_{1}|C_{2})} = \frac{0.324}{0.103} = 3.15$
Deze ratio van 3.15 biedt voldoende bewijs om te kunnen concluderen dat alcohol the kans op een auto ongeluk vergroot.

Vraag 26

Via de stelling van Bayes vinden we dat: P(A₁|B₁) = (0.60*0.15)/(0.20) = 0.45.

Vraag 27

$P(A_{1}|B_{1}) = \frac{P(A_{1} ∩ B_{1})}{P(B_{1})} = \frac{0.09}{0.18} = 0.50$

Vraag 28

$P(A_{2}|B_{2}) = \frac{P(A_{2} ∩ B_{2})}{P(B_{2})} = \frac{0.81}{0.82} = 0.988$

Vraag 29

P(A₁ ∩ B₁) = 0.90 * 0.10 = 0.09

Vraag 30

Gebruik zowel:
P(A₁ ∩ B₁) = 0.90 * 0.10 = 0.09
als ook:
P(A₁ ∩ B₂) = 0.10 * 0.10 = 0.01
om te vinden dat:
P(A₁) = 0.09 + 0.01 = 0.10
A₂is het complement van A₁, dus A₂ = 1 - A₁ = 1 - 0.10 = 0.90

Hoe kun je kansmodellen gebruiken voor discrete wilekeurige variabelen? - TentamenTests 4

Vragen

Vraag 1

Een onderzoeker bestudeert het aantal uilen eieren dat in Denemarken is gevonden. Is het aantal eieren een discrete of continue willekeurige variabele?

Vraag 2

Het gewicht van studenten wordt geregistreerd als onderdeel van een nationale gezondheidsstudie. Is het gewicht van studenten een discrete of continue willekeurige variabele?

Vraag 3

Geef voor elk van de volgende aan of een discrete of continue willekeurige variabele de beste definitie biedt.
a. Het aantal zonnige dagen in Nederland.
b. Het drukniveau in de banden van een auto.
c. De hoeveelheid olie die door Saudi-Arabië in 2019 is geëxporteerd.

Vraag 4

Geef de kansverdeling van een enkele, eerlijke dobbelsteen, wanneer die één keer wordt geworpen.

Vraag 5

Wat is de kans dat je 5 of 6 gooit, wanneer je één keer met een eerlijke dobbelsteen gooit?

Gebruik voor vraag 6-10 de volgende kansverdeling:

x	0	1	2	3	4	5	6
P(x)	0.03	0.15	0.11	0.19	0.22	0.26	0.04

Vraag 6

P(3 < x < 6) = ?

Vraag 7

P(x > 3) = ?

Vraag 8

P(2 < x < 5) = ?

Vraag 9

P(x < 4) = ?

Vraag 10

Wat is het gemiddelde behorend bij deze kansverdeling?

Vraag 11

Stel, de kansverdeling voor het aantal fouten per bladzijde in een economie boek is als volgt: P(0) = 0.81; P(1) = 0.17; P(2) = 0.02. Wat is het gemiddelde aantal fouten per bladzijde?

Vraag 12

Iemand is geïnteresseerd in de totale kosten van een project waarop hij van plan is te bieden. Hij schat dat het materiaal € 25.000, - kost en dat de larbor € 900, - per dag kost. Stel dat het project X dagen duurt om te voltooien. Geef de lineaire functie voor de totale kosten (C) van het project.

Vraag 13

Veronderstel nu dat de volgende kansverdeling wordt gegeven voor de doorlooptijd van het project.

Tijdsduur (x)	10	11	12	13	14
P(x)	0.1	0.2	0.3	0.2	0.1

Wat is het gemiddelde voor de tijdsduur om het project af te maken, x?

Vraag 14

Wat is de variantie voor de tijdsduur om het project af te maken, x?

Vraag 15

Wat is het gemiddelde voor de totale kosten, C?

Vraag 16

Wat is de standaarddeviatie voor de totale kosten, C?

Vraag 17

Stel dat een makelaar vijf contacten heeft en van mening is dat voor elk contact de kans op een verkoop 0,40 is. Wat is de kans dat de makelaar maximaal 1 verkoop doet?

Vraag 18

Wat is de kans dat de makelaar tussen de 2 en 4 verkopen doet (inclusief)?

Vraag 19

Er wordt voorspeld dat 3,5% van alle kleine bedrijven faillissement zal aanvragen in 2020. Voor een willekeurige steekproef van 100 kleine bedrijven, schat u de waarschijnlijkheid dat ten minste 3 faillissement zullen aanvragen in 2020, ervan uitgaande dat deze voorspelling correct is. Gebruik hiervoor de Poisson-verdeling.

Vraag 20

Doe nu hetzelfde met de (daadwerkelijke) binomiale verdeling. Is de Poisson-verdeling een goede schatting van de daadwerkelijke binomiale verdeling?

Vraag 21

Overweeg bij vraag 21-26 de volgende gezamenlijke kansverdeling voor twee willekeurige variabelen X en Y. Bepaal de marginale kansen.

		Y teruggave
X teruggave	0%	5%	10%	15%
0%	0.0625	0.0625	0.0625	0.0625
5%	0.0625	0.0625	0.0625	0.0625
10%	0.0625	0.0625	0.0625	0.0625
15%	0.0625	0.0625	0.0625	0.0625

Vraag 22

Zijn X en Y onafhankelijk?

Vraag 23

Wat is het gemiddelde van X?

Vraag 24

Wat is het gemiddelde van Y?

Vraag 25

Wat is de variantie van X?

Vraag 26

Wat is de variantie van Y?

Vraag 27

Overweeg de volgende gezamenlijke kansverdeling voor twee willekeurige variabelen X en Y.

		X
Y		0	1
	0	0.25	0.35
	1	0.10	0.30

Bereken de marginale verdelingen voor X en Y.

Vraag 28

Overweeg de volgende informatie voor vragen 28-30. Een belegger heeft € 1000, - om te investeren en twee investeringsmogelijkheden, die elk minimaal € 500, - vereisen. De winst voor € 100, - voor de eerste investering (X) kan worden weergegeven door de volgende kansverdelingen: P (X = -5) = 0,4 en P (X = 20) = 0,6. Vervolgens wordt de winst per € 100, - van de tweede investering (Y) weergegeven door de volgende kansverdelingen: P (Y = 0) = 0,6 en P (Y = 25) = 0,4. Willekeurige variabelen X en Y zijn onafhankelijk. De belegger heeft de volgende mogelijke strategieën:
a. € 1000, - in de eerste investering
b. € 1000, - in de tweede investering
c. € 500, - per investeringZoek het gemiddelde en de variantie voor de eerste strategie.

Vraag 29

Zoek het gemiddelde en de variantie voor de eerste strategie.

Vraag 30

Zoek het gemiddelde en de variantie voor de eerste strategie.

Antwoorden op de oefenvragen

Vraag 1

Het is een discrete willekeurige variabele, omdat deze een eindig aantal telbare getallen kan aannemen.

Vraag 2

Een continue willekeurige variabele.

Vraag 3

a. discreet
b. continu
c. continu

Vraag 4

Kansverdeling van een enkele, eerlijke dobbelsteen
x P(x)
1 0.16667
2 0.16667
3 0.16667
4 0.16667
5 0.16667
6 0.16667

Kansverdeling van een enkele, eerlijke dobbelsteen
x	P(x)
1	0.16667
2	0.16667
3	0.16667
4	0.16667
5	0.16667
6	0.16667

Vraag 5

0.1667 + 0.1667 = 0.3333

Vraag 6

P(3 < x < 6) = 0.19 + 0.22 + 0.26 = 0.67

Vraag 7

P(x > 3) = 0.19 + 0.22 + 0.26 + 0.04 = 0.71

Vraag 8

P(2 < x < 5) = 0.19 + 0.22 + 0.26 = 0.67

Vraag 9

P(x < 4) = 0.03 + 0.15 + 0.11 + 0.19 = 0.48

Vraag 10

$\mu_{X} = 0(0.03) + (1)(0.15) + (2)(0.11) + (3)(0.19) + (4)(0.22) + (5)(0.26) + (6)(0.04) = 3.36$

Vraag 11

$\mu_{x} = E[X] = \sum_{x} xP(x) = (0)(0.81) + (1)(0.17) + (2)(0.02) = 0.21$

Vraag 12

C = 25,000 + 900X

Vraag 13

$\mu_{X} = E[X] = \sum_{x}xP(x) = (10)(0.1) + (11)(0.3) + (12)(0.3) + (13)(0.2) + (14)(0.1) = 11.9$
Dus de gemiddelde tijd om het project af te ronden X is 11.9 dagen.

Vraag 14

$\sigma^{2}_{Y} = Var(a + bX) = b^{2}\sigma^{2}_{X}$

$(10 - 11.9)^{2}(0.1) + (11 - 11.9)^{2}(0.3) + ... + (14 - 11.9)^{2}(0.1) = 1.29$
Dus de variantie voor de tijd om het project af te ronden is 1.29 dagen.

Vraag 15

$\mu_{C} = E[25,000 + 900X] = (25,000 + 900\mu_{X}) = 2500 + (900)(11.9) = €35,710,-$

Vraag 16

$\sigma^{2}_{C} = Var(25,000 + 900X) = (900)^{2}\sigma^{2}_{X} = (810,000)(1.29) = €1,044,900,-$

Vraag 17

$P(0) = \frac{5!}{0!5!}(0.4)^{0}(0.6)^{5} = (0.6)^{5} = 0.078$

$P(1) = \frac{5!}{1!4!}(0.4)^{1}(0.6)^{4} = 5(0.4)(0.6)^{4} = 0.259$
P(X < 1) = P(X = 0) + P(X = 1) = 0.078 + 0.259 = 0.337

Vraag 18

$P(2) = \frac{5!}{2!3!}(0.4)^{2}(0.6)^{3} = 10(0.4)^{2}(0.6)^{3} = 0.346$

$P(3) = \frac{5!}{3!2!}(0.4)^{3}(0.6)^{2} = 10(0.4)^{3}(0.6)^{2} = 0.230$

$P(4) = \frac{5!}{4!1!}(0.4)^{4}(0.6)^{1} = 5(0.4)^{4}(0.6)^{1} = 0.077$
P(2 < X < 4) = P(2) + P(3) + P(4) = 0.346 + 0.230 + 0.077 = 0.653

Vraag 19

De distributie van X is binomiaal met n = 100 and P = 0.0035, dus het gemiddelde is gelijk aan nP = 3.5. Vervolgens vinden we met behulp van de Poisson-verdeling de kans op minstens 3 faillissementen:

$P(X \geq 3) = 1 - P(X \leq 2)$

$P(0) = \frac{e^{-3.5}(3.5)^{0}}{0!} = e^{-3.5} = 0.030197$

$P(1) = \frac{e^{-3.5}(3.5)^{1}}{1!} = (3.5)(0.030197) = 0.1056895$

$P(2) = \frac{e^{-3.5}(3.5)^{2}}{2!} = (6.125)(0.030197) = 0.1849566$
Dus,

$P(X \leq 2) = P(0) + P(1) + P(2) = 0.3208431$

$P(X \geq 3) = 1 - 0.3208431 = 0.6791569$

Vraag 20

Met behulp van de binomiale verdeling berekenen we de kans behorend bij X> 3 als: P (X> 3) = 0,684093.
De Poisson-kans is dus een goede schatting van de werkelijke binomiale verdeling.

Vraag 21

$P(X = 0) = \sum_{y}P(0,y) = 0.0625 + 0.0625 + 0.0625 + 0.0625 = 0.25$
Merk op dat voor elke combinatie van waarden voor X en Y, P(x,y) = 0,0625. Daarom zijn alle marginale kansen van X 25%. Hetzelfde geldt voor de marginale kansen van Y. Merk op dat de som van de marginale kansen voor een willekeurige variabele 1 is.

Vraag 22

Om onafhankelijkheid te testen, moeten we controleren of P (x, y) = P (x) P (y) voor alle mogelijke paren van waarden x en y.
P(x,y) = 0.0625 for all possible values of x and y.
P(x) = 0.25 and P(y) = 0.25 for all possible values of x and y.
P(x,y) = 0.0625 = (0.25)(0.25) = P(x)P(y)
Dus X en Y zijn onafhankelijk

Vraag 23

$\mu_{X} = E[X] = \sum_{x}P(x) = 0(0.25) + 0.05(0.25) + 0.10(0.25) + 0.15(0.25) = 0.075$

Vraag 24

Het gemiddelde van Y is gelijk aan het gemiddelde van X en dus: 0.075.

Vraag 25

$\sigma^{2}_{X} = \sum_{X}(x-\mu_{X})^{2}P(x) = (0.25)[(0 - 0.075)^{2} + (0.05 - 0.075)^{2} + (0.10 - 0.075)^{2} + (0.15 - 0.075)^{2}] = 0.003125$

Vraag 26

De standaarddeviatie is de wortel van de variantie, dat is 0.0559016, oftewel 5.59%.

Vraag 27

$P(X = 0) = \sum_{y}P(0,y) = 0.25 + 0.10 = 0.35$

$P(Y = 0) = \sum_{x}P(x,0) = 0.35 + 0.20 = 0.55$

Vraag 28

$\mu_{X} = E[X] = \sum_{x}xP(x) = (-5)(0.4) + (20)(0.6) = €10,-$

$\sigma^{2}_{x} = E[(X - \mu_{X})^{2}] = \sum_{x}(x - \mu)^{2} P(x) = (-5 - 10)^{2}(0.4) + (20 - 10)^{2}(0.6) = 150$
Strategie a heeft een gemiddelde winst van E[10Y] = €100,- met variantie Var(10Y) = 100Var(Y) = 15,000.

Vraag 29

$\mu_{Y} = E[Y] = \sum_{y}yP(y) = (0)(0.6) + (25)(0.4) = €10,-$

$\sigma^{2}_{y} = E[(Y - \mu_{Y})^{2}] = \sum_{y}(y - \mu)^{2} P(Y) = (0 - 10)^{2}(0.6) + (25 - 10)^{2}(0.4) = 150$
Strategie b heeft een gemiddelde winst van E[10Y] = €100,- met variantie Var(10Y) = 100Var(Y) = 15,000.

Vraag 30

$E[5X + 5Y] = E[5X] + E[5Y] = 5E[X] + 5E[Y] = €100,-$

$Var(5X + 5Y) = Var(5X) + Var(5Y) = 25Var(X) + 25Var(Y) = 7,500$ De variantie van strategie c is kleiner dan die van de strategieën van a en b, als gevolg van de afname van het risico die voortvloeit uit diversificatie in een beleggingsportefeuille. De meeste beleggers geven de voorkeur aan strategie c, omdat deze strategie hetzelfde verwachte rendement oplevert als de andere twee strategieën, maar met een lager risico.

Hoe kun je kansmodellen gebruiken voor continue willekeurige variabelen? - TentamenTests 5

Vragen

Vraag 1

Beschouw de uniforme kansdichtheidsfunctie f(x) = 0.5x met een bereik van 0 tot 2. Wat is de kans dat een willekeurige variabele X tussen 1.4 en 1.8 ligt?

Vraag 2

Beschouw de uniforme kansdichtheidsfunctie f(x) = 0.5x met een bereik van 0 tot 2. Wat is de kans dat een willekeurige variabele X tussen 0.5 en 1.6 ligt?

Vraag 3

Beschouw de uniforme kansdichtheidsfunctie f(x) = 0.5x met een bereik van 0 tot 2. Wat is de kans dat een willekeurige variabele X kleiner is dan 0.8?

Vraag 4

Beschouw de uniforme kansdichtheidsfunctie f(x) = 0.5x met een bereik van 0 tot 2. Wat is de kans dat een willekeurige variabele X groter is dan 1.3?

Vraag 5

Een huiseigenaar schat de verwarmingsrekening op basis van het bereik van de waarschijnlijke temperaturen in januari. Hij verkrijgt de volgende lineaire vergelijking: Y = 290 - 5T, waarin T verwijst naar de gemiddelde temperatuur voor de maand in graden Fahrenheit. Als de gemiddelde temperatuur in januari gemiddeld 24 en standaardafwijking 4 is, wat is dan het gemiddelde en de standaardafwijking van de verwarmingsrekening van deze huiseigenaar in januari?

Vraag 6

De winst voor een productieproces is gelijk aan 6000 dollar minus drie keer het aantal geproduceerde eenheden. Het gemiddelde en de variantie voor het aantal geproduceerde eenheden zijn respectievelijk 1000 en 900. Zoek het gemiddelde en de variantie van de winst.

Vraag 7

De winst van een bepaald productieproces is gelijk aan € 2000,- minus twee keer het aantal geproduceerde eenheden. Het gemiddelde en de variantie voor het aantal geproduceerde eenheden zijn respectievelijk 500 en 900. Wat is het gemiddelde en de variantie van de winst?

Vraag 8

De winst van een bepaald productieproces is gelijk aan € 1000,- minus twee keer het aantal geproduceerde eenheden. Het gemiddelde en de variantie voor het aantal geproduceerde eenheden zijn respectievelijk 50 en 90. Wat is het gemiddelde en de variantie van de winst?

Vraag 9

Gebruik voor vragen 9-15 de standaard normaalverdeling.
P(Z < 1.16) = ?

Vraag 10

P(Z > 1.73) = ?

Vraag 11

P(Z > -2.29) = ?

Vraag 12

P(Z > -1.35) = ?

Vraag 13

P(1.16 < Z < 1.73) = ?

Vraag 14

P(-2.29 < Z < 1.26) = ?

Vraag 15

P(-2.29 < Z < -1.35) = ?

Vraag 16

Leg uit waarom het in de vorige vraag gevonden resultaat precies is wat men op intuïtieve gronden zou kunnen verwachten.

Vraag 17

De kans is 0,25 dat Z kleiner is dan welk getal?

Vraag 18

De kans is 0,2 dat Z groter is dan welk getal?

Vraag 19

De kans is 0,6 dat Z groter is dan welk getal?

Vraag 20

Laat een continue willekeurige variabele X normaal verdeeld worden met X ~ (30, 81). Wat is de kans dat X groter is dan 40?

Vraag 21

De verwachte consumptievraag in een restaurant kan worden gemodelleerd door een normale willekeurige variabele met gemiddelde 1500 pond en standaardafwijking 110 pond. Wat is de kans dat de vraag 1.300 pond zal overschrijden?

Vraag 22

Van de scores op een prestatietest is bekend dat ze willekeurig worden verdeeld met een gemiddelde van 420 en een standaardafwijking van 80. Wat is de minimale testscore die nodig is om in de top 10% van alle mensen te zitten die de test maken?

Vraag 23

Gegeven een willekeurige steekproefgrootte van n = 900 uit een binomiale kansverdeling met P = 0,30. Wat is de kans dat het aantal successen groter is dan 305?

Vraag 24

Gegeven een willekeurige steekproefgrootte van n = 900 uit een binomiale kansverdeling met P = 0,30. Wat is de kans dat het aantal successen groter is dan 305?

Vraag 25

Servicetijden voor klanten bij een informatiebalie van de bibliotheek kunnen worden gemodelleerd door een exponentiële distributie met een gemiddelde service van 5 minuten. Wat is de kans dat een klantenservice langer dan 10 minuten zal duren?

Vraag 26

Een bedrijf in Nederland met 2000 werknemers heeft een gemiddeld aantal verzuimongevallen per week gelijk aan λ = 0,4 en het aantal ongevallen na een Poisson-verdeling. Wat is de kans dat de tijd tussen ongevallen minder dan 2 weken is?

Vraag 27

Gebruik de volgende informatie voor vragen 27-30. Een belegger heeft u om hulp gevraagd bij het opstellen van een portefeuille met twee aandelen. De belegger heeft € 1000, - die in eender welke verhouding kan worden toegewezen aan twee alternatieve aandelen. Het rendement per euro van deze twee investeringen wordt aangegeven door willekeurige variabelen X en Y. Beide variabelen zijn onafhankelijk en normaal verdeeld. Investering X heeft een gemiddelde van 25 en een variantie van 81. De tweede investering heeft een gemiddelde van 40 en een variantie van 121. Deze twee aandelenkoersen hebben een negatieve correlatie, ρxy = -0,40. Definieer de lineaire vergelijking van de waarde van de portefeuille, aangegeven door W.

Vraag 28

Wat is de gemiddelde waarde voor de aandelenportefeuille?

Vraag 29

Wat is de standaarddeviatie voor de aandelenportefeuille?

Vraag 30

Wat is de kans dat de portefeuillewaarde hoger is dan 2.000?

Antwoordindicatie

Vraag 1

P(1.8 < X < 1.4) = F(1.8) - F(1.4) = (0.5)(1.8) - (0.5)(1.4) = 0.9 - 0.7 = 0.2.

Vraag 2

P(1.6 < X < 0.5) = F(1.6) - F(0.5) = (0.5)(1.6) - (0.5)(0.5) = 0.8 - 0.25 = 0.55.

Vraag 3

P(X < 0.8) = F(0.8) = (0.5)(0.8) = 0.40.

Vraag 4

P(2.0 < X < 1.3) = F(2.0) - F(1.3) = (0.5)(2.0) - (0.5)(1.3) = 1.0 - 0.65 = 0.35.

Vraag 5

$\mu_{Y} = 290 - 5\mu_{T} = 290 - (5)(24) = 170$

$\sigma_{Y} = |-5| \sigma_{T} = (5)(4) = 20$

Vraag 6

$Y = 6000 - 3U$

$\mu_{Y} = 1000 = 6000 - 3U$

$3U = 6000 - 1000 = 5000$

$U ≈ 1667$

$\sigma_{Y} = |3|\sigma_{U}$

$900 = |3|\sigma_{U}$

$\sigma_{U} = \frac{900}{3} = 300$
Dus, het gemiddelde en de standaarddeviatie zijn respectievelijk 1,667 en 300 dollar.

Vraag 7

$Y = 2000 - 2U$

$\mu_{Y} = 500 = 2000 - 2U$

$2U = 2000 - 500 = 1500$

$U ≈ 750$

$\sigma_{Y} = |2|\sigma_{U}$

$900 = |2|\sigma_{U}$

$\sigma_{U} = \frac{900}{2} = 450$
Dus, het gemiddelde en de standaarddeviatie zijn respectievelijk €750,- en €450,-.

Vraag 8

$Y = 1000 - 2U$

$\mu_{Y} = 50 = 1000 - 2U$

$2U = 1000 - 50 = 950$

$U ≈ 475$

$\sigma_{Y} = |2|\sigma_{U}$

$90 = |2|\sigma_{U}$

$\sigma_{U} = \frac{900}{2} = 45$
Dus, het gemiddelde en de standaarddeviatie zijn respectievelijk €950,- en €45,-.

Vraag 9

P(Z < 1.16) = 0.8770

Vraag 10

P(Z > 1.73) = 1 - 0.9582 = 0.0418

Vraag 11

P(Z > -2.29) = P(Z < 2.29) = 0.9890

Vraag 12

P(Z > -1.35) = P(Z > 1.35) = 0.9115

Vraag 13

P(1.16 < Z < 1.73) = 0.9582 - 0.8770 = 0.0812

Vraag 14

P(-2.29 < Z < 1.26) = 0.9890 - 0.8962 = 0.0928

Vraag 15

P(-2.29 < Z < -1.35) = 0.0855 - 0.011 = 0.0745

Vraag 16

z = 0.525

Vraag 17

z = -0.575

Vraag 18

z = -0.845

Vraag 19

z = -0.256

Vraag 20

$Z = \frac{X - \mu}{sigma} = \frac{40 - 30}{\sqrt{81}} = \frac{-10}{9} = -1.11$
P(Z > -1.11) = 1 - 0.8665 = 0.1335

Vraag 21

$Z = \frac{(1300 - 1,500)}{110} = -1.82$
P(Z > -1.82) = 0.9656

Vraag 22

Top 10% correspondeert me z = 1.185.

$1.185 = \frac{X - 420}{80}$

$1.185*80 = X - 420$

$94.5 + 420 = X$
X = 514.8. Dus, iemand moet minimaal 515 scoren op de test om in de top 10% te vallen.

Vraag 23

nP(1 - P) = 900*0.30(1 - 0.30) = 189 > 5, dus de binomiale verdeling kan worden benaderd met de standaard normaal verdeling.

Vraag 24

$\mu = nP = 270$

$\sigma^{2} = 189$

$\sigma = \sqrt{189} = 13.75$

$z = \frac{305 - 270}{13.75} = 2.55$
P(Z > 2.55) = 1 - 0.9946 = 0.0054

Vraag 25

$P(T > 10) = 1 - P(T < 10) = 1 - F(10) = 1 - (1 - e^{-(0.20)(10)}) = e^{-2.0} = 0.1353$
Dus, de kans dat een servicetijd langer is dan 10 minuten is dus 0.1353.

Vraag 26

/[ P(T < 2) = F(2) = 1 - e^{-(0.4)(2)} = 1 - e^{-0.8} = 1 - 0.4493 = 0.5507 \]
Dus, de kans dat er minder dan 2 weken tussen twee verzuimongevallen zit is ongeveer 55%.

Vraag 27

W = 20X + 30Y

Vraag 28

W = 20*25 + 30*40 = 1,700

Vraag 29

\[ \sigma^{2}_{W} = 20^{2} \sigma^{2}_{X} 30^{2} \sigma^{2}_{Y} + 2*30 \rho_{XY} \sigma_{X} \ sigma_{Y} \]

$\sigma^{2}_{W} = 20^{2}*81 + 30^{2}*121 + 2*20*30*{-0.40}*9*11 = 93,780$

$\sigma = \sqrt{\sigma^{2}} = \sqrt{93,780} = 306.24$

Vraag 30

$Z = \frac{2000 - 1700}{306.24} = 0.980$
P(Z > 0.980) = 0.1635

Hoe kun je een goede steekproef uit de populatie verkrijgen? - TentamenTests 6

Vragen

Vraag 1

Stel dat we weten dat de jaarlijkse procentuele salarisverhoging normaal wordt verdeeld met een gemiddelde van 12,2% en een standaarddeviatie van 3,6%. Een willekeurige steekproef van 9 waarnemingen wordt verkregen van deze populatie en het steekproefgemiddelde wordt berekend. Wat is de standaardfout van het steekproefgemiddelde?

Vraag 2

Overweeg nogmaals de informatie van de vorige vraag. Wat is de kans dat het gemiddelde van de steekproef 14,4% overschrijdt?

Vraag 3

Gebruik de volgende informatie voor vragen 3-6. Gegeven een populatie met een gemiddelde van 105 en een variantie van 16, is de centrale limietstelling van toepassing wanneer de steekproefomvang n > 25 is . Een willekeurige steekproef van grootte 25 wordt verkregen. Wat zijn het gemiddelde en de variantie van de steekproefverdeling voor de steekproefgemiddelden?

Vraag 4

Wat is de kans dat x̅ > 106

Vraag 5

Wat is de kans dat 104 < x̅ < 106?

Vraag 6

Wat is de kans dat x̅ < 105.5?

Vraag 7

Gebruik de volgende informatie voor vragen 7-10. Gegeven een populatie met een gemiddelde van 150 en een variantie van 1600, is de centrale limietstelling van toepassing wanneer de steekproefgrootte n > 25 is . Een willekeurige steekproef van grootte 36 wordt verkregen. Wat zijn het gemiddelde en de variantie van de steekproefverdeling voor de steekproefgemiddelden?

Vraag 8

Wat is de kans dat x̅ > 155?

Vraag 9

Wat is de kans dat 145 < x̅ < 165?

Vraag 10

Wat is de kans dat x̅ > 165?

Vraag 11

Gebruik de volgende informatie voor vragen 11-14. De levensduur van gloeilampen die door een bedrijf worden uitgestoten, heeft een gemiddelde van 1200 uur en een standaardafwijking van 400 uur. De bevolking is normaal verdeeld. Stel dat u negen gloeilampen koopt, die als een goede steekproef uit de populatie kunnen worden beschouwd. Wat is het gemiddelde van de gemiddelde gemiddelde levensduur ?

Vraag 12

Wat is de variantie van de steekproef?

Vraag 13

Wat is de standaardfout van het voorbeeldgemiddelde?

Vraag 14

Wat is de kans dat gemiddeld die negen gloeilampen een levensduur hebben van minder dan 1050 uur?

Vraag 15

Om enig gevoel te krijgen voor mogelijke groottes van de eindige populatiecorrectiefactor, bereken het voor steekproeven van n = 20 observaties van populaties van leden: 20, 100, 10.000.

Vraag 16

Leg uit waarom het in de vorige vraag gevonden resultaat precies is wat men op intuïtieve gronden zou kunnen verwachten.

Vraag 17

Een willekeurige steekproef van 270 studenten werd genomen uit een grote populatie studenten die een statistiekexamen aflegden. Als in feite 20% van de studenten de test niet haalt, hoe groot is dan de kans dat het steekproefpercentage van de studenten die niet slagen voor de test tussen 16 en 24% zal liggen?

Vraag 18

Bereken nu dezelfde kans voor 16 tot 24%, maar gebruik dit keer een steekproef van 400 studenten.

Vraag 19

Naar schatting drinkt 43% van de studenten alcohol. Zoek de kans dat meer dan de helft van een willekeurige steekproef van 80 studenten alcohol drinkt.

Vraag 20

Stel dat 50% van alle volwassen Amerikanen eenmaal per week McDonald's eten. Wat is de kans dat meer dan 58% van een willekeurige steekproef van 250 volwassen Amerikanen eenmaal per week McDonald's eten?

Vraag 21

Stel dat 50% van alle volwassen Amerikanen eenmaal per week McDonald's eten. Wat is de kans dat meer dan 55% van een willekeurige steekproef van 250 volwassen Amerikanen eenmaal per week McDonald's eet?

Vraag 22

Gegeven is n = 6. Bepaal een bovengrens voor de steekproefvariantie zodanig dat de kans op overschrijding van deze limiet, gegeven een populatiestandaarddeviatie van 3,6, kleiner is dan 0,05. Gebruik de chi-kwadraat verdeling aan het oplossen van dit probleem .

Vraag 23

Overweeg de volgende informatie voor vragen 23-26. Er zijn zes werknemers met de volgende jaren ervaring:
2, 4, 6, 6, 7, 8
Twee van deze werknemers worden willekeurig gekozen.
Wat is de gemiddelde leeftijd voor deze zes werknemers?

Vraag 24

Hoeveel mogelijke steekproeven van twee werknemers zijn er?

Vraag 25

Maak een lijst van alle mogelijke steekproeven.

Vraag 26

Vind de steekproefverdeling van de steekproefgemiddelden.

Vraag 27

Wat is de centrale limietstelling?

Vraag 28

Overweeg de volgende informatie voor vragen 28-30. Stel dat een populatieverdeling schuin ligt met gemiddelde 100 en variantie 15. Uit deze populatie trekken we een willekeurige steekproef van n = 100. Wat is het verwachte gemiddelde van deze steekproef?

Vraag 29

Wat is de verwachte variantie van deze steekproef?

Vraag 30

Welke vorm wordt verwacht voor de steekproefverdeling?

Antwoordindicatie

Vraag 1

μ = 12,2; σ = 3,6; n = 9.

$\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} = \frac{3.6}{\sqrt{9}} = 1.2$

Vraag 2

$P(\bar{x} > 14.4) = P( \frac{\bar{X} - \mu}{\sigma_{\bar{x}}} > \frac{14.4 - 12.2}{1.2} ) = P(z > 1.83) = 0.0336$
Concluderend is de kans dat het steekproefgemiddelde 14,4% zal overschrijden slechts 0,0336.

Vraag 3

De centrale limietstelling is van toepassing, dus de steekproefverdeling heeft gemiddelde 105 en variantie 16 / √25 = 3.2.

Vraag 4

$Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{106 - 105}{3.2} = 0.3125$
P(Z > 0.3125) = 1- 0.6217 = 0.3783

Vraag 5

$Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{104 - 105}{3.2} = -0.3125$
P(104 < x̅ < 106) = P(-0.3125 < z < 0.3125) = 0.6217 - (1 - 0.6217) = 0.2434

Vraag 6

$Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{105.5 - 105}{3.2} = 0.1563$
P(Z < 0.1563) = 0.5636

Vraag 7

De centrale limietstelling is van toepassing, dus het gemiddelde van de steekproefverdeling is 150 en de variantie 1600 / √36 = 266.67.

Vraag 8

$Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{155 - 150}{266.7} = 0.0188$
P(Z > 0.0188) = 1- 0.5040 = 0.4960

Vraag 9

$Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{145 - 150}{266.7} = -0.06563$

$Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{165 - 150}{266.7} = 0.0563$
P(145 < x̅ < 165) = P(-0.0563 < z < 0.0563) = 0.5239 - (1 - 0.5239) = 0.5239 - 0.4761 = 0.0478

Vraag 10

P(x̅ > 165) = 1 - 0.5239 = 0.4761

Vraag 11

De bevolking is normaal verdeeld. Daarom is de steekproefverdeling van de steekproefgemiddelden normaal. Vandaar het gemiddelde van de steekproef verdeling is 1.200.

Vraag 12

De variantie is 400 / √9 = 133,33

Vraag 13

De standaardfout is √400 / √9 = 6.67.

Vraag 14

$Z = \frac{\bar{X} - \mu_{X}}{\sigma_{\bar{X}}} = \frac{1050 - 1200}{133.33} = 1.1250$
P(x̅ < 1050) = P(Z < 1.1250) = (0.8686 + 0.8708)/2 = 0.8697

Vraag 15

De eindige populatiecorrectiefactor wordt als volgt berekend: (N - n) / (N - 1).
De populatie correctiefactor voor sampl e size n = 20 voor een populatie met 20 leden is: (20-20) (20-1) = 0.
De populatie correctiefactor voor sampl e size n = 20 voor een populatie met 100 leden is : (100 - 20) (100 - 1) = 0,8081.
De populatiecorrectiefactor voor steekproefgrootte n = 20 voor een populatie met 10.000 leden is: (10.000 - 20) (10.000 - 1) = 0.9981.

Vraag 16

Het is de totale steekproefgrootte, niet de fractie van de populatie in de steekproef, die de nauwkeurigheid van de resultaten van een willekeurige steekproef bepaalt. Hoe groter het aantal leden in de populatie, hoe hoger de nauwkeurigheid van de schatting, ongeacht de grootte van een enkele steekproef.

Vraag 17

P = 0,20 en n = 270.

$\sigma_{\hat{p}} = \sqrt{ \frac{P(1 - P)}{n} } = \sqrt{\frac{0.20(1 - 0.20)}{270} } = 0.024$
De vereiste waarschijnlijkheid is:
\ [P (0.16 <\ hat {p} <0.24 = P (\ frac {0.16 - 0.20} {0.024} P (-1.67 We zien dus dat de kans 0,9050 is dat de steekproefverhouding binnen het interval [0,16 - 0,24] ligt gegeven P = 0,20 en steekproefomvang n = 270. Dit interval kan een acceptatie-interval van 90,50% worden genoemd. Merk op dat als de steekproefverhouding daadwerkelijk buiten deze interval lag, we kunnen vermoeden dat de populatiegraad P niet 0,20 is.

Vraag 18

P = 0,20; n = 400.
\ [\ sigma _ {\ hat {p}} = \ sqrt {\ frac {P (1 - P)} {n}} = \ sqrt {\ frac {0.20 (1 - 0.20)} {400} } = 0.0200 \]
De vereiste waarschijnlijkheid is:

$P(0.16 < \hat{p} < 0.24 = P( \frac{0.16 - 0.20}{0.024} < Z \frac{0.24 - 0.20}{0.024} )$
P(-1.67 < Z < 1.67) = 0.9525 - (1 - 0.9525) = 0.9050
Dit interval kan dus een acceptatie-interval van 95,44% worden genoemd (gegeven P = 0,20 en steekproefgrootte n = 400).

Vraag 19

P = 0.43; n = 80.

$\sigma_{\hat{p}} = \sqrt{ \frac{P(1 - P)}{n} } = \sqrt{\frac{0.43(1 - 0.43)}{80} } = 0.055$

$P(\hat{p} > 0.50) = P(Z > \frac{0.50 - 0.43}{0.055})$
P (Z > 1.27) = 0.1020

Vraag 20

P = 0.50; n = 250

$\sigma_{\hat{p}} = \sqrt{ \frac{P(1 - P)}{n} } = \sqrt{\frac{0.50(1 - 0.50)}{250} } = 0.0316$

$P(\hat{p} > 0.58) = P(Z > \frac{0.58 - 0.50}{0.0316}) = 2.5316$
P (Z > 2.53) = 1 - 0.9943 = 0.0057

Vraag 21

$P(\hat{p} > 0.55) = P(Z > \frac{0.55 - 0.50}{0.0316}) = 0.9494$
P (Z > 0.95) = 1 - 0.8289 = 0.1711

Vraag 22

Top 10% correspondeert me z = 1.185.

$1.185 = \frac{X - 420}{80}$

$1.185*80 = X - 420$

$94.5 + 420 = X$
X = 514.8. Dus, iemand moet minimaal 515 scoren op de test om in de top 10% te vallen.

Vraag 23

\ [\ mu = \ frac {2 + 4 + 6 + 6 + 7 + 8} {6} = 5.5 \]

Vraag 24

Twee van deze werknemers worden willekeurig gekozen. We nemen steekproeven zonder vervanging, dus de eerste waarneming heeft een waarschijnlijkheid van 1/6 dat wordt geselecteerd, terwijl de tweede waarneming een waarschijnlijkheid heeft dat 1/5 wordt geselecteerd. Vijftien mogelijke willekeurige steekproeven van twee werknemers konden worden geselecteerd. Merk op dat sommige steekproeven (zoals 2,6) twee keer voorkomen omdat er twee werknemers met zes jaar ervaring in de bevolking zijn.

Vraag 25

2 4
2 6 (2x)
2 7
2 8
4 6 (2x)
4 7
4 8
6 6
6 7 (2x)
6 8 (2x)
7 8

Vraag 26

steekproef gemiddelde	Waarschijnlijkheid van het steekproef gemiddelde
3.0	1/15
4.0	2/15
4.5	1/15
5.0	3/15
5.5	1/15
6.0	2/15
6.5	2/15
7.0	2/15
7.5	1/15

Vraag 27

De centrale limietstelling toont aan dat, als de steekproefgrootte groot genoeg is, het gemiddelde van een willekeurige steekproef uit een populatie met een waarschijnlijkheidsverdeling ongeveer normaal verdeeld zal zijn met gemiddelde μ en variantie σ² / n.

Vraag 28

100

Vraag 29

σ² / n = 15/100 = 0,15

Vraag 30

Volgens de centrale limietstelling verwachten we dat, naarmate n groter wordt, de verdeling de standaard normale verdeling nadert.

Hoe kun je schattingen verkrijgen voor een enkele populatie? - TentamenTests 7

Vragen

Vraag 1

Laat x1 , x2 , ..., xn een willekeurige steekproef zijn van een normaal verdeelde populatie met gemiddelde μ en variantie σ². Ervan uitgaande dat een populatie normaal verdeeld is met een zeer grote populatiegrootte in vergelijking met de steekproefgrootte, moet het steekproefgemiddelde of de steekproefmediaan worden gebruikt om het populatiegemiddelde te schatten?

Vraag 2

Geef één voordeel van de mediaan ten opzichte van het gemiddelde voor het schatten van een populatiegemiddelde.

Vraag 3

Geef één nadeel van de mediaan in vergelijking met het gemiddelde voor het schatten van een populatiegemiddelde.

Vraag 4

Welke twee eigenschappen moet een schatter bezitten?

Vraag 5

Overweeg de volgende informatie voor vraag 5-8. Stel dat winkeltijden voor klanten in een lokaal winkelcentrum een normale verdeling volgen. De standaarddeviatie van de populatie is gelijk aan 20 minuten. Een steekproef van 64 shoppers in de plaatselijke supermarkt heeft een gemiddelde tijd van 75 minuten. Wat is de standaardfout?

Vraag 6

Wat is de foutmarge?

Vraag 7

Wat is het 95% betrouwbaarheidsinterval voor de populatiegemiddelde μ ?

Vraag 8

Geef een interpretatie van dit betrouwbaarheidsinterval.

Vraag 9

Hoe kan de foutenmarge worden verminderd?

Vraag 10

Welke verdeling wordt gebruikt wanneer de populatievariantie bekend is?

Vraag 11

Welke verdeling wordt gebruikt wanneer de populatievariantie onbekend is?

Vraag 12

Zoek de standaardfout voor n = 17 en s = 16.

Vraag 13

Vind de bovenste kritische waarde van de Student's t-verdeling met v = 23 vrijheidsgraden voor α = 0,05.

Vraag 14

Gebruik de volgende informatie voor vragen 14-18. Uit een willekeurige steekproef van 344 medewerkers bleek dat 261 voor een aangepast bonusplan waren. Wat is de steekproefverhouding?

Vraag 15

Wat is de betrouwbaarheidsfactor voor een betrouwbaarheidsinterval van 90%?

Vraag 16

Wat is de foutmarge voor een betrouwbaarheidsinterval van 90%?

Vraag 17

Zorg voor een betrouwbaarheidsinterval van 90%.

Vraag 18

Interpreteer het betrouwbaarheidsniveau van 90%.

Vraag 19

Wat is het getal dat met waarschijnlijkheid 0,10 wordt overschreden door een chikwadraat willekeurige variabele met 4 vrijheidsgraden?

Vraag 20

Wat is het getal dat met waarschijnlijkheid 0,05 wordt overschreden door een chikwadraat willekeurige variabele met 18 vrijheidsgraden?

Vraag 21

De volgende informatie wordt verstrekt: n = 25, s² = 100. Wat zijn de kritische waarden voor een betrouwbaarheidsinterval van 95% met α = 0,05?

Vraag 22

Gebruik de informatie in de vorige vraag. Zoek het 95% betrouwbaarheidsinterval voor de populatievariantie.

Vraag 23

Overweeg de volgende informatie voor vragen 23-24. Stel dat er 1395 middelbare scholen in Nederland zijn. Uit een eenvoudige steekproef van 400 van deze scholen bleek dat de steekproefgemiddelde inschrijving in het afgelopen jaar voor biologiecursussen 320,8 studenten bedroeg, en de standaardafwijking van de steekproef bleek 149,7 studenten te zijn. Wat is de puntschatting voor het totale aantal inwoners, Nμ?

Vraag 24

Zoek het overeenkomende 99% betrouwbaarheidsinterval voor dit populatietotaal.

Vraag 25

Overweeg de volgende informatie voor vragen 25-26. Uit een eenvoudige steekproef van 400 van de 1.395 studenten in onze populatie blijkt dat biologie een cursus van twee semesters was in 141 van de in de steekproef opgenomen scholen. Schat het aandeel van alle scholen waarvoor de biologiecursus twee semesters lang is.

Vraag 26

Geef het betrouwbaarheidsinterval voor het aandeel van alle scholen waarvoor de biologiecursus twee semesters lang is.

Vraag 27

Stel dat we hebben: ME = 0,50; σ = 1,8; en za/2 = z0,005 = 2,576. Wat is de vereiste steekproefgrootte voor een betrouwbaarheidsinterval van 99%?

Vraag 28

Er wordt gegeven dat ME = 0,06 en za/2 = z0,025 = 1,96. Wat is de vereiste steekproefgrootte?

Vraag 29

Stel dat er een opiniepeiling wordt gehouden over de presidentsverkiezingen. De enquête zou een foutmarge van 3% hebben. De implicatie is dat een betrouwbaarheidsinterval van 95% voor het bevolkingsaandeel met een bepaalde mening het steekproefaandeel plus of min 3% is. Hoeveel burgers met stemgerechtigde leeftijd moeten worden bemonsterd om deze foutmarge van 3% te verkrijgen?

Vraag 30

Stel dat een eenvoudige steekproef van de 1.395 Nederlandse middelbare scholen wordt genomen. Wat de werkelijke verhouding ook is, een betrouwbaarheidsinterval van 95% mag zich niet verder uitstrekken dan 0,04 aan elke zijde van de steekproefverhouding. Hoeveel monsterobservaties moeten worden genomen?

Antwoordindicatie

Vraag 1

Ervan uitgaande dat een populatie normaal verdeeld is met een zeer grote populatiegrootte in vergelijking met de steekproefgrootte, is het steekproefgemiddelde een onpartijdige schatting van het populatiegemiddelde.

Vraag 2

De mediaan geeft minder gewicht aan extreme waarnemingen en is daarom minder gevoelig voor uitbijters.

Vraag 3

De relatieve efficiëntie van de mediaan is lager dan die van het gemiddelde.

Vraag 4

Ongekunsteld en de meest efficiënte.

Vraag 5

Standaardfout = σ/√n = 20 / √64 = 2.5

Vraag 6

De foutmarge = zα/2 * (σ / √n) = 1,96 * 2,5 = 4,9

Vraag 7

Het betrouwbaarheidsinterval van 95% loopt van 75 - 4,9 tot 75 + 4,9, dat wil zeggen: [70,1 - 79,9].

Vraag 8

Op de lange termijn bevat 95% van de op deze manier gevonden intervallen de werkelijke waarde van het populatiegemiddelde.

Vraag 9

Verlaag de standaarddeviatie van de populatie, of vergroot de steekproefomvang of verlaag het betrouwbaarheidsinterval.

Vraag 10

De standaard normale verdeling (z-verdeling).

Vraag 11

Student's t distributie.

Vraag 12

Standaardfout = s / √n = 16 / √17 = 3.88

Vraag 13

Gebruik tabel 8 (bijlage) om te bepalen dat de bovenste kritische waarde 1.714 is.

Vraag 14

$\hat{p} = 261/344 = 0.759$

Vraag 15

$z_{\alpha/2} = z_{0.05} = 1.645$

Vraag 16

$1.645 \sqrt{(0.759)(0.241)}{344} = 0.038$

Vraag 17

0.759 +/- 0.038 = [0.721; 0.797

Vraag 18

Stel dat je een zeer groot aantal onafhankelijke willekeurige steekproeven met grootte n = 344 uit deze populatie neemt en een betrouwbaarheidsinterval van 90% voor elk steekproefresultaat berekent. Vervolgens impliceert het betrouwbaarheidsniveau van het interval dat op de lange termijn 90% van de op deze manier gevonden intervallen de werkelijke waarde van het bevolkingsaandeel bevat.

Vraag 19

7,779

Vraag 20

28,869

Vraag 21

$X^{2}_{n-1,1-\alpha/2} = \chi^{2}_{24,0.975} = 12.401$

$X^{2}_{n-1,\alpha/2} = \chi^{2}_{24,0.025} = 39.364$

Vraag 22

$LCL = \frac{(n - 1) s^{2}}{\chi^{2}_{n - 1,\alpha/2} } = \frac{(24)(100)}{39.364} = 60.97$

$UCL = \frac{(n - 1) s^{2}}{\chi^{2}_{n - 1,1 - \alpha/2} } = \frac{(24)(100)}{12.401} = 193.53$
Het betrouwbaarheidsinterval van 95% is dus: [60,97; 193,53]

Vraag 23

Nx̄ = (1.395) (320.8) = 447.516. We schatten dus dat in totaal 447.516 studenten zullen worden ingeschreven voor biologiecursussen.

Vraag 24

$N\hat{\sigma}_{\bar{x}} = \frac{Ns}{\sqrt{n}} \sqrt{ (\frac{N - n}{N - 1}) } = \frac{(1,395)(149.7)}{\sqrt{400}} = 8,821.6$
Omdat de steekproefomvang groot is, kunnen we de centrale limietstelling met z α / 2 = 2,58 gebruiken voor een betrouwbaarheidsinterval van 99%. Vandaar:

$N\bar{x} \pm z_{\alpha/2} N \hat{\sigma}_{\bar{x}}$

$447,516 \pm 2.58(8.821.6)$

$447,516 \pm 22,760$
Het betrouwbaarheidsinterval van 99% loopt dus van 424.756 tot 470.276 studenten.

Vraag 25

N = 1,395; n = 400.

$\hat{p} = \frac{141}{400} = 0.3525$
De puntschatting van de populatie proportie P is eenvoudigweg gelijk aan deze populatie proportie, dat wil zeggen: 0,3525.

Vraag 26

$\hat{\sigma}^{2}_{\hat{p}} = \frac{\hat{p} (1 - \hat{p}}{n - 1} ( \frac{N - n}{N - 1} ) = \frac{(0.3525)(0.6475)}{400} = 0.0004073$
zodat

$\hat{\sigma}_{\hat{p}} = \sqrt{0.0004073} = 0.0202$
For a 90% confidence interval: z_a/2 = 1.645.

$ME = z_{\alpha/2} \hat{\sigma}_{\hat{p}} = 1.645(0.0202) ≅ 0.0332$
Voor een betrouwbaarheidsinterval van 90%: za/2 = 1.645.

$ME = z_{\alpha/2} \hat{\sigma}_{\hat{p}} = 1.645(0.0202) ≅ 0.0332$
Het betrouwbaarheidsinterval van 90% loopt dus van 0,3525 +/- 0,0332. Dat wil zeggen van 31,93% tot 38,57%.

Vraag 27

$n = \frac{z^{2}_{\alpha/2}} \sigma^{2}{ME^{2}} = \frac{ (2.576)^{2} (1.8)^{2} }{(0.5)^{2}} ≈ 86$

Vraag 28

$n = \frac{0.25 (z_{\alpha/2})^{2}}{(ME)^{2}} = \frac{0.25(1.96)^{2}}{(0.06)^{2}} = 267$

Vraag 29

$n = \frac{0.25 (z_{\alpha/2})^{2}}{(ME)^{2}} = \frac{(0.25)(1.96)^{2}}{(0.03)^{2}} = 1067.11 = 1068$

Vraag 30

$1.96 \sigma_{\hat{p}} = 0.04$

$\sigma_{\hat{p}} = 0.020408$

$n_{max} = \frac{0.25N}{(N - 1) \sigma^{2}_{\hat{p}} + 0.25 } = \frac{(0.25)(1,395)}{(1,394)(0.020408)^{2} + 0.25} = 419.88 = 420$

Hoe kun je parameters schatten voor twee populaties? - TentamenTests 8

Vragen

Vraag 1

De volgende informatie wordt verstrekt voor een afhankelijke willekeurige steekproef van twee normaal verdeelde populaties:

$n = 11 \ hspace {3mm} \ bar {d} = 28.5 \ hspace {3mm} s_ {d} = 3.3$
Zoek het 98% betrouwbaarheidsinterval voor het verschil tussen de gemiddelden van de twee populaties.

Vraag 2

Wat is de foutmarge voor een betrouwbaarheidsinterval van 98% voor het verschil tussen de gemiddelden van de twee populaties van de vorige vraag?

Vraag 3

Wat concludeer je op basis van het betrouwbaarheidsinterval van vraag 1?

Vraag 4

Overweeg de volgende gegevens voor vraag 4-6:

Voor	Na
6 12 8 10 6	8 14 9 13 7

Welke type afhankelijke steekproef is hier weergegeven?

Vraag 5

Wat is het steekproefgemiddelde van de verschillen?

Vraag 6

Er wordt aangegeven dat het gemiddelde verschil gelijk is aan 7,7 met standaarddeviatie sd = 43.68901. Bereken het 95% betrouwbaarheidsinterval met de normale benadering.

Vraag 7

Gebruik de volgende informatie voor vragen 7-13. Een educatieve studie wordt uitgevoerd om de effectiviteit van een wiskundig leesprogramma van basisschoolkinderen te onderzoeken. Elk kind kreeg een pre- en posttest (voor- en nameting). Hogere scores duiden op verbetering van de wiskunde. Van een zeer grote populatie werd een willekeurige steekproef getrokken. De gegevens die uit deze steekproef zijn verkregen, staan in de onderstaande tabel. Wat is de gemiddelde verschilscore?

Kind

Voormeting

Nameting

1
2
3
4
5
6
7

40
36
32
38

33
35

48
42

36
43
38
45

Vraag 8

Wat is de standaarddeviatie van de verschilscores?

Vraag 9

Zoek de t-waarde die overeenkomt met een betrouwbaarheidsinterval van 95%.

Vraag 10

Bereken een betrouwbaarheidsinterval van 95%.

Vraag 11

Kunnen we op basis van dit betrouwbaarheidsinterval van 95% concluderen dat er een significante verbetering is in de wiskunde?

Vraag 12

Bereken een betrouwbaarheidsinterval van 95% met de normale benadering.

Vraag 13

Wat concluderen we op basis van dit interval?

Vraag 14

Er is een onderzoek naar de GPA (het gemiddelde) van studenten uitgevoerd. Uit een zeer grote universiteit werden onafhankelijke steekproeven van 120 studenten met een hoofdvak economie en 90 studenten met een hoofdvak financiën geselecteerd. De gemiddelde GPA voor de willekeurige steekproef van economische majors bleek 3,08 te zijn. De gemiddelde GPA voor de willekeurige steekproef van financiële majors bleek 2,88 te zijn. Uit vergelijkbare eerdere onderzoeken is de populatiestandaarddeviatie voor de financiële majors 0,64. Geef het populatiegemiddelde voor economie aan met μ_x en het populatiegemiddelde voor financiën met μ_y. Met welk scenario hebben we hier te maken?
a. populatievariaties bekend
b. populatievarianties onbekend, maar aangenomen gelijk te zijn
c. populatievarianties onbekend en niet gelijk geacht

Vraag 15

Bereken het 95% betrouwbaarheidsinterval voor de verschilscore voor de informatie in de vorige vraag.

Vraag 16

Wat concluderen we op basis van dit 95% betrouwbaarheidsinterval (uit vraag 15)?

Vraag 17

Overweeg de volgende gegevens voor vragen 17-21:

X	100	125	135	128	140	142	128	137	156	142
Y	95	87	100	75	110	105	85	95

Stel dat dit onafhankelijke steekproeven zijn met onbekende varianties, maar de varianties worden
verondersteld gelijk te zijn. Geef n_x, n_y, x̄, ȳ, σ²_x and σ²_y.

Vraag 18

Bereken de gepoolde variantie.

Vraag 19

Wat zijn de vrijheidsgraden?

Vraag 20

Zoek de t-waarde die overeenkomt met een betrouwbaarheidsinterval van 95%.

Vraag 21

Bereken het betrouwbaarheidsinterval van 95%.

Vraag 22

Uitgaande van gelijke populatievarianties, bepaal het aantal graden voor:
n_x = 16; s²_x = 30
n_y = 9; s²_x = 36

Vraag 23

Bereken de gepoolde steekproefvariantie voor de informatie in de vorige vraag.

Vraag 24

Uitgaande van gelijke populatievarianties, bepaal het aantal graden voor:
n_x = 12; s²_x = 30
n_y = 14; s²_x = 36

Vraag 25

Bereken de gepoolde steekproefvariantie voor de informatie in de vorige vraag.

Vraag 26

Uitgaande van gelijke populatievarianties, bepaal het aantal graden voor:
n_x = 20; s²_x = 16
n_y = 8; s²_x = 25

Vraag 27

Bereken de gepoolde steekproefvariantie voor de informatie in de vorige vraag.

Vraag 28

De volgende informatie wordt verstrekt:

$n_{x} = 120; \hat {p}_{y} = 0.892$

$n_{y} = 141; \hat {p}_{y} = 0.518$
Bereken een betrouwbaarheidsinterval van 95% voor het populatieverschil (Px - Py)

Vraag 29

Bereken de foutmarge voor een betrouwbaarheidsinterval van 95% met:

$n_{x} = 300; \hat {p}_{y} = 0.62$

$n_{y} = 350; \hat {p}_{y} = 0.72$

Vraag 30

Bereken de foutmarge voor een betrouwbaarheidsinterval van 95% met:

$n_{x} = 100; \hat {p}_{y} = 0.44$

$n_{y} = 150; \hat {p}_{y} = 0.55$

Antwoordindicatie

Vraag 1

$\bar{d} \pm t_{n-1,\alpha/2} \frac{s_{d}}{\sqrt{n}} = 28.5 \pm 2.764 \frac{3.3}{\sqrt{11}} = 28.5 \pm 2.7502$
Het 98% betrouwbaarheidsinterval is: [25.75; 31.25].

Vraag 2

ME = 2.7502

Vraag 3

Op basis van deze voorbeeldgegevens concluderen we dat er voldoende bewijs is om te suggereren dat er een significant verschil is tussen de twee populaties.

Vraag 4

Herhaalde metingen (repeated measurements)

Vraag 5

$\bar{d} = \frac{2 + 2 + 1 + 3 + 1}{5} = 1.8$

Vraag 6

t_n-1,a/2 = t_139,0.025 ≅ 1.96.

$\bar{d} \pm t_{n-1,\alpha/2} \frac{s_{d}}{\sqrt{n}}$

$7.7 \pm 1.96 \frac{43.68901}{\sqrt{140}}$

$7.7 \pm 7.2$
Dit resulteert in het volgende 95% betrouwbaarheidsinterval: [70.5; 84.9]

Vraag 7

$\bar{d} = \frac{8 + 6 -2 + 5 + 10}{5} = 5.4$

Vraag 8

s_d ≅ 4.56

Vraag 9

t_4,0.025 = 2.776

Vraag 10

$\bar{d} \pm t_{n-1,\alpha/2} \frac{s_{d}}{\sqrt{n}}$

$5.4 \pm 2.776 \frac{4.56}{\sqrt{5}}$

$5.4 \pm 5.6620$
Dit resulteert in het volgende 95% betrouwbaarheidsinterval: [-0.26; 11.620]

Vraag 11

Nee, omdat de nul binnen het bereik van het betrouwbaarheidsinterval ligt. Er is dus onvoldoende bewijs om te concluderen dat er een significant verschil is.

Vraag 12

Met behulp van de normale benadering vervangen we t door z, dat wil zeggen: z = 1,96.

$5.4 \pm 1.96 \frac{4.56}{\sqrt{5}}$

$5.4 \pm 3.9976$
Het 95% betrouwbaarheidsinterval is: [1.40; 9.40]

Vraag 13

Op basis van het 95% betrouwbaarheidsinterval berekend door de normale benadering, zouden we concluderen dat er een significante verbetering is in de wiskundescores. Merk echter op dat het hier om een afhankelijke steekproef gaat (herhaalde metingen). Daarom is de normale benadering geen geldige procedure. Het is echter belangrijk om het verschil te zien dat de verdeling kan maken op de statistische inferenties.

Vraag 14

a. populatievariaties bekend

Vraag 15

$(\bar{x} - \bar{y}) \pm z_{\alpha/2} + \sqrt{\frac{\sigma^{2}_{x}}{n_{x}} + \frac{\sigma^{2}_{y}}{n_{y}}}$

$(3.08 - 2.88) \pm 1.96 \sqrt{ \frac{(0.42)^{2}}{120}} + \frac{(0.64)^{2}}{90} = 0.20 \pm 0.1521$
Dus het 95% betrouwbaarheidsinterval loopt van 0.0479 tot 0.3521

Vraag 16

Het betrouwbaarheidsinterval omvat niet de nul, dus concluderen we dat er een significant verschil is in de gemiddelde GPA van studenten met een hoofdvak economie en studenten met een hoofdvak in financiën. Nauwkeuriger gezegd, gemiddeld is de gemiddelde GPA van studenten met een hoofdvak in economie hoger dan de GPA van studenten met een hoofdvak in financiën.

Vraag 17

n_x = 10; x̄ = 133.30; σ²_x = 218.0111
n_y = 8; ȳ = 94.00; σ²_y = 129.4286

Vraag 18

$s^{2}_{p} = \frac{ (n_{x} - 1)s^{2}_{x} + (n_{y} - 1)s^{2}_{y} }{n_{x} + n_{y} - 2} = \frac{(10 - 1)(218.0111) + (8 - 1)(129.4286) }{10 + 8 -2} = 19.2563$

Vraag 19

df = n_x + n_y - 2 = 10 + 8 - 2 = 16

Vraag 20

t₁₆_,0.025 = 2.12

Vraag 21

$(\bar{x} - \bar{y}) \pm t_{n_{x} + n_{y} - 2, a/2} + \sqrt{\frac{s^{2}_{p}}{n_{x}} + \frac{s^{2}_{p}}{n_{y}}}$

$39.3 \pm (2.21) \sqrt{ \frac{179.2563}{10} + \frac{179.2563}{8} }$

$39.3 \pm 13.46$
Dus het 95% betrouwbaarheidsinterval is: [25.84; 52.76]

Vraag 22

df = n_x + n_y - 2 = 16 + 9 - 2 = 23

Vraag 23

$s^{2}_{p} = \frac{ (n_{x} - 1)s^{2}_{x} + (n_{y} - 1)s^{2}_{y} }{n_{x} + n_{y} - 2}$

$s^{2}_{p} = \frac{ (16-1)30 + (9 - 1)36}{16 + 9 - 2} = \frac{738}{23} = 32.08$

Vraag 24

df = n_x + n_y - 2 = 12 + 14 - 2 = 24

Vraag 25

$s^{2}_{p} = \frac{ (12-1)30 + (14 - 1)36}{12 + 14 - 2} = \frac{798}{24} = 33.25$

Vraag 26

df = n_x + n_y - 2 = 20 + 8 - 2 = 26

Vraag 27

$s^{2}_{p} = \frac{ (20-1)16 + (8 - 1)25}{20 + 8 - 2} = \frac{479}{26} = 18.42$

Vraag 28

$(\hat{p}_{x} - \hat{p}_{y}) \pm z_{\alpha/2} = \sqrt{ \frac{ \hat{p}_{x} (1 - \hat{p}_{x} ) }{n_{x}} + \frac{ \hat{p}_{y} (1 - \hat{p}_{y} ) }{n_{y}} }$

$(0.892 - 0.518) \pm 1.96 \sqrt{ \frac{(0.892)(0.108)}{120} + \frac{(0.518)(0.482)}{141} }$
Dus het 95% betrouwbaarheidsinterval loopt van 0.274 tot 0.473.

Vraag 29

$ME = z_{\alpha/2} = \sqrt{ \frac{ \hat{p}_{x} (1 - \hat{p}_{x} ) }{n_{x}} + \frac{ \hat{p}_{y} (1 - \hat{p}_{y} ) }{n_{y}} }$

$1.96 \sqrt{ \frac{(0.62)(0.38)}{300} + \frac{(0.72)(0.28)}{350} }$
ME = 0.0733

Vraag 30

$ME = z_{\alpha/2} = \sqrt{ \frac{ \hat{p}_{x} (1 - \hat{p}_{x} ) }{n_{x}} + \frac{ \hat{p}_{y} (1 - \hat{p}_{y} ) }{n_{y}} }$

$1.96 \sqrt{ \frac{(0.44)(0.56)}{100} + \frac{(0.55)(0.45)}{120} }$
ME = 0.1329

Hoe kun je hypothesen opstellen voor een enkele populatie? - TentamenTests 9

Vragen

Vraag 1

Kees wil de resultaten van een steekproefsgewijs marktonderzoek gebruiken om sterk bewijs te zoeken dat zijn graanmerk meer dan 20% van de totale markt heeft. Formuleer de nulhypothese en alternatieve hypothese met behulp van P als het populatiepercentage.

Vraag 2

Is de alternatieve hypothese die u formuleerde voor vraag 1 een eenzijdige of tweezijdige samengestelde alternatieve hypothese?

Vraag 3

Een autofabriek heeft een proces voorgesteld om de diameter van zuigers volgens een regelmatig schema te controleren. Ze willen testen of de diameter gelijk is aan 3800. Formuleer de nulhypothese en alternatieve hypothese.

Vraag 4

Is de alternatieve hypothese die u formuleerde voor vraag 1 een eenzijdige of tweezijdige samengestelde alternatieve hypothese?

Vraag 5

Wat is een type I-fout?

Vraag 6

Wat is een type II-fout?

Vraag 7

Overweeg de volgende informatie voor vragen 7-10. Een willekeurige steekproef wordt verkregen uit een populatie met variantie σ 2 = 625. Het steekproefgemiddelde wordt berekend. Test de nulhypothese H0 : μ = 100 versus de alternatieve hypothese H1 : μ > 100 met α = 0,05. Bereken de kritische waarde x̅c en vermeld uw beslissingsregel voor een steekproefgrootte van n = 25.

Vraag 8

Doe hetzelfde voor n = 16.

Vraag 9

Doe hetzelfde voor n = 44.

Vraag 10

Doe hetzelfde voor n = 32.

Vraag 11

Overweeg de volgende informatie voor vragen 11-14. Een willekeurige steekproef van n = 25 wordt verkregen uit een populatie met bekende variantie. Het steekproefgemiddelde wordt berekend. Test de nulhypothese: H0 : μ = 120 versus de alternatieve hypothese H1 : μ > 120 met α = 0,10. Bereken de kritische waarde x̅c en vermeld uw beslissingsregel met betrekking tot de populatievariantie σ² = 196.

Vraag 12

Doe hetzelfde voor σ 2 = 625.

Vraag 13

Doe hetzelfde voor σ 2 = 900.

Vraag 14

Doe hetzelfde voor σ 2 = 500.

Vraag 15

Test de hypothesen: H0 : μ = 100 en H1 = μ > 100, met behulp van een willekeurige steekproef van n = 31, een waarschijnlijkheid van type I-fout gelijk aan 0,05 en de volgende steekproefstatistieken: x̅ = 108; s = 20.

Vraag 16

Test de hypothesen: H0 : μ = 100 en H 1 = μ > 100, met behulp van een willekeurige steekproef van n = 31, een waarschijnlijkheid van type I-fout gelijk aan 0,05 en de volgende steekproefstatistieken: x̅ = 104; s = 10.

Vraag 17

Test de hypothesen: H0 : μ = 100 en H 1 = μ > 100, met behulp van een willekeurige steekproef van n = 31, een waarschijnlijkheid van type I-fout gelijk aan 0,05 en de volgende steekproefstatistieken: x̅̅ = 96; s = 10.

Vraag 18

Noem vier voorwaarden die de powerfunctie verhogen.

Vraag 19

Veronderstel dat we de waarschijnlijkheid van een type II-fout vinden bij het falen om de nulhypothese te verwerpen wanneer de werkelijke proportie 0,56 is β = 0,31 met een significantieniveau van α = 0,05. Wat is de power?

Vraag 20

Veronderstel dat we de waarschijnlijkheid van een type II-fout vinden bij het falen om de nulhypothese te verwerpen wanneer de werkelijke proportie 0,66 is β = 0,25 met een significantieniveau van α = 0,10. Wat is de power?

Vraag 21

Gebruik de volgende informatie voor vragen 21-25. Een willekeurige steekproef van 20 producten wordt verkregen en het gewicht van elk product wordt gemeten. De steekproefvariantie wordt berekend als 6,62. De hypothese wordt getest dat het gewicht van de producten niet kan overschrijden. Formuleer de nulhypothese en alternatieve hypothese.

Vraag 22

Wat zijn de vrijheidsgraden?

Vraag 23

Wat is de kritische waarde?

Vraag 24

Wat is de teststatistiek?

Vraag 25

Kunnen we op basis van deze voorbeeldgegevens de nulhypothese verwerpen?

Vraag 26

Gebruik de volgende informatie voor vragen 26-30. Stel dat we de volgende hypotheses testen:
H0 : μ < 100 H1 : μ > 100 met een willekeurige steekproef van n = 49, een kans op type I-fout gelijk aan 0,05. Stel dat de populatievarianties onbekend zijn, welke distributie moet u gebruiken?

Vraag 27

Test de hypothesen met behulp van de volgende teststatistieken: x̅ = 108; s = 20

Vraag 28

Test de hypothesen met behulp van de volgende teststatistieken: x̅̅ = 104; s = 10

Vraag 29

Test de hypothesen met behulp van de volgende teststatistieken: x̅ = 96; s = 10

Vraag 30

Test de hypothesen met behulp van de volgende teststatistieken: x̅ = 95; s = 8

Antwoordindicatie

Vraag 1

H0 : P = 0,20
H1 : P> 0,20

Vraag 2

Een eenzijdige samengestelde alternatieve hypothese.

Vraag 3

H0 : μ = 3800 H1 : μ ≠ 3800

Vraag 4

Een tweezijdige samengestelde alternatieve hypothese.

Vraag 5

Een type I-fout verwijst naar het verwerpen van de nulhypothese, terwijl de nulhypothese waar is.

Vraag 6

Een type II-fout verwijst naar het niet afwijzen van de nulhypothese, terwijl de nulhypothese onjuist is.

Vraag 7

$x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 100 + 1.96 x (25 / \sqrt{25}) = 109.80$
De beslissingsregel is: verwerp H0 als x̅̅ > 109.80

Vraag 8

$x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 100 + 1.96 x (25 / \sqrt{16}) = 112.50$
De beslissingsregel is: afwijzen H0 als x̅̅ > 112,50

Vraag 9

$x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 100 + 1.96 x (25 / \sqrt{44}) = 107.39$
De beslissingsregel is: afwijzen H0 als x̅̅ > 107.39

Vraag 10

$x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 100 + 1.96 x (25 / \sqrt{32}) = 108.62$
De beslissingsregel is: afwijzen H0 als x̅̅ > 108,62

Vraag 11

Voor een eenzijdige hypothesetest met significantieniveau α = 0,05, de waarde van zα = 1,282 uit de standaard normale tabel. De variantie is 196, dus de standaardafwijking is √196 = 14.

$x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 120 + 1.282 x (14 / \sqrt{25}) = 123.59$
De beslissingsregel is: verwerp H0 als x̅̅ > 123.59

Vraag 12

$x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 120 + 1.282 x (\sqrt{625} / \sqrt{25}) = 121.28$
De beslissing regel is: verwerp H0 als x̅̅ > 121.28

Vraag 13

$x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 120 + 1.282 x (\sqrt{900} / \sqrt{25}) = 127.69$
De beslissing regel is: verwerp H0 als x̅̅ > 127.69

Vraag 14

$x_{c} = \mu_{0} + z_{\alpha} \sigma/\sqrt{n} = 120 + 1.282 x (\sqrt{500} / \sqrt{25}) = 125.73$
De beslissing regel is: verwerp H0 als x̅̅ > 125.73

Vraag 15

t30,0.05 = 1.697

$t = \frac{\bar{x} - \mu_{0}}{s / \sqrt(n)} = \frac{108 - 100}{20 / \sqrt{31}} = 2.23$
Dus t> t 30,0.05. Op basis van dit resultaat verwerpen we de nulhypothese ten gunste van de alternatieve hypothese.

Vraag 16

t30,0.05 = 1.697
\ [ t = \ frac {\ bar {x} - \ mu_ {0}} {s / \ sqrt (n)} = \ frac {104 - 100} {10 / \ sqrt {31} } = 2.23 \]
Dus t > t30,0.05 . Op basis van dit resultaat verwerpen we de nulhypothese ten gunste van de alternatieve hypothese. De t-waarde is eigenlijk dezelfde als in de vorige vraag, omdat zowel de nominator als de noemer de helft van de oorspronkelijke waarde zijn en dus dezelfde uitkomst opleveren.

Vraag 17

t30,0.05 = 1.697

$t = \frac{\bar{x} - \mu_{0}}{s / \sqrt(n)} = \frac{96 - 100}{10 / \sqrt{31}} = -2.23$
Dus t < t30,0.05 . Omdat we een eenzijdige alternatieve hypothese testen met H 1 : μ> μ0 , kunnen we de nulhypothese hier niet verwerpen (houd er rekening mee dat het steekproefgemiddelde lager is dan de parameter van belang, in plaats van hoger dan de parameter).

Vraag 18

(1) het werkelijke gemiddelde is verder verwijderd van het hypothetische gemiddelde μ0 ; (2) het significantieniveau is hoger; (3) de populatievariantie is lager; (4) de steekproefomvang is groter.

Vraag 19

Power = 1 - β = 1 - 0.31 = 0.69

Vraag 20

Power = 1 - β = 1 - 0,25 = 0,75

Vraag 21

H₀: σ² < σ²₀ = 4
H₁: σ² > 4

Vraag 22

df = n - 1 = 20 - 1 = 19

Vraag 23

Voor deze test met een significantieniveau van α = 0,05 en 19 vrijheidsgraden, is de kritische waarde van de chikwadraatvariabele 30.144 (zie Bijlage Tabel 7 van het boek).

Vraag 24

\ [\ frac {(n - 1) s ^ {2}} {\ sigma ^ {2} _ {0}} = \ frac {20 -1) (6.62)} {4} = 31.445 \]

Vraag 25

31.445> 30.144. Daarom kunnen we de nulhypothese verwerpen en concluderen dat de variabiliteit van het gewicht van de producten de norm overtreft.

Vraag 26

Student t distributie

Vraag 27

De kritische t-waarde is: tc = 1.684

$t = \frac{108 - 100}{20 / \sqrt{49}} = 2.8$
t > tc , daarom kunnen we de nulhypothese verwerpen.

Vraag 28

$t = \frac{104 - 100}{20 / \sqrt{10}} = 2.8$
t > tc , daarom kunnen we de nulhypothese verwerpen.

Vraag 29

$t = \frac{96 - 100}{10 / \sqrt{49}} = -2.8$
t < tc , maar we testen t > tc. Daarom kunnen we de nulhypothese niet verwerpen ("verkeerde kant") .

Vraag 30

$t = \frac{95 - 100}{8 / \sqrt{49}} = 4.38$
t < tc , maar we testen t > tc. Daarom kunnen we de nulhypothese niet verwerpen ("verkeerde kant") .

Welke testprocedures zijn er voor het verschil tussen twee populaties? - TentamenTests 10

Vragen

Vraag 1

Gebruik de volgende informatie voor vragen 1-5. Een onderzoeker wil bepalen of twee verschillende productieprocessen een verschillend gemiddeld aantal producten per uur hebben. Het gemiddelde van productieproces 1 wordt gedefinieerd als μ₁ en het gemiddelde van productieproces 2 wordt gedefinieerd als μ₂. De nul- en alternatieve hypotheses zijn als volgt: H₀: μ₁ - μ₂ = 0 en H₁: μ₁ - μ₂ > 0. Uit de populaties wordt een willekeurige steekproef getrokken van 25 gematchte paren. De steekproefgemiddelden zijn respectievelijk 50 en 60 voor populaties 1 en 2. Geef de beslisregel met een kans op type I-fout α = 0,05.

Vraag 2

Kun je de nulhypothese verwerpen als de standaarddeviatie van het verschil van het verschil 20 is?

Vraag 3

Kun je de nulhypothese verwerpen wanneer je toets met een kans op type I-fout α = 0,05 als de standaarddeviatie van het steekproefverschil 30 is?

Vraag 4

Kun je de nulhypothese verwerpen wanneer je toets met een kans op type I-fout α = 0,05 als de standaarddeviatie van het steekproefverschil 15 is?

Vraag 5

Kun je de nulhypothese verwerpen wanneer je toets met een kans op type I-fout α = 0,05 als de standaarddeviatie van het steekproefverschil 40 is?

Vraag 6

Gebruik de volgende informatie voor vraag 6-10. Een onderzoeker wil bepalen of twee verschillende productieprocessen een verschillend gemiddeld aantal producten per uur hebben. Het gemiddelde van productieproces 1 wordt gedefinieerd als μ1 en het gemiddelde van productieproces 2 wordt gedefinieerd als μ2. De nul- en alternatieve hypotheses zijn als volgt: H₀: μ₁ - μ₂ = 0 en H₁: μ₁ - μ₂ < 0. Uit de populaties wordt een willekeurige steekproef getrokken van 25 gematchte paren. De standaarddeviatie van het verschil tussen de steekproefgemiddelden is 25. Geef de beslisregel wanneer je toets met een kans op type I-fout α = 0,05.

Vraag 7

Kun je de nulhypothese verwerpen met een kans op type I-fout α = 0,05 als de steekproefgemiddelden respectievelijk 56 en 50 zijn voor populaties 1 en 2?

Vraag 8

Kun je de nulhypothese verwerpen met een kans op type I-fout α = 0,05 als de steekproefgemiddelden respectievelijk 59 en 50 zijn voor populaties 1 en 2?

Vraag 9

Kun je de nulhypothese verwerpen met een kans op type I-fout α = 0,05 als de steekproefgemiddelden respectievelijk 56 en 48 zijn voor populaties 1 en 2?

Vraag 10

Kun je de nulhypothese verwerpen met een kans op type I-fout α = 0,05 als de steekproefgemiddelden respectievelijk 54 en 50 zijn voor populaties 1 en 2?

Vraag 11

Gebruik de volgende informatie voor vragen 11-13. Een onderzoeker wil een hypothesetest uitvoeren voor het verschil in gemiddelde tussen twee populaties met onafhankelijke steekproeven. De volgende informatie wordt verstrekt:
n_x = 25; x̅ = 115; σ_x² = 625
n_y = 25; y̅ = 100; σ_y² = 400
Bereken de test statistiek

Vraag 12

De onderzoeker besluit te testen met een significantieniveau van α = 0,05. Bepaal de kritieke z-waarde.

Vraag 13

Vergelijk de kritieke z-waarde met de teststatistiek. Kan de onderzoeker de nulhypothese verwerpen?

Vraag 14

Hoe groot moet de steekproefgrootte zijn om een goede benadering te krijgen als we de populatievarianties vervangen door de steekproefvarianties?

Vraag 15

Gebruik de volgende informatie voor vragen 15-20.
n_x = 25; x̅ = 1078; s_x = 633
n_y = 25; y̅ = 908.2; s_y = 469.8
We zijn geïnteresseerd in het testen van het verschil in populatiegemiddelden tussen X en Y. De alternatieve hypothese stelt dat het gemiddelde van populatie 2 groter is dan het gemiddelde van populatie 1. Voor deze hypothesetest gebruiken we een significantieniveau van α = 0,05. Merk op dat de populatievarianties onbekend zijn en dat de steekproefvarianties worden gegeven.

Vraag 16

Formuleer de nulhypothese en alternatieve hypothese.

Vraag 17

Bereken de gepoolde variatieschatting.

Vraag 18

Wat zijn het aantal vrijheidsgraden?

Vraag 19

Wat is de kritische waarde van t?

Vraag 20

Bereken de teststatistiek.

Vraag 21

Geef de beslisregel voor deze hypothesetest.

Vraag 22

Kan de nulhypothese worden verworpen?

Vraag 23

Hoe groot moet de steekproefgrootte zijn om de standaard normale verdeling te kunnen gebruiken voor het testen van de gelijkheid van twee populatieverhoudingen?

Vraag 24

Overweeg de volgende informatie voor vragen 23-27:
n_x = 270; p_x _(steekproef) = 0.185
n_y = 203; p_y _(steekproef) = 0.399
Bereken de schatting van de gemeenschappelijke variantie, P₀, volgens de nulhypothese.

Vraag 25

Bereken de teststatistiek.

Vraag 26

Stel dat we testen met de alternatieve hypothese: H₁: P_x < P_y. Voor deze test gebruiken we een significantieniveau van α = 0,05. Wat is de kritische waarde?

Vraag 27

Formuleer de beslisregel.

Vraag 28

Kunnen we de nulhypothese verwerpen?

Vraag 29

Overweeg de volgende informatie voor vragen 28-30.
n_x = 17; s_x = 123,35
n_y = 11; s_y = 8,02

Vraag 30

Wat zijn de vrijheidsgraden voor de F-verdeling?

Antwoordindicatie

Vraag 1

t_n-1,a = t_24,0.05 = 711
De algemene beslisregel hier is: verwerp H₀ als t > t_24,0.05 = 711.

Vraag 2

$t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{10}{20 / \sqrt{25}} = 5$
t > t_24,0.05 en dus kunnen we de nulhypothese verwerpen.

Vraag 3

$t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{10}{30 / \sqrt{25}} = 1.67$
t < t_24,0.05 en dus kunnen we de nulhypothese niet verwerpen.

Vraag 4

$t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{10}{15 / \sqrt{25}} = 3.33$
t > t_24,0.05 en dus kunnen we de nulhypothese verwerpen.

Vraag 5

$t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{10}{40 / \sqrt{25}} = 1.25$
t < t_24,0.05 en dus kunnen we de nulhypothese niet verwerpen.

Vraag 6

t_n-1,a = t_24,0.05 = -1.711
De algemene beslisregel hier is: verwerp H₀ als t < t_24,0.05 = -1.711.

Vraag 7

$t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{-6}{25 / \sqrt{25}} = -3.8$
t < t_24,0.05 en dus kunnen we de nulhypothese verwerpen..

Vraag 8

$t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{-9}{25 / \sqrt{25}} = -1.8$
t < t_24,0.05 en dus kunnen we de nulhypothese verwerpen.

Vraag 9

$t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{-8}{25 / \sqrt{25}} = -1.6$
t > t_24,0.05 en dus kunnen we de nulhypothese niet verwerpen.

Vraag 10

$t = \frac{\bar{d}}{s_{d} / \sqrt{n} } = \frac{-4}{25 / \sqrt{25}} = -0.8$
t > t_24,0.05 en dus kunnen we de nulhypothese niet verwerpen.

Vraag 11

$z = \frac{115 - 100}{\sqrt{\frac{625}{25} + \frac{400}{25}}} = 2.34$

Vraag 12

Z_0.05 = 1.645

Vraag 13

z > z_0.05 dus de nulhypothese kan worden verworpen

Vraag 14

De steekproefgrootte moet groter zijn dan 100.

Vraag 15

H₀: μ_x – μ_y = 0
H₁: μ_x – μ_y< 0

Vraag 16

$s^{2}_{p} = \frac{ (25-1)(633)^{2} + (25 – 1)(469.8)^{2} }{25 + 25 - 2} = 310,700$

Vraag 17

df = 25 + 25 – 2 = 48

Vraag 18

t_48,0.05 = 1.677

Vraag 19

$t = \frac{1078 – 908.2}{ \sqrt{ \frac{310,700}{25} + \frac{310,700}{25}}} = 1.08$

Vraag 20

Verwerp H₀ als t > t_48,0.05 = 1.677

Vraag 21

Nee, de teststatistiek is kleiner dan de kritieke waarde, dus er is onvoldoende bewijs om de nulhypothese te verwerpen.

Vraag 22

nP₀(1 – P₀) > 5

Vraag 23

$\hat{p}_{0} = \frac{n_{x} \hat{p}_{x} + n_{y} \hat{p}_{y}}{n_{x} + n_{y}} = \frac{(270)(0.185) + (203)(0.399)}{270 + 203} = 0.277$

Vraag 24

$\frac{0.185 – 0.399}{ \sqrt{ \frac{ (0.277)(1 – 0.277) }{270} + \frac{ (0.277)(1 – 0.277) }{203} } } = -5.15$

Vraag 25

–z_0.05 = -1.645

Vraag 26

Verwerp H₀ als z < –z_0.05 = -1.645

Vraag 27

Ja, we kunnen de nulhypothese verwerpen omdat -5.15 < -1.645.

Vraag 28

df_teller = (n_x - 1) = 17 – 1 = 16 and df_noemer = (n_y - 1) = 11 – 1 = 10.

Vraag 29

Uit Appendix Tabel 9 (in het boek) volgt dat: F_16,10,0.01 = 4.520

Vraag 30

$F = \frac{s^{2}_{x}}{s^{2}_{y}} = \frac{123.35}{8.02} = 15.380$
Het is duidelijk dat de teststatistiek van F(15.380) de kritieke waarde (4.520) overschrijdt. Daarom kan de nulhypothese worden verworpen ten gunste van de alternatieve hypothese.

Hoe werkt een enkelvoudige regressie? - TentamenTests 11

Vragen

Vraag 1

Gebruik de volgende informatie voor vragen 1-4. Stel dat we geïnteresseerd zijn in de relatie tussen het aantal werknemers (aangegeven met X) en het aantal geproduceerde tafels per uur (Y). Een steekproef van 10 werknemers wordt verstrekt. De volgende beschrijvende statistieken worden verkregen:

$Cov(x,y) = 106.93 \hspace{5mm} s^{2}_{x} = 42.01 \hspace{5mm} \bar{y} = 41.2 \hspace{5mm} \bar{x} = 21.3$
Bereken de helling van de steekproefregressie.

Vraag 2

Bereken het y-intercept voor de steekproefregressie.

Vraag 3

Wat is de vergelijking van de regressielijn?

Vraag 4

Als het management besluit 25 werknemers in dienst te nemen, hoeveel tafels verwachten we dan te produceren?

Vraag 5

De volgende regressievergelijking wordt gegeven: Y = 559 + 0.3815X.
Wat is de verwachte waarde van Y voor X = 55.000?

Vraag 6

Gebruik de volgende regressievergelijking voor vragen 6-11.
Y = 100 + 21X

Interpreteer de helling van de regressielijn.

Vraag 7

Wat is de verandering in Y als X met +5 verandert?

Vraag 8

Wat is de verandering in Y wanneer X met -7 verandert?

Vraag 9

Wat is de voorspelde waarde van Y wanneer X = 14?

Vraag 10

Wat is de voorspelde waarde van Y wanneer X = 27?

Vraag 11

Bewijst deze vergelijking dat een verandering in X een verandering in Y veroorzaakt?

Vraag 12

Gebruik de volgende informatie voor vragen 12-15. Gezien de regressievergelijking
Y = 107 + 10X
Wat is de verandering in Y wanneer X met +2 verandert?

Vraag 13

Wat is de verandering in Y wanneer X met -4 verandert?

Vraag 14

Wat is de voorspelde waarde van Y als X = 15?

Vraag 15

Wat is de voorspelde waarde van Y als X = 22?

Vraag 16

Bereken de coëfficiënten voor een regressievergelijking van de kleinste kwadraten en schrijf de vergelijking op basis van de volgende steekproefgegevens: x̅ = 10; ȳ = 50; s_x = 80; s_y = 75; r_xy = 0.4; n = 60.

Vraag 17

Bereken de coëfficiënten voor een regressievergelijking van de kleinste kwadraten en schrijf de vergelijking op basis van de volgende steekproefgegevens: x̅ = 60; ȳ = 50; s_x = 80; s_y = 65; r_xy = 0.7; n = 60.

Vraag 18

Bereken de coëfficiënten voor een regressievergelijking van de kleinste kwadraten en schrijf de vergelijking op basis van de volgende steekproefgegevens: x̅ = 90; ȳ = 100; s_x = 60; s_y = 70; r_xy = 0.4; n = 60.

Vraag 19

De volgende informatie wordt verstrekt: SSE = 17,89 en SST = 68,22. Wat is de procentuele verklaarde variabiliteit?

Vraag 20

Welke absolute waarde van de t-statistiek duidt op een relatie tussen twee variabelen wanneer we een tweezijdige test gebruiken met α = 0,05 en n> 60?

Vraag 21

Gegegeven het enkelvoudige regressiemodel
\ [Y = \ beta_ {0} + \ beta_ {1} X \]
en de regressieresultaten die volgen, test de nulhypothese dat de hellingcoëfficiënt nul is versus de alternatieve hypothese dat de hellingcoëfficiënt van nul verschilt met behulp van de kans op een type I fout gelijk aan 0,005 en bepaal het tweezijdige 99% betrouwbaarheidsinterval. De volgende steekproefgegevens worden verstrekt: n = 22; b₁ = 0,3815; s_b1 = 0,0253.

Vraag 22

Gebruik het anwoord op de vorige vraag. Wat kun je concluderen op basis van dit resultaat over de hellingscoëfficiënt?

Vraag 23

Welke vier factoren resulteren in smallere voorspellingsintervallen?

Vraag 24

Gebruik de volgende informatie voor vragen 24-26. Stel dat we H₀ willen testen: ρ = 0 tegen H₁: ρ > 0 met behulp van de voorbeeldinformatie: n = 49 en r = 0,42.
Wat is de teststatistiek?

Vraag 25

Wat is de kritische waarde als we testen op een significantieniveau van 0,05%?

Vraag 26

Wat concluderen we op basis hiervan over de populatiecorrelatie?

Vraag 27

Stel dat we de volgende informatie hebben: _n = 25. Gebruikmakend van de vuistregel voor het testen van de hypothese dat de populatiecorrelatie nul is, wat moet dan de absolute waarde zijn van de steekproefcorrelatie die moet worden overschreden om deze nulhypothese te verwerpen?

Vraag 28

Stel dat we de volgende informatie hebben: n = 64. Gebruik de vuistregel voor het testen van de hypothese dat de populatiecorrelatie nul is, wat moet de absolute waarde zijn van de steekproefcorrelatie die moet worden overschreden om deze nulhypothese te verwerpen?

Vraag 29

Welke twee factoren kunnen de geschatte regressievergelijking beïnvloeden?

Vraag 30

Punten met een hoge leverage hebben een .... standaardfout van het residu.

Antwoordindicatie

Vraag 1

$b_{1} = \frac{Cov(x,y)}{s^{2}_{x}} = r \frac{s_{y}}{s_{x}} = \frac{106.93}{42.01} = 2.545$

Vraag 2

$b_{0} = \bar{y} - b_{1}\bar{x} = 41.2 - 2.545(21.3) = -13.02$

Vraag 3

$\bar{y} = b_{0} + b_{1}x = -13.02 + 2.545x$

Vraag 4

$\hat{y} = -13.02 + 2.545(25) = 50.605$

Vraag 5

Y = 559 + 0.3815*55,000 = 21,542

Vraag 6

Voor elke wijziging van één eenheid in X, verandert Y met 21.

Vraag 7

Als X met +5 verandert, verandert Y met (21)(5) = 105

Vraag 8

Als X met -7 verandert, verandert Y met (21)(-7) = -147

Vraag 9

Y = 100 + (21)(14) = 394

Vraag 10

Y = 100 + (21)(27) = 667

Vraag 11

Nee, regressieresultaten vatten de informatie in de data samen. Ze bewijzen geen oorzakelijk verband.

Vraag 12

Als X verandert met +2, verandert Y met (10)(2) = 20

Vraag 13

Als X met -4 verandert, verandert Y met (10)(-4) = 40

Vraag 14

Y = 107 + (10)(15) = 257

Vraag 15

Y = 107 + (10)(22) = 327

Vraag 16

$b_{1} = r\frac{s_{Y}}{s_{X}} = 0.4 \frac{75}{80} = 0.375$

$b_{0} = \bar{y} = b_{1}\bar{x} = 50 - 0.43(10) = 46.25$

$\hat{y}_{i} = 46.25 + 0.375x_{i}$

Vraag 17

$b_{1} = r\frac{s_{Y}}{s_{X}} = 0.7 \frac{65}{80} = 0.8125$

$b_{0} = \bar{y} = b_{1}\bar{x} = 50 - 0.8125(60) = 1.25$

$\hat{y}_{i} = 1.25 + 0.8125x_{i}$

Vraag 18

$b_{1} = r\frac{s_{Y}}{s_{X}} = 0.4 \frac{70}{60} = 0.467$

$b_{0} = \bar{y} = b_{1}\bar{x} = 100 - 0.467(90) = 58$

$\hat{y}_{i} = 58 + 0.467x_{i}$

Vraag 19

$R^{2} = 1 - \frac{SSE}{SST} = 1 - \frac{17.89}{68.22} = 0.738$
Aldus wordt 73,80% van de variabiliteit verklaard door het regressiemodel.

Vraag 20

Volgens de vuistregel moet de absolute waarde van de t-statistiek van de student groter zijn dan 2,0 om aan te geven dat er een relatie is.

Vraag 21

Voor een betrouwbaarheidsinterval van 99% hebben we 1 - α = 0,05 en n - 2 = 22 - 2 = 20 vrijheidsgraden. Uit bijlage Tabel 8 (zie boek) volgt dus dat:

$t_{n-2,\alpha/2} = t_{20,0.005} = 2.845$
Dus, het 99% betrouwbaarheidsinterval is:

$0.3815 - (2.845)(0.0253) < \beta_{1} < 0.381 + (2.845)(0.0253)$

$0.3095 < \beta_{1} < 0.4535$

Vraag 22

Het betrouwbaarheidsinterval omvat niet de nul, daarom kunnen we de nulhypothese verwerpen en concluderen dat de hellingscoëfficiënt niet gelijk is aan nul.

Vraag 23

1. Een grotere steekproefgrootte (n)
2. Een kleinere waarde van s²_e
3. Een grote spreiding van de waarnemingen van de onafhankelijke variabele
4. Een kleinere waarde van de eenheid (x_n+1 - x̅)²

Vraag 24

$t = \frac{0.43 \sqrt{(49 - 2)}}{\sqrt{1 - (0.43)^{2}}} = 3.265$

Vraag 25

Aangezien er (n - 2) = 47 vrijheidsgraden is, volgt uit aanhangsel tabel 8 dat t_47,0.005 = 2.704

Vraag 26

t_47,0.005 = 2.704 < t. Daarom kunnen we de nulhypothese verwerpen. Er zijn sterke aanwijzingen voor een positief lineair verband tussen de twee variabelen. Merk echter op dat we uit dit resultaat niet kunnen concluderen dat de ene variabele de andere heeft veroorzaakt, maar alleen dat ze gerelateerd zijn.

Vraag 27

$|r| > \frac{2}{\sqrt{n}} = \frac{2}{\sqrt{25}} > 0.4$

Vraag 28

$|r| > \frac{2}{\sqrt{n}} = \frac{2}{\sqrt{64}} > 0.25$

Vraag 29

Punten met een hoge leverage en uitbijters.

Vraag 30

Kleiner

Hoe werkt een meervoudige regressie? - TentamenTests 12

Vragen

Vraag 1

Gebruik het volgende geschatte lineaire model voor vragen 1 - 4:

$\hat{y} = 12 + 5_{x1} + 6_{x2} + 2_{x3}$
Bereken de verwachte waarde van y wanneer x₁ = 11, x₂ = 24, en x₃ = 27.

Vraag 2

Bereken de verwachte waarde van y wanneer x₁ = 31, x₂ = 20, en x₃ = 17.

Vraag 3

Bereken de verwachte waarde van y wanneer x₁ = 32, x₂ = 29, en x₃ = 13.

Vraag 4

Bereken de verwachte waarde van y wanneer x₁ = 30, x₂ = 26, en x₃ = 29.

Vraag 5

Gebruik het volgende geschatte lineaire model voor vragen5 - 8:

$\hat{y} = 10 + 5_{x1} + 4_{x2} + 2_{x3}$
Bereken de verwachte waarde van y wanneer x₁ = 20, x₂ = 11, en x₃ = 10.

Vraag 6

Bereken de verwachte waarde van y wanneer x₁ = 15, x₂ = 14, en x₃ = 20.

Vraag 7

Bereken de verwachte waarde van y wanneer x₁ = 35, x₂ = 19, en x₃ = 25.

Vraag 8

Bereken de verwachte waarde van y wanneer x₁ = 10, x₂ = 17, en x₃ = 30.

Vraag 9

Gebruik het volgende geschatte lineaire model voor vragen9-11:

$\hat{y} = 10 - 2_{x1} - 14_{x2} + 6_{x3}$
Wat is de verandering in y wanneer x₁ stijgt met 4?

Vraag 10

Wat is de verandering in y wanneer x₃ stijgt met 1?

Vraag 11

Wat is de verandering in y wanneer x₂ stijgt met 2?

Vraag 12

Wat is de vijfde assumptie van een meervoudig lineair regressiemodel?

Vraag 13

Bereken de regressiecoëfficiënt b₁ voor het volgende regressiemodel:

$\hat{y}_{i} = b_{0} + b_{1}x_{1i} + b_{2}x_{x2i}$
gegeven de volgende steekproefgegevens:
r_x1y = 0.80, r_x2y = 0.30, r_x1x2 - 0.90, s_x1 = 500, s_x2 = 400, s_y = 100

Vraag 14

Bereken de regressiecoëfficiënt b₂ voor het regressiemodel van de vorige vraag.

Vraag 15

De volgende gegevens zijn beschikbaar: n = 25; K = 2; SSE = 0,0625; SST = 0,4640.
Bereken de aangepaste bepalingscoëfficiënt.

Vraag 16

Wanneer heeft de aangepaste bepalingscoëfficiënt de voorkeur boven de standaard bepalingscoëfficiënt?

Vraag 17

Hoe is de meervoudige correlatiecoëfficiënt gerelateerd aan de meervoudige bepalingscoëfficiënt?

Vraag 18

Gebruik de volgende gegevens voor vragen 18-20:
b₁ = 0.2372; s_b1 = 0.0556; b₂ = -0.000249; s_b2 = 0.00003205.
Wat is de kritieke t waarde voor een tweezijdige toets met een 99% betrouwbaarheidsinterval?

Vraag 19

Geef het 99% betrouwbaarheidsinterval voor β₁.

Vraag 20

Geef het 99% betrouwbaarheidsinterval voor β₂.

Vraag 21

Overweeg de volgende informatie voor vragen 21-24. Een onderzoeker test de invloed van vier onafhankelijke variabelen op een bepaalde afhankelijke variabele met behulp van multiple regressie (n = 88). Hij vindt, voor het complete model met vier voorspellende variabelen, dat SSE = 1.149,14. Voor een meervoudig regressiemodel met slechts twee van de vier voorspellende variabelen, vindt hij: SSE = 1.426.93. De variantieschatter is s2e = 13.52. Bereken de F-statistiek.

Vraag 22

Hoeveel vrijheidsgraden heeft de F-statistiek?

Vraag 23

Wat is de kritische waarde voor F met een significantieniveau van 0,01?

Vraag 24

Wat is een dummy-variabele?

Vraag 25

Formuleer de nulhypothese en de alternatieve hypothese voor het testen van de hellingscoëfficiënt in het geval van dummy variabelen.

Vraag 26

Wat is de modelconstante wanneer de dummy variabele gelijk is aan 1 in de volgende vergelijking, waarbij x₁ een continue variabele is en x₂ een dummy variabele is?

$\hat{y} = 9 + 6x_{1} + 9x_{2}$

Vraag 27

Wat is de modelconstante wanneer de dummy variabele gelijk is aan 1 in de volgende vergelijking, waarbij x₁ een continue variabele is en x₂ een dummy variabele is?

$\hat{y} = 7 + 4x_{1} + 2x_{2}$

Vraag 28

Wat is de modelconstante wanneer de dummy variabele gelijk is aan 1 in de volgende vergelijking, waarbij x₁ een continue variabele is en x₂ een dummy variabele is?

$\hat{y} = 4 + 4x_{1} + 8x_{2} + 9x_{1}x_{2}$

Vraag 29

Overweeg de volgende vergelijking: y_i = 2x^1.4
Bereken de waarde van y_i wanneer x_i = 1

Vraag 30

Overweeg de volgende vergelijking: y_i = 2x^1.4
Bereken de waarde van y_i wanneer x_i = 1

Antwoordindicatie

Vraag 1

$\hat{y} = 12 + (5)(11) + (6)(24) + (2)(27) = 265$

Vraag 2

$\hat{y} = 12 + (5)(31) + (6)(20) + (2)(17) = 321$

Vraag 3

$\hat{y} = 12 + (5)(32) + (6)(29) + (2)(13) = 372$

Vraag 4

$\hat{y} = 12 + (5)(30) + (6)(26) + (2)(9) = 336$

Vraag 5

$\hat{y} = 10 + (5)(20) + (4)(11) + (2)(10) = 174$

Vraag 6

$\hat{y} = 10 + (5)(15) + (4)(14) + (2)(20) = 181$

Vraag 7

$\hat{y} = 10 + (5)(35) + (4)(19) + (2)(25) = 311$

Vraag 8

$\hat{y} = 10 + (5)(10) + (4)(17) + (2)(30) = 188$

Vraag 9

De verandering in y wanneer x₁ stijgt met 4 is (2)(4) = 8.

Vraag 10

De verandering in y wanneer x₃ stijgt met 1 is (6)(1) = 6.

Vraag 11

De verandering in y wanneer x₂ stijgt met 2 is (14)(2) = 28.

Vraag 12

Er is geen direct lineair verband tussen de onafhankelijke variabelen.

Vraag 13

$b_{1} = \frac{ s_{y} (r_{x1y} - r_{x1x2}r_{x2y} ) }{s_{x1} (1 - r^{2}_{x1x2})} = \frac{100 (0.80 - 0.90*0.30)}{500 (1 - 0.90^{2}) = 0.56 }$

Vraag 14

$b_{2} = \frac{s_{y} (r_{x2y} - r_{x1x2} r_{x1y} ) }{s_{x2} (1 - r^{2}_{x1x2})} = \frac{100 (0.30 - 0.90*0.80)}{400 (1 - 0.90^{2}) = -0.55 }$

Vraag 15

$\bar{R}^{2} = 1 - \frac{0.0625/22}{0.4640/24} = 0.853$

Vraag 16

De aangepaste bepalingscoëfficiënt corrigeert voor het feit dat niet-relevante onafhankelijke variabelen resulteren in een (kleine) vermindering van de foutensom van vierkanten (SSE). Als gevolg hiervan biedt de aangepaste bepalingscoëfficiënt een betere vergelijking tussen meerdere regressiemodellen met verschillende aantallen onafhankelijke variabelen.

Vraag 17

De coëfficiënt van meervoudige correlatie is gelijk aan de wortel van de meervoudige bepalingscoëfficiënt.

Vraag 18

t_n-K-1,a/2 = t_22,0.005 = 2.819

Vraag 19

0.237 - (2.819)(0.05556) < β₁ < 0.237 + (2.819)(0.05556)
0.80 < β₁< 0.394

Vraag 20

-0.000249 - (2.819)(0.0000320) < β₂ < -0.000249 + (2.819)(0.0000320)
-0.000339 < β₂ < -0.000159

Vraag 21

$F = \frac{(1426.93 - 1149.14)/2}{13.52} = 10.27$

Vraag 22

De F-statistiek heeft 2 vrijheidsgraden (d.w.z. voor de twee gelijktijdig geteste variabelen) voor de teller en 85 vrijheidsgraden voor de noemer.

Vraag 23

F* = 4.9 (zie Appendix Tabel 9)

Vraag 24

Een dummy variabele is een variabele met twee mogelijke uitkomsten: 0 en 1.

Vraag 25

$H_{0}: \beta_{3} = 0 | \beta_{1} \neq 0, \beta_{2} \neq 0$

$H_{1}: \beta_{3} \neq 0 | \beta_{1} \neq 0, \beta_{2} \neq 0$

Vraag 26

Vraag 27

Vraag 28

Vraag 29

2.64

Vraag 30

5.28

Welke andere onderwerpen zijn belangrijk in regressie analyse? - TentamenTests 13

Vragen

Vraag 1

Wat zijn de vier fasen van modelbouw?

Vraag 2

Als het model niet kan worden geverifieerd, wat moet je dat doen?

Vraag 3

In een experimenteel ontwerp wordt de experimentele uitkomst (Y) gemeten op specifieke combinaties van niveaus voor ... en ... variabelen.

Vraag 4

Als een blokkeervariabele 4 niveaus heeft, hoeveel dummy-variabelen moeten dan worden aangemaakt?

Vraag 5

Wat is een behandelingsvariabele?

Vraag 6

Wat is een blokkeervariabele?

Vraag 7

Wat wordt er bedoeld met een vertraagde waarde?

Vraag 8

Wat is multicollineariteit?

Vraag 9

Stel, alle coëfficient student t statistieken zijn klein, maar de F statistiek is desalniettemin hoog. Waar is dit een indicatie voor?

Vraag 10

Geef drie manier om te corrigeren voor multicollineariteit.

Vraag 11

Wat is het gevaar van het corrigeren van multicollineariteit door een of meer sterk gecorreleerde onafhankelijke variabelen te verwijderen?

Vraag 12

Wat zijn de vier assumpties in een enkelvoudige lineaire regressieanalyse?

Vraag 13

Wat is de vijfde assumptie die wordt toegevoegd voor meervoudige regressieanalyse?

Vraag 14

Wat is heteroscedasticiteit?

Vraag 15

Beschrijf een procedure om te controleren op heteroscedasticiteit.

Vraag 16

Gebruik de volgende informatie voor vragen 16-18. Uit de regressie van de gekwadrateerde residuen op de voorspelde waarden, verkrijgen we het volgende geschatte model (voor n = 25):

$e^{2} = 0.00621 - 0.00550 \hat{y} \hspace{2mm} met \hspace{2mm} R^{2} = 0.066$
Bereken de teststatistiek.

Vraag 17

Wat is de kritische waarde als we testen met een significantieniveau van 10%?

Vraag 18

Kunnen we de nulhypothese verwerpen dat het regressiemodel een uniforme variantie heeft?

Vraag 19

Wat is de betekenis van ρ voor (auto) gecorreleerde fouten?

Vraag 20

Wat betekent het als ρ = 0?

Vraag 21

Wat betekent het als ρ = 0.3?

Vraag 22

Wat betekent het als als ρ = 0.9?

Vraag 23

Wat is de meest gebruikte test om mogelijke autocorrelatie van fouttermen te controleren?

Vraag 24

Formuleer de nulhypothese van deze test.

Vraag 25

Geef de beslissingsregels voor het toetsen van de nulhypothese aan de alternatieve hypothese: H1: ρ> 0.

Vraag 26

Geef de beslissingsregels voor het toetsen van de nulhypothese aan de alternatieve hypothese: H1: ρ <0.

Vraag 27

Stel dat we d = 0,2015 vinden, wat een positieve autocorrelatie aangeeft. Schat de seriële correlatie.

Vraag 28

Stel dat we d = 0,5213 vinden, wat een positieve autocorrelatie aangeeft. Schat de seriële correlatie.

Vraag 29

Bij het bepalen of de fouten in een regressiemodel positief gecorreleerd zijn voor het model

$y_{t} = \beta_{0} + \beta_{1}x_{1t} + \epsilon_{t}$
bepalen we

$\sum^{30}_{t = 1}e^{2}_{t} = 7587.9154$
en

$\sum^{30}_{t = 2} (e_{t} - e_{t - 1})^{2} = 8195.2065$
Formuleer de nul- en alternatieve hypothese voor de genoemde analyse.

Vraag 30

Bereken de Durbin-Watson-statistiek.

Antwoordindicatie

Vraag 1

Modelbouw bestaat uit vier fasen: (1) modelspecificatie; (2) coëfficiëntschatting; (3) modelverificatie, en; (4) interpretatie en gevolgtrekking.

Vraag 2

Ga terug naar de eerste fase: modelspecificatie.

Vraag 3

In een experimenteel ontwerp wordt de experimentele uitkomst (Y) gemeten op specifieke combinaties van niveaus voor behandeling- en blokkeervariabelen.

Vraag 4

Vraag 5

Een behandelingsvariabele is een variabele waarvan we het effect willen schatten met minimale variantie. We willen bijvoorbeeld graag weten welke van de vijf verschillende productiemachines de hoogste productiviteit per uur biedt. Voor dit voorbeeld is de behandelingsvariabele de productiemachine, vertegenwoordigd door een categorische variabele met vier niveaus.

Vraag 6

Een blokkerende variabele is een variabele die deel uitmaakt van de omgeving. Daarom kan het variabele niveau van een dergelijke variabele niet vooraf worden geselecteerd.

Vraag 7

Wanneer tijdreeksen worden geanalyseerd (d.w.z. wanneer metingen in de loop van de tijd worden genomen) zijn vertraagde waarden van de afhankelijke variabele een belangrijk probleem. Vaak is in tijdreeksgegevens de afhankelijke variabele in tijdsperiode t gerelateerd aan de waarde die door deze afhankelijke variabele wordt genomen in een eerdere tijdsperiode, dat is y_t-1. De vertraagde waarde is dan de waarde van de afhankelijke variabele in deze vorige periode.

Vraag 8

Multicollineariteit verwijst naar een toestand van zeer hoge intercorrelaties tussen de onafhankelijke variabelen.

Vraag 9

Multicollineariteit.

Vraag 10

1. Verwijder een of meer van de sterk gecorreleerde onafhankelijke variabelen.
2. Wijzig de modelspecificatie, inclusief mogelijk een nieuwe onafhankelijke variabele die een functie is van verschillende gecorreleerde onafhankelijke variabelen.
3. Verkrijg aanvullende gegevens die niet dezelfde sterke correlaties hebben tussen de onafhankelijke variabelen.

Vraag 11

Dit kan leiden tot een vertekening (bias) van de coëfficiëntschatting.

Vraag 12

1. De Y's zijn lineaire functies van X, plus een willekeurige foutterm.
2. De x-waarden zijn een vast getal dat onafhankelijk is van de fouttermen.
3. De fouttermen worden verondersteld willekeurige variabelen te zijn met een gemiddelde van nul en een covariantie van σ².
4. De willekeurige fouttermen zijn niet met elkaar gecorreleerd.

Vraag 13

Er is geen direct lineair verband tussen de onafhankelijke variabelen Xj.

Vraag 14

Heteroscedasticiteit verwijst naar de situatie waarin de fouttermen geen uniforme variantie hebben.

Vraag 15

Een mogelijkheid om te controleren op heteroscedasticiteit is door een spreidingsdiagram van de residuen versus de onafhankelijke variabele te onderzoeken. Als de grootte van de fouttermen de neiging heeft toe te nemen (of af te nemen) voor toenemende waarden van de onafhankelijke variabele, geeft dit aan dat de fouten varianties niet constant zijn.

Vraag 16

$nR^{2} = (25)(0.066) = 1.65$

Vraag 17

Uit Appendix Tabel 7 (zie het boek) blijkt dat de kritieke waarde voor een significantieniveau van 10% is: X²_1,0.10 = 2.706

Vraag 18

De teststatistiek overschrijdt de kritische waarde niet en daarom kan de nulhypothese niet worden afgewezen.

Vraag 19

Deze ρ is de correlatiecoëfficiënt (bereik -1 tot +1) tussen de fout in tijd t en de fout in het vorige tijdstip, dat wil zeggen t - 1.

Vraag 20

Als ρ = 0, betekent dit dat er geen autocorrelatie in de fouten is.

Vraag 21

Er is een relatief zwakke autocorrelatie.

Vraag 22

Er is een vrij sterke autocorrelatie.

Vraag 23

Durbin-Watson test.

Vraag 24

H₀: ρ = 0.

Vraag 25

Verwerp H₀ als d > d_L. Accepteer H₀ als d > d_u. Test is niet overtuigend als d_L < d < d_U.

Vraag 26

Verwerp H₀ als d > 4 - d_L. Accepteer H₀ als d < 4 - d_u. Test is niet overtuigend als 4 - d_L > d > 4 - d_U

Vraag 27

$r = 1 - \frac{d}{2} = 1 - \frac{0.2015}{2} = 0.90$

Vraag 28

$r = 1 - \frac{d}{2} = 1 - \frac{0.5213}{2} = 0.74$

Vraag 29

H₀: ρ = 0 and H₀: ρ > 0.

Vraag 30

$d = \frac{ \sum^{n}_{t = 2} (e_{t} - e_{t-1})^{2} }{\sum^{n}_{t=1} e^{2}_{t}} = \frac{8195.2065}{7587.9154} = 1.08$

Hoe kun je categorische data analyseren? - TentamenTests 14

Vragen

Gebruik de volgende gegevens voor vraag 1-4:

Categorie	A	B	C	D	Totaal
Geobserveerde frequenties	43	53	60	44	200
Kans (onder H₀)	1/4	1/4	1/4	1/4	1
Verwachte frequenties (onder H₀)	50	50	50	50	200

Vraag 1

Bereken de chi-kwadraat teststatistiek.

Vraag 2

Wat zijn de vrijheidsgraden voor de kritische teststatistiek?

Vraag 3

Geef het bereik van de teststatistiek met waarschijnlijkheid .10 en .90 met behulp van tabel 7a en 7b.

Vraag 4

Kunnen we de nulhypothese verwerpen dat er geen voorkeur is voor een van de vier categorieën?

Overweeg de volgende gegevens voor vraag 5-9.

Categorie	A	B	C	D	Totaal
Geobserveerde frequenties	50	93	45	12	200
Kans (onder H₀)	0.30	0.50	0.15	0.05	1
Verwachte frequenties (onder H₀)					200

Vraag 5

Bereken de verwachte waarden op basis van de nulhypothese die in de tabel is opgegeven.

Vraag 6

Bereken de chi-kwadraat teststatistiek.

Vraag 7

Hoeveel vrijheidsgraden zijn er?

Vraag 8

Uit Bijlage 7 met K - 1 vrijheidsgraden blijkt dat de teststatistiek tussen .... en .... valt

Vraag 9

Kan de nulhypothese worden afgewezen?

Overweeg de volgende gegevens voor vragen 10-14.

Categorie	A	B	C	D	Totaal
Geobserveerde frequenties	287	49	30	34	400
Kans (onder H₀)	0.80	0.10	0.06	0.04	1
Verwachte frequenties onder H₀					400

Vraag 10

Bereken de verwachte waarden op basis van de nulhypothese die in de tabel is opgegeven.

Vraag 11

Bereken de chi-kwadraat teststatistiek.

Vraag 12

Hoeveel vrijheidsgraden zijn er?

Vraag 13

Zoek de kritische waarde met een significantieniveau van 0,001.

Vraag 14

Kan de nulhypothese worden afgewezen?

Er wordt getest of de populatieverdeling Poisson is. Overweeg de volgende gegevens voor vragen 15-18:

Aantal gebeurtenissen	0	1	2	3+
Geobserveerde frequenties	156	63	29	14
Verwachte frequenties onder H₀	135.4	89.4	29.5	7.7

Vraag 15

Bereken de teststatistiek.

Vraag 16

Hoeveel vrijheidsgraden zijn er?

Vraag 17

Zoek de bijbehorende kritieke waarde met een significantieniveau van 0,001.

Vraag 18

Kan de nulhypothese dat de populatieverdeling Poisson is, worden afgewezen?

Vraag 19

Stel dat we geïnteresseerd zijn of mensen de voorkeur geven aan ananas op hun pizza. We nemen steekproef van 7 deelnemers onder de nulhypothese H0: P = 0,5. Wat is de kans om niet meer dan 2 personen met een voorkeur voor ananas op hun pizza te krijgen?

Vraag 20

Als onze teststatistiek voor een Sign-test gelijk is aan S = 2. Kunnen we de nulhypothese verwerpen?

Vraag 21

Gebruik de volgende informatie voor vragen 21-25. Een willekeurige steekproef van 100 studenten werd gevraagd om twee nieuwe ijssmaken te vergelijken: gegrilde BBQ en bubblegumverrassing. Na het testen van beide smaken, gaven 65 studenten de voorkeur aan gegrilde BBQ, 40 studenten aan de smaak van bubblegum en 4 gaven geen voorkeur uit. Gebruik de normale benadering om het gemiddelde en de standaarddeviatie te bepalen voor het prefereren van bubblegumverrassing.
Bereken de teststatistiek met behulp van de normale benadering en de continuïteitscorrectie.

Vraag 22

Zoek de geschatte p-waarde.

Vraag 23

Kunnen we de nulhypothese verwerpen?

Vraag 24

Wat wordt de teststatistiek als de continuïteitscorrectie niet wordt gebruikt?

Vraag 25

Gegeven een willekeurige steekproef van n = 31 gematchte paren, bereken het gemiddelde en de standaarddeviatie voor de Wilcoxon-statistiek onder de nulhypothese.

Vraag 26

Stel nu dat we ontdekken dat de waargenomen waarde van de statistiek T = 189 is. Als we de nulhypothese toetsen aan een lagere-staart alternatieve hypothese met significantieniveau 0,05, wat kunnen we dan concluderen over de nulhypothese?

Vraag 27

Twee onafhankelijke monsters worden beschouwd met n1 = 10, n2 = 12 en R1 = 93.5.

Vraag 28

Bereken het gemiddelde en de variantie voor de Mann-Whitney-statistiek.

Vraag 29

Bereken de Mann-Whitney U-statistiek.

Antwoordindicatie

Vraag 1

X² = 3.88

Vraag 2

df = K - 1 = 4 - 1 = 3.

Vraag 3

Onderste kritische waarde (Appendix Tabel 7b) X²_3,0.90 = 0.584
Bovenste kritische waarde (Appendix Tabel 7a) X²_3,0.10 = 6.251

Vraag 4

Het blijkt dat de teststatistiek van 3,88 tussen 0,584 en 6,251 ligt; hieruit volgt dat 0,10

Vraag 5

E_A = nP_A = 200(0.30) = 60
E_B = nP_B = 200(0.50) = 100
E_C = nP_C = 200(0.15) = 30
E_D = nP_D = 200(0.05) = 10

Vraag 6

X² = 10.06

Vraag 7

df = K - 1 = 4 - 1 = 3.

Vraag 8

Uit Appendix Bijlage 7 met K - 1 vrijheidsgraden blijkt dat de teststatistiek tussen 9.348 en 11.345 ligt.

Vraag 9

0.001 < p-waarde < 0.025. Dus, de nulhypothese kan worden verworpen.

Vraag 10

E_A = nP_A = 400(0.80) = 320
E_B = nP_B = 400(0.10) = 40
E_C = nP_C = 400(0.06) = 24
E_D = nP_D = 400(0.04) = 16

Vraag 11

X² = 27.178

Vraag 12

df = K - 1 = 4 - 1 = 3.

Vraag 13

Uit Appendix Bijlage 7 met K - 1 vrijheidsgraden blijkt dat de teststatistiek gelijk is aan X²_3,0.001 = 16.266

Vraag 14

De test statistiek is veel groter dan de kritische waarde, dus de nulhypothese kan worden verworpen.

Vraag 15

X² = 16.08

Vraag 16

df = K - m - 1 = 4 - 1 - 1 = 2

Vraag 17

X²_2,0.001 = 13.816

Vraag 18

De teststatistiek overschrijdt de kritische waarde, dus de nulhypothese dat de populatieverdeling Poisson is, kan worden afgewezen op het significantieniveau van 0,01%.

Vraag 19

p-waarde = P(x < 2) = 0.227 (ziee Appendix Tabel 3)

Vraag 20

Nee, met een p-waarde zo groot kan de nulhypothese niet worden afgewezen.

Vraag 21

Laat P de populatie zijn die de voorkeur geeft aan bubblegum-verrassing, gegeven S = 40.

$\mu = np = 0.5n = 0.5(96) = 48$

$\sigma = 0.5 \sqrt{96} = 4.899$

Vraag 22

Since 40 < 48, S* = 40.5

$z = \frac{S* - \mu}{\sigma} = \frac{40.5 - 48}{4.899} = -1.53$ Uit de standaard normale verdeling volgt dat de geschatte p-waarde = 2 (0,0630) = 0,126

Vraag 23

De nulhypothese kan worden afgewezen op alle significantieniveaus van meer dan 12,6%.

Vraag 24

Als geen continuïteitscorrectiefactor wordt gebruikt, wordt de waarde voor de teststatistiek Z = -1.633, wat een iets kleinere p-waarde van 0,1024 oplevert.

Vraag 25

$\mu_{T} = \frac{n(n + 1)}{4} = \frac{(31)(32)}{4} = 248$

$Var(T) = \sigma^{2}_{T} = \frac{n(n + 1)(2n + 1)}{24} = \frac{ (31)(32)(63) }{24} = 2604$

$\sigma_{T} = \sqrt{2604} = 51.03$

Vraag 26

$Z = \frac{T - \mu_{T}}{\sigma_{T}} = \frac{189 - 248}{51.03} = \frac{-59}{51.03} = -1.16$
Voor α = 0.05, z_α = -1.645
De teststatistiek overschrijdt de kritieke waarde niet, daarom is er onvoldoende bewijs om de nulhypothese te verwerpen.

Vraag 27

\[ E(U) = \mu_{U} = \frac{n₁n₂}{2} = \frac{ (10)(12) }{2} = 60 \]
\[ Var(U) = \sigma^{2}_{U} = \frac{ n₁n₂ (n₁ + n₂ + 1) }{12} = \frac{ (10)(12)(23) }{12} = 230 \]

Vraag 28

$Z = \frac{U - \mu{U}}{\sigma_{U}} = \frac{81.5 - 60}{ \sqrt{230} } = 1.42$

Vraag 29

De bijbehorende p-waarde = 0,1556. Met een significantieniveau van 0,05 is dit testresultaat niet voldoende om te concluderen dat de nulhypothese kan worden verworpen.

Hoe werkt de analyse van variantie? - TentamenTests 15

Vragen

Vraag 1

Wat is de nulhypothese van een eenwegs ANOVA?

Vraag 2

Stel dat we de volgende gegevens hebben gevonden: SSW = 12.18, n = 20, k = 3. Bereken een schatting van het gemiddelde binnen de groepen.

Vraag 3

Stel dat we de volgende gegevens hebben gevonden: SSG = 21.55, n = 20, k = 3. Bereken een schatting van het gemiddelde tussen de groepen.

Vraag 4

Bereken de F ratio voor de MSW en MSG berekenen in de vorige twee vragen.

Vraag 5

Wat zijn de vrijheidsgraden die overeenkomen met de informatie in vraag 2 en 3.

Vraag 6

Wat is de kritische F waarde als we testen met een significantieniveau van 1%?

Vraag 7

Wat kunnen we concluderen over de populatiegemiddelden op basis van deze F-ratio?

Beschouw de volgende variantie-analyse voor vraag 8-13.

Bron van variantie	SS	Vrijheidsgraden	MS	F-ratio
Tussen groepen	1728	4
Binnen groepen	624	..
Totaal	2352	17

Vraag 8

Hoeveel vrijheidsgraden heeft de binnen groepen SS?

Vraag 9

Bereken de tussen groepen MS.

Vraag 10

Bereken de binnen groepen MS.

Vraag 11

Bereken de F-ratio.

Vraag 12

Zoek de kritische F-waarde die overeenkomt met een significantieniveau van 0,05.

Vraag 13

Wat kan worden geconcludeerd over de nulhypothese?

Beschouw de volgende variantieanalyse voor vragen 14-19.

Bron van variantie	SS	Vrijheidsgraden	MS	F-ratio
Tussen groepen	879	..
Binnen groepen	798	16
Totaal	1677	19

Vraag 14

Hoeveel vrijheidsgraden heeft de tussen groepen SS?

Vraag 15

Bereken de tussen groepen MS.

Vraag 16

Bereken de binnen groepen MS.

Vraag 17

Bereken de F-ratio.

Vraag 18

Zoek de kritische F-waarde die overeenkomt met een significantieniveau van 0,05.

Vraag 19

Wat kan worden geconcludeerd over de nulhypothese?

Overweeg voor vraag 20-28 een tweewegs ANOVA met één waarneming per cel en gerandomiseerde blokken met de volgende resultaten:

Bron van variantie	SS	Vrijheidsgraden	MS	F-ratio
Tussen groepen	3636	33	MSG = SSG / (K - 1)
Tussen blokken	7575	66	MSB = SSB / (H - 1)
Fout (error)	9999	1818	MSE = SSE / ((K - 1) (H - 1))
Totaal	210210	2727

Vraag 20

Bereken de MS tussen groepen.

Vraag 21

Bereken de MS binnen groepen.

Vraag 22

Bereken de MS voor de foutenterm.

Vraag 23

Bereken de F-ratio MSG / MSE.

Vraag 24

Zoek de kritische waarde voor de hypothesetest dat de gemiddelden tussen de groepen gelijk zijn met een significantieniveau van 5%.

Vraag 25

Wat kunnen we concluderen over de nulhypothese dat de gemiddelden tussen groepen gelijk zijn?

Vraag 26

Bereken de F-ratio MSB / MSE.

Vraag 27

Zoek de kritische waarde voor de hypothesetest dat de tussenblokgemiddelden gelijk zijn met een significantieniveau van 5%.

Vraag 28

Wat kunnen we concluderen over de nulhypothese dat de tussenblokgemiddelden gelijk zijn?

Overweeg de volgende gegevens voor vragen 29-30.

Bron van variantie	SS	Vrijheidsgraden	MS	F-ratio
Tussen groepen	62.04	1	62.04
Tussen blokken	0.06	1	0.06
Interactie	1.85	...	1.85
Fout (error)	23.31	63	0.37
Totaal	87.26	66

Vraag 29

Bereken het aantal vrijheidsgraden voor de interactie term.

Vraag 30

Bereken de F-ratio voor de interactie term.

Antwoordindicatie

Vraag 1

Alle populatie gemiddelden zijn gelijk aan elkaar: H₀: μ₁ = μ₂ = ... = μ_k voor K populaties.

Vraag 2

MSW = (12.18) / (20 - 3) = 0.72

Vraag 3

MSG = (21.55) / (3 - 1) = 10.78

Vraag 4

F = MSG / MSW = 10.78 / 0.72 = 15.039

Vraag 5

df = (K - 1) = 3 - 1 = 2 voor de teller.
df = (n - K) = 20 - 3 = 17 voor de noemer

Vraag 6

F_2,17,0.01 = 6.112 (Appendix Tabel 9)

Vraag 7

De testwaarde (15.039) overschrijdt de kritische waarde (6.112), daarom kunnen we de nulhypothese verwerpen dat het populatiegemiddelde hetzelfde is voor alle drie groepen.

Vraag 8

K - 1 = 4 is, dus K = 5.
n - 1 = 17 , dus n = 18.
df = N - k = 18 - 5 = 13.

Vraag 9

MSG = SSG / (K - 1) = 1728 / 4 = 432

Vraag 10

MSW = SSW / (n - K) = 624 / 13 = 48

Vraag 11

F = MSG / MSW = 246.86 / 48 = 9

Vraag 12

F_4,13,0.05= 3.179

Vraag 13

F > F_4,13,0.05, dus we kunnen de nulhypothese van gelijke populatie gemiddelden niet verwerpen.

Vraag 14

n - 1 = 19 --> n = 20
n - k = 16 --> 20 - k = 16 --> k = 4
df = k - 1 = 4 - 1 = 3

Vraag 15

MSG = SSG / (K - 1) = 879 / 3 = 293

Vraag 16

MSW = SSW / (n - K) = 798 / 16 = 49.875

Vraag 17

F = MSG / MSW = 293 / 49.875 = 5.875

Vraag 18

F_3,16,0.05= 3.239

Vraag 19

F < F_3,16,0.05, dus we kunnen de nulhypothese van gelijke populatie gemiddelden niet verwerpen.

Vraag 20

MSG = SSG / (K - 1) = 3636 / 33 = 110.18

Vraag 21

MSB = SSB / (H - 1) = 7575 / 66 = 114.77

Vraag 22

MSE = SSE / ((K - 1) (H - 1)) = 9999 / 1818 = 5.5

Vraag 23

F = MSG / MSE = 110.18 / 5.5 = 20.03

Vraag 24

F_33,1818,0.05 = 1.676

Vraag 25

De teststatistiek overschrijdt de kritische waarde, daarom kunnen we de nulhypothese verwerpen dat de gemiddelden tussen blokken gelijk zijn.

Vraag 26

F = MSB / MSE = 114.77 / 5.5 = 20.87

Vraag 27

F_66,9999,0.05 = 1.676

Vraag 28

De teststatistiek overschrijdt de kritische waarde, daarom kunnen we de nulhypothese verwerpen dat de gemiddelden tussen blokken gelijk zijn.

Vraag 29

df = 1

Vraag 30

F = MSI / MSE = 1.85 / 0.37 = 5.

Hoe kun je data met metingen in de loop van de tijd analyseren? - TentamenTests 16

Vragen

Vraag 1

Wat wordt bedoeld met een tijdreeks?

Vraag 2

Wat zijn de vier componenten van een tijdreeks?

Vraag 3

Laat de schattingen van niveau en trend in jaar 5 als volgt zijn:

$\hat{x}_{5} = 347$

$T_{5} = 13$
Wat is de verwachting voor het volgende jaar met de Holt-Winters-methode?

Vraag 4

Wat is de voorspelling voor jaar 7 met de Holt-Winters-methode voor niet-seizoensgebonden series?

Vraag 5

Wat is de voorspelling voor jaar 8 met behulp van de Holt-Winters-methode voor niet-seizoensgebonden series?

Vraag 6

Wat is de voorspelling voor jaar 9 met de Holt-Winters-methode voor niet-seizoensgebonden series?

Vraag 7

Stel dat we 32 waarnemingen hebben en een seizoensfactor s = 4 die kwartaalgegevens aangeeft. Noteer de vergelijking voor de voorspelling van de volgende waarneming na het einde van de reeks. Gebruik hiervoor de door Holt-Winters ontwikkelde methode voor seizoensreeksen.

Vraag 8

Wat is de nulhypothese in een autoregressief model?

Vraag 9

Geef de algemene vergelijking die een reeks weergeeft volgens het autoregressieve model.

Vraag 10

Welk algoritme wordt gebruikt om de parameters voor het autoregressieve model te verkrijgen?

Antwoordindicatie

Vraag 1

Een tijdreeks is een reeks metingen, geordend in de tijd, voor een bepaalde hoeveelheid interesse. In een tijdreeks is de volgorde van waarnemingen belangrijk.

Vraag 2

T_t: trend component
S_t: seizoensgebonden component
C_t: Cyclische component
I_t: Onregelmatige component

Vraag 3

$\hat{x}_{6} = 347 + 13 = 360$

Vraag 4

$\hat{x}_{7} = 347 + (2)(13) = 373$

Vraag 5

$\hat{x}_{8} = 347 + (3)(13) = 386$

Vraag 6

$\hat{x}_{8} = 347 + (4)(13) = 399$

Vraag 7

$\hat{x}_{n+h} = ( \hat{x}_{n} + hT_{n} ) F_{n+h-s} = \hat{x}_{33} = (\hat{x}_{32} + T_{32}) F_29$

Vraag 8

H₀: Φ_p = 0

Vraag 9

$x_{t} = \gamma + \phi_{1}x_{t - 1} + \gamma + \phi_{2}x_{t - 2} + ... + \gamma + \phi_{p}x_{t - p} + \epsilon_{t}$

Vraag 10

Het least squares (kleinste kwadraten) algoritme.

Welke andere procedures zijn er beschikbaar voor het trekken van steekproeven? - TentamenTests 17

Vragen

Vraag 1

Stel dat we een gestratificeerde steekproeftrekkingsprocedure hebben uitgevoerd. Gebruik de volgende informatie voor vraag 1-7:
N₁ = 75; N₂ = 30; N₃ = 125.
n₁ = 15; n₂ = 8; n₃ = 25.
x̄₁= 21.2; s₁ = 12.8.
x̄₂= 13.3; s₂ = 11.4.
x̄₃= 26.1; s₃ = 9.2.
Bereken de puntschatting van het populatiegemiddelde.

Vraag 2

Bereken de puntschatting van de variantie voor het eerste stratum.

Vraag 3

Bereken de puntschatting van de variantie voor het tweede stratum.

Vraag 4

Bereken de puntschatting van de variantie voor het derde stratum.

Vraag 5

Bereken de puntschatting van de variantie voor het populatiegemiddelde.

Vraag 6

Bereken de puntschatting van de standaarddeviatie voor het populatiegemiddelde.

Vraag 7

Bereken een betrouwbaarheidsinterval van 95% voor het populatiegemiddelde.

Vraag 8

Stel dat we een gestratificeerde steekproeftrekkingsprocedure hebben uitgevoerd. Gebruik de volgende informatie voor vraag 8 - 13:
N₁ = 364; N₂ = 1031.
n₁ = 40; n₂ = 60.
p(geschat)₁= 7/40 = 0.175
p(geschat)₂= 13/60 = 0.217
Bereken de puntschatting van de populatie proportie.

Vraag 9

Bereken de puntschatting van de variantie van de proportie voor het eerste stratum.

Vraag 10

Bereken de puntschatting van de variantie van de proportie voor het tweede stratum.

Vraag 11

Bereken de puntschatting van de variantie van de proportie voor de populatie.

Vraag 12

Bereken de puntschatting van de standaarddeviatie van de populatie proportie.

Vraag 13

Bereken het 90% betrouwbaarheidsinterval voor het populatiepercentage uit deze gestratificeerde steekproeven.

Vraag 14

Gebruik de volgende informatie voor vragen 14-16. Stel dat we een totaal van N = 125 hebben dat is verdeeld in drie strata met N₁ = 75, N₂ = 30 en N₃ = 20. Stel nu dat we een steekproef willen selecteren met n = 25. Bereken de steekproefgrootte voor het eerste stratum met behulp van proportionele toewijzing.

Vraag 15

Bereken de steekproefgrootte voor het tweede stratum met behulp van proportionele toewijzing.

Vraag 16

Bereken de steekproefgrootte voor het derde stratum met behulp van proportionele toewijzing.

Vraag 17

Gebruik de volgende informatie voor vragen 17-19. Stel dat we in totaal N = 225 hebben die is verdeeld in drie lagen met N₁ = 100, N2 = 75 en N₃ = 50. Stel nu dat we een steekproef willen selecteren met n = 50. Bereken de steekproefgrootte voor het eerste stratum met behulp van proportionele toewijzing.

Vraag 18

Bereken de steekproefgrootte voor het tweede stratum met behulp van proportionele toewijzing.

Vraag 19

Bereken de steekproefgrootte voor het derde stratum met behulp van proportionele toewijzing.

Vraag 20

Gebruik de volgende informatie voor vragen 20-22. Stel dat we in totaal N = 225 hebben die is verdeeld in drie lagen met N₁ = 250, N2 = 100 en N₃ = 150. Stel nu dat we een steekproef willen selecteren met n = 50.Bereken de steekproefgrootte voor het eerste stratum met behulp van proportionele toewijzing.

Vraag 21

Bereken de steekproefgrootte voor het tweede stratum met behulp van proportionele toewijzing.

Vraag 22

Bereken de steekproefgrootte voor het derde stratum met behulp van proportionele toewijzing.

Vraag 23

Gebruik de volgende informatie voor vragen 23-25. Stel dat we in totaal N = 225 hebben die is verdeeld in drie lagen met N₁ = 250, N₂ = 100 en N₃ = 150. Stel nu dat we een steekproef willen selecteren met n = 50. Bereken de steekproefgrootte voor het eerste stratum met behulp van proportionele toewijzing.

Vraag 24

Bereken de steekproefgrootte voor het tweede stratum met behulp van proportionele toewijzing.

Vraag 25

Bereken de steekproefgrootte voor het derde stratum met behulp van proportionele toewijzing.

Vraag 26

Wat is het verschil tussen proportionele allocatie en optimale allocatie qua steekproefinspanning?

Vraag 27

Wat is het verschil tussen de proportionele allocatie en de optimale allocatie bij het schatten van de steekproefomvang voor strata voor populatieverhoudingen?

Vraag 28

Wat is het verschil tussen gestratificeerde steekproeftrekking en clustersteekproeftrekking?

Vraag 29

Noem één voordeel en één nadeel van clustersteekproeftrekking.

Vraag 30

Noem één voordeel en één nadeel van steekproeftrekking in twee fasen.

Antwoordindicatie

Vraag 1

$\bar{x}_{st} = \frac{1}{N} \ sum^{K}_{j = 1} N_{j}\bar{x}_{j} = \frac{ (75)(21.2) + (30)(13.3) + (20)(26.1) }{125} = 20.09$

Vraag 2

$\hat{\sigma}^{\frac{2}{x_{1}}} = \frac{ s^{2}_{1} }{n_{1}} x \frac{ (N_{1} - n_{1} ) }{N_{1} - 1 } = \frac{s^{2}_{1}}{n_{1}} x \frac{ (N_{1} - n_{1}) }{N_{1} - 1} = \frac{(12.8)^{2}}{15} x \frac{60}{74} = 8.856$

Vraag 3

$\hat{\sigma}^{\frac{2}{x_{2}}} = \frac{ s^{2}_{2} }{n_{2}} x \frac{ (N_{2} - n_{2} ) }{N_{2} - 1 } = \frac{s^{2}_{1}}{n_{1}} x \frac{ (N_{1} - n_{1}) }{N_{1} - 1} = \frac{(11.4)^{2}}{8} x \frac{22}{29} = 12.324$

Vraag 4

$\hat{\sigma}^{\frac{2}{x_{3}}} = \frac{ s^{2}_{3} }{n_{3}} x \frac{ (N_{3} - n_{3} ) }{N_{3} - 1 } = \frac{s^{2}_{1}}{n_{1}} x \frac{ (N_{1} - n_{1}) }{N_{1} - 1} = \frac{(9.2)^{2}}{2} x \frac{18}{19} = 40.093$

Vraag 5

$\hat{\sigma}^{\frac{2}{st}} = \frac{1}{N^{2}} \ sum^{K}_{j = 1} N^{2}_{j} \hat{\sigma}^{2}_{x_{j}} = \frac{ (75)^{2}(8.856) + (30)^{2}(12.324) + (20)^{2}(40.093) }{125^{2}} = 4.924$

Vraag 6

$\hat{\sigma}_{\bar{x}_{st}} = \sqrt{4.924} = 2.22$

Vraag 7

20.09 +/- (1.96)(2.22) = [15.74; 24.44]

Vraag 8

$\hat{p}_{st} = \frac{1}{N} = \sum^{K}_{j = 1} N_{j} \hat{p}_{j} = \frac{ (364)(0.175) + (1031)(0.217) }{1395} = 0.206$

Vraag 9

$\hat{\sigma}^{2}_{p_{st}} = \frac{ \hat{p}_{j} (1 - \hat{p}_{j}) }{n_{j} - 1} x \frac{ (N_{j} - n_{j}) }{N_{j} - 1} = \frac{ (0.175)(0.825) }{39} x \frac{324}{363} = 0.003304$

Vraag 10

$\hat{\sigma}^{2}_{p_{st}} = \frac{ \hat{p}_{j} (1 - \hat{p}_{j}) }{n_{j} - 1} x \frac{ (N_{j} - n_{j}) }{N_{j} - 1} = \frac{ (0.217)(0.783) }{59} x \frac{971}{1030} = 0.002715$

Vraag 11

$\hat{\sigma}^{2}_{\hat{p}_{st}} = \frac{1}{N^{2}} \sum^{K}{j = 1} N^{2}_{j} \ hat{\sigma}^{2}_{\hat{p}_{j}} = \frac{ (364)^{2}(0.003304) + (1031)^{2}(0.002715) }{ (1395)^{2} } = 0.001708$

Vraag 12

$\hat{\sigma}_{\hat{p}_{st}} = 0.0413$

Vraag 13

(0.206) +/- (1.645)(0.0413) = [0.138; 0. 274]

Vraag 14

$n_{1} = \frac{75}{125} x 25 = 12$

Vraag 15

$n_{2} = \frac{30}{125} x 25 = 5$

Vraag 16

$n_{3} = \frac{20}{125} x 25 = 6$

Vraag 17

$n_{1} = \frac{100}{225} x 50 = 22$

Vraag 18

$n_{2} = \frac{75}{225} x 50 = 17$

Vraag 19

$n_{3} = \frac{50}{225} x 50 = 11$

Vraag 20

$n_{1} = \frac{250}{500} x 50 = 25$

Vraag 21

$n_{2} = \frac{100}{500} x 50 = 10$

Vraag 22

$n_{3} = \frac{150}{500} x 50 = 15$

Vraag 23

$n_{1} = \frac{250}{500} x 100 = 50$

Vraag 24

$n_{2} = \frac{100}{500} x 100 = 20$

Vraag 25

$n_{3} = \frac{150}{500} x 100 = 30$

Vraag 26

Optimale allocatie wijst relatief meer steekproefinspanning toe aan strata waarin de populatievariantie het grootst is.

Vraag 27

Optimale toewijzing wijst meer steekproefwaarnemingen toe aan strata waarin de werkelijke populatieverhoudingen het dichtst bij 0,50 liggen.

Vraag 28

Bij gestratificeerde willekeurige steekproeftrekking wordt een steekproef genomen van elke stratum van de populatie in een poging om ervoor te zorgen dat belangrijke segmenten van de populatie een overeenkomstig gewicht krijgen. Bij clustersteekproeven wordt een willekeurige steekproef van clusters genomen, zodat sommige clusters geen leden in de steekproef hebben.

Vraag 29

Voordeel: gemak. Nadeel: de extra onnauwkeurigheid in de steekproeframingen.

Vraag 30

Voordeel: het stelt de onderzoeker in staat om de enquête tegen lage kosten uit te proberen. Nadeel: tijdrovend.

Access:

Public

Click & Go to more related summaries or chapters

Studiegids voor samenvattingen bij Statistics for Business and Economics van Newbold

Boeksamenvatting bij de 9e druk van Statistics for Business and Economics van Newbold

TentamenTest bij de 9e druk van Statistics for Business and Economics van Newbold

Summary with the 9th edition of Statistics for Business and Economics by Newbold

Examtest with the 9th edition of Statistics for Business and Economics by Newbold

Samenvatting bij de 8e druk van Statistics for Business and Economics van Newbold

Summary with the 8th edition of of Statistics for Business and Economics by Newbold

ExamTest with the 8th edition of Statistics for Business and Economics by Newbold

Examtest with Statistics for Business and Economics by Newbold

BulletpointSummary with Statistics for Business and Economics by Newbold

TentamenTest bij Statistics for Business and Economics van Newbold

Business and Economics - Theme

Join WorldSupporter!

Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Check more of topic:

Organization and management

Going abroad?

Insure your way around the world

International expat insurances

Travel & Worldsupporter insurances (NL)

Study with summaries

Contributions: posts

Help other WorldSupporters with additions, improvements and tips

Spotlight: topics

Check the related and most recent topics and summaries:

Activities abroad, study fields and working areas:

Organization and management

Statistics and Data analysis Methods

Check how to use summaries on WorldSupporter.org

Submenu: Summaries & Activities

Follow the author: Vintage Supporter

Work for WorldSupporter

JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Statistics

External and related links:

Bedrijfsorganisatie & Economie: opleiding tot studeren in het buitenland

Bedrijfskundige en management in het buitenland via betaald werk, stage en vrijwilligerswerk

Studeren in het buitenland verzekeren

Competenties en je kwaliteiten verbeteren en versterken

Search a summary, study help or student organization

Select any filter and click on Search to see results