Boeksamenvatting bij Research Methods for the Behavioral Sciences - Stangor - 5e druk
- 5978 keer gelezen
Bulletpoint samenvatting bij Research Methods for the Behavioral Sciences - Stangor - 5e druk
Alle wetenschappers, of het nou psychologen, scheikundigen, of biologen zijn, maken gebruik van de wetenschappelijke methode. De wetenschappelijke methode is een set van assumpties, regels, en procedures die wetenschappers hanteren bij het doen van onderzoek. Het is een raamwerk voor het verzamelen, analyseren, en interpreteren van data. Onderdeel van de wetenschappelijke methode is bijvoorbeeld dat onderzoek empirisch moet zijn, dus gebaseerd op observaties of metingen. Een ander voorbeeld is dat onderzoek objectief moet zijn, dus (zo veel mogelijk) vrij van de voorkeur, opinie, of emoties van de onderzoeker(s). Een derde voorbeeld is dat onderzoek transparant (helder) en repliceerbaar (te herhalen) moet zijn. Het opschrijven van de procedure en resultaten moet zo gebeuren dat een andere onderzoeker precies snapt welke stappen er zijn genomen en hoe dit leidt tot de conclusie van het onderzoek. Idealiter moet een andere onderzoeker het onderzoek kunnen herhalen en op hetzelfde uitkomen. Al is dit natuurlijk lastig bij onderzoeken waarbij gebruik wordt gemaakt van proefpersonen, omdat ieder mens uniek is en (net) even anders reageert of handelt. De wetenschappelijke methode resulteert in een accumulatie (opeenstapeling) van wetenschappelijke kennis. Resultaten van het ene onderzoek worden gepubliceerd en vervolgonderzoek bouwt daarop voort door het onderzoek te herhalen, eventueel deels te wijzigen of iets toe te voegen, en dat vervolgens weer te publiceren.
Correlationeel onderzoek heeft als doel om de relatie tussen twee of meer variabelen onderzoeken. Een variabeleis een eigenschap die verschillende waarden kan aannemen tussen de studieobjecten (mensen, dieren, tijden, plaatsen). Voorbeelden zijn geslacht, leeftijd, opleidingsniveau, en inkomen. De meest gebruikte maat om verbanden tussen variabelen te kwantificeren (in een getal uit te drukken) is de Pearson product-moment correlatie coëfficiënt, aangegeven met het symbool r. Deze coëfficiënt heeft een range (bereik) van -1 tot 1. Dit wordt ook wel genoteerd als [-1; 1]. Negatieve waarden duiden op een negatief verband. Bijvoorbeeld: als X groter wordt, dan wordt Y kleiner. Positieve waarden duiden op een positief verband: als X groter wordt, dan wordt Y ook groter. Waarden dichter bij -1 of 1 geven een sterker verband aan. Als de correlatiecoëfficiënt 0 is, dan is er een verband tussen de variabelen. Het is heel belangrijk om te onthouden dat een correlatie niets zegt over oorzaak en gevolg. Ook al is de relatie tussen X (opleidingsniveau) en Y (inkomen) heel sterk, bijvoorbeeld 0.95, dan wil dit niet zeggen dat opleidingsniveau de oorzaak is van de hoogte van het inkomen. Het kan andersom zijn. Het kan zijn dat andere variabelen de hoogte van het inkomen veroorzaken. Correlationeel onderzoek kan gebruikt worden om het verband tussen twee of meer eigenschappen uit te drukken in een getal, maar zegt niets over de oorzaak van deze relatie. Daarvoor is experimenteel onderzoek nodig.
Experimenteel onderzoek wordt gebruikt om onderzoeksvragen over causale relaties (oorzaak-gevolg) tussen variabelen te kunnen beantwoorden. Een voorbeeld van zo’n vraag is: “Leidt het kijken van gewelddadige films tot meer agressie?” Met andere woorden, experimenteel onderzoek richt zich op de oorzaak van bepaald gedrag. In tegenstelling tot beschrijvend onderzoek, heeft de onderzoeker bij experimenteel onderzoek een actieve rol. Er vindt een actieve manipulatie plaats van een gegeven situatie voor twee of meer groepen van individuen. Het is hierbij belangrijk dat deze groepen voor de manipulatie (zo) gelijk (mogelijk) zijn, zodat een eventueel gemeten verandering niet kan worden toegeschreven aan een andere oorzaak. Om de hierboven gestelde vraag over agressiviteit te kunnen beantwoorden, zou een onderzoeker bijvoorbeeld honderd kinderen kunnen selecteren die in groep 6 van de basisschool zitten. Deze honderd kinderen worden vervolgens willekeurig verdeeld in twee groepen van elk vijftig kinderen. Beide groepen worden gemeten op agressiviteit. Vervolgens krijgt de ene groep elke dag een gewelddadige film te zien. De andere groep kijkt elke dag naar een niet-gewelddadige film. Aan het einde van de week worden de kinderen weer gemeten op agressiviteit, waarbij de verwachting zou kunnen zijn dat de groep die gewelddadige films keek meer agressiviteit toont dan de andere groep. Een nadeel van experimenteel onderzoek is dat, vanwege praktische of ethische redenen, niet al het gedrag hiermee geobserveerd kan worden. Voorbeelden hiervan zijn: kindermishandeling, zwerven (daklozen), en racisme.
Ethiek gaat over meer dan alleen zorgen over het welzijn van de onderzoeksparticipanten. Ethisch onderzoek doen heeft ook betrekking op het uitvoeren en rapporteren van onderzoek. Worden bijvoorbeeld alle resultaten gerapporteerd, of wordt een deel (bewust) weggelaten? Heel af en toe wordt een onderzoeker (denk aan Diederik Stapel) betrapt op het bewust wijzigen of fabriceren van data. Dit wordt ook wel wetenschappelijke fraude genoemd. Worden resultaten eerlijk gerapporteerd? Er zijn verschillende richtlijnen en protocollen opgesteld voor het uitvoeren van ethisch onderzoek. De American Psychological Association (APA) is een voorbeeld van een organisatie die dergelijke richtlijnen heeft opgesteld. Welke richtlijnen men ook volgt, ethisch onderzoek kent de volgende vier basisprincipes: 1. Participanten dienen te worden beschermd tegen fysieke en psychologische schade. 2. Participanten dienen vrijheid van keuze te hebben (om deel te nemen of te stoppen) in het onderzoek. 3. Men dient zich bewust te zijn, en te blijven, van de machtsverschillen tussen onderzoeker(s) en participanten. 4. Men dient de aard en het gebruik van (de data van) de studie eerlijk te beschrijven aan de participanten.
Samengevat komt het erop neer dat de ethiek van een onderzoeksproject wordt bepaald door een afweging van de kosten en baten van het onderzoek. Wat zijn de kosten, dat wil zeggen, gevaren/risico's/nadelen voor de participanten? En wat zijn de baten, dat wil zeggen, de mogelijke winst in kennis, kwaliteit van leven, en wetenschap? Wanneer de (mogelijke) kosten niet opwegen tegen de baten van het onderzoek, dient het onderzoek te worden beëindigd. Hoewel dit in theorie logisch klinkt is het, opnieuw, lastiger in de praktijk. Want hoe bepaal je nou hoe zwaar iets weegt? De waarden die hierbij een rol spelen kunnen ook veranderen door de tijd heen, denk bijvoorbeeld aan het een eperiment van Milgram. Ook zijn er waardeverschillen tussen verschillende culturen. Wat in de ene cultuur als heel belangrijk wordt beschouwd, is misschien minder van belang in een andere cultuur. Een mogelijkheid is om de mogelijke kosten en baten van het onderzoek voor te leggen aan individuen die gelijk zijn aan potentiële participanten en te vragen of zij mee zouden doen aan het onderzoek. Dit geeft een indicatie van de waardering van de kosten en baten. Tot slot moet ieder onderzoek waarbij mensen of dieren betrokken zijn worden goedgekeurd door de ethische commissie. De ethische commissie heeft als taak om onderzoek te toetsen op criteria van wetenschappelijk verantwoord handelen.
Conceptuele variabelen zijn de variabelen die de basis vormen van een onderzoekshypothese. Voorbeelden hiervan zijn: depressie, gedragsproblemen, en cognitieve ontwikkeling. Meten is een proces, waarbij de conceptuele variabelen worden omgezet in gemeten variabelen. Een meting is het toewijzen van getallen aan een object, subject (bijvoorbeeld een leerling), of een gebeurtenis. De gemeten variabelen zijn dus metingen van de conceptuele variabele. Soms is die transformatie direct, bijvoorbeeld wanneer de conceptuele variabele "studietijd" wordt gemeten door het aantal minuten dat iemand studeert te meten. Soms is een conceptuele variabele niet direct observeerbaar. Voorbeelden hiervan zijn "woede", "verdriet", en "populariteit". Dergelijke variabelen worden ook wel latente variabelen genoemd. Ze zijn niet rechtstreeks te meten. Populariteit kun je bijvoorbeeld (indirect) meten door klasgenoten te vragen in hoeverre ze iemand aardig vinden op een schaal van 1 tot 10. De somscore of het gemiddelde van die metingen geeft je dan een indirecte indicatie van de populariteit van die leerling. Latente variabelen komen met name in de gedragswetenschappen veel voor.
Er zijn grofweg twee typen meetbare variabelen te onderscheiden: nominaal en kwantitatief. Een nominale variabele bestaat uit categorieën (die niet zijn uit te drukken in getallen). Een voorbeeld is geslacht, een nominale variabele met de categorieën man en vrouw. Een ander voorbeeld is 'diersoort' met onder andere de categorieën zoogdieren, reptielen, amfibieën, vissen, en vogels. Hoewel soms getallen worden gebruikt bij nominale variabelen om categorieën aan te duiden (bijvoorbeeld man = 1, vrouw = 2) zijn getallen bij nominale variabelen niet betekenisvol. Daartegenover staan kwantitatieve variabelen, die juist wel worden uitgedrukt in getallen. Schalen is het specificeren van de relatie tussen de getalen van een kwantitatieve variabele en de bijbehorende waarde van de conceptuele variabele. Er zijn binnen het proces van schalen drie vormen te onderscheiden: interval, ratio, en ordinaal. Bij een interval schaal is de afstand tussen twee punten op de schaal gelijk voor de hele schaal. Een voorbeeld is temperatuur in graden Celcius. Het verschil tussen 10 en 20 graden Fahrenheit is exact hetzelfde als tussen 20 en 30 graden Celcius. Maar we kunnen niet zeggen dat 20 graden Cecius twee keer zo warm is als 10 graden Celcius (omdat de 0 niet een absoluut nulpunt is). Een ratio schaal heeft die eigenschap van een absoluut nulpunt wel. Een voorbeeld is temperatuur in Kelvin, waarbij 0 het absolute nulpunt is (0 Kelvin = -273.15 graden Celcius). Nu kunnen we wel zeggen dat bijvoorbeeld 10 K (K = Kelvin) de helft is van 20 K. Een ander voorbeeld is gewicht. Ook gewicht kent een absoluut nulpunt, waardoor we kunnen zeggen dat 60 kilogram het dubbele is van 30 kilogram. In de gedragswetenschappen is het schalen van variabelen vaak niet zo eenduidig en wordt er vaak gebruikt gemaakt van ordinale schalen. De getallen van een ordinale schaal geven een rangorde aan, maar het verschil tussen twee waarden is niet (per definitie) gelijk over de hele schaal. Een voorbeeld is schooltype: vmbo (= 1), havo (= 2), vwo (= 3). Er zit wel een rangorde in deze drie typen, maar de getallen zeggen ons niets over de afstand tussen vmbo en havo, en havo en vwo. Die afstand is niet per definitie gelijk.
De betrouwbaarheid is de mate waarin een meting vrij is van random error. Bij het berekenen van de betrouwbaarheid kunnen, in theorie, de volgende formules worden opgesteld. Gemeten score = ware score + random error. De betrouwbaarheid is dan de proportie van de gemeten score die de ware score reflecteert: Betrouwbaarheid = (ware score / gemeten score). Aangezien de random error zichzelf opheft, hoef je die dus niet mee te nemen bij de bepaling van de betrouwbaarheid. Wanneer er geen enkele sprake is van systematische error, dan is de ware score identiek aan de gemeten score en is de betrouwbaarheid dus 1. Hoewel dit in theorie een niet al te ingewikkelde som is om de betrouwbaarheid te berekenen, weet je in de praktijk natuurlijk nooit echt wat de 'ware' score is. Je weet alleen de gemeten score. Daarom zijn er verschilende manieren om de betrouwbaarheid van een meting te schatten. In het boek worden vier verschillende manieren besproken om de betrouwbaarheid te bepalen: 1) test-hertest, 2) equivalente vormen, 3) interne consistentie, en 4) interrater betrouwbaarheid.
Zelfs al is een meting 100% betrouwbaar, dan zegt dit nog niet dat de meting ook daadwerkelijk meet wat je wilt meten. Bijvoorbeeld: een onderzoeker meet de snelheid waarmee kleuters hun veters kunnen strikken. De onderzoeker herhaalt deze meting een week later en vindt een 100% overeenkomst met de eerste meting. De onderzoeker concludeert hieruit dat de meting betrouwbaar is. Stel nu dat de onderzoeker hiermee beweert de conceptuele variabele intelligentie te hebben gemeten. Ben je het daar mee eens? Dit is een voorbeeld van een meting die hoog scoort op betrouwbaarheid, maar laag op construct valditeit. Construct validiteit is de mate waarin de gemeten variabele daadwerkelijk de conceptuele variabele (het construct) meet. In andere woorden, het zegt iets over of de meting meet wat je beoogt te meten. Zoals je in het voorbeeld over veters strikken kon lezen, is een hoge betrouwbaarheid geen garantie voor een hoge constructvaliditeit. Dat een meting betrouwbaar is, wil dus niet zeggen dat het valide is (dat het meet wat je wilt meten). Er zijn vier verschillende manieren om de construct validiteit te bepalen: indruksvaliditeit (face validity), inhoudsvaliditeit (content validitity), convergente validiteit (convergent validity), en discriminatie validiteit (discriminant validity).
De overeenkomst tussen betrouwbaarheid en validiteit is dat beiden worden bepaald aan de hand van correlaties tussen gemeten variabelen. Het verschil is dat betrouwbaarheid gaat over de correlatie tussen verschillende variabelen die de onderzoeker wil combineren tot één meting om de conceptuele variabele te meten, terwijl validiteit gaat over de correlatie met andere metingen voor andere conceptuele variabelen. Aan het begin van het hoofdstuk werd al besproken dat een betrouwbaar instrument niet per definitie valide is. Daarbij komt nog dat betrouwbaarheid een voorwaarde is voor validiteit. Het is dus belangrijk om eerst de betrouwbaarheid te bepalen en pas als een instrument betrouwbaar wordt bevonden te kijken naar de validiteit. In andere woorden: betrouwbaarheid is geen garantie voor validiteit, maar wel een noodzakelijke voorwaarde. Vaak wordt als algemene richtlijn aangenomen dat een schaal een betrouwbaarheid moet hebben van minstens α = .70 (hoewel in de praktijk de meeste tests een alfa hebben van minstens .80).Over het algemeen is het bepalen van de betrouwbaarheid makkelijker dan het bepalen van de construct validiteit. Bij de betrouwbaarheid hoef je in principe alleen maar een correlatie te meten tussen items die hetzelfde meten, terwijl je bij construct validiteit ook kijkt naar de correlatie tussen variabelen die iets anders beogen te meten (discriminatie validiteit).
In een aselecte (willekeurige, kans) steekproeftrekking heeft iedere persoon in de populatie een evengrote kans om in de steekproef terecht te komen. Dit vergroot de kans op een representatieve steekproef en de mogelijkheid om gevolgtrekkingen (inferenties) op te stellen over de populatie.
Beschrijvende statistieken zijn getallen die patronen van gemeten variabelen samenvatten. Zo'n patroon wordt ook wel de distributie of verdeling genoemd. Er zijn verschillende maten om de centrale tendens (het punt waar de distributie zich centreert) en de spreiding samen te vatten.
Voorbeelden van centrummaten zijn: het gemiddelde, de mediaan en de modus. Het gemiddelde is de meest gebruikte centrummaat. Het gemiddelde kun je berekenen door de som van alle scores te delen door het aantal participanten (N). Stel, de scores van 5 studenten op het tentamen statistiek zijn: 6.0, 6.0, 6.5, 7.0, 8.0 dan is het gemiddelde (6.0 + 6.0 + 6.5 + 7.0 + 8.0)/5 = 6.7. De modus is het meest voorkomende getal. In het voorbeeld is de modus 6. De mediaan is het middelste getal. In het voorbeeld is de mediaan 6.5.
Het gemiddelde, de mediaan en de modus geven een indicatie van de verdeling van de variabele. Wanneer deze drie maten (ongeveer) gelijk zijn, dan is de variabele hoogstwaarschijnlijk normaal verdeeld. In het geval van een normaalverdeling liggen de meeste punten rond het centrum, is de verdeling symmetrisch en 'klokvormig' (bell shaped). In sommige gevallen zijn er uitbijters (outliers). Uitbijters zijn extreme scores aan de uiteinden van de distributie. Uitbijters kunnen ervoor zorgen dat de distributie minder normaal verdeeld is. Een scheve distributie kan zowel positief (rechts) als negatief (links) scheef verdeeld zijn. Een rechtsscheve verdeling heeft (meer) uitbijters aan de rechterkant van de verdeling. Hierdoor trekt het gemiddelde naar de rechterkant. De volgorde van links naar rechts is dan: modus, mediaan, gemiddelde. Wanneer er (meer) uitbijters aan de linkerkant zijn, dan is de verdeling linksscheef (negatief) verdeeld. Het gemiddelde trekt dan naar de linkerkant. De volgorde van links naar rechts is dan: gemiddelde, mediaan, modus.
Een vuistregel bij betrouwbaarheidsintervallen is:
standaarddeviatie links en rechts van het gemiddelde = 68%
standaarddeviaties links en rechts van het gemiddelde = 95%
standaarddeviaties links en rechts van het gemiddelde = 99.7%
Dit heeft twee implicaties. Het betekent dat 68% van de scores van de steekproef binnen 1 standdaarddeviatie van het gemiddelde ligt (zowel links als rechts van het gemiddelde). Het betekent ook dat je met 68% zekerheid kunt zeggen dat het populatiegemiddelde in dit interval ligt. Let hierbij op dat het steekproefgemiddelde natuurlijk altijd in het betrouwbaarheidsinterval ligt, omdat het betrouwbaarheidsinterval is opgebouwd rondom het steekproefgemiddelde. Het steekproefgemiddelde op zichzelf is niet zo interessant. Je bent uiteindelijk geïnteresseerd in het populatiegemiddelde en om daar uitspraken over te kunnen doen wil je dus met zo'n hoog mogelijke zekerheid iets zeggen over de waarde van dat populatiegemiddelde.
Naturalistisch onderzoek beschrijft en meet het dagelijks gedrag van mensen en dieren. Het kan gaan om het meten van gedrag op het moment dat het plaatsvindt, maar het kan ook gaan om gedrag dat eerder al (door anderen) is opgenomen en pas later gecodeerd. Zulke observaties leveren complexe data op, die lastig te analyseren zijn. In dit hoofdstuk worden een aantal methoden besproken om observaties van dagelijks voorkomend gedrag om te zetten in meetbare variabelen: observationeel onderzoek, case studies, en archiefstudies.
Het grote voordeel van naturalistisch onderzoek is de hoge ecologische validiteit. Ecologische validiteit is de mate waarin het onderzoek is uitgevoerd in situaties die gelijkwaardig zijn aan alledaagse levensgebeurtenissen en ervaringen. Aangezien in naturalistisch onderzoek het alledaagse gedrag van mensen of dieren wordt beoordeeld en ze soms niet eens weten dat ze worden geobserveerd, is de ecologische validiteit bij dit type onderzoek dus erg hoog. Als gevolg is de reactiviteit van de participanten lager en de construct validiteit waarschijnlijk hoger.
De wetenschappelijke methode is een set van procedures die onderzoekers gebruiken om te schatten of de data de onderzoekshypothese onderstenen. Omdat deze procedures gebruiken maken van steekproefdata om inferenties (gevolgtrekkingen, conclusies) op te stellen over de populatie, worden deze procedures ook wel inferentiële statistiek genoemd. In grote lijnen zijn de volgende stappen te onderscheiden bij het testen van een hypothese:
Ontwikkelen van een onderzoekshypothese
Specificeer alfa (meestal α = .05)
Bereken de power om te bepalen welke steekproefgrootte nodig is
Verzamel data
Bereken statistieken en de p-waarde
Vergelijk de p-waarde met de alpha
Als p < .05: verwerp nulhypothese
Als p >.05: niet verwerpen nulhypothese
Na het opstellen van het significantieniveau, voer je de test uit en bereken je de p-waarde. De p-waarde is de kans (een getal tussen 0 en 1) dat je het huidige effect vindt, terwijl er in werkelijkheid geen effect is (dus wanneer het puur op basis van toeval is). Wanneer de p-waarde lager is dan de alfa (het significantieniveau), spreek je van een significant verschil en verwerp je de nulhypothese. Wanneer de p-waarde groter is dan de alfa, is het verschil niet signficant en mag je de nulhypothese niet verwerpen.
Inferentiële statistiek is gebaseerd op kansen. Dit betekent ook dat er altijd een kans is dat je een fout maakt. De conclusies die je trekt bevatten altijd een bepaalde mate van onzekerheid. Hoewel de wetenschappelijke methode helpt om deze kans zo klein mogelijk te maken, kun je het nooit helemaal elimineren. Er zijn verschilende typen fouten die een onderzoeker kan maken. Deze zijn samengevat in onderstaande tabel:
H0 verwerpen | H0 niet verwerpen | |
H0 is waar | Type 1 fout | Juist 1 - α |
H0 is niet waar | Juist | Type 2 fout β |
Hoe groter de effectgrootte, des te groter de power. De richtlijnen van Cohen (klein = .10, medium = .30, groot = .50) worden gebruikt om een inschatting te maken van de te verwachten effectgrootte. Wanneer je een kleine effectgrootte verwacht, is de power lager en heb je een grotere steekproef nodig om een significant verschil te vinden. Dit verband kan worden samengevat als: statistische significantie = effectgrootte x steekproefgrootte.
Het is erg belangrijk om te onthouden dat een significant effect niet hetzelfde is als een groot effect! P-waarden en effect sizes zijn twee verschillende begrippen. Een significant effect betekent niets meer dan dat de kans op het gevonden resultaat kleiner is dan een bepaald significantieniveau (vaak α = .05). Omdat het significantieniveau van tevoren door de onderzoeker wordt vastgesteld, heeft de onderzoeker dus invloed op de conclusie of iets significant is of niet. Denk maar eens terug aan het voorbeeld over de vriend die beweerde gedachten te lezen. Afhankelijk van wat voor significantieniveau je specificeert, is een effect significant of niet. Om die reden wordt er tegenwoordig in de gedragswetenschappen meer nadruk gelegd op de effectgrootte dan op het significantieniveau.
In het voorbeeld van sporten en optimisme spreken we van een lineair verband, omdat de relatie tussen de twee variabelen redelijk kan worden geschat met een rechte lijn. Alle punten liggen relatief in de buurt van deze lijn. Daarnaast is er sprake van een positief lineair verband, omdat hogere scores op de ene variabele over het algemeen ook hogere scores op de andere variabele betekenen. Wanneer dit andersom is, dus wanneer een hogere score op de ene variabele verband houdt met een lagere score op de andere variabele, dan spreken we van een negatieve lineaire relatie. In zo'n geval zul je een dalende regressielijn zien in een scatterplot.
Hoewel een scatterplot een indicatie geeft van het verband tussen variabelen, is er wel een bepaalde mate van subjectiviteit verbonden aan het oordeel over de sterkte van het verband. Een figuur alleen is dus niet voldoende voor een objectieve indicatie van de sterkte van een verband tussen twee variabelen. Om die reden zijn er meerdere manieren om de sterkte en richting van het verband in een getal uit te drukken. De meest bekende index is de Pearson product-moment correlate coëfficient, ook wel Pearson's r of simpelweg de correlatie coëfficient genoemd. De correlatie coëfficient heeft een range van -1 tot +1 en geeft dus zowel de sterkte as de richting van het verband aan. Een positief verband wordt aangeduid met een positieve r. Een negatief verband wordt aangeduid met een negatieve r. Waardes dichter bij +1 (of -1) geven een sterker verband aan. Waardes dichter bij 0 geven een zwakker verband aan. Een 0 betekent dat er geen verband is tussen de twee variabelen.
De effectgrootte (de sterkte) van het verband kan ook worden aangeduid met de gekwadrateerde correlatie coefficient, oftwel de r2. Dit is de proportie verklaarde varantie. Deze determinantie coëfficient geeft aan hoeveel variantie van de ene variabele wordt verspeld door de andere variabele. De proportie verklaarde variantie loopt van 0 tot 1.
Er zijn twee typen derde variabelen te onderscheiden: mediatoren en moderatoren. Een moderator heeft invloed op de sterkte van het verband tussen de onafhankelijke en afhankelijke variabele. Het tweede type is de mediator. In het geval van een mediator betekent het dat het verband tussen de onafhankelijke en afhankelijke variabele via de mediator loopt. In het onderstaande voorbeeld is dit afgebeeld. Het kijken van gewelddadige films (onafhankelijke variabele) zorgt voor meer spanning/opwinding (moderator). En een hoger niveau van spanning/opwinding zorgt voor agressiever gedrag (afhankelijke variabele).
Om uitspraken te kunnen doen over oorzaak en gevolg, zijn er drie factoren die je moet overwegen: (empirische) assocciatie, temporele voorrang, en controle van gezamenlijke oorzaken. Deze drie factoren vormen de basis van experimenteel onderzoek.
Er zijn verschillende manieren om potentiële gemeenschappelijke oorzaken te minimaliseren. De eerste methode is door participanten in elke groep te selecteren die zo gelijk mogelijk aan elkaar zijn (between-participants design). Wanneer je bijvoorbeeld verwacht dat geslacht een mogelijk gemeenschappelijke veroorzaker is, dan kun je dus bijvoorbeeld in elke groep 10 jongens en 10 meisjes selecteren. Een tweede methode is door dezelfde participanten in iedere experimentele conditie te testen middels een repeated-measures design (herhaalde metingen). Omdat je dezelfde participanten meerdere keren meet, is er (waarschijnlijk) geen veranderingen in de waardes van mogelijke derde of vreemde variabelen. De derde, meest gebruikte methode om gelijke groepen te creëren, is random assignment to conditions, oftewel willekeurige toewijzing van participanten aan de condities. Dit betekent dat participanten willekeurig worden toegewezen aan de experimentele groep of controle groep, bijvoorbeeld door het gooien van een munt of het gebruiken van een tabel met willekeurige getallen. Hoewel deze methode niet garandeert dat de groepen exact gelijk zijn, zorgt het er wel voor dat de kans op verschillen tussen de groepen wordt verlaagd.
De statistische procedure die wordt gebruikt om oorzaak-gevolg relaties in experimenteel designs aan te tonen, is de analysis of variance, kortweg ANOVA. De ANOVA is ontworpen om het gemiddelde van de afhankelijke variabele tssen verschillende levels van het experiment te vergelijken. De nulhypothese bij deze toets is dat er geen verschil is tussen de experimentele condities. De alternatieve hypothese kan tweezijdig of éénzijdig geformuleerd worden. In het geval van een tweezijdige alternatieve hypothese, betekent het dat er een verschil is in agressiviteit tussen het wel en niet kijken van gewelddadige films, maar specificeer je niet welke condities leidt tot hogere niveaus van agressiviteit. In het geval van een eenzijdige hypothese geef je ook de richting van het verband aan. In het voorbeeld is de rechtszijdige hypothese dat het kijken van gewelddadige films meer agressiviteit veroorzaakt. Na het opstellen van de hypothesen, ga je de F-statistiek berekenen. De F-statistiek is de ratio van de variantie tussen groepen en de variantie binnen groepen. F = tussengroepsvariantie / binnengroepsvariantie. Een F-waarde hoger dan 1 betekent dat er meer variantie is tussen groepen dan binnen groepen. Hoe meer de condities verschillen, des te hoger de F-waarde. Iedere F-waarde heeft een bijbehorende p-waarde, om het verschil in termen van statistische significantie uit te drukken. D
Twee voordelen van herhaalde metingen ten opzichte van between-participants designs zijn (1) een verhooge statistische power, en (2) efficiëntie, omdat er minder participanten nodig zijn.
In hoofdstuk 10 is het enkelvoudige (eenweg) experimenteel design besproken. In zo'n enkelvoudig experimenteel design wordt de relatie tussen één onafhankelijke en één of meer afhankelijke variabele(n)getoetst. Alle andere variabelen worden (zoveel mogelijk) constant gehouden. Dit is echter een vrij kunstmatige situatie, omdat in het dagelijks leven vele verschillende variabelen met elkaar verband houden en elkaar beïnvloeden. Om deze complexiteit beter in kaart te brengen, zijn dus uitgebreidere designs nodig. In dit hoofdstuk bespreken we factorieel experimentele designs, die zijn ontworpen om meer dan één onafhankelijke variabele te toetsen.
Wanneer in een tweeweg design de twee hoofdeffecten van beide onafhankelijke variabelen worden gemeten, levert dit dezelfde informatie op als het uitvoeren van twee losse eenweg design. Maar, het voordeel van een tweeweg design is dat je meer informatie uit het experiment kan halen. Naast de hoofdeffecten (in het voorbeeld: invloed van gewelddadidge films op agressie en invloed van frustratie op agressie) kun je namelijk ook de interacties tussen de factoren in kaart brengen. Een interactie is een patroon van gemiddelden waarbij de invloed van de ene onafhankelijke variabele op de afhankelijke variabele verschillend is voor verschillende levels van de andere onafhankelijke variabele(n). In het voorbeeld dat we hierboven bespraken was al sprake van een interactie effect: de hypothesen bevatte de verwachting dat het effect van gewelddadige films anders is voor gefrustreerde kinderen dan voor niet-gefrustreerde kinderen. Het effect van één factor binnen een level van een andere factor wordt ook wel het simpele effect van de eerste factor genoemd.
Goed onderzoek is valide onderzoek. Met valide wordt bedoeld dat de conclusies die door de onderzoeker worden trokken, gerechtvaardigd zijn. Ter illustratie, wanneer een onderzoeker beweert dat mensen pepsi cola lekkerder vinden dan coca cola, of dat sporten zorgt voor een geluksgevoel, dan is het onderzoek alleen valide als mensen daadwerklijk pepsi lekker vinden, en wanneer sporten daadwerkelijk zorgt voor een gevoel van geluk. Helaas liggen er vele bedreigingen op de loer die de validiteit van het onderzoek kunnen verlagen. Als gevolg van een lage validiteit, worden soms foute conclusies getrokken. Natuurlijk willen onderzoekers geen onjuiste conclusies over de data trekken. Maar vaak, ondanks de beste bedoelingen, wordt invalide onderzoek gerapporteerd. Dit gebeurt zowel in kranten, op het journaal, en zelfs in wetenschappelijke tijdschriften. Het is belangrijk om op de hoogte te zijn van de potentiële bedreigingen voor de validiteit van onderzoek, zodat jij zelf een weloverwogen keuze kan maken om de conclusies van een onderzoek wel of niet te vertrouwen.
Er zijn vier typen validiteitsbedreigingen te onderscheiden. 1. bedreigingen voor de constructvaliditeit, 2. bedreigingen voor de validiteit met betrekking tot statistische conclusies, 3. bedreigingen voor de interne validiteit, 4. bedreigingen voor de externe validiteit.
Zowel vreemde als verstorende variabelen vormen een bedreiging voor de validiteit van onderzoek. Goed, valide onderzoek controleert zowel vreemde variabelen (extraneous variables) als verstorende variabelen (confounding variables). Vier manieren om de effecten van vreemde variabelen te controleren zijn: beperkte populatie, voor-na designs, gepaarde groepen, en standaardisatie van condities.
Hoewel er veel potentiële bedreigingen zijn voor de interne validiteit van een onderzoek, zijn er drie bedreigingen die zo vaak voorkomen dat het belangrijk is om deze goed te kennen: 1. placebo effect, 2. vraagkenmerken, en 3. onderzoeker bias.
Externe validiteit is de mate waarin conclusies van het onderzoek gegeneraliseerd kunnen worden naar situaties, participanten, en tijden buiten de experimentele setting om. Generalisatie is dan ook de mate waarin verbanden tussen conceptuele variabelen aangetoond kunnen worden in een grote verscheidenheid van mensen (generalization across participants), in een grote verscheidenheid van omgevingen (generalization across settings), en binnen een grote verscheidenheid van gemanipuleerde (= onafhankelijke) of gemeten (= afhankelijke) variabelen.
Omdat een enkele test van een onderzoekshypothese altijd erg beperkt is in wat het kan aantonen, wordt het aanbevolen om dezelfde hypothese meerdere malen te testen. Het herhalen van een onderzoek wordt ook wel een replicatie genoemd. De wetenschap is een accumulatief proces (opeenstapeling) van kennis. Herhalingen van onderzoek kunnen op vele verschillende manieren worden uitgevoerd: 1. exact, 2. conceptueel, 3. constructief, 4. participant.
Quasi-experimentele onderzoeksdesigns zijn onderzoeksdesigns waarbij de onafhankelijke variabele wordt gemeten in plaats van gemanipuleerd. Vaak wordt er gebruik gemaakt van bestaande, natuurlijke groepen. Quasi-experimentele onderzoeksdesigns zijn correlationeel, niet experimenteel! Desalniettemin heeft dit type design wel overeenkomsten met experimentele designs, omdat de onafhankelijke variabele een groepering heeft (opsplitsing in bepaalde categorieën of condities) en de data vaak worden geanalyseerd met een ANOVA. Er zijn grofweg vier typen quasi-experimentele designs te onderscheiden: 1. enkele groep design, 2. vergelijkingsgroep design, 3. enkele groep design met voor- en na meting, en 4. vergelijkingsgroep design met voor- en nameting.
Tot nu toe hebben we steeds varianten van quasi-experimenteel onderzoek besproken waarbij groepen mensen met verschillende ervaringen met elkaar werden vergeleken, maar de meest voorkomende variant van quasi-experimenteel onderzoek is waarschijnlijk die waarin gebruik wordt gemaakt van verschillen in natuurlijk voorkomende eigenschappen van participanten, zoals geslacht of etniciteit. Wanneer de groepering betrekking heeft op een variabele met reeds bestaande eigenschappen, dan spreken we van een participant-variabele design. De variabele waarop de participanten verschillen wordt ook wel de participant variabele genoemd. Een voorbeeld is wanneer een onderzoek wordt uitgevoerd naar gewelddadige films en agressiviteit en de kinderen worden opgesplits in twee groepen: jongens en meisjes. Omdat de groeperingsvariabele wordt gemeten in plaats van gemanipuleerd, spreken we van een quasi-experimenteel onderzoek.
Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>
There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.
Do you want to share your summaries with JoHo WorldSupporter and its visitors?
Main summaries home pages:
Main study fields:
Business organization and economics, Communication & Marketing, Education & Pedagogic Sciences, International Relations and Politics, IT and Technology, Law & Administration, Medicine & Health Care, Nature & Environmental Sciences, Psychology and behavioral sciences, Science and academic Research, Society & Culture, Tourisme & Sports
Main study fields NL:
JoHo can really use your help! Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world
1299 |
Add new contribution