Hoorcollegeaantekeningen Inleiding in de methoden en technieken

Deze samenvatting is gebaseerd op het studiejaar 2013-2014.

Week 1

 

Geschiedenis van de methodologie

Buddha (563-483 v.Chr.) en Aristoteles (384-322 v.Chr.) stelden al vragen over oorzaken van gedrag, denken en emotie.

In het jaar 1875 werd de wetenschappelijke psychologie geboren. De belangrijkste grondlegger hiervan was Wilhelm Wundt, een Duitse wetenschapper die onder andere het eerste psychologische laboratorium opzette en begon met het schrijven van theorieboeken en lesgeven aan studenten.

James Mckeen Cattell bracht de methodologie in het onderwijs.

Psychologie is een wetenschappelijke discipline die gedrag en mentale processen (emotie, denken) bestudeert met wetenschappelijke methoden.

Waarom wordt het vak M&T toegepast in universitair onderwijs? Universitair onderwijs is gericht op wetenschappelijk onderzoek. Wetenschap is gebaseerd op onderzoek. Goed onderzoek doe je door middel van m&t.

 

Wanneer is een studie wetenschappelijk?

  1. Empirisme:

Je moet kijken naar de feitelijk zintuiglijk waarneembare zaken. Oorzaak -gevolg relaties moeten gecontroleerd worden. Een van de meest voor de hand liggende methodes om dit te doen is steeds van oorzaak veranderen, en de gevolgen met elkaar vergelijken. Belangrijk bij empirisch onderzoek is het opzetten van systematische onderzoeken, in overkoepelende theorieën zit vaak een algemene regelmaat.

  1. Verificatie:

Andere onderzoekers moeten jouw onderzoek stap voor stap kunnen nadoen. Daarom is het belangrijk dat alle onderzoeksresultaten en methodes openlijk worden gepresenteerd. Het nadoen van een onderzoek kan een bepaalde theorie versterken ( als er opnieuw dezelfde conclusie uitkomt), maar ook verzwakken ( als er een hele andere conclusie uitkomt)

  1. Onderzoekbare problemen onderzoeken:

Je moet wel problemen onderzoeken die je ook echt kunt toetsen. Een voorbeeld van een niet- toetsbare hypothese is: engelen bestaan. Dat we het niet kunnen onderzoeken wil niet zeggen dat ze daadwerkelijk niet bestaan, maar op dit moment hebben we geen instrumenten of methodes om een dergelijke theorie te onderzoeken.

Als wetenschapper heb je twee taken:

  • ontdekken en beschrijven
  • verklaringen opstellen en voorspellen

Deze twee taken hangen samen met de verschillende soorten onderzoek die er zijn, het ene onderzoek is geschikt voor beschrijvingen, het ander voor verklaringen.
 

4 categorieën van gedragsonderzoek:

  1. Descriptief onderzoek: dit is beschrijvend onderzoek. Bij beschrijvend onderzoek ben je alleen maar bezig met het beschrijven van wat er gebeurt. Je gaat alle waarnemingen noteren en onderzoeken.

  2. Correlationeel onderzoek: hierbij laat je de samenhang zien tussen variabelen. Het gaat bij correlationeel onderzoek om twee variabele en hun verband. Dit hoeft niet per se een oorzaak-gevolg relatie te zijn, dat twee variabele samenhangen wil nog niet zeggen dat de ene ook daadwerkelijk het gevolg is van de ander.

  3. Experimenteel onderzoek: met experimenteel onderzoek kan je wel oorzaak-gevolg relaties aantonen. Het gaat hier dus om causale relaties.

  4. Quasi-experimenteel onderzoek: dit is experimenteel onderzoek met al bestaande groepen. Je kunt de categorieën niet random toewijzen. Voorbeeld hiervan is onderzoek in een schoolklas, je kan de kinderen die in de klas zitten niet zelf uitkiezen.

 

Empirische cyclus:

Adriaan de Groot had een empirische cyclus als model voor het onderzoek in 5 fasen:

  1. Obeservatiefase: in deze fase ontstaat het idee voor een onderzoek. Dit idee ontstaat vaak vanuit een observatie, en kan dus overal overgaan.

  2. Inductiefase: In deze fase ga je van een specifieke observatie naar een algemene theorie. Dit wordt ook wel operationaliseren genoemd. Een theorie is een verzameling uitspraken die aan de hand van begrippen een relatie beschrijft.
    ‘leap of faith’: je kan nooit zeker weten of je theorie, die dus vaak gebaseerd is op één observatie, klopt.

  3. Deductiefase: uit de algemene theorie wordt een toetsbare werkhypothese (onderzoeksvraag) afgeleid. Hiervoor zijn een aantal criteria: de werkhypothese moet voldoende specifiek (afgebakend ) zijn, het moet staan in de ‘als… dan…’ vorm, het moet falsifieerbaar (weerlegbaar) zijn en in de werkhypothese moet gebruik worden gemaakt van duidelijk omschreven begrippen. Voor het laatste criteria onderscheiden we 2 soorten definities. De eerste is de conceptuele definitie, hierbij gaat het om een woordenboekomschrijving, een abstracte omschrijving die je niet kan meten. De tweede is de operationele definitie, dit is de concrete definitie die precies aangeeft hoe een begrip wordt waargenomen, gemeten of gemanipuleerd.

  4. Toetsingsfase: in deze fase wordt de werkhypothese getoetst door het onderzoek daadwerkelijk uit te voeren. In deze fase worden data verzameld, deze worden geanalyseerd en daaruit worden conclusies getrokken.

  5. Evaluatiefase: wat zegt het resultaat over de algemene theorie? Het resultaat kan de theorie bevestigen of verwerpen. Daarna moet er geëvalueerd worden of de theorie wellicht moet worden aangepast, uitgebreid of verbeterd. In deze fase wordt ook gekeken naar eventuele tekortkomingen in het onderzoek.

Gedurende een onderzoek wordt de empirische cyclus ( vanaf stap 2) vaak een aantal keer herhaald.

Kan een theorie bewezen worden?

  • positief bewijs: de theorie is 100% waar. Dit is logisch gezien onmogelijk, omdat je nooit met zekerheid kunt zeggen of een theorie waar is. Hoe vaker de theorie bewezen wordt, hoe aannemelijker het is dat deze waar is.
  • negatief bewijs: de theorie is niet waar. Dit kan logisch gezien wel (het resultaat bevestigt de theorie niet) maar is uit praktisch oogpunt onmogelijk. Dat een hypothese niet waar is betekent niet dat meteen de hele theorie verworpen is.

Empirische generalisatie: uit data (dit zijn bestaande gegevens) een samenhang vinden. Dit gaat via deductie volgens Leary.

We doen onderzoek om bewijs te verzamelen om een theorie te ondersteunen. De kwaliteit van bewijs hangt af van drie dingen: de strengheid van de tests die je hanteert, het aantal keren dat een theorie bevestigd wordt door verschillende onderzoeken, de gevarieerdheid van onderzoeksmethoden die je gebruikt om een theorie te testen (methodologisch pluralisme).

 

Variabiliteit:

Variabiliteit: dat is datgene wat varieert. Het kan hierbij gaan om iets dat varieert tussen personen, tussen situaties of in de loop der tijd. Variantie is de index voor variabiliteit. Je bekijkt hierbij scores ten opzichte van een standaard (het gemiddelde).

De totale variantie = systematische variantie + foutenvariantie

Dit wordt ook wel als volgt aangeduid: SStotaal = SStussen + SSbinnen

De totale variantie is het te verklaren totaal, alle verschillen tussen individuen. Systematische variantie zijn de verklaarde verschillen tussen groepen. Foutenvariantie gaat over de onverklaarbare verschillen.

 

Variantie en de bijbehorende formules:

De formule voor variantie is: 

SS(totaal)= ∑(yij- ẏ)2

n = het aantal observaties of het aantal personen.

SS= de som van de gekwadrateerde afwijkingen

ẏ= groot gemiddelde. Dit bereken je door alle scores te delen door het aantal scores. Het gemiddelde wordt aangegeven met het streepje boven de y.

Yij= de individuele score. Hierbij is Ui de groep en Uj het individu

∑= het Griekse symbool dat we gebruiken als somteken.

Om de variantie te berekenen moet je dus eerst van alle individuele observaties het groot gemiddelde afhalen. Deze kwadrateer je, omdat je anders bij het optellen altijd uitkomt op 0. Na het kwadrateren tel je ze bij elkaar op en deel je ze door (n-1) Bij 10 individuen worden de scores dus gedeeld door 9.

SStotaal: individuele scores verschillen rondom het gemiddelde

SSbinnen: individuele scores verschillen binnen elke groep

SStussen: groepsgemiddelden verschillen tussen groepen

VAF( de proportie verklaarde variantie) = SS(tussen) / SS(totaal)

Effect size is de maat voor de sterkte van de relatie. Dit wordt berekend als de ‘proportie verklaarde variantie’, dit is de systematische variantie/totale variantie. Als deze 0 is, is er geen relatie (niets verklaard). Als deze 1 is, is er sprake van een perfecte relatie.

Vuistregel effect size:
0.01 = small effect

0.06 = medium effect

Boven 0.15 = large effect

 

Week 2

 

Observeren en meten van variabelen:

Observeren: Via waarnemingen individuen of hun gedrag indelen in klassen

Meten: Aan de waarnemingen die zijn verkregen door het observeren getallen toekennen, waarmee gerekend kan worden.

Variabele: Datgene dat varieert, een verzameling waarden of categorieën.

 

Variabiliteit:

Een variabele waarde moet voldoen aan 2 eisen. Het moet uitputtend zijn en wederzijds uitsluitend. Met behulp van de tabel hieronder wordt uitgelegd hoe dat in zijn werk gaat:

Categorie:

Leeftijd:

1.

0-18

2

19-35

3

36-70

4

>71

De tabel is uitputtend, want iedereen van iedere leeftijd kan zich in een categorie inschrijven. Wanneer bijvoorbeeld bij categorie 1 in plaats van 0-18, 1-18 stond, dan konden mensen die 9 maanden oud zijn zich nergens plaatsen.

De tabel is wederzijds uitsluitend, omdat je niet hoeft te twijfelen over de categorie waar je in hoort. Wanneer bijvoorbeeld bij categorie 2 in plaats van 19-35,18-35 stond, dan konden mensen die 18 zijn gaan twijfelen of ze in categorie 1 of in categorie 2 moesten staan.

 

Meetniveaus:

  1. Nominaal: dit zijn categorieën, of labels. Het gaat er hierbij alleen maar om of mensen gelijk zijn aan elkaar, of om te tellen hoe vaak iets voorkomt. Het nominale meetniveau is het laagste meetniveau. Voorbeelden: oogkleur, geslacht.
  2. Ordinaal: het gaat hier om een bepaalde volgorde, er wordt iets ‘geordend’. Het eerst gekozen doel heeft een hogere rangorde, maar de verschillen onderling zijn niet gelijk en doen er ook niet toe. Voorbeeld: op volgorde van lengte zetten.
  3. Interval: dit is een volgorde met gelijke intervallen, er zijn dus gelijke afstanden tussen de getallen. Er is hierbij geen absoluut nulpunt. Een voorbeeld hiervan is IQ. A is niet 2 x zo groot als B, want er is geen nulpunt, maar het verschil tussen een IQ van 70 en 80 is evenveel als het verschil tussen een IQ van 130 en 140. Dit betekent dat IQ zich op het niveau van interval bevindt. Je kan dus optellen en aftrekken met scores op intervalniveau, maar niet delen of vermenigvuldigen.
  4. Ratio: dit is een interval met een absoluut nulpunt. Een voorbeeld hiervan is de inhoud in centiliter. Hierbij is een absoluut nulpunt te vinden en de intervallen zijn gelijk. Dan spreek je dus van ratio. Bij dit meetniveau kan je naast optellen en aftrekken ook verhoudingen uitrekenen: dus ook vermenigvuldigen of delen.
  5. Absoluut: Het nulpunt en de eenheid liggen vast, hier mag je zelf niks meer aan doen. Dit is het hoogste meetniveau. Voorbeeld hiervan zijn percentages.

 

Centrale tendentie

Modus: De waarde die het meeste voorkomt. In het rijtje: 2, 3, 5, 5, 7, 8, is de modus 5.

Mediaan: De middelste waarde van een verzameling gegevens. In het rijtje 1, 2, 3, 4, 5 is de mediaan 3.

Gemiddelde: Alle waarden bij elkaar opgeteld gedeeld door het aantal waarden. In het rijtje 1, 2, 3, 4, 7 is het gemiddelde (1+2+3+4+10)/5= 4.

Bij een nominaal meetniveau hoort de modus.

Bij een ordinaal meetniveau hoort de mediaan (+modus).

Bij een interval hoort het gemiddelde (+mediaan +modus).

Bij ratio hoort het gemiddelde( +mediaan+modus).

Met interval en ratio kun je gaan rekenen, omdat je hierbij het gemiddelde kunt berekenen.

 

Benaderingen psychologisch meten:

Observatie:

Om goed te kunnen observeren moeten er drie beslissingen worden gemaakt: 1 de onderzoeksetting, 2 weten de deelnemers wel of niet dat ze worden geobserveerd en 3 hoe wordt het gedrag geregistreerd.

  1. Naturalistisch: Observatie hoe het zich voordoet (de onafhankelijke variabele wordt hierbij niet beïnvloed). Een voorbeeld hiervan is participerende observatie, waarin de onderzoeker zich als het ware infiltreert in een groep mensen en ze observeert zonder dat ze het zelf weten.

Kunstmatig: Observatie in een gecontroleerde omgeving (de onafhankelijke variabele kan hier worden beïnvloed). Een voorbeeld hiervan is een laboratoriumexperiment.

  1. Openlijk: De deelnemer weet dat hij geobserveerd wordt. Een nadeel hiervan is reactiviteit; de deelnemer wordt beïnvloed in zijn gedrag door het feit dat hij weet dat hij geobserveerd wordt.

Verborgen: De deelnemer weet niet dat hij geobserveerd wordt. Een nadeel hiervan is dat het voor ethische problemen kan zorgen.

Oplossingen voor de nadelen van openlijk en verborgen observeren zijn:

  • gedeeltelijke verborgenheid: De deelnemer weet dat hij mee doet aan een onderzoek, maar sommige informatie over het onderzoek weet hij niet.

  • Indirecte observatie: Observatie via informanten.

  • Unobtrusive measures: Indirecte observatie zonder dat de respondent het weet. Een voorbeeld is in iemand zijn container kijken hoeveel flessen drank er liggen, om vervolgens te bepalen hoeveel alcohol hij drinkt.

  1. Het noteren van verhalen: Bij deze vorm van gedragsregistratie worden verhalen van een participant geanalyseerd om daar vervolgens conclusies uit te kunnen trekken.

  • Checklists: Bijvoorbeeld een observatie waarbij bepaalde gedragingen worden geturfd.

  • Tijdmaten: Er wordt onderscheid gemaakt tussen het oberveren van twee verschillende soorten tijdmaten: latentie en duur.

  • latentie: De tijdsinterval tussen gedrag en een respons, of tussen twee verschillende soorten gedragingen.

  • duur: Hoelang een gedrag plaats vindt. Bijvoorbeeld iemand lacht 5 seconden achter elkaar.

  • Observationele ratingsscales: Observationele ratingsscales meten in welke mate iets beoordeeld wordt. Een voorbeeld observationele ratingscale is: in hoeverre ben je gelukkig? Zeer ongelukkig 1 2 3 4 5 Zeer gelukkig.

 

Fysiologisch

Het principe van de fysiologische en neurowetenschappelijke methoden is dat gedrag, gedachten en emoties ontstaan uit processen in het zenuwstelsel.

  • Neurale electrische activiteit (bijv. EEG, EMG)

  • Neuroimaging (bijv. fMRI)

  • Autonome zenuwstelsel (bijv. harslag, bloeddruk)

  • Bloed en speeksel (bijv. hormoonspiegel)

  • Zichtbare reacties (bijv. blozen)

 

Zelfrapportage

Er zijn twee vormen van zelfrapportage:

  • Vragenlijsten

  • Interviews

Voordelen van vragenlijsten zijn dat ze vaak goedkoper zijn en een betere garantie voor anonimiteit biedt. Een nadeel van een vragenlijst is dat ze niet afgenomen kunnen worden bij bijvoorbeeld jonge kinderen en analfabeten.

Voordelen van interviews zijn dat ze de mogelijkheid bieden tot doorvragen en dat er gecontroleerd kan worden of de participant de vraag heeft begrepen. Een nadeel van een interview is dat ze een goede training van interviewers vereisen.

 

Hoe formuleer je goede vragen voor een interview/vragenlijst?

Houd je aan de volgende criteria:

  • Wees in je vragen specifiek, eenvoudig en kort

  • Doe geen onterechte aannames

  • Geef voorwaardelijke informatie eerst. Bijvoorbeeld: Als je broer iets heeft gestolen, zou je de politie inschakelen in plaats van: Zou je de politie inschakelen als je broer iets heeft gestolen.

  • Geen dubbelloops vragen (twee vragen in één). Bijvoorbeeld hoe vaak eet en sport je per dag? Maak hier twee vragen van: 1. hoe vaak eet je per dag? en 2. hoe vaak sport je per dag?

  • Voer eerst een pilot study uit (het testen van je vragenlijst voordat je het daadwerkelijk voor het onderzoek gaat gebruiken).

  • Kies een juiste response format uit:

  • Free response format: een open vraag. Een voordeel hiervan is dat de vraag niet sturend is. Een nadeel hiervan is dat het lastig te coderen en analyseren is.

  • Ratingscale: De respondent geeft aan in welke mate hij het met iets eens is. Bijvoorbeeld hoe gelukkig voelt u zich? Zeer ongelukkig 1 2 3 4 5 6 7 Zeer gelukkig. Een voordeel hiervan is dat het makkelijk te coderen en analyseren is.

  • Multiplechoice: Een vraag waar je kunt kiezen uit verschillende antwoorden: a, b, c of d bijvoorbeeld.

Bij zelfrapportage moet er rekening gehouden worden met drie dingen:

  • respondenten kunnen sociaal wenselijk antwoorden, wat bias creëert.

  • Respondenten kunnen ja-knikken of nee-knikken (het met elke vraag eens of oneens zijn). Een maatregel hiertegen is vragen maken die precies het tegenovergestelde zijn van een andere vraag. Een respondent kan het dan nooit eens zijn met allebei die vragen en zo kan je de ja en nee-knikkers eruit filteren.

 

Archiefdata

Ook kan je gebruik maken van data die in archieven is opgeslagen. Dit is geschikt om dingen die in het verleden zijn gebeurd te analyseren, veranderingen over tijd te meten en om vastgelegde zeldzame gebeurtenissen te analyseren. Een nadeel is dat de onderzoeker deze data niet kan controleren.

 

Inhoudsanalyse

Bij een inhoudsanalyse codeer je bepaalde eenheden.

 

Steekproeven

Er zijn verschillende soorten steekproeven. Er is een onderscheid te maken tussen kanssteekproeven en niet-kanssteekproeven.

Kanssteekproeven:

  1. Simple random steekproef (SRS): dit is het beste te vergelijken met het trekken van namen uit een hoge hoed, iedereen heeft dus gelijke kans om in de steekproef te vallen. Dit is een praktisch probleem bij grote populaties ( hoe krijg je de namenlijst?)
  2. Systematische steekproef: hierbij wordt een vaste regelmaat aangehouden. Bijvoorbeeld na elke tien voorbijgangers weer iemand ondervragen.
  3. Gestratificeerde random steekproef: hierbij verdeel je de populatie eerst onder in bijvoorbeeld mannen-vrouwen of verschillende leeftijden (stratum). Vervolgens haal je uit beide delen mensen voor het onderzoek.
  4. Clustersteekproef: hierbij gaat het niet om een inhoudelijk stratum, maar wordt de steekproef ingedeeld op geografische locatie.

Niet-kanssteekproeven:

  1. Gelegenheidssteekproef: afgaan op wat er voorbij komt. Voorbeeld: voor het FSW mensen ondervragen.
  2. Quota steekproef: hierbij moet de steekproef gelijk zijn aan de percentages binnen de populatie. Voorbeeld: onder psychologiestudenten is 20% man en 80% vrouw. Een steekproef moet dan uit 20% mannen en 80% vrouwen bestaan.
  3. Doelgerichte steekproef

 

Niet kanssteekproeven kunnen nooit bij beschrijvend onderzoek gebruikt worden. Nonresponse bij steekproeven geeft een onbekende bias. Non-response kun je minimaliseren door de respondent meerdere keren proberen te bereiken.

 

Week 3

 

Het doel van onderzoek doen is variabiliteit verklaren. Variabiliteit in metingen is variabiliteit in eigenschappen zoals gedrag. Een goed onderzoek dient betrouwbaar en valide te zijn.

 

Betrouwbaarheid:

Betrouwbaarheid: komt de variabiliteit in de getallen overeen met de werkelijke variabiliteit in het te meten gedrag? Het gaat hier om weinig toevalsfouten. Betrouwbaarheid komt er in het kort op neer dat er bij herhaald meten steeds hetzelfde wordt gemeten.

Meten betrouwbaarheid: systematische (ware score) variantie/totale ( geobserveerde) variantie

De betrouwbaarheidscoëfficiënt ligt tussen 0 en 1. De vuistregel is dat 0,70 of meer voldoende is.

Geobserveerde variantie (de meting): systematische variantie (ware score) + toevalsfouten (meetfout, zie 1 t/m 5 hieronder)

  1. Tijdelijke toestanden (transient states) zoals vermoeidheid, honger en dorst.
  2. Stabiele eigenschappen zoals persoonlijkheid en geslacht
  3. Situationele factoren zoals hoe de testruimte eruit ziet of hoe de onderzoeker zich gedraagt tegenover de respondent
  4. Eigenschappen van het meetinstrument zoals
  5. Fouten door de onderzoeker zoals het foutief invoeren van gegevens in spss

Betrouwbaarheidscoëfficiënten

  1. Test- hertest betrouwbaarheid: het twee keer afnemen van dezelfde test en de overeenstemming in de resultaten bepalen. Voorbeeld: je neemt bij iemand een IQ-test af waaruit blijkt dat deze persoon een IQ heeft van 120. Twee maanden later neem je precies dezelfde test af, maar nu heeft diegene ineens een IQ van 80. Dan kan je ervan uitgaan dat er iets mis is met het meetinstrument.
  2. Paralleltest betrouwbaarheid: in dit geval zijn de vragen hetzelfde ( ze meten hetzelfde), maar ze zijn niet identiek. Goed voorbeeld hiervan is het tentamen en de herkansing: ze testen dezelfde kennis/vaardigheden, maar zijn niet identiek.
  3. Inter-item betrouwbaarheid: in hoeverre zijn items in een meetinstrument intern consistent? Dus meten de items in een meetinstrument wel wat ze moeten meten? Het gaat hier om een samenhang.
  4. Item-totaal betrouwbaarheid: de score van 1 item moet samenhangen met het totale meetinstrument.
  5. Replicatie: het onderzoek nogmaals uitvoeren en de overeenstemmingen bekijken.

Hoe verbeter je de betrouwbaarheid? Door toevalsfouten te elimineren. Dit kan op vier manieren:

  • standaardiseren afname instrument (elke persoon neemt dezelfde test af op dezelfde manier)

  • De vragen en de instructies van de vragen moeten helder zijn

  • De observatoren moeten goed getraind zijn

  • Minimale fouten bij de verwerking van de gegevens (met bijvoorbeeld spss)

 

Validiteit:

Meet het instrument ook werkelijk datgene wat het claimt te meten? Het gaat hier om weinig systematische fouten.

Soorten validiteit:

1. Face validiteit: het onderzoek is valide naar het oordeel van de onderzoeker of participanten. Dit is dus niet heel betrouwbaar.

2. Inhoudsvaliditeit: wordt het gehele domein gedekt door het instrument? Dit vereist onafhankelijke beoordelaars

3. Construct validiteit: is er samenhang met andere metingen?

  • Convergente validiteit: er is een sterke samenhang met instrumenten die hetzelfde of een vergelijkbaar construct meten

  • Discriminante validiteit: er is een zwakke of geen samenhang met instrumenten die een ander construct meten

4. Criterium validiteit: stelt een criterium, doet een voorspelling en kijkt vervolgens of het klopt. Deze vorm van validiteit is onder te verdelen in 2 componenten.

  • Concurrente validiteit: deze validiteit wordt tegelijkertijd gemeten met de uitvoering van het onderzoek.

  • Predictieve validiteit: deze validiteit wordt voorspeld aan de hand van eerder onderzoek

De voorspelbaarheid is echter laag. Voorbeeld hiervan is selectie bij de poort voor studenten: is dit valide?

Opletten: validiteit vereist betrouwbaarheid, maar dat een test betrouwbaar is wil nog niet zeggen dat deze ook valide is!

Validiteit geheel onderzoek

Statistische Validiteit: Is de data-analyse correct?

Interne Validiteit: Zijn alternatieve verklaringen uitgesloten?

Externe Validiteit: Is het resultaat generaliseerbaar?

Construct Validiteit: Zijn alle gebruikte instrumenten valide?

 

Week 4

 

Er zijn drie verschillende soorten beschrijvend onderzoek

  • Surveys: vragenlijst, interview

  • Demografisch: statistisch onderzoek, bijvoorbeeld de statistiek die het CBS bijhoudt

  • Epidemiologisch onderzoek: aanwezigheid van ziekten en psychologische aandoeningen

 

Er zijn drie verschillende soorten surveys

  • Cross-sectioneel: een éénmalige doorsnede van de populatie, dus als je bijvoorbeeld een vragenlijst afneemt bij verschillende personen doe je dit éénmalig en daaruit trek je een conclusie.

  • Opeenvolgende onafhankelijke steekproeven: je herhaalt de steekproef één of meerdere keren en vergelijkt de resultaten met elkaar. Je moet je wel afvragen of deze steekproeven vergelijkbaar zijn.

  • Longitudinaal: je onderzoekt veranderingen over de tijd met één (dezelfde) groep. Dit kan voor problemen zorgen als er mensen uitvallen. Na verloop van tijd kan iemand bijvoorbeeld besluiten zijn deelname aan het onderzoek te beëindigen om wat voor reden dan ook.

 

Beschrijven en presenteren van data
Uit een onderzoek komen vaak een heleboel cijfers (ruwe data). De ruwe data zijn lastig te interpreteren. Daarom vatten we ze samen. Dit kan numeriek en/of grafisch. Een grafische weergave van een verdeling heet een plot. Dit verschilt van een numerieke verdeling (bijvoorbeeld een tabel). Voor een goede beschrijving van de data moet de data accuraat, beknopt en begrijpelijk zijn. Er is een spanningsveld tussen beknoptheid en accuraatheid. Hoe beknopter iets wordt beschreven hoe minder accuraat het is en andersom.

 

Hoe beschrijven we een verdeling?

  • Algehele patroon

  • Vorm: is de vorm van de verdeling symmetrisch of scheef? Hoeveel pieken zijn er te zien in de verdeling? (unimodaal één piek, bimodaal twee pieken en multimodaal meer dan twee pieken)

  • Centrale tendentie/locatie: Welke vormen van centrale tendentie kunnen we beschrijven? (gemiddelde, mediaan, modus)

  • Spreiding: Is er veel of weinig spreiding

  • Opvallende afwijkingen

  • Uitbijters: waarnemingen die in hoge mate afwijken van de rest van de waarnemingen

  • Staarten: is de staart dik of dun van een normaalverdeling. Wat betekent dit?

 

Absolute en relatieve frequenties
Absolute frequenties (f): aantal proefpersonen met een bepaalde score. Bijvoorbeeld bij een de afname van IQ-test bij mensen:

IQ van 120 8 keer

IQ van 122 6 keer

IQ van 135 1 keer

Een nadeel van absolute frequenties is dat ze moeilijk te vergelijken en interpreteren vallen. Is bijvoorbeeld de bovenstaande absolute frequentie IQ van 120 8 keer veel of weinig.

Relatieve frequenties (P): Proportie van een bepaalde score ten opzichte van het totaal (P = f/n). Bijvoorbeeld als 10 mensen een IQ-test maken en 4 daarvan hebben een score van 120 dan is de relatieve frequentie 4/10= 0.4. P = 0.4. Een voordeel van relatieve frequenties is dat je scores makkelijk kunt vergelijken en interpreteren.

 

Frequentieverdeling: gegroepeerde tabel
Frequentieverdelingen kun je in een gegroepeerde tabel plaatsen. Je moet dan eerst intervallen maken. De vuistregel voor de hoeveelheid intervallen is de wortel van N. Bij 49 groepen heb je dus 7 intervallen. Daarna moet je het bereik (range) bepalen. Range= hoogste waarde – laagste waarde. Als laatste moet je ervoor zorgen dat je gelijke intervalbreedtes hebt.

De intervalbreedte is: Een interval moet uitputtend & wederzijds exclusief zijn.

Als je de intervallen bij elkaar optelt, dan moet je ook de frequenties van de bij elkaar behorende intervallen bij elkaar optellen.

Frequentieverdeling: cumulatieve tabel
Bij een absolute cumulatieve frequentieverdeling tel je alle voorgaande frequenties bij elkaar op. Je kunt ook de proporties van een variabele cumulatief weergeven. Bijvoorbeeld bij de volgende data:

Toelichting

Cumulatieve absolute frequentie (f): bij a zijn er 6 scores dus de absolute frequentie is gewoon 6. Bij b tel je daar de 8 frequenties bij op, dat maakt 14. Bij c tel je er vervolgens weer 12 bij op, dat maakt 26, etc. 30 is het totaal aantal absolute frequenties. Bij de cumulatieve relatieve frequenties is het principe hetzelfde, alleen hier tel je telkens de proportie van een frequentie ten op zichte van het totaal bij elkaar op. Bijvoorbeeld bij a 6/30= 0.200 -> 20% van de totale scores zijn tussen de 70 en 79. Bij b tel je de proportie 8/30= 0.267 bij de proportie van a op en dat maakt 0.267 + 0.200 = 0.467, etc. Alle cumulatieve relatieve frequenties bij elkaar opgeteld maakt 1 en dat is 100%.

Een cumulatieve frequentieverdeling kun je weergeven met een polygoon.

 

Maten voor centrale tendentie

De modus is de meest voorkomende waarneming.

Kijk bijvoorbeeld naar de volgende getallenreeks: 2.8.8.8.6.5.4.3.6.6.8.8

8 is hier de modus.

De mediaan ((n+1)/2) is de middelste waarneming. Hiervoor moet je alles eerst op volgorde zetten.

Kijk bijvoorbeeld naar de volgende getallenreeks: 2.4.6.9.12

6 is hier de mediaan

Bij de volgende getallenreeks zie je 2 middelste getallen: 2.4.6.7.9.12

6.5 is dan de mediaan ( 6+7= 13, 13/2= 6,5)

Het gemiddelde is alle scores bij elkaar opgeteld delen door het aantal waarnemingen. Kijk bijvoorbeeld naar de volgende getallenreeks: 1 2 3 6.

3 is hier het gemiddelde ((1+2+3+6)/4= 3.

De modus en de mediaan blijven redelijk constant bij een normaalverdeling ongeacht de scores. Het gemiddelde daarentegen is erg gevoelig voor uitbijters.

 

Maten van spreiding

De standaarddeviatie en variantie zijn alleen geschikt voor spreiding rond het gemiddelde en ze zijn niet bestand tegen uitschieters. Kijk terug naar de samenvatting van college 1 voor de beschrijving van de verschillende letters/tekens van de variantie. De standaarddeviatie is de wortel van de variantie.

 

Interquartile range (IQR): Q3-Q1

De IQR kan verduidelijkt worden aan de hand van de Five-number summary:

Minimum: laagste score die geen uitbijter is

Q1: 25e percentiel; 25% van de scores is lager dan Q1 en 75% hoger.

Mediaan (Q2): 50e percentiel; 50% van de scores is hoger dan Q2 en 50% lager.

Q3: 75e percentiel: 75% van de scores is lager dan Q3 en 25% hoger.

Maximum: hoogste score die geen uitbijter is

De IQR is Q3 – Q1.

Een vuistregel voor uitbijters is dat als een observatie 1.5 keer de IQR boven de Q3 of 1.5 keer onder de Q! ligt dat het een uitbijter is.

Bijvoorbeeld:

Data 3 13 17 19 22 24 25 28 35 39 44 45 83 86 93

Minimum: 3

Maximum: 93

Mediaan: (Q2): 28 ((n+1)/2 = (15+1)2 = 8) het achtste getal in deze reeks is 28.

Vervolgens deel je de data op in twee groepen: de data links naast de mediaan en de data rechts van de mediaan. Dan pas je dezelfde formule toe als bij de mediaan en dan is het antwoord op de data links naast de mediaan Q1 en rechts naast de mediaan Q3. In het geval van deze datareeks: Q1= 19 en Q3 is 45.

IQR = 45 – 19 = 26

Q1 – (26 x 1.5) = -20

Q3 + (26 x 1.5) = 84

Er zijn geen waarnemingen onder de -20. Er zijn 2 waarnemingen boven de 84, namelijk 86 en 93. Dit zijn uitbijters.

 

Meetniveau ‘s, grafieken en centrale tendenties
Bij een nominaal meetniveau hoort een staafdiagram of een taartdiagram. De bijbehorende centrale tendentie is de modus. Bij een ordinaal meetniveau kun je een staafdiagram, taartdiagram of een Boxplot gebruiken. Hierbij kun je de mediaan of de modus gebruiken als centrale tendentie. Bij een interval meetniveau of hoger kun je een taartdiagram, staafdiagram, boxplot of een histogram gebruiken. De centrale tendenties die mogelijk zijn bij een interval meetniveau of hoger zijn de modus, het gemiddelde en de mediaan.

 

Week 6

 

Analyse van de verdeling van variabele
Maak eerst een grafische weergave van je variabele (bijvoorbeeld een histogram). Kijk naar de grafische weergave naar de verdeling en eventuele afwijkende variabele. Geef vervolgens een numerieke beschrijving van de verdeling (in een tabel bijvoorbeeld). Fit vervolgens een dichtheidscurve.

 

Dichtheidscurve

Een dichtheidscurve is de ideale benadering van je empirische verdeling; het vormt om je verdeling een gladde curve. Als deze curve overeenkomt met de daadwerkelijke verdeling kan je deze gebruiken om waarden af te lezen en berekeningen te maken. Je kunt een dichtheidscurve toepassen bij een interval meetniveau of hoger. De parameters van een dichtheidscurve zijn het gemiddelde (µ) en de standaardafwijking (σ). De dichtheidscurve toont de relatieve frequentie als oppervlakte. Het gedeelte onder de lijn van de curve is de oppervlakte. De totale oppervlakte van de curve is 1; dit is 100% en dat komt omdat alle waardes binnen de curve liggen. De curve ligt altijd op of boven de x-as. Dit komt omdat de y-as frequenties aangeeft. Al zou de curve onder de x-as liggen betekent dit dat de curve een negatieve y-waarde heeft en dit kan niet, je kan namelijk geen -1 of -2 frequentie hebben, 0 is het minimum. Een dichtheidscurve kan een staart naar links hebben (negative skew) als er veel hoge waardes zijn of een (positive skew) als er veel lage waardes zijn (zie sheet 5).

 

Eigenschappen van een normale verdeling

Een normale verdeling is klokvormig en symmetrisch. Symmetrisch wilt zeggen dat de vorm van een perfecte normaalverdeling links en rechts van het gemiddelde hetzelfde is. De normale verdeling wordt bepaald door de parameters σ en µ. µ geeft de horizontale locatie en is precies in het midden van een perfecte normaalverdeling. Let op het gemiddelde zit vaak niet precies in het midden, omdat de meeste verdeling niet perfect symmetrisch zijn. De σ geeft het buigpunt van de verdeling aan. Op dit punt verandert de richting waar de normaalverdeling heenbuigt. Als er een hoge waarde van σ is zal de verdeling breder en lager zijn. Bij een lage waarde van σ zal de verdeling smaller en hoger zijn. Op sheet 6 kun je alle eigenschappen van een normale verdeling in een figuur zien. Op sheet 5 kun je een voorbeelden van verschillende breedtes en hoogtes van verdelingen zien (laptokurtic, normaal en platykurtic).

 

Waarom is een normale verdeling belangrijk?

Een normale verdeling is een model maar ook een norm. Er zijn drie redenen waarom een normale verdeling een norm is:

  1. biedt de mogelijkheid tot verschillende berekeningen

  2. belangrijke aanname voor veel statistische toetsen

  3. Verdeling van steekproefgemiddelden (hier wordt verder op ingegaan bij het vak Toetsende Statistiek)

 

Standaardscores (z-scores) berekenen

Een normaalverdeling wordt bepaald door het gemiddelde en de standaarddeviatie. Omdat je oneindig veel combinaties van waarden voor het gemiddelde en de standaarddeviatie kunt hebben betekent het dat je ook een oneindig veel verschillende normaal verdelingen kunt tekenen. Met behulp van een tabel kan je met een normaalverdeling berekeningen maken hoeveel procent van de scores tussen twee grenzen of boven of onder een grens valt. Dit geeft ook een indicatie voor de kans dat iemand van een populatie binnen twee of onder of boven een grens valt. Als 20% van de scores tussen twee grenzen vallen is ook de kans dat iemand uit die populatie tussen die twee grenzen valt 20%.Voor elke verschillende gemiddeldes en standaarddeviaties (en dus ook een andere normale verdeling) heb je een tabel met andere waardes nodig om berekeningen te maken. Omdat er oneindig veel combinaties gemiddeldes en standaarddeviaties zijn, is het handig om je gemiddelde en standaarddeviatie om te rekenen naar een standaardscore. Voor deze standaardscore is al een tabel gemaakt (die achter in met boek van Howell staat: appendix z of op collegesheet 14 en 22). Deze standaardscore heeft altijd een gemiddelde van 0 en een standaarddeviatie van 1. Deze scores worden ook wel z-scores genoemd en je kunt ze berekenen per x-waarde. De formule voor een z-score is:

Z = (x- µ)/σ

Je kunt ook een x-score berekenen als je de z-score, de standaarddeviatie en het gemiddelde weet. De formule hiervoor is:

X = µ+zσ

De z-scores staan op de x-as van een gestandaardiseerde verdeling. Met behulp met appendix z achter in het boek van Howell of met de tabel op sheet 17 en 19 kun je bepalen wat voor oppervlakte er links, rechts of tussen twee grenzen ligt. Deze oppervlakte heeft een relatieve frequentie. Links van de tabellen van sheet 17 en 19 staat een rij (de verticale)met scores. Dit is de z-score afgerond op 1 decimaal. De horizontale rij geeft de tweede decimaal achter de komma aan. Op deze manier kun je verschillende waardes uitrekenen. Bijvoorbeeld de cumulatieve waarde van het gebied links van een z-score en rechts van een z-score. Door de cumulatieve relatieve waarde links van een lagere z-score van de cumulatieve relatieve waarde recht van een z-score af te trekken kun je de cumulatieve relatieve waarde tussen de twee punten uitrekenen. Op sheet 13 en 21 kun je voorbeelden van sommen zien die je met de normale verdeling en de tabel kunt maken.

Dus:

  • standaardiseren geeft een gemiddelde van 0 en een standaarddeviatie van 1.

  • als de waardes van de verdeling voor het standaardiseren een normale verdeling waren zijn ze het na het standaardiseren ook. Je kunt een niet-normale verdeling niet normaal maken door ze te standaardiseren; de verdeling blijft namelijk hetzelfde.

  • Het gemiddelde verschuift met afstand µ; dit kun je ook zien omdat je van elke x score µ aftrekt. Als je dat bij elke score doet en je zou dat bij elkaar optellen kom je op 0 uit.

  • De standaardafwijking verandert met 1/σ. Al was je standaardafwijking eerst 15 en het is nu 1 (bij het standaardiseren maak je de standaardafwijking 1) dan is het 0.07% van wat het eerst was.

 

De 68 – 95 – 99.7% regel

Een handige vuistregel is dat bij elke normale verdeling ongeveer 68% van de scores tussen -1σ en 1σ ligt, ongeveer 95% tussen -2σ en 2σ en ongeveer 99.7% tussen -3σ en 3σ. Dit kun je gebruiken bij het aflezen van een verdeling. Ook is het handig als je een tekening maakt van een verdeling om deze waardes te vermelden.

 

Normaliteit vaststellen

Je kunt met spss met een P-P plot en een Q-Q plot de normaliteit van een verdeling vaststellen. Soms is het lastig om aan een verdeling te zien of het normaal verdeelt is. Je kunt met spss een P-P plot en een Q-Q plot de normaliteit van een verdeling vaststellen. Op sheet 25 zie je links een P-P plot en rechts een Q-Q plot. Bij de Q-Q plot kun je zien aan de puntjes welke waarde de observaties die op de x-as staan hebben en op de y-as kun je zien welke waarde je deze waarde verwacht te zijn als de verdeling normaal was. Bij de P-P plot zijn de waarden op de y-as de cumulatieve verwachte relatieve scores en op de x-as de cumulatieve geobserveerde relatieve scores. Bij de Q-Q plot zijn de waarden op de y-as de absolute verwachte scores en op de x-as de absolute geobserveerde scores. De lijn geeft aan waar de puntjes zouden moeten staan als de verdeling perfect normaal verdeeld is. Dit is echter vrijwel nooit zo. Hoe ver de puntjes van de lijn afstaan bepaalt hoe normaal verdeeld de verdeling is. Als de lijntjes systematisch afwijken van de diagonale lijn is de verdeling niet normaal verdeeld. Aan het begin en aan het einde van de lijn zijn vaak afwijkingen; dit komt door outliers (uitschieters). Daarnaast kun je naar de skewness (scheefheid van een verdeling) of de kurtosis kijken: zie sheet 5. Ten slotte heb je nog de Kolmorgorov-Smirnov (K-S) test die kan uitrekenen of een verdeling normaal verdeeld is. Deze test is echter zeer (over)gevoelig en kan daardoor soms iets bepalen als niet-normaal verdeeld hoewel het wel normaal verdeeld is.

 

Week 7

 

Verband tussen twee variabelen

Er zijn twee vormen van samenhang tussen twee variabelen: samenhang en afhankelijkheid. Bij afhankelijkheid is er spraken van causaliteit: een onafhankelijke variabele veroorzaakt een afhankelijke variabele. Ook is er bij afhankelijkheid sprake van een voorspelling (regressie); je kunt voorspellen wat de onafhankelijke variabele voor invloed heeft op de afhankelijke variabele. Bij samenhang gaat het puur om correlatie; je kunt geen uitspraak doen over wat de correlatie nou veroorzaakt.

Om de samenhang tussen twee variabelen vast te stellen is het belangrijk om dezelfde n cases (de totale populatie/alle observaties) te nemen voor beide variabelen. Het is niet nuttig om de samenhang tussen lengte en gewicht te bepalen, waarbij je bij 20 mensen de lengte hebt en bij 16 mensen het gewicht hebt gemeten. Je kunt variabelen met verschillende meetniveaus met elkaar vergelijken. Je kunt de samenhang tussen twee numerieke variabelen, de samenhang tussen een categorische en een numerieke variabele en de samenhang tussen twee categorische variabelen. vergelijken Hierbij hebben de numerieke variabelen een meetniveau van interval of hoger en hebben de categorische variabelen een nominaal of ordinaal meetniveau. Je kunt stellen dat twee waarden 1 en 2 met elkaar zijn geassocieerd als waarde 1 vaker optreedt met een waarde van 2 dan met andere waarden.

 

Scatterplot

Je kunt de samenhang tussen variabelen globaal aflezen in een scatterplot. Op sheet 5 van week 7 kun je zien hoe zo’n scatterplot eruit ziet. Je kunt de relatie tussen variabelen beschrijven met behulp van een scatterplot met een drietal dingen:

  1. Richting

Als er een positieve relatie is tussen twee variabelen zal een hogere van variabele 1 samengaan met een hogere variabele van 2 en andersom.

Als er een negatieve relatie is tussen variabelen zal een hogere score van variabele 1 samengaan met een lagere score van variabele 2. Bij een positieve relatie zullen de punten op de scatterplot (vaak heel globaal) een opgaande lijn voorstellen en bij een negatieve relatie juist een dalende lijn.

  1. Vorm

Lineair verband: bij een lineair verband volgen de punten op een scatterplot min of meer een rechte lijn.

Niet-lineair verband: bij een niet-lineair verband volgen de punten op een scatterplot juist geen rechte lijn, maar is er een ander verband aanwezig. Op sheet 7 kun je voorbeelden van beide verbanden in een scatterplot zien.

Daarnaast valt er onderscheid te maken tussen hetero –en homogeniteit. Homogeniteit betekent dat alle punten op de scatterplot min of meer in hetzelfde cluster liggen. Heterogeniteit betekent dat er meerdere clusters met punten zijn, zoals op sheet 8.

  1. Sterkte

Als je een volledig rechte lijn door de punten van je scatterplot kan trekken is er een perfect verband tussen de variabelen. Er is vrijwel altijd spreiding in de observaties (er zal vrijwel nooit een perfecte lijn in de scatterplot te trekken zijn). Als de punten op de scatterplot compleet willekeurig zijn verdeeld betekent dit dat er geen verband is tussen de variabelen. Op sheet 6 kun je voorbeelden zien van sterktes van verbanden op een scatterplot.

Ten slotte heb je ook met scatterplots te maken met uitbijters: observaties die ver afwijken van het algemene patroon. Uitbijters kunnen de sterkte van een verband beïnvloeden (ze kunnen de denkbeeldige lijn die je kunt trekken door de punten op de scatterplot steiler of minder steil maken). Je kunt je data plotten zonder uitbijters om dan het verband tussen de variabelen te bekijken in een scatterplot, maar je mag niet zonder reden uitbijters volledig uit de dataset verwijderen.

 

Covariantie

Een maat die gebruikt kan woorden om de sterkte van de samenhang tussen twee variabelen uit te drukken is de covariantie. De formule voor de covariantie is:

De formule lijkt sterk op de formule van de variantie. De variantie is echter niet geschikt voor bivariate data (twee variabelen). De covariantie voegt de variantie van twee variabele samen in één formule. Op sheet 17 kun je de covariantie in beeld op een scatterplot zien. Je ziet in de tabel de afwijking van het gemiddel van x en y aangegeven met pijltjes. Op sheet 18 t/m 20 kun je een voorbeeld van het bereken van de covariantie zien. Let op: kruisproducten en covarianties kunnen ook een negatieve waarde aannemen; dit wijst op een negatief verband tussen de variabelen. Een nadeel van de covariantie is dat het slecht interpreteerbaar is. Al bereken je bijvoorbeeld lengte in centimeters zal de covariantie veel groter zijn dan als je meters gebruikt als meeteenheid. Hierdoor gaat de voorkeur vaak uit naar een gestandaardiseerde maat die de sterkte van samenhang tussen twee variabelen meet, bijvoorbeeld de Pearson (r).

 

Pearson (r)

De pearson (r) is een maat voor samenhang tussen twee intervalvariabelen. De correlatie kan tussen -1 en 1 liggen. -1 betekent een perfecte negatieve correlatie, 1 betekent een perfecte positieve correlatie en 0 betekent geen correlatie. De pearson (r) is gestandaardiseerd en verandert dus niet als je de meeteenheid verandert (bijv. Lengte in meters -> lengte in centimeters). De pearson (r) kan alleen gebruikt worden voor lineaire verbanden; als je hem toepast bij andere verbanden is de maat niet bruikbaar. Je kunt een scatterplot maken om te checken of er een lineair verband is. De pearson (r) is gevoelig voor uitbijters. De formule van de pearson (r) is:

Of

rxy = (Sxy)/(SxSy)

De vuistregel voor de sterkte van de correlatie is:

small

medium

large

0.1

0.3

0.4

Kanttekeningen bij het vaststellen van correlatie

Er zijn vier dingen waar je rekening mee moet houden bij het vaststellen van correlatie:

  1. Niet-lineaire verbanden: correlatie betekent alleen iets bij een lineair verband.

  2. Uitbijters: uitbijters kunnen de richting van de regressielijn op de scatterplot sterk veranderen.

  3. Heterogene subgroepen: als je twee groepen met een verschillende gemiddelde samenvoegt zal dit de totale correlatie beïnvloeden.

  4. Restriction of range: als je niet de gehele range van alle punten op de scatterplot bekijkt kan er een ander verband tussen de variabelen waargenomen worden dan wanneer je wel de gehele range had genomen.

Correlatie is niet hetzelfde als causaliteit. Er zijn drie criteria voor causaliteit

  1. variabelen moeten correleren

  2. Oorzaak komt voor gevolg in de tijd

  3. Alternatieve verklaringen zijn uitgesloten

 

Week 8

 

Causaliteit

Er zijn drie criteria voor causaliteit:

  1. Er moet samenhang tussen variabelen zijn (je kunt dit bijvoorbeeld berekenen met de covariantie en de pearson-r).

  2. De oorzaak van iets moet vooraf gaan in de tijd aan het gevolg (directionality/temporal precendence).

  3. Er is sprake van interne validiteit (alternatieve verklaringen die het verband tussen variabelen verklaren zijn uitgesloten). Hierbij moet worden uitgekeken of er geen verstorende, verscholen variabele aanwezig is die het verband verklaart (lurking variable).

Een verscholen variabele kan de geobserveerde samenhang tussen twee variabelen versterken/verzwakken, een tegengestelde samenhang laten zien dan de wereklijke samenhang en er kan spraken zijn van een spurieus verband (er is eigenlijk helemaal geen samenhang tussen de variabele x en y.

 

Associatie en causatie

Er zijn drie verschillende situaties te onderscheiden waarin x en y samenhangen:

  1. Causatie: Er is een causaal verband tussen x en y; een hogere x veroorzaakt een hogere y. X en y correleren ook met elkaar.

  2. Common response: Een verborgen variabele z veroorzaakt x en y. X en y correleren met elkaar.

  3. Confounding: Een verborgen variabele z veroorzaakt y en de variabele z correleert met x en beinvloed zo de causale relatie tussen x en y. Ook correleren x en y met elkaar.

Essentiële kenmerken van een experiment

Er zijn drie essentiële kenmerken van een experiment:

  1. Manipuleren van de onafhankelijke variabelen:

  • Onafhankelijke variabelen: een kenmerk van een experiment is dat je de onafhankelijke variabele manipuleert om conclusies te kunnen trekken over de relatie tussen variabelen.

  • Omgevingsfactoren: veranderingen in fysieke of sociale omgeving van de participant

  • Instructies: verschillen in instructies die de participant krijgt bij het experiment

  • Invasieve factoren: de invasieve factoren beslaat de manipulatie van fysieke factoren als het fysieke lichaam, medicatie en hormonen

  • Proefpersoonvariabelen

Om praktische en ethische redenen kun je proefpersoonvariabelen vaak niet manipuleren. Wel kunnen deze variabelen de oorzaak zijn van correlatie of causatie. Voorbeelden van proefpersoonsvariabelen zijn: sexe, woonplaats en leeftijd.

  • Condities: een experiment bevat meerdere condities

  • Experimentele conditie: Dit is de conditie waarin de treatment plaatsvindt. Er zijn kwantitatieve en kwalitatieve verschillen tussen treatments. Bijvoorbeeld: verschillende hoeveelheden medicatie (kwantitatief) en verschillende soorten medicatie (kwalitatief). Er zitten meestal een klein aantal participanten in de experimentele conditie.

  • Controle conditie: Dit is de conditie die geen treatment ontvangt of een dummy treatment (placebo).

  • Is de manipulatie succesvol?

  • Je kunt van tevoren een pilot test doen om te testen of het experiment dat je wilt doen geschikt is om te meten wat je wilt meten.

  • Je kunt na het experiment een manipulation check doen (een vragenlijst die je achteraf afneemt om nuttige informatie van de participanten te verkirjgen).

  1. Random toewijzing van participanten

  • Doel

Het doel van een random toewijzing is om de onderzoeksgroepen gelijk te maken. Hierdoor kun je uitsluiten dat het verschil achteraf door de treatment komt en niet door verschillen die er al waren tussen de participanten voordat het experiment begon. Je kunt door middel van een voormeting vaststellen of de groepen gelijk zijn.

  • Manieren

  • Simpele random toewijzing: elke participant wordt compleet random in een groep ingedeeld.

  • Matched random toewijzing: de groepen worden zo ingedeeld dat de participanten worden ingedeeld in groepen naarmate van bijvoorbeeld een score van een voormeting. Daarna verdeel je elk van de personen random over de groepen, maar zorg je er wel voor dat de groepen uiteindelijk gemiddeld gelijk zijn verdeeld met mensen en hun score op de voormeting.

  • Blocking: bij blocking neem je twee even grote groepen van een gelijke soort (bijvoorbeeld mannen en vrouwen). Vervolgens verdeel je de participanten random over de condities.Hierdoor weet je zeker dat elke groep zowel mannen als vrouwen bevat.

  • Between vs within

Between-subjects design (randomised group): in elke conditie zijn andere proefpersonen.

Within-subjects design (repeated measures): iedere proefpersoon zelf in alle condities. Het voordeel hiervan is dat de proefpersoon altijd helemaal gelijk is, simpelweg omdat het dezelfde eprsoon is. Ook heb je minder proefpersonen nodig met dit design. Ook biedt dit design meer power (de mate waarin je het effect van de onafhankelijke variabele kunt meten). Een nadeel van het design is het volgorde-effect; mensen kunnen bijvoorbeeld beter worden in een taak als je ze er meerdere keren aan blootstelt en dan zou dit het verschil tussen de voor en nameting verklaren in plaats van de manipulatie van de onafhankelijke variabele. Een oplossing voor het volgorde effect is counterbalancing; bijvoorbeeld bij een groep van drie personen die elk drie taken moeten doen kun je de personen elk van deze taken in een andere volgorde doen. Op deze manier kun je uitsluiten dat het verschil puur komt door de volgorde van de condities.

  1. Experimentele controle

  • Interne validiteit: zijn alternatieve verklaringen uitgesloten?

  • Variantie

Totale variantie = treatment variantie + confound variantie + error variantie.

Hierbij is de treatment variantie de variantie in y door x, de confound variantie de variantie in y door externe variabele(n) en de error variantie de niet systenmatische variantie. De treatment variantie en de confound variantie samen is de systematische variantie. Het is erg belangrijk om de confound variantie compleet uit te roeien, anders kun je geen goed causaal verband meten tussen x en y.

  • Middelen

Between-subjects design

  • Randomisatie

  • Matching

  • Blocking

Within-subjects design

  • Repeated measures

  • Constant houden van factoren die niet onderzocht worden

  • Stastische controle; het corrigeren voor bestaande verschillen en/of verstorende variabelen door middel van de statistiek.

 

Bedreigers van de interne validiteit

  1. Selectie van proefpersonen (geen randomisatie; biased assignment of participants).

  2. Uitval van proefpersonen (attrition)

  3. Testing (de invloed van de voormeting)

  4. (pretest) sensitation (de invloed van de voormeting op de treatment)

  5. maturation (veranderingen binnen de proefpersonen in de loop van de tijd)

  6. history (gebeurtenissen buiten de proefpersonen)

  7. local history (history heeft op de ene groep wel effect en op de andere groep niet)

  8. instrumentation (problemen met meetinstrumenten)

  9. differential treatment/miscellaneous confounds (verschillende bendaring proefpersonen door onderzoeker)

  10. experimenter expectancy effect (de verwachtingen van de onderzoeker beïnvloeden de proefpersonen)

  11. demand characteristics (de participanten willen vaak graag goede participanten zijn en gaan zich gedragen naar hoe zij denken dat ze zich moeten gedragen zodat ze positief uit de test komen)

  12. placebo-effect (het toedienen van een placebo kan een effect hebben op het gedrag van de participanten)

 

Bronnen van foutenvariantie (zie aantekeningen college 3)

  1. individuele verschillen

  2. tijdelijke toestanden

  3. omgevingsfactoren

  4. verschil in benadering proefpersonen

  5. meetfouten

 

Interne validiteit vs externe validiteit

Interne validiteit gaat over het feit of er alternatieve verklaringen zijn voor de relatie tussen variabelen. Dit kun je versterken door experimentele controle. Maar de experimentele controle kan de generaliseerdbaarheid van het onderzoek verkleinen. Externe validiteit gaat over het feit of de relatie tussen variabelen generaliseerbaar is. Dus al gaat de interne validiteit omhoog gaat de externe validiteit omlaag. Over het algemeen gaat de voorkeur naar de interne validiteit. De reden hiervoor is dat als de interne validiteit zwak al zwak is dan heeft het helemaal geen zin om het resultaat te generaliseren (externe validiteit).

Access: 
Public

Image

Work for WorldSupporter

Image

JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Comments, Compliments & Kudos:

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.
Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams

How and why would you use WorldSupporter.org for your summaries and study assistance?

  • For free use of many of the summaries and study aids provided or collected by your fellow students.
  • For free use of many of the lecture and study group notes, exam questions and practice questions.
  • For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
  • For compiling your own materials and contributions with relevant study help
  • For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, study notes en practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Use the menu above every page to go to one of the main starting pages
    • Starting pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
  2. Use the topics and taxonomy terms
    • The topics and taxonomy of the study and working fields gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
  3. Check or follow your (study) organizations:
    • by checking or using your study organizations you are likely to discover all relevant study materials.
    • this option is only available trough partner organizations
  4. Check or follow authors or other WorldSupporters
    • by following individual users, authors  you are likely to discover more relevant study materials.
  5. Use the Search tools
    • 'Quick & Easy'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject.
    • The search tool is also available at the bottom of most pages

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study for summaries and study assistance

Field of study

Check the related and most recent topics and summaries:
Activity abroad, study field of working area:
Access level of this page
  • Public
  • WorldSupporters only
  • JoHo members
  • Private
Statistics
2164 1 1