Join with a free account for more service, or become a member for full access to exclusives and extra support of WorldSupporter >>

Image

Aantekeningen van Statistiek BDK College 1

 

Hoorcollege 1

De data revolutie: vandaag de dag speelt data analyse een rol in praktisch elke beslissing die gemaakt wordt door corporaties en grotere bedrijven. Kennis uit data is een zogenoemde significant corporate asset geworden. Statistiek is het halen van informatie uit een gegevensset van (ongeordende) data. Dit is belangrijk om betere beslissingen te kunnen maken en om interessante vragen te stellen.

Er valt een onderscheid maken tussen:

  • Beschrijvende statistiek (descriptive statistics): data samenvatten en op een informatieve manier presenteren

  • Verklarende statistiek (inferential statistics): gebruik maken van een steekproef uit populatie en hieruit conclusies trekken.

 

Statistische hoofdconcepten

  • Populatie: Een groep waarin je geïnteresseerd bent

Voorbeeld: alle eerstejaars BDK studenten

  • Sample: Een steekproef uit je populatie

Voorbeeld: Alle eerstejaars BDK studenten op de eerste rij.

  • Variabele: Het karakteristiek waarin je geïnteresseerd bent

Voorbeeld: Het inkomen van een Formule-1 rijder

  • Waarde: Alle mogelijke observaties van een variabele

Voorbeeld: Van €150.000 tot €30.000.000

  • Data: De daadwerkelijke geobserveerde waarde

Voorbeeld: Het geobserveerde jaarlijkse inkomen van 12 verschillende Formule-1 rijders in miljoenen euro’s.

 

Typen data:

  • Kwantitatieve data: Je kunt er mee rekenen en het zijn reële nummers op de getallenlijn.

Voorbeeld:jaarlijkse inkomen van Formule-1 rijders

  • Ordinale data: Er bestaat een rangorde in de data

Voorbeeld: gezondheid status (1= very good, 2 = good etc.).

  • Nominale waarde: Er bestaat geen rangorde binnen de data

Voorbeeld: Burgerlijke staat (1=single, 2=getrouwd, 3=gescheiden, 4=weduwe).

 

Een bar chart (of staafdiagram) wordt gebruikt om frequenties te beschrijven (histogram). Een pie chart (of taartdiagram) wordt gebruikt om relatieve frequenties te beschrijven (cirkeldiagram).

 

Relatie tussen 2 variabelen:

  • Scatter diagram: hoe dichter de punten op de lijn liggen, hoe sterker de relatie. Als alle punten op de lijn vallen noemen we dit deterministisch.

  • Lineaire relatie: Als de meeste punten dicht bij een rechte lijn liggen

 

Basisprincipes voor grafieken en tabellen

Visualisatie van data is heel belangrijk

Het boek “The Visual Display of Quantitative Information” laat 7 basisprincipes van grafische uitmuntendheid zien:

  • Geef de data weer

  • Vermijd onduidelijkheid over wat er in moet staan

  • Grafieken moeten goed leesbaar zijn, er moet in 1 oogopslag te zien zijn wat bedoeld wordt

  • Integreer de tekst en de grafiek

 

Er kan ook gelogen worden met statistiek. Dit gebeurt door bijvoorbeeld een grafiek heel erg uit te vergroten waardoor het verschil tussen de verschillende gemeten eenheden heel erg groot lijkt. In werkelijkheid kan het verschil dan veel kleiner zijn.

 

Arithmetic mean (average): de som van de observaties gedeeld door het nummer van de observasties

  • Population mean (gemiddelde): µ = , met N=populatiegrootte

  • Sample mean (steekproefgemiddelde): x̅ = , met n=steekproefgrootte

Let op de notatie! µ is een onbekende parameter en x̅ een statistiek

 

Maten van centrale locatie

  1. Mediaan: De middelste observatie

  2. Modus: De observatie dat de hoogste frequentie heeft. De modus van een steekproef of populatie hoeft niet uniek te zijn.

  3. Percentiel: De waarde voor welke P % minder dan de waarde is en (100-P)% groter is dan het waarde. Voorbeeld: als jouw cijfer het 80th percentiel is, zit 80% er onder en 20% er boven.

  4. Kwartiel: Het 25e, 50e en 75e percentiel

  5. Mediaan: Het 50e percentiel/ het tweede kwartiel

  6. Spreiding (range): De grootste observatie – de kleinste observatie

  7. Interquartile range: 3e kwartiel – 1e kwartiel

 

Een boxplot bestaat uit eerste, tweede en derde kwartiel. Ook heb je ‘snorharen’, het maximum en het minimum. Punten dat buiten de snorharen liggen worden outliers genoemd. De maximale lengte van een snorhaar is 1,5 keer de interquartile range. Een voorbeeld van een boxplot is te vinden in de slides van hoorcollege 1 slide 38 en 39.

 

De range en interkwartiel range maken maar gebruik van 2 datapunten.

Variantie: De gemiddelde afwijking van het gemiddelde.

  • Populatie variantie: σ2 =

  • Steekproefvariantie: s2 =

De afwijking kan positief en negatief zijn, daarom wordt er een kwadraat genomen.

 

Voor een voorbeeld van steekproefvariantie, zie de slides van de colleges.

Chebyshev’s ongelijkheid en de empirical regel

In elke steekproef of populatie zijn bijna alle waarden dichtbij het centrum. Ten minste 1-(1/k2) van de waarden zijn in de k standaard deviaties van het centrum, voor k>1.

 

 

Correlatie: het weergeven van de relatie tussen 2 waarden. Dit kan goed weergegeven worden bij gewicht en lengte. Het kan bijvoorbeeld weergegeven worden in een scatterplot. Bij een rechte lijn is er geen relatie, bij een stijgende lijn een positieve relatie, en bij een dalende lijn een negatieve relatie.

  • Population covariance:

  • Sample covariance:

 

Image  Image  Image  Image

Access: 
Public

Image

Image

Follow the author: lucaslucas103
Work for WorldSupporter

Image

JoHo can really use your help!  Check out the various student jobs here that match your studies, improve your competencies, strengthen your CV and contribute to a more tolerant world

Working for JoHo as a student in Leyden

Parttime werken voor JoHo

Comments, Compliments & Kudos:

Add new contribution

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
Image CAPTCHA
Enter the characters shown in the image.

Image

Check how to use summaries on WorldSupporter.org

Online access to all summaries, study notes en practice exams

How and why would you use WorldSupporter.org for your summaries and study assistance?

  • For free use of many of the summaries and study aids provided or collected by your fellow students.
  • For free use of many of the lecture and study group notes, exam questions and practice questions.
  • For use of all exclusive summaries and study assistance for those who are member with JoHo WorldSupporter with online access
  • For compiling your own materials and contributions with relevant study help
  • For sharing and finding relevant and interesting summaries, documents, notes, blogs, tips, videos, discussions, activities, recipes, side jobs and more.

Using and finding summaries, study notes en practice exams on JoHo WorldSupporter

There are several ways to navigate the large amount of summaries, study notes en practice exams on JoHo WorldSupporter.

  1. Use the menu above every page to go to one of the main starting pages
    • Starting pages: for some fields of study and some university curricula editors have created (start) magazines where customised selections of summaries are put together to smoothen navigation. When you have found a magazine of your likings, add that page to your favorites so you can easily go to that starting point directly from your profile during future visits. Below you will find some start magazines per field of study
  2. Use the topics and taxonomy terms
    • The topics and taxonomy of the study and working fields gives you insight in the amount of summaries that are tagged by authors on specific subjects. This type of navigation can help find summaries that you could have missed when just using the search tools. Tags are organised per field of study and per study institution. Note: not all content is tagged thoroughly, so when this approach doesn't give the results you were looking for, please check the search tool as back up
  3. Check or follow your (study) organizations:
    • by checking or using your study organizations you are likely to discover all relevant study materials.
    • this option is only available trough partner organizations
  4. Check or follow authors or other WorldSupporters
    • by following individual users, authors  you are likely to discover more relevant study materials.
  5. Use the Search tools
    • 'Quick & Easy'- not very elegant but the fastest way to find a specific summary of a book or study assistance with a specific course or subject.
    • The search tool is also available at the bottom of most pages

Do you want to share your summaries with JoHo WorldSupporter and its visitors?

Quicklinks to fields of study for summaries and study assistance

Field of study

Statistics
671