Samenvatting Statistiek

-
103 Flashcards en notities
1 Studenten
  • Deze samenvatting

  • +380.000 andere samenvattingen

  • Een unieke studietool

  • Een oefentool voor deze samenvatting

  • Studiecoaching met filmpjes

Onthoud sneller, leer beter. Wetenschappelijk bewezen.

PREMIUM samenvattingen zijn gecontroleerd op kwaliteit en speciaal geselecteerd om je leerdoelen nog sneller te kunnen bereiken!

Samenvatting - Statistiek

  • 1 College 1

  • Categorische  variabelen

    Categorieën en geen getallen als waarden. 

  • 2 soorten categorische variabelen:

    Nominaal & ordinaal

  • Nominale variabelen

    Geen rangordening. Man/ vrouw

  • Ordinale variabelen

    Weinig religieus, beetje religieus, heel erg religieus

     

  • 2 soorten kwantitatieve variabelen

    Discrete & continue

  • Discrete variabelen

    Kunnen bepaald aantal waarden voorkomen. aantal kinderen bv

  • Continue variabelen

    Inkomen, tijd enz 

  • Proportie ligt altijd tussen de 

     

    0 en de 1

  • Centrummaten (GEMEMO)

    - Gemiddelde

    - Mediaan

    - Modus

  • Spreiding

    Afwijkingen van het gemiddelde

  • Meer spreiding betekent

    Meer zekerheid

  • Standaarddeviatie

    De standaarddeviatie geeft aan hoeveel de data gemiddeld afwijkt van het gemiddelde

     

  • “gemiddelde afstand” van het gemiddelde

    Standaarddeviatie

  • Hoe groter de standaarddeviatie (s)

    Hoe groter de spreiding van de data

  • Variantie

     

    s² gemiddelde van gekwadrateerde deviaties

  • Z-score

    Hoeveel standaarddeviaties een observatie van het gemiddelde ligt, dat is de z-score

     

  • Percentiel

    Geeft aan hoeveel procent van de observaties onder een bepaald punt ligt

     

  • Drie percentielen die vaak gebruikt worden

    25e, 50e, 75e Deze worden ook wel kwartielen Q1, Q2 en Q3 genoemd

  • Interquartile range:

    Reken je uit door Q3 – Q1 te doen

  • Criterium outliers

    Een observatie is een outlier als het meer dan 1.5 keer de IQR onder het eerste kwartiel of boven het derde kwartiel ligt

  • Skewed to the right is

    Mooi meegenomen Modus, mediaan, gemiddelde

  • Negatieve associatie (wat gebeurt er met x en y)

    als X omhoog gaat, dan gaat Y omlaag

  • Positieve associatie (wat gebeurt er met x en y)

    als X omhoog gaat, dan gaat Y ook omhoog

  • Lineair verband: Als je een rechte lijn kan trekken door een scatterplot, dan bestaat er een lineair (letterlijk: rechtlijnig) verband tussen X en Y

    Als je een rechte lijn kan trekken door een scatterplot, dan bestaat er een lineair (letterlijk: rechtlijnig) verband tussen X en Y

  • Correlatie

    Beschrijft de sterkte van een lineair verband (r) Ligt altijd tussen de -1 en +1. Hoe dichter bij de 0, hoe zwakker het lineair verband

  • Positieve correlatie: positief verband

    x en y omhoog of x en y omlaag. 

  •  

    Negatieve correlatie

     

    x omhoog en y omlaag of andersom

  • Is de sterkte van de correlatie afhankelijk of onafhankelijk van de meeteenheden?

    Onafhankelijk

  • Verschil associatie en correlatie

    Associatie betekent letterlijk verband en correlatie drukt dit verband uit in een cijfer (vanaf een correlatie van .3 spreken we meestal van een significant verband tussen x en y)

     

  • Waarvoor wordt een regressielijn gemaakt?

    Je maakt een regressielijn zodat je dmv een waarde van X de waarde van Y kunt voorspellen

     

  • y-hat

     

    Voorspelde y

  • Intercept in regressieformule

    Waarde van Y als X 0 is

     

  • Positieve b

    Positief verband en stijgende lijn

  •  

    Method of least squares:

     

    Alle residuen worden gekwadrateerd en vervolgens bij elkaar opgeteld. 

  • Nonresistentie

    Correlatie en de regressielijn zijn nonresistent: ze kunnen worden beïnvloed door outliers.

     

  •  

    Extrapolatie

     

     

    Het uitbreiden van een reeks getallen met punten die buiten die reeks liggen

  • Confouding variable

    Een confounding of lurking variabele is een variabele die de associatie tussen X en Y beïnvloedt.

  • Verschil confounding en lurking variabelen

    Confounders zijn gemeten in de studie, je houdt er vooraf rekening mee. Lurking variabele is niet gemeten in de studie

     

  • Simpsons paradox

    Als je gegevens van twee groepen op een onhandige manier combineert, dan lijken de resultaten van de groepen om te draaien.  

  • Kans

     

    P (probability) = hoe vaak komt de “juiste uitkomst” voor van het totaal aantal uitkomsten?  

  • P(niet A)

    Complementaire kans: De kans dat A niet voorkomt. 1-P(A)

  • P(A of B)

    Met overlap of zonder overlap

  • P(A en B)

    Checken onafhankelijkheid in steekproef

  • Conditionele kans

    P(A|B) is een conditionele kans: de kans op A, gegeven B 

  • Gewogen gemiddelde

    Gemiddelde waarbij rekening wordt gehouden op de kans dat een waarde voorkomt

     

  • µ

    Het gemiddelde van de populatie

     

  • σ

    De standaarddeviatie van de populatie

  • Verschil µ & σ met x-bar & s

    Gemiddelde en standaarddeviatie van de steekproef

  • Centrale vraag kansverdelingen

    Hoe kan ik op basis van beperkt aantal observaties uitspraak doen over hele groep?

  •  

    Definitie z-score

     

     

    Aantal standaarddeviaties dat een waarde van het gemiddelde af ligt

     

Lees volledige samenvatting
Deze samenvatting. +380.000 andere samenvattingen. Een unieke studietool. Een oefentool voor deze samenvatting. Studiecoaching met filmpjes.

Voorbeelden van vragen in deze samenvatting

Categorische  variabelen
1
2 soorten categorische variabelen:
1
Nominale variabelen
1
Ordinale variabelen
1
Pagina 1 van 26