Sammanfatta siffrorna… Läge Spridning - individ variation? Form på datamaterialet - fenomenet??
Form på datamaterial - fenomen IQ Lön ex: nio anställda 10 000 kr/mån, en vd 210 000 kr/mån, medellön=30 000
Form på datamaterial - fenomen Samlagsdebut, medelålder = 17 år
Korstabeller... Rad & Kolumnprocent…=?
Vilken presentation är ”bäst” Mera procent... Vilken presentation är ”bäst”
Kort om grafer...
Konsten att karaktärisera ett material BMI före BMI efter
Datanivåer Nominaldata Ordinaldata Intervalldata Kvotdata Kategorier Ex: kön, yrke Ordinaldata Ordnade data Ex: Socialklass, Vas, Betyg etc Intervalldata Ekvidistans Ingen nollpunkt Ex: temp i grader celcius Kvotdata Nollpunkt Meningsfullt att beräkna kvot Ex: Inkomst, längd, Vikt, Tid, etc Man brukar även skilja på diskreta och kontinuerliga data...
”Karaktäristikor”
Medel Vanligaste lägesmåttet? Kräver kvotdata! Dvs ej lämpligt för ordinaldata (Vas etc) Utnyttjar all information effektivt Påverkas av extremvärden Formel
Median Lägesmått Mittersta värdet bland de storleksordnade Om n udda, median = mittersta Om n jämn, median= medel av två mittersta Generellt, positionspunkt: Påverkas ej av extremvärden Kräver lägst ordinaldata
Typvärde Lägesmått Mest frekventa kategorin Kan användas för nominal och ordinaldata
Proportion Lägesmått Andel med en viss egenskap Används för nominal och ordinaldata Andra namn: andel, relativ frekvens, procent, … ?
Kvartil Kan vara vägledande för spridning och form Dela datamaterialet i fyra delar Q1 Q2 Q3 Position kvartil i: Percentil=?
Range (Variationsvidd) Spridningsmått Skillnad mellan största och minsta värde Range = Beroende av n
Kvartilavstånd Spridningsmått Skillnad mellan övre och undre kvartil Kvartilavstånde = Påverkas ej av extremvärden
Standardavvikelse Spridningsmått Vanligaste spridningsmåttet En ungefärlig tolkning: Visar individernas spridning kring det gemensamma medelvärdet
Standardavvikelse formel Finns även alternativa formler...
Om normalfördelning så gäller: 68% av alla observationer mellan 95% av alla observationer mellan 1.96 (avrundas ofta till 2) 99,7% av alla observationer mellan 3 =populationens medel =populationens sd uppskattas normalt med medelvärde i stickprov resp. sd.