Deskription
Individer och variabler Individer, undersökningsobjekt – De vi undersöker. De vi gör mätningar på. Kan vara människor, men kan också vara djur, bostadshus, kommuner, mm. Variabel – En egenskap som kan variera mellan olika individer
Variabler kan vara kvalitativa eller kvantitativa. Kvalitativ variabel: Indelning av undersökningsenheterna i olika kategorier. – Ex: kön, civilstånd, gymnasieprogram, partitillhörighet Kvantitativ variabel: En variabel som är numerisk och där vi med hjälp av siffrorna kan uttala oss om hur mycket en undersökningsenhet har av en egenskap. – Ex: ålder, längd, poäng på prov, inkomst Olika typer av variabler
Diskreta och kontinuerliga variabler En kvantitativ variabel är antingen diskret eller kontinuerlig. – Diskret: Kan endast anta ett ändligt antal värden eller kan anta ett oändlig antal värden som dock är uppräkneliga. – Kontinuerlig: Kan anta alla värden i ett intervall.
Diagram Diagramrubriken bör vara fullständig men ändå kortfattad Lämplig uppställning: – Diagramnr., rubrik – Kort anmärkning som gäller hela diagrammet – Diagram – Noter – Längre anmärkningar – Källhänvisning
Välj diagramtyp som passar det aktuella problemet Välj lämpliga skalor för axlarna Stympa ej y-axeln i onödan. Om y-axeln stympas bör detta klart anges
Exempel på stympad y-axel: Löpdistanser i första och andra halvlek för ett antal elitspelare. Halvlekarna är indelade i femtonminutersperioder.
Samma data utan stympad y-axel.
För axlarna skall man tydligt ange variabler, enheter, skalsteg och skalvärden Diagrammet kan med fördel omges av en ram och innehålla stödlinjer
Kvalitativa variabler För att visa en fördelning, i en population eller ett urval, när man har en kvalitativ variabel, kan man t.ex. använda ett stapeldiagram eller ett cirkeldiagram.
Stapeldiagram, en variabel. Absoluta frekvenser.
Stapeldiagram, en variabel. Relativa frekvenser.
Liggande stapeldiagram
Cirkeldiagram
Fotbollsspelarens rörelsemönster
Kvantitativa variabler När man har en kvantitativ variabel kan man t.ex. använda histogram eller ett stam- bladdiagram. Man kan även klassindela materialet och presentera det med hjälp av ett stapeldiagram.
Histogram. Nyfödda barns fördelning på variabeln längd
Histogram. Åldersfördelning för ett urval av högskoleprovtagare.
Stapeldiagram. Åldersfördelning för samtliga högskoleprovtagare våren 1987.
Stapeldiagram, två variabler
Stam-bladdiagram. Chefernas fördelning på anställningstid. Anställningstid Stem-and-Leaf Plot Frequency Stem & Leaf 4, , , , , , , Stem width: 10,00 Each leaf: 1 case(s)
Tidsseriedata Tidsserier presenteras ofta med hjälp av s.k. linjediagram I linjediagram kan man ofta upptäcka sådant som trender, cykler eller säsongsvariationer.
Privat konsumtion i USA
Försäljning, kvartalsdata
Pulsmätning
Beskrivande mått Om man vill beskriva en egenskaps fördelning i en population eller ett sampel kan man naturligtvis göra detta genom att räkna upp samtliga observationer.
I en frekvenstabell sammanfattas en fördelning i ett fåtal värden - frekvenserna. Med hjälp av beskrivande mått sammanfattas fördelningen av ett eller ett fåtal tal.
Kvartiler Genom att beräkna kvartiler sammanfattas en fördelning i tre tal: – första kvartilen – andra kvartilen (medianen) – tredje kvartilen
Lägger vi till det minsta och det största värdet kan vi beskriva fördelningen med hjälp av fem tal. (Five number summary) En boxplot (ett lådagram) är ett diagram som bygger på denna five number summary.
Boxplot (lådagram), ORD-provet.
Box-plot (lådagram), NOG-provet
Exempel: BMI för fotbollsspelare (samtliga spelare i de två bästa lagen år 2003) i fyra olika ligor.
Genom att beräkna ett centralmått sammanfattas fördelningen i ett tal. Tre vanliga centralmått: – Typvärdet – Medianen – Medelvärdet Centralmått
Typvärdet... – är det mest frekventa värdet Medianen… – är, om antalet mätvärden är udda, det mittersta av de rangordnade mätvärdena. Om antalet mätvärden är jämnt är medianen medelvärdet av de två mittersta mätvärdena. Medelvärdet… – är summan av alla mätvärden dividerat med antalet mätvärden.
Vilket av dessa tre mått skall vi använda? Detta beror framför allt på två saker: – Syfte. Vad skall vi ha måttet till? – Möjlighet att tolka resultatet. Antag att vi sätter gul=1, blå=2 och röd=3. Eftersom vi har siffror kan vi beräkna typvärde, median och medelvärde. Men hur tolkar vi t.ex. medelvärdet 2,3 eller medianen 2?
Spridningsmått Ett centralmått sammanfattar en fördelning i ett enda tal och ger information om var fördelningens ”centrum” är beläget. Ett spridningsmått ger information om fördelningens spridning.
Tre olika spridningsmått Variationsvidden är skillnaden mellan det största och det minsta värdet Kvartilavståndet är avståndet mellan första och tredje kvartilen. Måttet anger alltså inom vilket avstånd de 50% mittersta observationerna ligger. Standardavvikelsen är ett spridningsmått som beskriver hur mycket mätvärdena avviker från medelvärdet.