Ladda ner presentationen
Presentation laddar. Vänta.
Publicerades avTorbjörn Lind
1
Introduktion
2
2 Vad är statistik? ”En massa siffror” Beskrivning av staten Metodlära
3
3 Några ”definitioner” Metodlära ägnad åt insamling, bearbetning, beskrivning och analys av data Statistics is concerned with data and with scientific analysis in the face of uncertainty
4
4 Statistics is concerned with the production, organization and analysis of data, and with inference from data to the underlying reality Statistics is a key part of inductive inference and the philosophy of science Statistics is the science of data –Data are numbers with a context
5
Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet att skaffa sig sådan kunskap är genom observationer Inom statistikteorin studeras –hur observationer samlas in –hur observationer analyseras –hur slutsatser kan dras från observationer
6
Deskriptiva, förklarande och framåtblickande undersökningar Vid en deskriptiv eller beskrivande undersökning försöker man att, med hjälp av ett insamlat datamaterial, beskriva ett förhållande eller ett faktiskt händelseförlopp.
7
Vid en förklarande (analytisk) undersökning försöker man klarlägga orsakssamband och förklara varför verkligheten ser ut som den gör. Vid en framåtblickande undersökning försöker man göra s.k. prognoser om vad som kommer att hända i framtiden.
8
En statistisk undersöknings olika steg Syfte och frågeställningar Planering Datainsamling Analys Rapportering
9
Planering av en undersökning Vid planering bestämmer man sig bl.a. för: –Vilka data som skall samlas in –Hur dessa data skall samlas in, dvs. val av datainsamlingsmetod Totalundersökning eller urvalsundersökning Typ av urval vid urvalsundersökning Val av mätmetod och mätinstrument. –Hur eventuellt bortfall skall hanteras –Hur data skall analyseras –Hur resultatet skall redovisas
10
Deskription Diagram
11
Individer och variabler Individer, undersökningsobjekt –De vi undersöker. De vi gör mätningar på. Kan vara människor, men kan också vara djur, bostadshus, kommuner, mm. Variabel –En egenskap som kan variera mellan olika individer
12
Variabler kan vara kvalitativa eller kvantitativa. En kvalitativ variabel är icke-numerisk. –Ex: kön, civilstånd, gymnasieprogram, partitillhörighet En kvantitativ variabel är en variabel som är numerisk –Ex: ålder, längd, poäng på prov, inkomst Olika typer av variabler
13
Diskreta och kontinuerliga variabler En kvantitativ variabel är antingen diskret eller kontinuerlig. –Diskret: Kan endast anta ett ändligt antal värden eller kan anta ett oändlig antal värden som dock är uppräkneliga. –Kontinuerlig: Kan anta alla värden i ett intervall.
14
Diagram Diagramrubriken bör vara fullständig men ändå kortfattad Lämplig uppställning: –Diagramnr., rubrik –Kort anmärkning som gäller hela diagrammet –Diagram –Noter –Längre anmärkningar –Källhänvisning
15
Välj diagramtyp som passar det aktuella problemet Välj lämpliga skalor för axlarna Stympa ej y-axeln i onödan. Om y-axeln stympas bör detta klart anges
16
Exempel på stympad y-axel: Löpdistanser i första och andra halvlek för ett antal elitspelare. Halvlekarna är indelade i femtonminutersperioder.
17
Samma data utan stympad y-axel.
18
För axlarna skall man tydligt ange variabler, enheter, skalsteg och skalvärden Diagrammet kan med fördel omges av en ram och innehålla stödlinjer
19
Kvalitativa variabler För att visa en fördelning, i en population eller ett urval, när man har en kvalitativ variabel, kan man t.ex. använda ett stapeldiagram eller ett cirkeldiagram.
20
Stapeldiagram, en variabel. Absoluta frekvenser.
21
Stapeldiagram, en variabel. Relativa frekvenser.
22
Liggande stapeldiagram
23
Cirkeldiagram
24
Fotbollsspelarens rörelsemönster
25
Kvantitativa variabler När man har en kvantitativ variabel kan man t.ex. använda histogram eller ett stam-bladdiagram. Man kan även klassindela materialet och presentera det med hjälp av ett stapeldiagram.
26
Histogram. Nyfödda barns fördelning på variabeln längd
27
Histogram. Åldersfördelning för ett urval av högskoleprovtagare.
28
Stapeldiagram. Åldersfördelning för samtliga högskoleprovtagare våren 1987.
29
Stapeldiagram, två variabler
30
Stam-bladdiagram. Chefernas fördelning på anställningstid. Anställningstid Stem-and-Leaf Plot Frequency Stem & Leaf 4,00 0. 2344 6,00 0. 567889 7,00 1. 0222233 8,00 1. 56788899 9,00 2. 111123344 5,00 2. 56679 2,00 3. 34 Stem width: 10,00 Each leaf: 1 case(s)
31
Tidsseriedata Tidsserier presenteras ofta med hjälp av s.k. linjediagram I linjediagram kan man ofta upptäcka sådant som trender, cykler eller säsongsvariationer.
32
Privat konsumtion i USA
33
Försäljning, kvartalsdata
34
Pulsmätning
35
Numeriska Deskriptiva Tekniker
36
Centralmått Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: –Centralläge –Variation eller spridning
37
En datapunkt Centralmått Ett centralmått skall ge centraltendens för det aktuella datat. Hur? En tredje datapunkt Med två
38
Summan av alla värden Antalet observationer Medel= Aritmetiska medelvärdet är det mest populära centralmåttet Det aritmetiska medelvärdet
39
Stickprovs-_ medelvärdet Populations- medelvärdet StickprovsstorlekPopulationsstorlek Aritmetiskt medelvärde
40
Exempel (stickprovsmedelvärde) Den rapporterade tiden som ett urval av 10 vuxna personer använt internet under en vecka är 0, 7, 12, 5, 33, 14, 8, 0, 9 respektive 22 timmar. 0 0 7 7 22 11.0
41
Udda antal observationer 0, 0, 5, 7, 8 9, 12, 14, 22 0, 0, 5, 7, 8, 9, 12, 14, 22, 33 Jämnt antal observationer Exempel Beräkna medianen i exemplet med internetanvändande Medianen är det värde som delar materialet mitt itu, dvs 50% av observationerna finns till vänster om medianen och 50% finns till höger om medianen. Medianen Antag att enbart 9 skulle ha valts (vi tar bort den längsta tiden (33)) Kommentar 8.5, 8
42
Typvärdet är det värde som förekommer oftast. Typvärdes-klassen Typvärdet är klassmitten i typvärdesklassen Typvärde
43
Exampel Beräkna typvärdet för följande data: 0, 7, 12, 5, 33, 14, 8, 0, 9, 22 Lösning Alla observationer utom “0” finns en gång. Det finns två “0”. Alltså är typvärdet “0”. Är detta ett bra mått ? Jämför med medelvärdet = 11.0 och medianen = 8.5. Typvärdet
44
Förhållandet mellan medelvärde, median och typvärde Om fördelningen är symmetrisk så sammanfaller de tre måtten Om fördelningen är skev och sned mot vänster eller höger så skiljer sig de tre måtten. En positivt snedfördelning Medel Median Typvärde
45
Positivt sned Medel Median Typ Medel Median Typ En negativt sned fördelning Förhållandet mellan medelvärde, median och typvärde Om fördelningen är symmetrisk så sammanfaller de tre måtten Om fördelningen är skev och sned mot vänster eller höger så skiljer sig de tre måtten.
46
Spridningsmått Centralmått beskriver inte hela sanningen om fördelningen. En fråga återstår att besvara: Hur stor är variationen (spridningen) i våra data?
47
Spridningsmått Studera dessa två hypotetiska dataset: Medelvärdet Liten variation Dessa data ändras till
48
Spridningsmått Studera dessa två hypotesiska dataset: Medelvärdet Liten variation Stor variation Samma medvärde.
49
–Variationsvidd är avståndet mellan största och minsta värdet. –Variationsvidden är enkel att beräkna. ? ? ? Minsta värde Största värde Vidd § Variationsvidd
50
Varians och standardavvikelse Studera två små stickprov och beräkna summan av alla avvikelser från medelvärdet: 10 98 74 1112 1316 8-10= -2 9-10= -1 11-10= +1 12-10= +2 4-10 = - 6 7-10 = -3 13-10 = +3 16-10 = +6 Summa = 0 Medelvärdet är 10... …men avvikelserna är större i stickprov B än i stickprov A A B Summa av avvikelserna är noll för de två stickproven
51
Varians
52
Exempel –Föjande är data för antalet jobb som sex studenter sökt under sista halvåret: 17, 15, 23, 7, 9, 13. Beräkna medelvärde och varians för datamaterialet Lösning: Beräkning av variansen
53
Standardavvikelse
54
–Första kvartilen: Q 1 = det mätvärde där 25 % av observationerna är mindre (ligger “till vänster” efter rangordning). –Andra kvartilen: Q 2 = medianen = det mätvärde där 50 % av observationerna är mindre. –Tredje kvartilen: Q 3 = det mätvärde där 75 % av observationerna är mindre. Kvartiler
55
Exempel Beräkna de olika kvartilerna för följande datamaterial :7, 8, 12, 17, 18, 4, 2, 4, 10, 21, 5, 8
56
Lösning Rangordna datat 2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, (.25)(12) = 3 observationer Q 1 =(4+5)/2=4.5. (.25)(12) = 3 observationer Q 1 =(4+5)/2=4.5. (.75)(12)=9 observationer Q 3 = (17+18)/2=17.5. (.75)(12)=9 observationer Q 3 = (17+18)/2=17.5. Första kvartilen Kvartiler
57
Det avstånd inom vilket de 50% mittersta observationerna finns. Ett stort kvartilavstånd indikerar en stor spridning i våra data. Kvartilavstånd = Q 3 – Q 1 Kvartilavstånd
58
L - Det största värdet (max) Q 3 - Den övre (tredje) kvartilen Q 2 – Medianen Q 1 – Den nedre (första) kvartilen S - Det minsta värdet (min) SQ1Q1 Q2Q2 Q3Q3 L Box- Plott
59
Exempel: Två grupper, en får vitaminstillskott den andra placebo. Notera antalet sjukdagar.
60
Exempel: BMI för fotbollsspelare (samtliga spelare i de två bästa lagen år 2003) i fyra olika ligor.
Liknande presentationer
© 2024 SlidePlayer.se Inc.
All rights reserved.