1 Numeriska Deskriptiva Tekniker
2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge (oftast medelvärdet) l Variation eller spridning
3 En datapunkt Centralmått §Ett centralmått skall ge centraltendens för det aktuella datat. §Hur? En tredje datapunkt Med två
4 Summan av observationerna Antalet observationer Medel= §Aritmetiska medelvärdet är det mest populära centralmåttet Det aritmetiska medelvärdet
5 Stickprovs-_ medelvärdet Populations- medelvärdet StickprovsstorlekPopulationsstorlek Aritmetiskt medelvärde
6 Exempel (stickprovsmedelvärde) Den rapporterade tiden som ett urval av 10 vuxna personer använt Internet under en vecka är 0, 7, 12, 5, 33, 14, 8, 0, 9 respektive 22 timmar
7 Udda antal observationer 0, 0, 5, 7, 8 9, 12, 14, 22 0, 0, 5, 7, 8, 9, 12, 14, 22, 33 Jämnt antal observationer Exempel Beräkna medianen i exemplet med internetanvändande § Medianen är det värde som delar materialet mitt itu, dvs 50% av observationerna finns till vänster om medianen och 50% finns till höger om medianen. Medianen Antag att enbart 9 skulle ha valts (vi tar bort den längsta tiden (33)) Kommentar 8.5, 8
8 §Typvärdet är det värde som förekommer oftast. Typvärdes-klassen Typvärdet är klassmitten i typvärdesklassen Typvärde
9 §Exampel Beräkna typvärdet för följande data: 0, 7, 12, 5, 33, 14, 8, 0, 9, 22 Lösning Alla observationer utom “0” finns en gång. Det finns två “0”. Alttså är typvärdet “0”. Är detta ett bra mått ? Jämför med medelvärdet = 11.0 och medianen = 8.5. Typvärdet
10 Förhållandet mellan medelvärde, median och typvärde § Om fördelningen är symmetrisk så sammanfaller de tre måtten § Om fördelningen är skev och sned mot vänster eller höger så skiljer sig de tre måtten. En positivt snedfördelning Medel Median Typvärde
11 Positivt sned Medel Median Typ Medel Median Typ En negativt sned fördelning Förhållandet mellan medelvärde, median och typvärde § Om fördelningen är symmetrisk så sammanfaller de tre måtten § Om fördelningen är skev och sned mot vänster eller höger så skiljer sig de tre måtten.
12 Spridningsmått §Centralmått beskriver inte hela sanningen om fördelningen. §En fråga återstår att besvara: Hur stor är variationen (spridningen) i våra data?
13 Spridningsmått Studera dessa två hypotetiska dataset: Medelvärdet Liten variation Dessa data ändras till
14 Spridningsmått Studera dessa två hypotesiska dataset: Medelvärdet Liten variation Stor variation Samma medvärde.
15 l Variationsvidd är avståndet mellan största och minsta värdet. l Variationsvidden är enkel att beräkna. ? ? ? Minsta värde Största värde Vidd § Variationsvidd
16 Varians och standardavvikelse Studera två små stickprov och beräkna summan av alla avvikelser från medelvärdet: = = = = = = = = +6 Summa = 0 Medelvärdet är …men avvikelserna är större i stickprov B än i stickprov A A B Summa av avvikelserna är noll för de två stickproven
17 Varians OBS: Ni behöver inte kunna denna formel
18 § Exempel l Föjande är data för antalet jobb som sex studenter sökt under sista halvåret: 17, 15, 23, 7, 9, 13. Beräkna medelvärde och varians för datamaterialet Lösning: Beräkning av variansen
19 Standardavvikelse
20 l Första kvartilen: Q 1 = det mätvärde där 25 % av observationerna är mindre (ligger “till vänster” efter rangordning). l Andra kvartilen: Q 2 = medianen = det mätvärde där 50 % av observationerna är mindre. l Tredje kvartilen: Q 3 = det mätvärde där 75 % av observationerna är mindre. Kvartiler
21 Kvartiler § Exempel Beräkna de olika kvartilerna för följande datamaterial :7, 8, 12, 17, 18, 4, 2, 4, 10, 21, 5, 8
22 §Lösning §Rangordna datat 2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, (.25)(12) = 3 observationer Q 1 =(4+5)/2=4.5. (.25)(12) = 3 observationer Q 1 =(4+5)/2=4.5. (.75)(12)=9 observationer Q 3 = (17+18)/2=17.5. (.75)(12)=9 observationer Q 3 = (17+18)/2=17.5. Första kvartilen 12 observationer Kvartiler
23 §Det avstånd inom vilket de 50% mittersta observationerna finns. §Ett stort kvartilavstånd indikerar en stor spridning i våra data. Kvartilavstånd = Q 3 – Q 1 Kvartilavstånd
24 L - Det största värdet (max) Q 3 - Den övre (tredje) kvartilen Q 2 – Medianen Q 1 – Den nedre (första) kvartilen S - Det minsta värdet (min) SQ1Q1 Q2Q2 Q3Q3 L Box- Plot
25 §Exempel Box Plot Inga outliers
26 Exempel: Två grupper, en får vitaminstillskott den andra placebo. Notera antalet sjukdagar.
27 Exempel: BMI för fotbollsspelare (samtliga spelare i de två bästa lagen år 2003) i fyra olika ligor.