1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.

Slides:



Advertisements
Liknande presentationer
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Advertisements

Numeriska beräkningar i Naturvetenskap och Teknik
FL3 732G81 Linköpings universitet.
Skånes Universitetssjukhus
MEDELVÄRDE, MEDIAN & TYPVÄRDE
Kap 4 - Statistik.
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Sammanfatta siffrorna…
Statistik Tabeller och diagram.
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 1 Kursintroduktion Statistiska undersökningar
Centrala Gränsvärdessatsen:
Binomialsannolikheter ritas i ett stolpdiagram
Ohälsotalet för sjukpenning Mars 2010 Sida 1 Minskad regional spridning för sjukpenningdelen av ohälsotalet Bilaga till Pressmeddelande
732G22 Grunder i statistisk metodik
732G22 Grunder i statistisk metodik
Statistik Lars Valter Fil.lic. Statistik
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Några allmänna räkneregler för sannolikheter
732G22 Grunder i statistisk metodik
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Lägesmått. Lägesmått Vad är lägesmått? Sammanfatta en mängd data Exempelvis hur mycket veckopengar får elever som går i åk7… En klass består av ca.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Föreläsning 1, Introduktion Varför statistik? Population – Urval - Mätnivå Deskription Cirkeldiagram, stapeldiagram, histogram, spridningsdiagram, boxplot…
Medicinsk statistik Läkarprogrammet HT Medicinsk statistik Varför behöver Ni kunskap i medicinsk statistik? Självständigt arbete Kunna tolka resultat.
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. NORMALFÖRDELNING 4. HYPOTESPRÖVNING a) t-test b) ickeparametriska test c) chitvåtest.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
Deskription. Individer och variabler Individer, undersökningsobjekt – De vi undersöker. De vi gör mätningar på. Kan vara människor, men kan också vara.
Introduktion. Exempel: Till ett försök med bantningsmedlet Bantomid anmälde sig 14 personer frivilligt, alla med övervikt. De delades slumpmässigt in.
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test c)
Föreläsning 1-3 Introduktion till kursen Beskrivande statistik.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
1. Kontinuerliga variabler
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
DESKRIPTION Bearbeta, tolka och redovisa resultat. Vad ingår? Tabeller - Sammanfatta material Diagram - Åskådliggöra material Lägesmått - ”Genomsnitt”
Introduktion. 2 Vad är statistik? ”En massa siffror” Beskrivning av staten Metodlära.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Kap 4 - Statistik.
Marknadsundersökning Kap 12
X 5.5 Lägesmått från tabeller och diagram
X Lägesmått För att beskriva ett statistiskt material använder vi oss av lägesmått. De vanligaste lägesmåtten är medelvärde, median och.
Trender och fluktuationer
Data och att presentera data
Fördelning av data och index
Förelasning 1 Kursintroduktion Statistiska undersökningar
Vad ingår kursen? i korta drag
Kvalitetsenkäten för studerande mäter folkbildningskvalitet på fyra områden Redovisningen återspeglar de fyra perspektiven som ingår i enkäterna: deltagarnas.
Grundl. statistik F2, ht09, AN
STATISTIK OCH SANNOLIKHETER
Grundläggande begrepp
Kvalitetsenkäten för studerande mäter folkbildningskvalitet på fyra områden Redovisningen återspeglar de fyra perspektiven som ingår i enkäterna: deltagarnas.
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

1 Numeriska Deskriptiva Tekniker

2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge (oftast medelvärdet) l Variation eller spridning

3 En datapunkt Centralmått §Ett centralmått skall ge centraltendens för det aktuella datat. §Hur? En tredje datapunkt Med två

4 Summan av observationerna Antalet observationer Medel= §Aritmetiska medelvärdet är det mest populära centralmåttet Det aritmetiska medelvärdet

5 Stickprovs-_ medelvärdet Populations- medelvärdet StickprovsstorlekPopulationsstorlek Aritmetiskt medelvärde

6 Exempel (stickprovsmedelvärde) Den rapporterade tiden som ett urval av 10 vuxna personer använt Internet under en vecka är 0, 7, 12, 5, 33, 14, 8, 0, 9 respektive 22 timmar

7 Udda antal observationer 0, 0, 5, 7, 8 9, 12, 14, 22 0, 0, 5, 7, 8, 9, 12, 14, 22, 33 Jämnt antal observationer Exempel Beräkna medianen i exemplet med internetanvändande § Medianen är det värde som delar materialet mitt itu, dvs 50% av observationerna finns till vänster om medianen och 50% finns till höger om medianen. Medianen Antag att enbart 9 skulle ha valts (vi tar bort den längsta tiden (33)) Kommentar 8.5, 8

8 §Typvärdet är det värde som förekommer oftast. Typvärdes-klassen Typvärdet är klassmitten i typvärdesklassen Typvärde

9 §Exampel Beräkna typvärdet för följande data: 0, 7, 12, 5, 33, 14, 8, 0, 9, 22 Lösning Alla observationer utom “0” finns en gång. Det finns två “0”. Alttså är typvärdet “0”. Är detta ett bra mått ? Jämför med medelvärdet = 11.0 och medianen = 8.5. Typvärdet

10 Förhållandet mellan medelvärde, median och typvärde § Om fördelningen är symmetrisk så sammanfaller de tre måtten § Om fördelningen är skev och sned mot vänster eller höger så skiljer sig de tre måtten. En positivt snedfördelning Medel Median Typvärde

11 Positivt sned Medel Median Typ Medel Median Typ En negativt sned fördelning Förhållandet mellan medelvärde, median och typvärde § Om fördelningen är symmetrisk så sammanfaller de tre måtten § Om fördelningen är skev och sned mot vänster eller höger så skiljer sig de tre måtten.

12 Spridningsmått §Centralmått beskriver inte hela sanningen om fördelningen. §En fråga återstår att besvara: Hur stor är variationen (spridningen) i våra data?

13 Spridningsmått Studera dessa två hypotetiska dataset: Medelvärdet Liten variation Dessa data ändras till

14 Spridningsmått Studera dessa två hypotesiska dataset: Medelvärdet Liten variation Stor variation Samma medvärde.

15 l Variationsvidd är avståndet mellan största och minsta värdet. l Variationsvidden är enkel att beräkna. ? ? ? Minsta värde Största värde Vidd § Variationsvidd

16 Varians och standardavvikelse Studera två små stickprov och beräkna summan av alla avvikelser från medelvärdet: = = = = = = = = +6 Summa = 0 Medelvärdet är …men avvikelserna är större i stickprov B än i stickprov A A B Summa av avvikelserna är noll för de två stickproven

17 Varians OBS: Ni behöver inte kunna denna formel

18 § Exempel l Föjande är data för antalet jobb som sex studenter sökt under sista halvåret: 17, 15, 23, 7, 9, 13. Beräkna medelvärde och varians för datamaterialet Lösning: Beräkning av variansen

19 Standardavvikelse

20 l Första kvartilen: Q 1 = det mätvärde där 25 % av observationerna är mindre (ligger “till vänster” efter rangordning). l Andra kvartilen: Q 2 = medianen = det mätvärde där 50 % av observationerna är mindre. l Tredje kvartilen: Q 3 = det mätvärde där 75 % av observationerna är mindre. Kvartiler

21 Kvartiler § Exempel Beräkna de olika kvartilerna för följande datamaterial :7, 8, 12, 17, 18, 4, 2, 4, 10, 21, 5, 8

22 §Lösning §Rangordna datat 2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, (.25)(12) = 3 observationer Q 1 =(4+5)/2=4.5. (.25)(12) = 3 observationer Q 1 =(4+5)/2=4.5. (.75)(12)=9 observationer Q 3 = (17+18)/2=17.5. (.75)(12)=9 observationer Q 3 = (17+18)/2=17.5. Första kvartilen 12 observationer Kvartiler

23 §Det avstånd inom vilket de 50% mittersta observationerna finns. §Ett stort kvartilavstånd indikerar en stor spridning i våra data. Kvartilavstånd = Q 3 – Q 1 Kvartilavstånd

24 L - Det största värdet (max) Q 3 - Den övre (tredje) kvartilen Q 2 – Medianen Q 1 – Den nedre (första) kvartilen S - Det minsta värdet (min) SQ1Q1 Q2Q2 Q3Q3 L Box- Plot

25 §Exempel Box Plot Inga outliers

26 Exempel: Två grupper, en får vitaminstillskott den andra placebo. Notera antalet sjukdagar.

27 Exempel: BMI för fotbollsspelare (samtliga spelare i de två bästa lagen år 2003) i fyra olika ligor.