Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
PowerPoint av Bendik S. Søvegjarto Koncept, text och regler av Skage Hansen.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL3 732G81 Linköpings universitet.
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
Skånes Universitetssjukhus
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Statistikens grunder, 15p dagtid
Kap 4 - Statistik.
Sammanfatta siffrorna…
Skattningens medelfel
Förelasning 1 Kursintroduktion Statistiska undersökningar
Centrala Gränsvärdessatsen:
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Binomialsannolikheter ritas i ett stolpdiagram
Täthetsfunktion f(x) (”pdf”) Och fördelningsfunktion F(x) (”cdf”)
Sannolikhet Stickprov Fördelningar
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
Hur bra är modellen som vi har anpassat?
Normalfördelningen och centrala gränsvärdessatsen
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Slumptal Pseudoslumptal Fysikexperiment 5p Föreläsning 2
Diskret stokasticitet Projekt 2.3, Talltita
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
1 Ingenjörsmetodik IT & ME 2007 Föreläsare Dr. Gunnar Malm.
Några allmänna räkneregler för sannolikheter
732G22 Grunder i statistisk metodik
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Medicinsk statistik Läkarprogrammet HT Medicinsk statistik Varför behöver Ni kunskap i medicinsk statistik? Självständigt arbete Kunna tolka resultat.
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
1 Icke-linjär regression Sid (i kapitel 16.1)
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
1. Kontinuerliga variabler
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
DESKRIPTION Bearbeta, tolka och redovisa resultat. Vad ingår? Tabeller - Sammanfatta material Diagram - Åskådliggöra material Lägesmått - ”Genomsnitt”
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Introduktion. 2 Vad är statistik? ”En massa siffror” Beskrivning av staten Metodlära.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Lite matterepetition Räknesätten, bråk, förkorta, parenteser
Kap 4 - Statistik.
Geometriska figurer Exempeluppgifter.
Sju sätt att visa data Sju vanliga och praktiskt användbara presentationsformat vid förbättrings- och kvalitetsarbete.
Marknadsundersökning Kap 12
Fördelning av data och index
Förelasning 1 Kursintroduktion Statistiska undersökningar
Grundlägande statistik,ht 09, AN
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Deskription Normalfördelningsmodellen 1

2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall använda modellen till.En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall använda modellen till. Modeller

3 Exempel Kartor är modeller av den geografiska verkligheten. Vad som finns med på en karta beror på användningsområde. Vi har t.ex.Kartor är modeller av den geografiska verkligheten. Vad som finns med på en karta beror på användningsområde. Vi har t.ex. –vägkartor –ekonomiska kartor –topografiska kartor –sjökort

4 Flygplansmodell i vindtunnelFlygplansmodell i vindtunnel En cirkel som en modell för ett runt bord för att t.ex. beräkna bordets ytaEn cirkel som en modell för ett runt bord för att t.ex. beräkna bordets yta Tiden = sträckan / hastighetenTiden = sträckan / hastigheten Efterfrågefunktion för att beskriva hur efterfrågan på en vara (Y) beror på varans pris (X):Efterfrågefunktion för att beskriva hur efterfrågan på en vara (Y) beror på varans pris (X):

5 Parametriska fördelningar Ibland kan man beskriva variationen i en population genom att använda en matematisk modell.Ibland kan man beskriva variationen i en population genom att använda en matematisk modell. Ett exempel på en sådan modell är normalfördelningen.Ett exempel på en sådan modell är normalfördelningen.

6 Fördelningarna bestäms ofta av ett fåtal tal, s.k. parametrar.Fördelningarna bestäms ofta av ett fåtal tal, s.k. parametrar. Vet vi t.ex. att en variabels variation i en population på ett tillfredsställande sätt kan beskrivas av en normalfördelning, räcker det med att veta medelvärdet och standardavvikelsen i populationen för att vi skall få en komplett bild av hur stor andel av populationen som finns inom vissa intervall.Vet vi t.ex. att en variabels variation i en population på ett tillfredsställande sätt kan beskrivas av en normalfördelning, räcker det med att veta medelvärdet och standardavvikelsen i populationen för att vi skall få en komplett bild av hur stor andel av populationen som finns inom vissa intervall.

7 Normalfördelningsmodellen Den kurva som beskriver hur stor proportion av en population som ligger inom vissa intervall (hur tätt observationerna ligger) kallas för en täthetsfunktion.Den kurva som beskriver hur stor proportion av en population som ligger inom vissa intervall (hur tätt observationerna ligger) kallas för en täthetsfunktion. Andelar räknas som ytor under denna täthetsfunktion.Andelar räknas som ytor under denna täthetsfunktion.

8 En normalfördelad variabel (egenskap) X, med medelvärde  och standardavvikelse  har följande täthetsfunktion (lite mer komplicerad än en rät linje f(x) = kx+m, men principen är densamma).En normalfördelad variabel (egenskap) X, med medelvärde  och standardavvikelse  har följande täthetsfunktion (lite mer komplicerad än en rät linje f(x) = kx+m, men principen är densamma). Normalfördelningens täthetsfunktion (Definitivt överkurs!)

9 Och så här ser kurvan ut… Normalfördelningen är “klockformad” och symmetrisk runt medelvärdet. 

10 Effekter av olika medelvärden och standardavvikelser Så här påverkas kurvans utseende av olika standardavvikelser  = 2  =3  =4  = 10  = 11  = 12 Så här påverkar olika medelvärden kurvans läge.

11 För en normalfördelning gäller följande:För en normalfördelning gäller följande: –Ungefär 68% av fördelningen ligger inom en standardavvikelse från medelvärdet. –Ungefär 95% av fördelningen ligger inom två standardavvikelser från medelvärdet (kom ihåg detta!). –Ungefär 99.7% av fördelningen ligger inom tre standardavvikelser från medelvärdet.

12 Exempel:Exempel: –Antag att intelligensen i en population, mätt med ett visst intelligenstest, kan beskrivas av en normalfördelning med medelvärdet 100 och standardavvikelsen 15. –Då vet vi att ungefär 68% av populationen ligger mellan 85 och 115, ungefär 95 % av populationen mellan 70 och 130 och ungefär 99.7 % av populationen mellan 55 och Ytan till vänster om 70 är ungefär 0.025, dvs andelen under 70 är ungefär 2.5 %

13 Exempel:Exempel: –Antag att fördelningen av såväl kvinnors som mäns längd i en population kan beskrivas av normalfördelningsmodellen. Kvinnornas medellängd är 165 cm och standardavvikelsen är 6.2 cm. Männens medellängd är cm. Hur stor andel av kvinnorna är längre än männens medellängd? –Lösning: 95% av kvinnorna ligger max 2 standardavvikelser (2x6.2=12.4) cm ifrån 165 cm. Dvs 95% av kvinnorna har en längd som ligger mellan cm och cm. Detta innebär att ungefär 2.5% är kortare än cm och ungefär 2.5% är längre än cm.

14 z-värden Antal standardavvikelser som ett värde ligger ifrån medelvärdet kallas ibland för ett z-värde.Antal standardavvikelser som ett värde ligger ifrån medelvärdet kallas ibland för ett z-värde. En observation som ligger en standardavvikelse under medelvärdet får alltså z-värdet -1. En observation som ligger en standardavvikelse över medelvärdet får z-värdet +1.En observation som ligger en standardavvikelse under medelvärdet får alltså z-värdet -1. En observation som ligger en standardavvikelse över medelvärdet får z-värdet +1.

15 Exempel:Exempel: –Antag att intelligensen i en population, mätt med ett visst intelligenstest, kan beskrivas av en normalfördelning med medelvärdet 100 och standardavvikelsen 15. –Ett värde på 70 innebär alltså z=-2. Ett värde på 100 innebär att z blir 0, osv. –Ungefär 95% av alla observationerna har ett z-värde mellan -2 och +2.

16 Exempel: Jämförelser av IQExempel: Jämförelser av IQ –Ett vanligt använt IQ-test är ”The Wechsler Adult Intelligence Scale” (WAIS). Värden på WAIS för åldersgruppen år är approximativt normalfördelade med medelvärdet 110 och standardavvikelsen 25. Även för åldersgruppen är värdena approximativt normalfördelade, men med medelvärdet 90 och standardavvikelsen 25. –Sarah, som är 30 år, får värdet 135 på WAIS, medan hennes mor, som är 60 år, får värdet 120. –Vem av de två har, enligt detta test, högst IQ? –Vem av de två ligger högst relativt övriga i sin egen åldersgrupp?

17 Lösning:Lösning: –Sarah har högst IQ. –Sarahs IQ ligger en standardavvikelse ovanför medelvärdet, dvs. z=1. Sarahs mors IQ ligger 1.2 standardavvikelser över medelvärdet i hennes åldersgrupp, dvs. z=1.2. (Kan räknas ut på följande sätt: ( )/25=1 och (120-90)/25=1.2). Alltså har Sarahs mor en IQ som ligger högre jämfört med övriga i sin åldersgrupp.

18 Standardnormalfördelningen Om variabeln X är normalfördelad så gäller att variabeln Z=(X-  )/  är standardnormalfördelad. Detta innebär att Z är normalfördelad med medelvärdet 0 och standardavvikelsen 1.Om variabeln X är normalfördelad så gäller att variabeln Z=(X-  )/  är standardnormalfördelad. Detta innebär att Z är normalfördelad med medelvärdet 0 och standardavvikelsen 1. För standardnormalfördelningen finns tabeller med beräknade areor.För standardnormalfördelningen finns tabeller med beräknade areor.

19 Exempel: Fortsättning på jämförelse av IQ.Exempel: Fortsättning på jämförelse av IQ. –Sarah fick x=135, vilket motsvarar z=1.0. Hur stor andel av populationen har en IQ som är lägre än Sarahs? Titta i tabellen på bokpärmens insida. Vi ser att z=1.0 ger en yta (dvs. andel) som är Dvs % har en IQ som är lägre än Sarahs. –Mamman fick x=120, vilket motsvarar z=1.2. Hur stor andel av populationen har en IQ som är lägre än mammans? Titta i tabellen. Vi ser att z=1.2 ger en yta (dvs. andel) som är Dvs % har en IQ som är lägre än mammans.

Hur vet vi om normalfördelningen är en bra modell? Några verktyg som vi kan använda:Några verktyg som vi kan använda: –Histogram. Ser fördelningen ut som en normalfördelning? –Stam-blad-diagram. Ser fördelningen ut som en normalfördelning? –Normal quantile plot. 20

Normal quantile plot Ordna data från minsta till största.Ordna data från minsta till största. –Exempel: Antag att vi har 20 observationer. Låt oss beteckna dem x 1, x 2,…,x 20, där x 1 är minst och x 20 störst. Antag vidare att x 1 = 165 och x 2 = 167. Beräkna varje observations percentil.Beräkna varje observations percentil. –Forts. exempel: x 1 = 165 är femte percentilen, x 2 = 167 är tionde percentilen, osv. Beräkna motsvarande percentiler i standardnormalfördelningen.Beräkna motsvarande percentiler i standardnormalfördelningen. –Forts. exempel: z 1 = -1,645 är femte percentilen, z 2 = -1,282, osv. Plotta x-värdena (på y-axeln) mot z-värdena (på x-axeln).Plotta x-värdena (på y-axeln) mot z-värdena (på x-axeln). –Forts. exempel: Vi plottar alltså 165 mot -1,645, 167 mot -1,282, osv. Om normalfördelningen är en bra modell för att beskriva våra data så bör observationerna i vårt diagram ligga ungefär efter en rät linje.Om normalfördelningen är en bra modell för att beskriva våra data så bör observationerna i vårt diagram ligga ungefär efter en rät linje. 21