Centrala Gränsvärdessatsen:

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Systematiska fel Några exempel från g-labben: Av detta lär vi oss:
Inferens om en population Sid
PowerPoint av Bendik S. Søvegjarto Koncept, text och regler av Skage Hansen.
Andragradsfunktioner & Andragradsekvationer
En genomgång av spelet: Dubbelkrig-Grön
PowerPoint av Bendik S. Søvegjarto Koncept, text och regler av Skage Hansen.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Numeriska beräkningar i Naturvetenskap och Teknik
FL3 732G81 Linköpings universitet.
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Kapitel 5 Stickprovsteori Sid
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Statistikens grunder, 15p dagtid
(Några begrepp från avsnitt 14.2)
Kap 4 - Statistik.
Tillämpad statistik Naprapathögskolan
Vibeke Horstmann, Inst för hälsa, vård, samhälle, Centre for Ageing and Supportive Environments Jämförelse av två behandlingar.
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
FK2002,FK2004 Föreläsning 2.
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
732G22 Grunder i statistisk metodik
Forskningsmetodik 2003 Vetenskapsfilosofi Etik Medicinsk statistik
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statistik för internationella civilekonomer
1 Kapitel 9 Interval Estimation Dan Hedlin. 2 Konfidensintervall vanligast för ”location problems”, dvs k.i. för medelvärde o.d. K.i. för t.ex. standardavvikelse.
Täthetsfunktion f(x) (”pdf”) Och fördelningsfunktion F(x) (”cdf”)
Ohälsotalet för sjukpenning Mars 2010 Sida 1 Minskad regional spridning för sjukpenningdelen av ohälsotalet Bilaga till Pressmeddelande
Sannolikhet Stickprov Fördelningar
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Linjär regression föreläsning 9
Normalfördelningen och centrala gränsvärdessatsen
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Slumptal Pseudoslumptal Fysikexperiment 5p Föreläsning 2
Fysikexperiment 5p Föreläsning Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 I allmänhet är den asymptotiska fördelningen.
Negativa tal – några exempel
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
1 Ingenjörsmetodik IT & ME 2007 Föreläsare Dr. Gunnar Malm.
Några allmänna räkneregler för sannolikheter
732G22 Grunder i statistisk metodik
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Hur ser universum ut? När vi tittar upp på himlen en natt så kan vi med blotta ögat se ett antal små prickar & ofta en större prick, månen. Den del av.
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
1. Kontinuerliga variabler
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Kap 4 - Statistik.
Kapitel 2, mattespananrna
Data och att presentera data
Grundlägande statistik,ht 09, AN
Grundl. statistik F2, ht09, AN
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Centrala Gränsvärdessatsen: När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som ”beskriver en mätning”? Svaret ges av en vid första påseende märklig sats: Centrala Gränsvärdessatsen: Om vi summerar ett stort antal slumpmässigt fördelade tal, så kommer den asymptotiska fördelningen för summan att gå mot en normalfördelning Detta gäller oberoende av hur fördelningen ser ut för de termer som ingår i summan!! Så vad är denna “normalfördelning”, och vad har den med mätningar att göra? Normalfördelningen: 2s x Forskningsmetodik HT 2003

Forskningsmetodik HT 2003 Egenskaper Maximum vid x = m Symmetrisk runt x = m När s är litet så blir exponenten stor -> lutningen blir större När s är litet så blir normaliseringskonstanten större -> höjden vid toppen blir relativt sett högre Ytan under kurvan är lika med 1- kurvan är ”normaliserad”. Normalfördelningen har normaliseringen 1. Utryckt på vanlig svenska betyder det att ytan under kurvan alltid är lika med ett, det är därför topppen blir högre när vidden blir smalare. För att förstå hur centralvärdessatsen sats kan hjälpa oss så kan vi betrakta resultatet av en mätning som beroende av det sanna värdet till vilket har adderats slumpvisa bidrag från ett stort antal okända (och en del kända) felkällor. Det totala felet i mätningen är då summan av alla dessa bidrag. Enligt centrala gränsvärdessatsen är då denna summa (= det totala mätfelet) normalfördelat. Resultatet av ett stort antal mätningar kommer då att spridas runt det sanna värdet, och fördelningen av mätningarna runt detta kommer att ha en form som ges av normalfördelningen. Forskningsmetodik HT 2003

Exempel: Summera tal slumpvis fördelade mellan 0 och 1: Den ursprungliga fördelningen: Summan av 2 tal: 5 termer 20 termer Se figur 5.27 sidan 212! Exempel 3 s 193 När kan man förvänta sig en normalfördelning? De flesta värdena skall ligga nära medelvärdet. Positiva avvikelser är lika vanliga som negativa. Stora avvikelser är mindre sannolika än små. Den totala avvikelsen för ett mätvärde är summan av en mängd slumpmässiga bidrag. (Strikt matematiskt kommer punkt 4, tack vare centrala gränsvärdessatsen leda till de övrig punkterna) När vi gör en mätning kan vi under förutsättning att negativa och positiva mätfel är lika vanliga förvänta oss att summan av det mätfel som adderas till det sanna värdet har ett medelvärde som är noll Alltså kan vi förvänta oss att våra mätresultat följer en normalfördelning, centrerad på det sanna värdet (om vi bortser från eventuella systematiska fel). Forskningsmetodik HT 2003

Eftersom normalfördelningen är “normaliserad” - så kan man tolka ytan under kurvan mellan två x-värden som den relativa frekvensen för att mätvärdena skall hamna I detta intervall. Uttrycker man integrationsgränser i parametern s så har alla normalfördelningar samma area inom dessa gränser - oberoende av vilka exakta värden m och s antar. Integrerar man en normalfördelning mellan till exempel -s och +s så är arean 68% av hela arean. Detta har betydelse när vi tolkar f(x) som en sannolikhetsfördelning - sannolikheten att hamna i intervallet [m-2s, m+2s] är 95% och så vidare. Exempel mitt på sid 200 Exempel 5 sid 200 Ett standardiserat mått på avvikelsen ges av (mätvärdet - medelvärdet) / standardavvikelsen. I boken kallas detta mått “standard score” eller “z-score”. Vanligare I naturvetenskap är kanske termen “pull” Med hjälp av tabeller som t.ex. tabell 5.1 på sidan 205 I läroboken kan man enkelt gå ifrån percentiler till pull och vice versa. Exempel 7&8 på sid 204 Vi kan nu ge en kvantitativ uppskattning av osäkerheten I ett mätvärde: ger vi en uppskattning av mätvärdet som m ± s så antar vi om vi gör ett stort antal mätningar så kommer det sanna värdet att täckas in av vårt intervall I 68% av fallen. Ofta säger man att det är 68% sannolikhet att det sanna värdet ligger inom ±1 sigma, det räcker för vårt bruk, men det finns en subtil matematisk skillnad. Forskningsmetodik HT 2003

Forskningsmetodik HT 2003 Tillbaks till vår mätsituation: Om det inte finns stora systematiska effekter så kan vi alltså förvänta oss att våra mätresultat - efter ett stort antal mätningar och under förutsättning att det inte finns systematiska effekter - beskrivs av en normalfördelning. Vi förväntar oss att m svarar mot det sanna värdet för den parameter vi vill mäta, vi kommer snart att se att s säger oss någonting om mätmetodens precision. Givet mätdata, hur uppskattar vi parametrarna m och s? Man kan strikt matematiskt visa att medelvärdet är den bästa uppskattningen av m och att variansen är den bästa uppskattningen av s. Forskningsmetodik HT 2003

“De stora talens välsignelse” Har man gjort många mätningar är normalfördelningen relativt väl bestämd: Gausskurvan på den vänstra grafen stämmer alldeles klart bättre med data än den till höger. Men samma skillnad I centrum för Gaussfördelningen ger två kurvor som ser ganska likvärdiga ut om vi har färre mätpunkter, och därmed ojämnare distributioner. Det går att visa att skillnaden mellan det sanna värdet och det som uppskattas genom att ta medelvärdet av datapunkterna har en normalfördelning centrerad på noll med en vidd som ges av: Det vill säga standardavvikelsen hos normalfördelningen I fråga (uppskattad med variansen av datapunkterna) dividerad med kvadratroten ur antalet mätvärden). “De stora talens välsignelse” Ex 1 och 2 sidan 213 Forskningsmetodik HT 2003