Slumptal Pseudoslumptal Fysikexperiment 5p Föreläsning 2

Slides:



Advertisements
Liknande presentationer
Inferens om en population Sid
Advertisements

Talföljder formler och summor
Andragradsfunktioner & Andragradsekvationer
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Ellära Fysik 1 / A Översiktlig beskrivning av en del av innehållet i Ellära – Fysik A För djupare studier hänvisar jag till kurslitteratur som finns.
Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
Numeriska beräkningar i Naturvetenskap och Teknik
Föreläsning 2 21 jan 2008.
PowerPoint av Bendik S. Søvegjarto Koncept, text och regler av Skage Hansen.
Föreläsning 7 Analys av algoritmer T(n) och ordo
Kapitel 5 Stickprovsteori Sid
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Statistikens grunder, 15p dagtid
MaB: Andragradsekvationer
Algebraiska uttryck Matematik 1.
Kap 4 - Statistik.
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
Grundläggande programmering
Problemlösning Veckodagsproblemet Gissa talet Siffersumman.
Centrala Gränsvärdessatsen:
FK2002,FK2004 Föreläsning 2.
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
732G22 Grunder i statistisk metodik
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Fysikexperiment 5p Föreläsning Fysikens metoder Vi kommer att göra ett grundläggande antagande att: det existerar en objektiv sanning!
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Fysikexperiment 5p Föreläsning Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004 Allmänna anpassningar enligt ”Maximum.
Binomialsannolikheter ritas i ett stolpdiagram
Egenskaper för punktskattning
Täthetsfunktion f(x) (”pdf”) Och fördelningsfunktion F(x) (”cdf”)
KOMPLETTERING AV MA1202 MATMAT02bb OK8028 Versionsdatum:
Sannolikhet Stickprov Fördelningar
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Lösningsförslag Rättningsmall som gäller alla uppgifter Enligt följande princip -1p slarvfel -2p räknefel Om dessa fel påverkar svaret får man inget ytterligare.
Linjär regression föreläsning 9
Normalfördelningen och centrala gränsvärdessatsen
Övningsexempel till Kapitel 7 Ex 1. BRÄNNBOLLSDILEMMAT ! En person funderar över hur man bäst uppskattar 28 meter. Av erfarenhet vet han att hans steglängd,
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Forskningsmetodik HT04 lekt 3 Forskningsmetodik HT04 Lektion 3.
Fysikexperiment, 7.5 hp1 Oviktad linjär anpassning Om är det bästa estimatet (enligt minsta kvadratmetoden) av parametrarna a och b: Uppskattat.
Fysikexperiment 5p Föreläsning Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 I allmänhet är den asymptotiska fördelningen.
Negativa tal – några exempel
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
1 Ingenjörsmetodik IT & ME 2007 Föreläsare Dr. Gunnar Malm.
Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Några allmänna räkneregler för sannolikheter
732G22 Grunder i statistisk metodik
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
1. Kontinuerliga variabler
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Kap 4 - Statistik.
Sju sätt att visa data Sju vanliga och praktiskt användbara presentationsformat vid förbättrings- och kvalitetsarbete.
Data och att presentera data
Fördelning av data och index
Ett verktyg för systematisk uppföljning i missbruksbruksvården
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Slumptal Pseudoslumptal Fysikexperiment 5p Föreläsning 2 Slumptal är en på förhand oförutsägbar serie av tal. För att ta fram äkta slumptal används ofta radioaktiva material där man mäter hur ofta atom-kärnor klyvs. Enligt modern fysik är denna process helt slumpmässig. Pseudoslumptal Pseudoslumptal genererade av datorer är talserier som räknas fram med en så pass komplex formel att nästa tal inte är uppenbart förutsägbart. Datorn använder en seed (startvärde) som avgör var i talserien uppräkningen ska börja för att minska överskådligheten ytterligare. För att ge intryck av äkta slump används ofta ett antal faktorer såsom antal millisekunder datorn varit påslagen, medelvärdet av tidsskillnaden mellan tangentbordstryckningar, hur många paket som inkommer från nätverket, etc., som seed. Ur ” http://susning.nu/Slumptal”. Exempel: Summera tal slumpvis fördelade mellan 0 och 1: Den ursprungliga fördelningen visas till höger: (i var och en av plottarna nedan ingår 10000 summor - notera att medelvärdena synes vara 1, 2.5 och 10 som man förväntar sig). Summan av 2 tal Summan av 5 tal Summan av 20 tal För att förstå hur denna sats kan hjälpa oss så kan vi betrakta resultatet av en mätning som beroende av det sanna värdet till vilket har adderats slumpvisa bidrag från ett stort antal okända (och en del kända) felkällor. Om vi utgår från att det inte finns några systematiska effekter kommer positiva fel vara lika vanliga som negativa. Resultatet av ett stort antal mätningar kommer då att spridas runt det sanna värdet, och fördelningen av mätningarna runt detta kommer att ha en form som ges av normal-fördelningen. 2005-08-29 01

Föreläsning 2 Fysikexperiment 5p Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 02 2005-08-29

Centrala Gränsvärdessatsen: Fysikexperiment 5p Föreläsning 2 Nästa fråga blir då: - hur skulle vi kunna definiera en asymptotisk fördelning för till exempel mätningen av längden av en parkeringsficka? Svaret ges av en vid första påseende märklig sats: Centrala Gränsvärdessatsen: Om vi summerar ett stort antal slumpmässigt fördelade tal, så kommer den asymptotiska fördelningen för summan att gå mot en normalfördelning. Detta gäller oberoende av hur fördelningen ser ut för de termer som ingår i summan!! Det här ”svaret” öppnar för två nya frågor: Vad är en normalfördelning och hur kan det komma sig att alla summor av slumpmässigt fördelade tal går mot en normalfördelning? Uttrycker man integrationsgränser i parametern s så har alla normalfördelningar samma area inom dessa gränser - oberoende av vilka exakta värden m och s antar. Integrerar man en normalfördelning mellan till exempel -s och +s så är arean 68% av hela arean. Detta har betydelse när vi tolkar f(x) som en sannolikhetsfördelning – sannolikheten att hamna i intervallet [m-2s, m+2s] är 95% och så vidare. Eftersom normalfördelningen är normaliserad så ges sannolikheten att få ett mätresultat x i intervallet [a, b] direkt av Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 2005-08-29 03

P(x1, x2, x3, … , xN) = P(x1)·P(x2)·P(x3)· … · P(xN) Föreläsning 2 fysikexperiment 5p Tillbaks till vår mätsituation: Om det inte finns stora systematiska effekter så kan vi alltså förvänta oss att våra mätresultat - efter ett stort antal mätningar och under förutsättning att det inte finns systematiska effekter - beskrivs av en normalfördelning. Vi förväntar oss att m svarar mot det sanna värdet för den parameter vi vill mäta, vi kommer snart att se att s säger oss någonting om mätmetodens precision. Givet mätdata, hur uppskattar vi parametrarna m och s? Lösningen ligger i att vi betraktar normalfördelningen som en sannolikhetsdistribution för att göra observationen x, givet m och s. Om den underliggande distributionen är en normalfördel- ning med parametrarna m och s, så är sannolikheten för att göra observationen x proportionell mot: Oberoende sannolikheter: för oberoende händelser (sannolikheten av en händelse påverkas inte av utfallet i de andra händelserna) är sannolikheten för serien lika med produkten av sannolik-heterna för de enskilda händelserna. Om våra mätningar av x är oberoende, vilket vi kommer att anta, så ges tydligen sannolikheten för att observera just vår mätserie, x1, x2, x3, … , xN av produkten av sannolikheterna för de enskilda mätningarna: P(x1, x2, x3, … , xN) = P(x1)·P(x2)·P(x3)· … · P(xN) Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004 05 2005-08-29

fysikexperiment 5p Föreläsning 2 Uttrycket ger oss sannolikheten att observera vår mätserie x1, x2, x3, … , xN givet parametrarna m och s för den underliggande fördelningen. Vi bestämmer nu vilka värden på m och s som ger oss den största sannolikheten att observera just vår mätserie genom normal maximering: Villkoret att denna derivata är noll ger oss då ett estimat för m: Den bästa uppskattningen av parametern m ges alltså av medelvärdet för alla ingående storheter. Vi gör nu samma optimering för parametern s: I detta uttryck betecknar m det sanna värdet på denna parameter. Eftersom detta värde oftast är okänt så får vi approximera det med vårt bästa estimat — medelvärdet. Man kan visa (det görs inte i kursen) att detta medför att vi får ett något modifierat uttryck för variansen: Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004 2004-08-23 05

Föreläsning 2 fysikexperiment 5p Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 06 2005-08-29

fysikexperiment 5p Föreläsning 2 Det grafiska intrycket styrs mycket av binvidden. Men vi kan också förlora information genom olämpliga val - hamnar alla data i en enda bin vet vi inte så mycket om t.ex. vidden av distribu-tionen, om vi å andra sidan har för glest mellan binnarna blir det till slut bara ett bidrag till varje bin och vi är tillbaks till ett stolpdiagram. Många gånger vill man jämföra data med en anpassad fördelning, eller med en teoretiskt förväntad fördelning. Detta görs med fördel i samma graf. Figur 1. Längden hos manliga studenter (histogram) och normalfördelningen med samma medelvärde och standardavvikelse som data (graf) Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004 2005-08-29 07

Bättre Bäst En graf skall: Föreläsning 2 fysikexperiment 5p Även mätserier med fler än en variabel kan representeras grafiskt. I exemplet ser vi tydligt hur mycket lättare det är att tillgodogöra oss information i grafisk form än om data presenteras i en tabell med siffror. Kurvor som visas i grafer skall vara anpassningar eller teoretiska förutsägelser, inte bara en rät linje mellan mätpunkterna. Däremot skall man så gott som alltid plotta felstaplar. Bättre Bäst En graf skall: • Vara tydlig - skalor skall väljas så att data upptar “lagom” stor del av grafen • Lämplig typ av skala (lin, log...) beroende på vilket samband som skall illustreras. • Ha en tydlig titel, och en Figurtext med nummer och kort beskrivning • Symboler och enheter tydligt utmärkta på axlarna • Indelningen av skalorna skall vara i enheter av 1, 2 eller 5, samt dessa gånger olika tiopotenser • Förekommer fler kurvor i samma graf skall det tydligt framgå vilken som är vilken. Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004 08 2005-08-29

y = a·ebx k = b · log(e) fysikexperiment 5p Föreläsning 2 a Olika typer av data kan kräva olika skalor: Log-Lin skala t ex kan användas för att ge en tydligare bild av vad som händer vid låga y-värden. Vid exponentiella förlopp blir dessutom parametrarna tydliggjorda i ett Log-Lin diagram y = a·ebx a k = b · log(e) Ibland kan en log-skala också vara enda möjligheten att se små modulationer vid låga värden, ett typexempel är ”icke-gaussiska” svansar Linjär skala: - god överblick över detaljer kring toppen - nästan ingenting synligt bortom 3 sigma Log-skala: - Dålig precision kring toppen. - Men man ser vad som händer 10 sigma bort. Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004 2005-08-29 09