Ladda ner presentationen
Presentation laddar. Vänta.
1
Slumptal Pseudoslumptal Fysikexperiment 5p Föreläsning 2
Slumptal är en på förhand oförutsägbar serie av tal. För att ta fram äkta slumptal används ofta radioaktiva material där man mäter hur ofta atom-kärnor klyvs. Enligt modern fysik är denna process helt slumpmässig. Pseudoslumptal Pseudoslumptal genererade av datorer är talserier som räknas fram med en så pass komplex formel att nästa tal inte är uppenbart förutsägbart. Datorn använder en seed (startvärde) som avgör var i talserien uppräkningen ska börja för att minska överskådligheten ytterligare. För att ge intryck av äkta slump används ofta ett antal faktorer såsom antal millisekunder datorn varit påslagen, medelvärdet av tidsskillnaden mellan tangentbordstryckningar, hur många paket som inkommer från nätverket, etc., som seed. Ur ” Exempel: Summera tal slumpvis fördelade mellan 0 och 1: Den ursprungliga fördelningen visas till höger: (i var och en av plottarna nedan ingår summor - notera att medelvärdena synes vara 1, 2.5 och 10 som man förväntar sig). Summan av 2 tal Summan av 5 tal Summan av 20 tal För att förstå hur denna sats kan hjälpa oss så kan vi betrakta resultatet av en mätning som beroende av det sanna värdet till vilket har adderats slumpvisa bidrag från ett stort antal okända (och en del kända) felkällor. Om vi utgår från att det inte finns några systematiska effekter kommer positiva fel vara lika vanliga som negativa. Resultatet av ett stort antal mätningar kommer då att spridas runt det sanna värdet, och fördelningen av mätningarna runt detta kommer att ha en form som ges av normal-fördelningen.
2
Föreläsning 2 Fysikexperiment 5p
Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005
3
Centrala Gränsvärdessatsen:
Fysikexperiment 5p Föreläsning 2 Nästa fråga blir då: - hur skulle vi kunna definiera en asymptotisk fördelning för till exempel mätningen av längden av en parkeringsficka? Svaret ges av en vid första påseende märklig sats: Centrala Gränsvärdessatsen: Om vi summerar ett stort antal slumpmässigt fördelade tal, så kommer den asymptotiska fördelningen för summan att gå mot en normalfördelning. Detta gäller oberoende av hur fördelningen ser ut för de termer som ingår i summan!! Det här ”svaret” öppnar för två nya frågor: Vad är en normalfördelning och hur kan det komma sig att alla summor av slumpmässigt fördelade tal går mot en normalfördelning? Uttrycker man integrationsgränser i parametern s så har alla normalfördelningar samma area inom dessa gränser - oberoende av vilka exakta värden m och s antar. Integrerar man en normalfördelning mellan till exempel -s och +s så är arean 68% av hela arean. Detta har betydelse när vi tolkar f(x) som en sannolikhetsfördelning – sannolikheten att hamna i intervallet [m-2s, m+2s] är 95% och så vidare. Eftersom normalfördelningen är normaliserad så ges sannolikheten att få ett mätresultat x i intervallet [a, b] direkt av Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005
4
P(x1, x2, x3, … , xN) = P(x1)·P(x2)·P(x3)· … · P(xN)
Föreläsning fysikexperiment 5p Tillbaks till vår mätsituation: Om det inte finns stora systematiska effekter så kan vi alltså förvänta oss att våra mätresultat - efter ett stort antal mätningar och under förutsättning att det inte finns systematiska effekter - beskrivs av en normalfördelning. Vi förväntar oss att m svarar mot det sanna värdet för den parameter vi vill mäta, vi kommer snart att se att s säger oss någonting om mätmetodens precision. Givet mätdata, hur uppskattar vi parametrarna m och s? Lösningen ligger i att vi betraktar normalfördelningen som en sannolikhetsdistribution för att göra observationen x, givet m och s. Om den underliggande distributionen är en normalfördel- ning med parametrarna m och s, så är sannolikheten för att göra observationen x proportionell mot: Oberoende sannolikheter: för oberoende händelser (sannolikheten av en händelse påverkas inte av utfallet i de andra händelserna) är sannolikheten för serien lika med produkten av sannolik-heterna för de enskilda händelserna. Om våra mätningar av x är oberoende, vilket vi kommer att anta, så ges tydligen sannolikheten för att observera just vår mätserie, x1, x2, x3, … , xN av produkten av sannolikheterna för de enskilda mätningarna: P(x1, x2, x3, … , xN) = P(x1)·P(x2)·P(x3)· … · P(xN) Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004
5
fysikexperiment 5p Föreläsning 2
Uttrycket ger oss sannolikheten att observera vår mätserie x1, x2, x3, … , xN givet parametrarna m och s för den underliggande fördelningen. Vi bestämmer nu vilka värden på m och s som ger oss den största sannolikheten att observera just vår mätserie genom normal maximering: Villkoret att denna derivata är noll ger oss då ett estimat för m: Den bästa uppskattningen av parametern m ges alltså av medelvärdet för alla ingående storheter. Vi gör nu samma optimering för parametern s: I detta uttryck betecknar m det sanna värdet på denna parameter. Eftersom detta värde oftast är okänt så får vi approximera det med vårt bästa estimat — medelvärdet. Man kan visa (det görs inte i kursen) att detta medför att vi får ett något modifierat uttryck för variansen: Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004
6
Föreläsning 2 fysikexperiment 5p
Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005
7
fysikexperiment 5p Föreläsning 2
Det grafiska intrycket styrs mycket av binvidden. Men vi kan också förlora information genom olämpliga val - hamnar alla data i en enda bin vet vi inte så mycket om t.ex. vidden av distribu-tionen, om vi å andra sidan har för glest mellan binnarna blir det till slut bara ett bidrag till varje bin och vi är tillbaks till ett stolpdiagram. Många gånger vill man jämföra data med en anpassad fördelning, eller med en teoretiskt förväntad fördelning. Detta görs med fördel i samma graf. Figur 1. Längden hos manliga studenter (histogram) och normalfördelningen med samma medelvärde och standardavvikelse som data (graf) Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004
8
Bättre Bäst En graf skall: Föreläsning 2 fysikexperiment 5p
Även mätserier med fler än en variabel kan representeras grafiskt. I exemplet ser vi tydligt hur mycket lättare det är att tillgodogöra oss information i grafisk form än om data presenteras i en tabell med siffror. Kurvor som visas i grafer skall vara anpassningar eller teoretiska förutsägelser, inte bara en rät linje mellan mätpunkterna. Däremot skall man så gott som alltid plotta felstaplar. Bättre Bäst En graf skall: • Vara tydlig - skalor skall väljas så att data upptar “lagom” stor del av grafen • Lämplig typ av skala (lin, log...) beroende på vilket samband som skall illustreras. • Ha en tydlig titel, och en Figurtext med nummer och kort beskrivning • Symboler och enheter tydligt utmärkta på axlarna • Indelningen av skalorna skall vara i enheter av 1, 2 eller 5, samt dessa gånger olika tiopotenser • Förekommer fler kurvor i samma graf skall det tydligt framgå vilken som är vilken. Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004
9
y = a·ebx k = b · log(e) fysikexperiment 5p Föreläsning 2 a
Olika typer av data kan kräva olika skalor: Log-Lin skala t ex kan användas för att ge en tydligare bild av vad som händer vid låga y-värden. Vid exponentiella förlopp blir dessutom parametrarna tydliggjorda i ett Log-Lin diagram y = a·ebx a k = b · log(e) Ibland kan en log-skala också vara enda möjligheten att se små modulationer vid låga värden, ett typexempel är ”icke-gaussiska” svansar Linjär skala: - god överblick över detaljer kring toppen - nästan ingenting synligt bortom 3 sigma Log-skala: - Dålig precision kring toppen. - Men man ser vad som händer 10 sigma bort. Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004
Liknande presentationer
© 2024 SlidePlayer.se Inc.
All rights reserved.