Diskreta slumpvariabler. Stokastiskvariabel En slumpvariabel (stokastisk variabel) är en Funktion eller regel som tilldelar ett tal till varje Utfall.

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
F3 Matematikrep Summatecknet Potensräkning Logaritmer Kombinatorik.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
Statistikens grunder, 15p dagtid
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Statistikens grunder, 15p dagtid
Statistikens grunder, 15p dagtid
Vad ingår kursen? i korta drag
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Grundlägande statistik,ht 09, AN1 F5 Kombinatorik (KW 1.6) Ex.: På en matsedel finns tre förrätter, två huvudrätter och två efterrätter. På hur många olika.
Skattningens medelfel
Efterfrågemodeller R. D. Jonsson, Transportmodellkurs Trafikverket
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Centrala Gränsvärdessatsen:
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Övningsexempel till Kapitel 4
Binomialsannolikheter ritas i ett stolpdiagram
Egenskaper för punktskattning
Statistik för internationella civilekonomer
Föreläsning 5Forskningsmetodik 2005 Forskningsmetodik lektion 6.
Täthetsfunktion f(x) (”pdf”) Och fördelningsfunktion F(x) (”cdf”)
Föreläsning 4: Sannolikhetslära
Sannolikhet Stickprov Fördelningar
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Övningsexempel till Kapitel 3 Ex 1: En familj planerar att skaffa tre barn. Sannolikheten att få en flicka är 0.47 medan sannolikheten att få en pojke.
Normalfördelningen och centrala gränsvärdessatsen
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
F8 Hypotesprövning. Begrepp
732G22 Grunder i statistisk metodik
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Några allmänna räkneregler för sannolikheter
732G22 Grunder i statistisk metodik
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Forskningsmetodik lektion
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
Lars Madej  Talmönster och talföljder  Funktioner.
Introduktion. Exempel: Till ett försök med bantningsmedlet Bantomid anmälde sig 14 personer frivilligt, alla med övervikt. De delades slumpmässigt in.
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
1 Icke-linjär regression Sid (i kapitel 16.1)
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Föreläsning 4 732G81. Kapitel 4 Sannolikhetsfördelningar Sid
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Betingade sannolikheter. 2 Antag att vi kastar en tärning och noterar antalet prickar som kommer upp. Låt A vara händelsen ”udda antal prickar”, dvs.
1. Kontinuerliga variabler
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
1 I. Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
1 UNDERSÖKNINGSMETODIK Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Statistiska undersökningar kan vara.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Lite matterepetition Räknesätten, bråk, förkorta, parenteser
Populärt brukar algebra ibland kallas för bokstavsräkning
X Sannolikhet Om man kastar en sexsidig tärning kan det bli sex olika utfall. Sannolikheten är lika stor för varje utfall.
Grundlägande statistik,ht 09, AN
Grundl. statistik F2, ht09, AN
Y 5.1 Hur stor är sannolikheten?
Presentationens avskrift:

Diskreta slumpvariabler

Stokastiskvariabel En slumpvariabel (stokastisk variabel) är en Funktion eller regel som tilldelar ett tal till varje Utfall av ett experiment. Betecknas vanligtvis med en stor bokstav i slutet på arbetet. X, Y, Z – Ex 1) X = Antal prickar på en tärning. – Ex 2) Y = Antal rökare bland tre tillfrågade.

Stokastiskvariabel En stokastiskvariabel (S.v.) är diskret om den antar ett ändligt eller uppräknerligt antal värden Antal prickar Antal bilar Antal defekta enheter Antal rökare

Sannolikhetsfunktion Till varje möjligt värde på en diskret Slumpvariabel tilldelas en sannolikhet. P(X = x) = p(x), där X – experimentet och x – utfall Tillsammans bildar dessa sannolikheter den diskreta s.v. sannolikhetsfunktionen

Exempel Låt X vara antal tillverkade enheter per dag. P(X=4)=0.1 P(X=6)=0.3 P(X=8)=0.4 P(X=10)=0.2

Fördelningsfunktion F(x) = P(X ≤ x) kallas för s.v. fördelningsfunktion Forts. exempel F(1) = P(X ≤ 1) = 0 F(4) = P(X ≤ 4) = P(X = 4) = 0.1 F(5) = P(X ≤ 5) = P(X = 4) = 0.1 F(6) = P(X ≤ 6) = P(X = 4) + P(X = 6) = = 0.4 F(8) = P(X ≤ 8) = P(X = 4) + P(X = 6) + P(X = 8) = 0.8 F(10) = P(X ≤ 10) = …= 1 F(100) = P(X ≤ 100) = … = 1

Mått Det finns två mått som sammanfattar en slumpvariabels egenskaper på ett bra sätt: Lägesmått - Väntevärde Spridningsmått – Varians/Standardavvikelse

Väntevärdet Väntevärdet anger det genomsnittliga värdet vid Ett obegränsat antal mätningar. Väntevärdet betecknas vanligtvis med E(X) eller µ

Väntevärde Väntevärdet för en diskretslumpvariabel X definieras som:

Exempel forts. X – Antal tillverkade enheter µ = E(X) = 4· · · ·0.2 = = 7.4

Varians/standardavvikelse Variansen anger det genomsnittliga kvadratiska avståndet till väntevärdet (µ ). Variansen betecknas med V(X) eller σ 2 Nackdel: Variansen tittar på de kvadratiska avstånden vilket resulterar i fel enhet. Använd därför standardavvikelsen = √variansen

Varians/standardavvikelse Variansen respektive standardavvikelsen för en diskret variabel definieras som

Exempel forts. σ 2 = (4 – 7.4) 2 ·0.1 + (6 – 7.4) 2 ·0.3 + (8 – 7.4) 2 ·0.4 + (10 – 7.4) 2 ·0.2 = 3.24 Alternativt: σ 2 = 4 2 · · · ·0.2 – = 3.24 D.v.s. σ 2 = 3.24 och σ = √(3.24) = 1.8

Räkneregler. Viktigt! E(konstant, c) = konstanten, c E(X + c) = E(X) + c E(c·X) = c·E(X) V(c) = 0 V(X + c) = V(X) V(c·X) = c 2 ·V(X)

Exempel forts. Antag att det kostar 3 kr att tillverka en enhet. Y – tillverkningskostnad/dag Y = 3·X E(Y) = 12· · · ·0.2 = 22.2 E(Y) = E(3·X) = 3·E(X) = 3·7.4 = 22.2

Exempel forts. V(Y) = 12 2 · · · ·0.2 = V(Y) = V(3·X) = 3 2 ·V(X) = 3 2 ·3.24 = 29.16

Exempel forts. Antag vidare att det tillkommer en fast kostnad på 30 kr/dag. Z = Y + 30 = 3·X + 30 E(Z) = 42 2 · · · ·0.2 = 52.2 E(Z) = E(Y + 30) = E(Y) + 30 = = 52.2 V(Z) = 42 2 · · · ·0.2 = V(Z) = V(Y + 30) = V(Y) = 29.16

Flerdimensionella s.v Precis som för händelser så kan det vara intressant att studera två eller flera slumpvariabler (X och Y) samtidigt. X och Y är oberoende om P(X = x, Y = y) = P(X = x) ·P(Y = y)

Räkneregler E(X + Y) = E(X) + E(Y) V(X + Y) = V(X) + V(Y) + 2·cov(X,Y) Cov betecknar kovariansen som är variationen mellan de två stokastiskavariablerna. Är X och Y oberoende så är cov(X,Y) = 0

Några diskreta fördelningar

Bernoullifördelningen sägs X vara en Bernoullifördelad slumpvariabel E(X) = 1·π + 0·(1 – π) = π V(X) = 1 2 · π ·(1 – π) – π 2 = π(1 – π) Ofta studerar man en följd av Bernoullifördelade slumpvariabler och får då en Binominalfördelning

Binomialfördelningen Studera n oberoende försök av samma slag. I Varje försök kan en viss händelse, A, inträffa eller utebli med sannolikheten π resp. (1 – π) Om X anger antalet försök där A inträffar sägs X vara en Binomialfördelad s.v.

Binomialfördelningen Sannolikhetsfunktionen för en Binomialfördelad s.v. ser ut som följer: där Skrivsätt: X ~Bin(n, π)

Exempel En viss typ av blomfrön uppges ha 40% Grobarhet. Vad kan vi förvänta oss om vi planterar 3 frön i en kruka? Låt X beteckna antalet groende frön. (Löses på tavlan)

Regler Binomialfördelningen Om följande är uppfyllt så X~Bin(n, π) Oberoende mellan utfallen Fixt antal händelser n Samma sannolikhet π att en händelse inträffar Endast två utfall (lyckas/misslyckas) Slumpvariabeln X betecknar antal lyckade utfall En tabell över Binomialfördelningen finns på s (tabell 5)

Lös övning 3

Hypergeometriskfördelning Betrakta en urna med N kulor varav r är vita. Drag slumpmässigt, utan återläggning, n kulor ur Urnan och låt X = antal vita kulor. X sägs då vara en hypergeometriskslumpvariabel med sannolikhetsfunktion.

Regler Hypergeometriskfördelning X~Hyp(n, N, π) Om N är stort i förhållande till n så kan man approximera med Binomialfördelningen (n/N).

Lös övning 4

Multinomial I en urna finns vita, röda och blå kulor. Drag n kulor med återläggning π 1 – sannolikhet vita kulor π 2 – sannolikhet röda kulor π 3 – sannolikhet blåa kulor π 1 + π 2 + π 3 =1, x 1 + x 2 + x 3 = n

Poissonfördelningen Låt X vara antalet händelser som inträffar i ett visst intervall. Då sägs X vara en Poissonfördelad s.v. med Sannolikhetsfunktion: där µ är det förväntade antalet händelser i ett sådant intervall. X~Po(µ) Finns tabeller i Appendix B tabell 6

Poissonfördelningen Används för att beskriva antalet enheter som kommer inom ett visst tidsintervall. Om X~Po(µ) E(X) = µ V(X) = µ

Lös övning 7