Statistik för internationella civilekonomer Föreläsning 5 732G81 Statistik för internationella civilekonomer Patrik.Waldmann@liu.se
Dagens föreläsning Diskreta sannolikhetsfördelningar Bernoullifördelningen Binomialfördelningen Poissonfördelningen Normalfördelningen Kontinuitetskorrektion (halvtalskorrektion) Samplingfördelningar och urval 732G81
Bernoullifördelningen Den enklaste av de diskreta sannolikhetsfördelningarna som bara har två utfallsmöjligheter {0,1} ex. krona, klave som har 𝑝=0.5 Dess täthetsfunktion är för 0≤𝑝≤1 𝑃 𝑛 = 1−𝑝 för 𝑛=0 𝑝 för 𝑛=1 Väntevärde och varians 𝜇=𝑝 𝜎 2 =𝑝− 𝑝 2 732G81
Bernoullifördelningen Exempel En student står på Campus och frågar 100 slumpmässigt utvalda förbipasserande om de tar studiestöd eller inte. Svaren blir enligt följande (Ja representerar p) Ja: 90 100 =0.9 Nej: 10 100 =0.1 Väntevärde och varians 𝜇=𝑝=0.9 𝜎 2 =𝑝− 𝑝 2 =0.9− 0.9 2 =0.09 732G81
Binomialfördelningen Summan av 𝑛 upprepade Bernoulliförsök där varje försök har samma 𝑝 (sannolikhet för lyckat utfall) ex. krona som singlas flera gånger Dess täthetsfunktion är för 0≤𝑝≤1 och antalet lyckade utfall 𝑘 𝑃 𝑋=𝑘 = 𝑛 𝑘 𝑝 𝑘 1−𝑝 𝑛−𝑘 Väntevärde och varians 𝜇=𝑛𝑝 𝜎 2 =𝑛𝑝 1−𝑝 Jmf. Komb. utan upprepning 732G81
Binomialfördelningen Exempel En familj har skaffat 6 barn, varav 5 blev flickor. Vad är sannolikheten att få så många flickor på sex försök? 𝑝=0.5, 𝑘=5 och 𝑛=6 𝑃 𝑋=5 = 6 5 0.5 5 1−0.5 6−5 = 6! 5! 6−5 ! 0.5 5 1−0.5 1 =0.09375 Vad är väntevärdet och variansen för flickor på sex försök? 𝜇=𝑛𝑝=6∙0.5=3 𝜎 2 =𝑛𝑝 1−𝑝 =6∙0.5∙0.5=1.5 732G81
Hypergeometriska fördelningen Beskriver sannolikheten för 𝑘 lyckade utfall i 𝑛 försök som dragits utan återläggning från en population med storleken 𝑁 som totalt innehåller 𝑁𝑝 lyckade utfall Dess täthetsfunktion är 𝑃 𝑋=𝑘 = 𝑁𝑝 𝑘 𝑁−𝑁𝑝 𝑛−𝑘 𝑁 𝑛 Väntevärde och varians 𝜇=𝑛𝑝 𝜎 2 =𝑛𝑝 1−𝑝 𝑁−𝑛 𝑁−1 732G81
Hypergeometriska fördelningen Exempel En kortlek består av N= 52 kort. När man spelar poker delas 5 kort ut. Vad är sannolikheten för att få 3 ess? 𝑝= 4 52 , 𝑘=3 och 𝑛=5 𝑃 𝑋=3 = 4 3 52−4 5−3 52 5 =0.001736 732G81
Poissonfördelningen Är en approximation till Binomialfördelningen som beskriver sannolikheten att få 𝑘 lyckade utfall bland 𝑛 delförsök (𝑛>20) Dess täthetsfunktion är 𝑃 𝑋=𝑘 = 𝜇 𝑘 𝑘! 𝑒 −𝜇 Väntevärde och varians 𝜇=𝑛𝑝 𝜎 2 =𝑛𝑝 732G81
Poissonfördelningen Exempel När man tillverkar en elektronisk komponent så vet man att det vanligtvis blir fel på en av 10 000. Under en vecka har man tillverkat 20 000 komponenter och vill veta vad sannolikheten är för mindre än två felaktiga komponenter. 𝑝= 1 10 000 och 𝑛=20 000 ger 𝜇=2 𝑃 𝑋≤2 = 2 0 0! 𝑒 −2 + 2 1 1! 𝑒 −2 =0.41 732G81
Normalfördelningen Symmetrisk, kontinuerlig fördelning som beskrivs helt av väntevärdet och standardavvikelsen Dess täthetsfunktion är 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 Väntevärde och varians 𝜇 𝜎 2 732G81
Normalfördelningen Linjär variabeltransformation Om 𝑋 ~ 𝑁 𝜇,𝜎 och a, b är konstanter så gäller att den linjära formen 𝑏𝑋+𝑎 ~ 𝑁 𝑏𝜇+𝑎,𝑏𝜎 det vill säga, väntevärdet förändras på samma linjära sätt och standardavvikelsen ökar med faktorn a. Där linjen skär y-axeln Lutning på en linje 732G81
Normalfördelningen Sannolikhet för ett givet x Standardiserad normalfördelning 𝑧~𝑁 0,1 Beräkna (där 𝜇 och 𝜎 är kända) 𝑧= 𝑥−𝜇 𝜎 Slå upp z i normalfördelningstabell, eller använd en dator som har tabeller lagrade och ger större exakthet, och avläs sannolikheten. 732G81
Normalfördelningen Z-värden 732G81
Normalfördelningen Normalfördelningsapproximation av binomialfördelningen Givet att 𝑋~𝐵𝑖𝑛 𝑛,𝑝 och 𝑛𝑝 1−𝑝 >5 Så kan Bin approx med N enligt 𝑋≈𝑁 𝑛𝑝, 𝑛𝑝 1−𝑝 Exakt och approx. resultat kan skilja sig, kan förbättras med kontinuitetskorrektion (inkludera halvtalsintervall i beräkningarna) 732G81
Samplingfördelning De stora talens lag säger att ju större stickprov vi drar desto mer lika blir stickprovsstatistikorna populationsparametrarna. Att dra fler stickprov från en population kallas för sampling Fördelningen för stickprovsmedelvärdena kallas urvalsfördelning Urvalsfördelningen kan betraktas som en uppskattning av samplingfördelningen 732G81
Samplingfördelning Samplingfördelning för summor och medelvärden av n oberoende slumpvariabler är approximativt normalfördelad om n är tillräckligt stort 732G81
Tack för idag!