F8 Hypotesprövning. Begrepp

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Bedömning av uppfyllelse av miljökvalitetsnormer
Inferens om en population Sid
Spelstrategi.
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
Samband mellan kvalitativa variabler Sid
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
FL10 732G81 Linköpings universitet.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
Grundläggande statstik, ht 09, AN1 F9 Analys av frekvenstabeller Hittills har vi analyserat eller jämfört 2 grupper avseende variabler på intervall- eller.
732G22 Grunder i statistisk metodik
Statistikens grunder, 15p dagtid
Workshop i statistik för medicinska bibliotekarier!
Algebra och ekvationer
Tillämpad statistik Naprapathögskolan
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Grundlägande statistik,ht 09, AN1 F5 Kombinatorik (KW 1.6) Ex.: På en matsedel finns tre förrätter, två huvudrätter och två efterrätter. På hur många olika.
Skattningens medelfel
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statistikens grunder 2 dagtid
Egenskaper för punktskattning
Sannolikhet Stickprov Fördelningar
FL6 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Linjär regression föreläsning 9
Normalfördelningen och centrala gränsvärdessatsen
F8 Hypotesprövning. Begrepp
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Fysikexperiment 5p Föreläsning Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 I allmänhet är den asymptotiska fördelningen.
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
732G22 Grunder i statistisk metodik
Grundläggande statistik, ht 09, AN
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Diskreta slumpvariabler. Stokastiskvariabel En slumpvariabel (stokastisk variabel) är en Funktion eller regel som tilldelar ett tal till varje Utfall.
Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Hypotesprövning. Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens:
Idag: Repetition av Chi2-test Kap 6*, Kodning av svaren Kap 10*, Olika feltyper Kap 12*, Rapportskrivning *Dahmström.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Grundlägande statistik,ht 09, AN
Grundl. statistik F2, ht09, AN
Grundläggande begrepp
Presentationens avskrift:

F8 Hypotesprövning. Begrepp Nollhypotes Mothypotes Testfunktion Beslutsregel Signifikansnivå Kritiskt område Ensidigt/tvåsidigt test Typ-I-fel Typ-II-fel Styrka P-värde Grundläggande statistik, ht 09, AN

F8 Hypotesprövning (Ex 5 sid. 186 KW) Är myntet symmetriskt? Vi har blivit ombedda att kontrollera om ett mynt är symmetriskt. Hur ska vi gå till väga? Hur många gånger behöver vi kasta myntet för att kunna uttala oss något så när säkert? Vad innebär symmetri? Kasta 1 gång? 2? 20? 40? 100? 3. Vad betyder att vara ”något så när säker”? Vilka fel kan vi göra? Låt n=antal kast X= antal gånger vi får krona P=andelen gånger vi får krona Grundläggande statistik, ht 09, AN

F8 Hypotesprövning av  (= 0,5 i detta ex.) H0:  =0,5 (kallas ofta 0) H1:  ≠ 0,5 Testfunktion: X som är Bi(n; 0,5) om H0 är sann. Alternativt om n stort, P som är Nf(0,5; ) eller som är Nf(0; 1) om H0 är sann. Om ensidigt test: H1:  > 0,5 eller H1:  < 0,5 Grundläggande statistik, ht 09, AN

Grundläggande statistik, ht 09, AN F8 Hypotesprövning Vill ha svar på frågan: Beror skillnaden mellan P och 0,5 på slumpen? Beslutsregel: Vi förkastar H0 om vi får så höga eller låga värden på X (eller P eller Z) som vi sällan skulle få om är sann H0. Kallas kritiskt område. Signifikansnivå (α ): Pr (förkasta H0 när den är sann). Definierar kritiska området. Att förkasta en sann H0 kallas för typ-I-fel. Styrkan (1-β): Pr(förkasta H0 när den inte är sann) där β = Pr(inte förkasta H0 när den inte är sann). Att inte förkasta en falsk H0 kallas för typ-II-fel. Grundläggande statistik, ht 09, AN

F8 Hypotesprövning (forts) I verkligheten är H0 sann H0 falsk Beslut H0 förkastas inte H0 förkastas Korrekt beslut Typ I-fel Sign. nivån Pr = α Typ II-fel Pr = β Pr = 1- β Styrkan Grundläggande statistik, ht 09, AN

F8 Hypotesprövning av medelvärde Nf(µ ;σ) Alternativt, om ensidigt test H1 : µ > µ0 eller H1 : µ < µ0 Testfunktion: som är Nf(µ0 ; ) eller som är Nf(0; 1) om H0 är sann. Grundläggande statistik, ht 09, AN

F8 Hypotesprövning av medelvärde Nf(µ ;σ) när σ är okänd Alternativt, om ensidigt test H1: µ < µ0 eller H1: µ ≠>µ0 Skatta σ med Testfunktion som är t-fördelad med n-1 frihetsgrader om H0 är sann. Grundläggande statistik, ht 09, AN

F8 Hypotesprövning av medelvärde. Okänd fördelning, n stort Alternativt, om ensidigt test H1: µ < µ0 eller H1: µ ≠>µ0 Testfunktion där Z är Nf(0; 1) om H0 är sann och n stort. Enligt C G S. Grundläggande statistik, ht 09, AN

Hypotesprövning av  (allmänt) Alternativt, om ensidigt test H1:  < 0 eller H1:  > 0 Testfunktion där Z är Nf(0; 1) om H0 är sann och n stort Grundläggande statistik, ht 09, AN

F8 Hypotesprövning, p-värden I många sammanhang anges ett s.k. p-värde p-värdet är ett mått på hur stor sannolikheten är att få ett minst lika extremt värde på testfunktionen som det vi faktiskt har fått, givet att H0 är sann. Ju lägre p-värde, desto starkare stöd för mothypotesen. Om vi har bestämt oss för signifikansnivån 5%, så ska vi förkasta H0 om vi får ett p-värde som är mindre än 0,05. Om signifikansnivån är 1%, så ska vi förkasta H0 om vi får ett p-värde som är mindre än 0,01, o.s.v. Grundläggande statistik, ht 09, AN