1 Dummyvariabler (se 15.7) Man stöter ofta på förklaringsvariabler där den skala som använts vid mätning ej ger intervall- eller kvotskala. Denna typ av.

Slides:



Advertisements
Liknande presentationer
Inferens om en population Sid
Advertisements

Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
Fö 8 – Arbetsmarknad och arbetsmarknadspolitik
Marknaden – ett enkelt exempel Varian kap 1
Ränta och inflation Företagen Ränta Konsumenter
Ränta och inflation Företagen Konsumenter Ränta
Inferens om en ändlig population Sid
Kapitel 5 Stickprovsteori Sid
Grundläggande statstik, ht 09, AN1 F9 Analys av frekvenstabeller Hittills har vi analyserat eller jämfört 2 grupper avseende variabler på intervall- eller.
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Skattningens medelfel
Chitvå-test Regression forts.
Lunds Tekniska Högskola, 18 november 2011
2. Enkel regressionsanalys
Efterfrågemodeller R. D. Jonsson, Transportmodellkurs Trafikverket
FL1 732G70 Statistik A Linköpings universitet.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Multipel linjär regressionsanalys
Hur bra är modellen som vi har anpassat?
3. Multipel regression 2005 © Rune Höglund Multipel regression.
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S.
Statistik Lars Valter Fil.lic. Statistik
Några allmänna räkneregler för sannolikheter
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
1 Om sambandet inte är linjärt? Om sambandet till en variabel inte är linjärt så kan vi inkludera ytterligare en term i regressionsmodellen I en modell.
Kvadratisk regression, forts.
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Kvantitativ metod. 2 Vad är statistik? En massa siffror Beskrivning av staten Metodlära.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Modell för konsumtionen i Sverige Från Baudins kompendium.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
1 Icke-linjär regression Sid (i kapitel 16.1)
Uppdrag motverka mäns våld mot kvinnor Introduktion till filmen Vill du välja färg och/eller layout? Klicka på den lilla pilen under knappen ”Ny bild”
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Föreläsning 4 (Kajsa Fröjd) Multipel regression Kap 11.3 A.Man har en kvantitativ responsvariabel som är linjärt relaterad till en/flera kvantitativa förklarande.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
1 UNDERSÖKNINGSMETODIK Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Statistiska undersökningar kan vara.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
1 Utvärdering och tolkning: MBA Program Admission Policy Rektorn vid ett stort universitet vill höja standarden på de som antas till deras populära MBA-program.
STATISTISK METODIK 1. INLEDNING / VAD ÄR STATISTIK? 2. UNDERSÖKNINGSMETODIK 3. DESKRIPTION 4. SAMBAND.
Vetenskapsprojekt, rubrik
Icke-linjära modeller:
Att analysera med hjälp av matematik
Fiskbensdiagram.
Tillämpad ekonometri (5 sp)
Vad ingår kursen? i korta drag
Samband mellan ohälsa i munnen och MNA ≤ 7 – data från Senior alert Jan 2013 – Juli Dennis Nordvall Statistiker, Qulturum.
effektmätning för CASINO COSMOPOL –
Grundläggande begrepp
Förbättringsarbete för säker läkemedelshantering
Presentationens avskrift:

1 Dummyvariabler (se 15.7) Man stöter ofta på förklaringsvariabler där den skala som använts vid mätning ej ger intervall- eller kvotskala. Denna typ av variabler tar vi med i regressionsmodellen i form av dummyvariabler (indikatorvariabler). En dummyvariabel (I) kan anta ett av de två värdena, “noll” eller “ett”. 1 om det är en man 0 om det är en kvinna I= 1 för data till och med år för data efter år om temperaturen är under 50 o 0 om temperaturen är 50 o eller mer 1 om man har en universitetsexamen 0 om man ej har en universitetsexamen

2 Exempel: Priset på Ford Taurus Exempel –En bilhandlare vill prediktera auktionspriset på en bil. –Förutom vägmätarställning tror bilhandlaren att bilens färg kan ha betydelse för priset. –Man delar in bilarna i tre färgkategorier: Vit Silver Andra färger Obs: Detta är en nominalskala.

3 Vi använder följande dummyvariabler: I 1 = 1 om bilen är vit 0 om bilen ej är vit I 2 = 1 om bilen är silverfärgad 0 om bilen ej är silverfärgad Kategorin “Andra färger” får värdena: I 1 = 0; I 2 = 0

4 Obs: När vi har tre kategorier behöver vi två dummyvariabler. Slutsats: Har vi m kategorier behöver vi m-1 dummyvariabler Hur många dummyvariabler?

5 Modellen –y =  0 +  1 (Odometer) +  2 I 1 +  3 I 2 +  med de “vanliga” antagandena om slumptermen –Data Vit Annan färg Silver

6 Odometer Price Price = (Odometer) (0) (1) Price = (Odometer) (1) (0) Price = (Odometer) (0) (0) (Odometer) (Odometer) (Odometer) Ekvationen för en bil med “annan färg”. Ekvationen för en vit bil. Ekvationen för en silverfärgad bil Vi får följande skattade regressionsekvation PRICE = (Odometer)+90.48(I-1) (I-2) Den skattade regressionekvationen

7 PRICE = (Odometer)+90.48(I-1) (I-2) En vit bil säljs, i genomsnitt, för $90.48 mer än en bil i kategorin “annan färg” En silverfärgad bil säljs, i genomsnitt för $ mer än en bil i kategorin “annan färg” För ytterligare en mile minskar priset med i genomsnitt 5.55 cents.

8 Vi har ej tillräckligt empiriskt stöd för hypotesen att vita bilar, i genomsnitt, säljs för ett högre pris än bilar med “annan färg” Vi har tillräckligt empiriskt stöd för hypotesen att silverfärgade bilar, i genomsnitt, säljs för ett högre pris än bilar med “annan färg”.

9 Rektorn vill utvärdera ansökningar för ett MBA-program genom att förutsäga hur det kommer att gå för de som söker. Man använder följande förklaringsvariabler: –Undergraduate GPA –GMAT score –Years of work experience –Type of degree. Exempel: MBA Program Admission Obs: Type of degree är på nominal nivå.

10 I 1 = 1 om B.A. 0 för övrigt I 2 = 1 om B.B.A 0 för övrigt Kategorin “Other group” får värdena: I 1 = 0; I 2 = 0; I 3 = 0 I 3 = 1 om B.Sc. eller B.Eng. 0 för övrigt

11 Resultat av modellskattning

12 Exempel: Lika lön Exempel –Diskrimineras kvinnliga chefer i ett stor företag? –Ett slumpmässigt urval, bestående av 100 chefer, valdes. Följande variabler mättes: Annual salary Years of education Years of experience Gender

13 Modellen: y =  0 +  1 Education +  2 Experience +  3 Gender +  –Observera mätnivåerna: Education – Intervall Experience – Intervall Gender – Nominal (Gender = 1 om man; =0 om kvinna).

14 Resultat av modellskattning Analys och tolkning Modellen anpassar bra till data. Modellen är användbar. Experience är en variabel som är starkt relaterad till lön Vi har ej tillräckligt empirsikt stöd för hypotesen om könsdiskriminering.