Presentation laddar. Vänta.

Presentation laddar. Vänta.

1 Dummyvariabler (se 15.7) Man stöter ofta på förklaringsvariabler där den skala som använts vid mätning ej ger intervall- eller kvotskala. Denna typ av.

Liknande presentationer


En presentation över ämnet: "1 Dummyvariabler (se 15.7) Man stöter ofta på förklaringsvariabler där den skala som använts vid mätning ej ger intervall- eller kvotskala. Denna typ av."— Presentationens avskrift:

1 1 Dummyvariabler (se 15.7) Man stöter ofta på förklaringsvariabler där den skala som använts vid mätning ej ger intervall- eller kvotskala. Denna typ av variabler tar vi med i regressionsmodellen i form av dummyvariabler (indikatorvariabler). En dummyvariabel (I) kan anta ett av de två värdena, “noll” eller “ett”. 1 om det är en man 0 om det är en kvinna I= 1 för data till och med år 1980 0 för data efter år 1980 1 om temperaturen är under 50 o 0 om temperaturen är 50 o eller mer 1 om man har en universitetsexamen 0 om man ej har en universitetsexamen

2 2 Exempel: Priset på Ford Taurus Exempel –En bilhandlare vill prediktera auktionspriset på en bil. –Förutom vägmätarställning tror bilhandlaren att bilens färg kan ha betydelse för priset. –Man delar in bilarna i tre färgkategorier: Vit Silver Andra färger Obs: Detta är en nominalskala.

3 3 Vi använder följande dummyvariabler: I 1 = 1 om bilen är vit 0 om bilen ej är vit I 2 = 1 om bilen är silverfärgad 0 om bilen ej är silverfärgad Kategorin “Andra färger” får värdena: I 1 = 0; I 2 = 0

4 4 Obs: När vi har tre kategorier behöver vi två dummyvariabler. Slutsats: Har vi m kategorier behöver vi m-1 dummyvariabler Hur många dummyvariabler?

5 5 Modellen –y =  0 +  1 (Odometer) +  2 I 1 +  3 I 2 +  med de “vanliga” antagandena om slumptermen –Data Vit Annan färg Silver

6 6 Odometer Price Price = 16701 -.0555(Odometer) + 90.48(0) + 295.48(1) Price = 16701 -.0555(Odometer) + 90.48(1) + 295.48(0) Price = 16701 -.0555(Odometer) + 90.48(0) + 295.48(0) 16701 -.0555(Odometer) 16791.48 -.0555(Odometer) 16996.48 -.0555(Odometer) Ekvationen för en bil med “annan färg”. Ekvationen för en vit bil. Ekvationen för en silverfärgad bil Vi får följande skattade regressionsekvation PRICE = 16701-.0555(Odometer)+90.48(I-1)+295.48(I-2) Den skattade regressionekvationen

7 7 PRICE = 16701-.0555(Odometer)+90.48(I-1)+295.48(I-2) En vit bil säljs, i genomsnitt, för $90.48 mer än en bil i kategorin “annan färg” En silverfärgad bil säljs, i genomsnitt för $295.48 mer än en bil i kategorin “annan färg” För ytterligare en mile minskar priset med i genomsnitt 5.55 cents.

8 8 Vi har ej tillräckligt empiriskt stöd för hypotesen att vita bilar, i genomsnitt, säljs för ett högre pris än bilar med “annan färg” Vi har tillräckligt empiriskt stöd för hypotesen att silverfärgade bilar, i genomsnitt, säljs för ett högre pris än bilar med “annan färg”.

9 9 Rektorn vill utvärdera ansökningar för ett MBA-program genom att förutsäga hur det kommer att gå för de som söker. Man använder följande förklaringsvariabler: –Undergraduate GPA –GMAT score –Years of work experience –Type of degree. Exempel: MBA Program Admission Obs: Type of degree är på nominal nivå.

10 10 I 1 = 1 om B.A. 0 för övrigt I 2 = 1 om B.B.A 0 för övrigt Kategorin “Other group” får värdena: I 1 = 0; I 2 = 0; I 3 = 0 I 3 = 1 om B.Sc. eller B.Eng. 0 för övrigt

11 11 Resultat av modellskattning

12 12 Exempel: Lika lön Exempel –Diskrimineras kvinnliga chefer i ett stor företag? –Ett slumpmässigt urval, bestående av 100 chefer, valdes. Följande variabler mättes: Annual salary Years of education Years of experience Gender

13 13 Modellen: y =  0 +  1 Education +  2 Experience +  3 Gender +  –Observera mätnivåerna: Education – Intervall Experience – Intervall Gender – Nominal (Gender = 1 om man; =0 om kvinna).

14 14 Resultat av modellskattning Analys och tolkning Modellen anpassar bra till data. Modellen är användbar. Experience är en variabel som är starkt relaterad till lön Vi har ej tillräckligt empirsikt stöd för hypotesen om könsdiskriminering.


Ladda ner ppt "1 Dummyvariabler (se 15.7) Man stöter ofta på förklaringsvariabler där den skala som använts vid mätning ej ger intervall- eller kvotskala. Denna typ av."

Liknande presentationer


Google-annonser