Tillämpad ekonometri (5 sp) Jonas.Lagerstrom@abo.fi
OLS på tvärsnittsdata är i regel svårt och kräver starka antaganden för en kausal tolkning. Du måste faktiskt sälja storyn att selektionen är slumpmässig GIVET DE X SOM DU HAR LAGT IN I MODELLEN. Det ska alltså inte finnas några systematiska skillnader mellan grupperna som i sig påverkar utfallet. Om dina tvärsnittsdata innehåller uppgifter för TVILLINGAR kan du i praktiken lägga in fixa effekter för tvillingpar. Intuitionen är identisk som när du lägger in individfixa effekter, men nu jämför du mellan tvillingar i stället för mellan en enskild individ över tiden. Lägg alltså in en dummy för varje tvillingpar: Bröderna Sedin tjänar ALLTID mycket pengar (kanske för att de är fysiska, långa, streber till farsa); Mary Kate och Asley Olsen har alltid lägre inkomst (deras släkt är inte klok) Att tvillingar får olika utfall kan OMÖJLIGEN bero på faktorer som är gemensamma för tvillingar. Om individ A tjänar 100 euro mer i månaden än sin tvilling B så kan inte det bero på gener – eftersom generna är gemensamma. https://www.youtube.com/watch?v=CMbI7DmLCNI Tvillingar delar en stor mängd faktorer: gener, ålder, föräldrar, uppväxtförhållande mm. Kan vi utnyttja det!? 21.9.2018
Leder rökning till tidigare död? Tvillingfixa effekter Rökare dör tidigare än observerbart identiska icke-rökare, men kan kanske ha andra icke-observerade egenskaper som i sig ger ökad dödlighet: dåliga gener, fattig uppväxt, dåliga kostvanor mm. Klassisk finsk tvillingstudie av 22 tvillingpar där bara ena tvillingen är rökare. I 18 av 22 fall dog rökaren först. Case closed? Unika tvillingdata, här.
Tvärsnittsdata med panelegenskaper Tvillingfixa effekter Daniel Sedins hälsa avgörs av huruvida han röker eller inte. Dessutom beror den på icke-observerade faktorer. En del av dessa faktorer är gemensamma med hans tvilling Henrik: Dom är starka, unga, har lågt IQ, gillar att dricka öl. Andra faktorer är olika mellan Daniel och Henrik (Daniel gillar att gå på gym, Henrik gillar att köra speedway). När du inkluderar tvillingfixa effekter (alltså en dummy för respektive tvillingpar) så tar den hänsyn till allt som är gemensamt för tvillingarna. Du kan därför inte heller identifiera effekten av X som alltid är gemensamt för tvillingar. Antagande som vanligt: Inget systematiskt samband mellan X och (nya) feltermen u. Fundera på om detta är ett starkt eller svagt antagande! Vi spjälkar upp feltermen i sånt som är konstant hos tvillingparet (gener, IQ, föräldrar, uppväxtförhållanden) och sånt som varierar mellan tvillingarna (kostvanor, jobbförhållanden). Hur kan du kontrollera för den fixa effekten? Dummy för varje tvillingpar!
Centralt antagande för kausal tolkning: Cov(X,u)=0. Effekten av ett extra skolår på lön Aschenfelter & Krueger (1992) Välutbildade tjänar mer, men selektion av ordentliga och smarta in i högre utbildning? Slutsats: Ett extra skolår höjer timlönen med 10 procent. Förstå variationen! Varför har individen mer utbildning än sin tvilling? Tänkbar förklaring? Tvillingen som föds först väger ofta mer och har högre IQ. Åt vilket håll tror du biasen går om du inte inkluderar tvillingfixa effekter? (invändningen: Mick Jagger och Bill Gates hoppade av skolan). Sen är det lite märkligt VARFÖR tvillingar faktiskt skiljer sig på X; vår analys utgår ju i princip från att tvillingar är identiska så varför väljer dom då olika vägar i skogen? Centralt antagande för kausal tolkning: Cov(X,u)=0.
Karriärseffekt av att få barn tidigt Syskonfixa effekter Tvillingdata sällsynt, men vanligt med syskondata. Lägg in en dummy för varje syskonpar och estimera effekter genom variation inom syskon. Holmlund (2005) jämför systrar där bara den ena får barn före 18 års ålder. Slutsats: Att tonårsföräldrar lyckas dåligt på arbetsmarknaden senare i livet beror till stor del på selektion. Exempel: Jämför systrar där ena blivit gravid som tonåring och den andra inte (Holmlund). Detta gör att vi kan mäta effekten från tonårsfödsel på framtida lön men ej effekten av att ha rika föräldrar på framtida lön. Var finns variationen? Kan vi identifiera effekten av att ha rika föräldrar? Kritisera slutsatserna! 6
Leder ett utländskt namn till lägre lön? Djupsjöbacka & Lagerström Vi estimerar löneeffekten av ett utländskt namn genom att jämföra observerbart identiska helsyskon där bara vissa har ett finskt förnamn. Slutsats: Individer med icke-västerländska förnamn har 6 procent lägre arbetsinkomst än sina helsyskon med finländska förnamn. Jämför estimatet mot estimaten i studier som använt individfixa effekter. Var finns variationen? Kan vi identifiera effekten av att ha rika föräldrar? Kritisera slutsatserna! 7
Hur farlig är ungdomsarbetslösheten? Syskonjämförelser Individer som varit arbetslösa efter i gymnasiet har mycket lägre inkomster senare i livet, men är det orsakat av arbetslösheten eller andra faktorer? Slutsats: Individer som var arbetslösa direkt efter gymnasiet har fem år senare 17 procent lägre årsinkomst än sina syskon med samma observerbara egenskaper som inte var arbetslösa efter gymnasiet. Ställ upp den ekonometriska modellen! Kritisera slutsatserna! 21.9.2018 4.8