Icke-linjära modeller:

Slides:



Advertisements
Liknande presentationer
Talföljder formler och summor
Advertisements

Justerad metod i RAMS Justerad metod i RAMS 2011 I framställningen av den Registerbaserade arbetsmarknadsstatistiken (RAMS) avseende.
Icke-linjära modeller:
Kap 1 - Algebra och linjära modeller
Romersk skulptur Exempel Förutsättningar Kännetecken
1 Tillämpning av Koden Innehåll •Undersökningens metod och uppläggning, inkl. bolagsurval •Sammanfattning •Genomgång av svar på fokusfrågor.
MS Excel 2010 – Dag 2 Mahmud Al Hakim
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Regressions- och tidserieanalys, 5 p
Hur bra är modellen som vi har anpassat?
Regressions- och tidsserieanalys
Leif Håkansson’s Square Dancer Rotation
Projektföljeforskning
FL10 732G81 Linköpings universitet.
Linda Wänström och Elisabet Nikolic (Karl Wahlin)
Karolinska Institutet, studentundersökning Studentundersökning på Karolinska Institutet HT 2013.
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
V E R S I O N N R 2. 0 T A V E L I D É E R I M I L J Ö.
Bastugatan 2. Box S Stockholm. Blad 1 Läsarundersökning Maskinentreprenören 2007.
INFÖR NATIONELLA PROVET
Företagarpanelen – Q SEPTEMBER 2011 Hallands län.
Enkätresultat för Grundskolan Elever 2014 Skola:Hällby skola.
Robert Gidehag & Jonas Arnberg. Studiens frågeställningar Övergripande: Är den svenska alkoholpolitiken effektiv på 2000-talet?
Antag att följande värden hos kapitalet har gällt:
Digitalteknik 7.5 hp distans: 5.1 Generella sekvenskretsar 5.1.1
Hittarps IK Kartläggningspresentation år 3.
F10 Företagets lönsamhet, finansiering och tillväxt
Från Gotland på kvällen (tågtider enligt 2007) 18:28 19:03 19:41 19:32 20:32 20:53 21:19 18:30 20:32 19:06 19:54 19:58 20:22 19:01 21:40 20:44 23:37 20:11.
Ekonomirapporten. April 2014
TÄNK PÅ ETT HELTAL MELLAN 1-50
Skattningens medelfel
1 Joomla © 2009 Stefan Andersson 1. 2 MÅL 2 3 Begrepp Aktör: en användare som interagerar med webbplatsen. I diagrammet till höger finns två aktörer:
Chitvå-test Regression forts.
Kouzlo starých časů… Letadla Pár foteček pro vzpomínku na dávné doby, tak hezké snění… M.K. 1 I Norrköping får man inte.
Diskreta, deterministiska system Projekt 1.2; Vildkatt
Grundskola Föräldrar 2013 Grundskoleenkät - Föräldrar Enhet:Gillberga skola.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fastbasindex--Kedjeindex
Multipel regressionsanalys
Kapitel 2: Den ekonomiska analysens redskap David Begg, Stanley Fischer and Rudiger Dornbusch, Economics, 6th Edition, McGraw-Hill, 2000 Power Point presentation.
732G71 STATISTIK B Vad förväntas man egentligen kunna efter genomgången kurs? Exempel: Du sitter i ett projektmöte på din arbetsplats. Din chef (om det.
Binomialsannolikheter ritas i ett stolpdiagram
Grundkurs i nationalekonomi, Åbo akademi Centralbanker och det monetära systemet.
1 Regression Analysis: Hyra versus Kv-meter The regression equation is Hyra = Kv-meter Predictor Coef SE Coef T P Constant
Multipel linjär regressionsanalys
Vägda medeltal och standardvägning Index
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
Räkna till en miljard 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14,15,16,17,18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, En miljard är ett.
Hur bra är modellen som vi har anpassat?
1 Kursens Mål Allmänbildning “Att kunna läsa tidningarnas ekonomisidor etc.” Att lära ut redskap (modeller) som kan användas för att göra en självständig.
Förskoleenkät Föräldrar 2012 Förskoleenkät – Föräldrar Enhet:Hattmakarns förskola.
Kvadratsummeuppdelning/Variansanalys
Bild 1 Prognos för länets arbetsmarknad Stefan Tjb.
När infaller Julafton och hur ofta?
Exempel: Vad påverkar kostnaden för produktion av korrugerat papper, dvs sådant som ingår i wellpapp och kartonger? Amerikansk studie: Kostnaden kan förmodligen.
Tidsserieregression fungerar statistiskt som vanlig regression. Regression Analysis The regression equation is Sold = 5,78 + 0,0430 time Predictor.
Regression Analysis The regression equation is Sold = 5,78 + 0,0430 time Predictor Coef StDev T P Constant 5,7761 0,9429 6,13 0,000 time 0, ,03420.
Regressions- och tidsserieanalys
Kapitel 2 Nationalekonomiska verktyg. 1 Modeller och data En modell –är en teoretisk referensram baserad på förenklande antaganden –som hjälper en att.
1 Om sambandet inte är linjärt? Om sambandet till en variabel inte är linjärt så kan vi inkludera ytterligare en term i regressionsmodellen I en modell.
Kvadratisk regression, forts.
Multipel regressionsanalys Den generella metoden i vilken Enkel linjär regression är ett specialfall Syften: –Att förklara variationen i en intressant.
1 Icke-linjär regression Sid (i kapitel 16.1)
Föreläsning 4 (Kajsa Fröjd) Multipel regression Kap 11.3 A.Man har en kvantitativ responsvariabel som är linjärt relaterad till en/flera kvantitativa förklarande.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Icke-linjära modeller:
Presentationens avskrift:

Icke-linjära modeller: Polynomregression, t ex: som vi har avhandlat som ”vanlig” multipel regression. Exponentiell modell: där 0 och 1 är parametrar som tidigare och  är en slumpkomponent som antas ha väntevärde 1 och som är sådan att log() har väntevärde 0 och konstant varians, oftast N (0,).

Den exponentiella modellen kan naturligtvis ha flera förklarande variabler Hur kan man analysera en sådan modell? t.ex Genom att logaritmera modellen får vi:

och sätter man: y ' = log y,  0' = log 0 , 1’ = log 1 , osv  = log  så får man modellen

Denna modell kan man anpassa som en vanlig regressionsmodell Denna modell kan man anpassa som en vanlig regressionsmodell. Tester, konfidensintervall , prognoser och bedömningar om modellen är adekvat (förklaringsgrad, residualanalys,...) kan göras som förut. Däremot måste man komma ihåg att transformera tillbaka storheter som man nu får som logaritmerade värden (de kan vanligtvis bara tolkas i originalskala) t.ex. ŷ '= b0'+b1'·x1+b2’x2+b3’x3 Transformera tillbaka till originalskala. Vi antar att vi har använt 10-logaritmen här, dvs c=log d  d=10c alltså

Varför en exponentiell modell? klarar av mer invecklade icke-linjära samband kan hantera ”explosiva” samband, t ex mycket expansiva marknader. Exempel: Antag att ett företag under en tioårsperiod har placerat en viss kapitalmängd på litet olika sätt. Genom att sälja och köpa diverse former av värdepapper har man hoppats kunna förränta kapitalet bättre än genom en fast placering under dessa år. Hur skulle man kunna uppskatta en ekvivalent räntesats?

Antag att följande värden hos kapitalet har gällt: År Kapital 1 27.7 2 33.9 3 34.0 4 42.9 5 48.7 6 60.3 7 67.8 8 76.0 9 81.0 10 95.1

En modell för data skulle i och för sig kunna vara linjär men vi vet ju att en teoretisk räntemodell har formen: Kapital år t=Grundkapital  (1+r)t där r är räntesatsen. Vi använder därför modellen y= 0 ·1 t ·  där 1 = 1+r. Modellen logaritmeras som ovan vilket innebär att vi måste beräkna log y för alla y-värden.

År (t) Kapital (y) log y t2 (log y)2 t·log y 1 27.7 1.442 1 2.079 1.442 2 33.9 1.530 4 2.341 3.060 3 34.0 1.531 9 2.344 4.593 4 42.9 1.632 16 2.663 6.528 5 48.7 1.688 25 2.849 8.440 6 60.3 1.780 36 3.168 10.680 7 67.8 1.831 49 3.353 12.817 8 76.0 1.881 64 3.538 15.048 9 81.0 1.908 81 3.640 17.172 10 95.1 1.978 100 3.912 19.780 Summor: 55 17.20 385 29.89 99.57

Modellen (med y' =log y) anpassas nu till ŷ '= b0'+b1'·t där

och en anpassad modell i originalskala erhålls genom att beräkna: och vi kan tolka 1.148 – 1=0.148 som den skattade räntesatsen, dvs 14.8 % b0=24.55 tolkas som ingångskapitalet.

Efterfrågeanalys Nationalekonomisk framställning: Efterfrågan, Q = försäljningsvolym av aktuell vara, tjänst eller grupp av varor/tjänster beror av Priset, P, på varan, tjänsten, eller priserna i gruppen av varor/tjänster Inkomstnivån, I , i den population av konsumenter som efterfrågar varan/tjänsten/gruppen. Priset, P2 , på en annan vara relaterad till varan/tjänsten/gruppen. Ett substitut eller ett komplement Tiden, t, som sammanfattande indikator på smakförändringar.

Prisvariablerna är sällan enskilda styckepriser för produkten ifråga utan oftare ett prisindex. Speciellt använder man ett relativprisindex där effekter av inflation har filtrerats bort (prisindex/KPI) Detta gäller förstås samtliga prisvariabler i listan ovan Inkomstvariabeln utgörs som regel av realinkomsten per capita i den population av konsumenter som efterfrågar varan/tjänsten/gruppen Realinkomst erhålls genom att deflatera nominell inkomst med KPI.

Modeller: 1) Man kan tänka sig en linjär modell: där  som vanligt antas vara en slumpkomponent med väntevärde 0 och konstant varians, oftast N (0, ). men vilka problem kan finnas med en sådan? Vad händer då priset, P, ökar från värdet 1 till värdet 2? priset, P, ökar från värdet 11 till värdet 12? priset, P, ökar från värdet 101 till värdet 102?

2) Man skulle också kunna tänka sig följande modell: där A, EP , EI , EP2 och  är konstanter och  är en slumpkomponent som har egenskapen att log ( ) har väntevärde 0 och konstant varians, oftast N (0, ). Vad händer i denna modell om priset, P, ökar från värdet 1 till värdet 2? priset, P, ökar från värdet 11 till värdet 12? priset, P, ökar från värdet 101 till värdet 102?

Exempel: Antag följande två modeller där efterfrågan (Q) förklaras av pris (P): Q=10 – 0.2·P 2. Q=10 · P –1.1 Om priset ökar från 1 till 2 minskar efterfrågan med modell 1: 0.2 enheter eftersom Q2 – Q1 = (10 - 0.2 ·2) – (10 - 0.2 ·1) = –0.2 modell 2: 53 % eftersom Q2 / Q1=(10·2 –1.1) / (10· 1 –1.1)  0.47

1. Q=10 – 0.2·P 2. Q=10 · P –1.1 Eller, om priset ökar från 10 till 11 minskar efterfrågan med modell 1: 0.2 enheter eftersom Q2 – Q1 = (10-0.2 ·11) – (10-0.2 ·10) = –0.2 modell 2: 10% eftersom Q2 / Q1=(10·11–1.1) / (10· 10–1.1)  0.90

Modellen kallas elasticitetsmodell och parametrarna EP , EI och EP2 är förstås i tur och ordning priselasticitet, inkomstelasticitet och korselasticitet. Parametrarna antas vara konstanta i denna modell och efterfrågesambandet säges då vara isoelastiskt. Inom mikroekonomin väljer man ofta att arbeta med mer generella modeller med varierande elasticiteter. Ovanstående modell blir dock lämplig som förklaringsmodell till efterfrågan runt jämviktspunkten. Parametern  relaterar till smakförändringar över tiden.

Vi reducerar modellen till dess specialfall: Anpassning med regressionsanalys kan göras av de logaritmerade sambanden. För de två första används enkel linjär regressionsanalys. För den tredje används multipel regressionsanalys.

Betrakta den första modellen: Logaritmera: Om vi tillfälligt ignorerar feltermen och deriverar bägge sidor av modellen  dQ uttrycker en mycket liten förändring i Q, dvs ett litet Q dP uttrycker motsvarande ett mycket litet P

dQ/Q uttrycker alltså en mycket liten relativ förändring i Q dP/P uttrycker motsv. en mycket liten relativ förändring i P För små prisförändringar blir sambandet ungefär (% förändring i Q)  EP·(% förändring i P) Den logaritmerade modellen kan skrivas och anpassas till

där Anpassad modell i originalskala blir då

Spelar det någon roll hur vi väljer prisvariabeln? Vi kan tänka oss att använda pris dividerat med KPI (eller motsvarande inflationsmätande index) eller ett prisindex dividerat med KPI. Värdet på b1 (dvs kommer att bli detsamma oavsett vilka av dessa två prisvariabler som används. Det spelar heller ingen roll vilka basår vi har i prisindexet resp. i KPI (de kan alltså vara olika) Det enda som förändras är a, dvs den nivåjusterande konstanten i modellen.

Exempel: Konsumtion av margarin i Storbritannien.

Konsumtionen minskar med realpris, men det är naturligtvis ingen skarp ickelinjär efterfrågekurva.

Logaritmera nu konsumtions- och prisvärdena och plotta log Q mot log P: Obs! Det är inte självklart att man ser att detta samband blir mer linjärt. Man får oftast lita på att modellen är förnuftig.

I modellen skall vi skatta Ep och log A (dvs 0 ) Vi beräknar och får

Sett till punktskattningen av EP: –0 Sett till punktskattningen av EP: –0.6503 skulle inte margarin tolkas som en priselastisk vara. Mikroekonomi: EP Typ av vara > –1 oelastisk, ej priskänslig = –1 enhetselastisk, normalt priskänslig < –1 priselastisk, priskänslig Dock förstår vi att värdet –0.6503 borde analyseras djupare än bara som det punktskattade värdet.

The regression equation is C4 = 1.87 - 0.649 C5 Predictor Coef SE Coef T P Constant 1.8708 0.2304 8.12 0.000 C5 -0.6494 0.1132 -5.73 0.000 S = 0.03943 R-Sq = 67.3% R-Sq(adj) = 65.2% Analysis of Variance Source DF SS MS F P Regression 1 0.051109 0.051109 32.88 0.000 Residual Error 16 0.024870 0.001554 Total 17 0.075979

Tydligt att EP är skild från 0, men är detta intressant? Vi vill snarare testa: H0: EP= –1 mot t.ex. H0: EP> – 1 Testfunktionen blir då som m h a MINITAB-utskriften beräknas till Test på 5% nivå Jämför t med t0.05[16]=1.746 (Enkelsidigt test) 3.10>1.746  H0 förkastas. Margarin är inte priskänsligt i UK.

Allt som hittills gjorts i kursen om t-test, F-test, konfidens- och prognosintervall kan också tillämpas här. Skillnaden ligger i att vi använder logaritmerade data i beräkningarna och att konfidens- och prognosintervall i första hand görs i denna skala och sedan tillbakatransformeras. Om man sätter ett (inflationsjusterad) pris =110, hur stor efterfrågan kan man då förvänta sig? I modellen har vi ju använt oss av logaritmerat pris och kvantitet – därför måste vi logaritmera 110 innan vi sätter in det i modellen.

Minitab-analys av datamaterialet: log 110 MTB > regress c4 1 c5; SUBC> predict 2.04139. Regression Analysis: log Q versus log p The regression equation is log Q = 1.87 - 0.649 log P Predictor Coef SE Coef T P Constant 1.8708 0.2304 8.12 0.000 log P -0.6494 0.1132 -5.73 0.000 S = 0.03943 R-Sq = 67.3% R-Sq(adj) = 65.2% Analysis of Variance Source DF SS MS F P Regression 1 0.051109 0.051109 32.88 0.000 Residual Error 16 0.024870 0.001554 Total 17 0.075979 Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 0.54518 0.00934 ( 0.52538, 0.56499) ( 0.45929, 0.63108) Values of Predictors for New Observations New Obs log P 1 2.04 log 110

I analysen beräknas ett 95% prognosintervall för konsumtionen då realpriset är 110. I logaritmisk skala blir intervallet: (0.45929, 0.63108) För att få intervallet i originalskala transformerar vi enligt: (100.45929, 100.63108)  (2.88 , 4.28)