Modell för konsumtionen i Sverige Från Baudins kompendium.

Slides:



Advertisements
Liknande presentationer
Inferens om en population Sid
Advertisements

Från Fanta till Fleece Lokal pedagogisk planering Biologi åk 5
Nolans modell MÅL Vad är det vi vill uppnå?
Hur bra är modellen som vi har anpassat?
Regressions- och tidsserieanalys
FL3 732G81 Linköpings universitet.
Dette har skjett i tidigere episode:
Föreläsning 12 Sammanfattning
Föreläsning 9 Förväntningar och stabiliseringspolitik
Robert Gidehag & Jonas Arnberg. Studiens frågeställningar Övergripande: Är den svenska alkoholpolitiken effektiv på 2000-talet?
Att gå från magkänsla till faktabaserad utveckling Stöd för förskolor och skolor som vill ordna analysgrupp Metoden har utvecklats och prövats i Eu-projektet.
Chitvå-test Regression forts.
2. Enkel regressionsanalys
Regressionsanalys Vi vill ha svar på frågan hur mycket kommer y att förändras om x ändras med enhet. Sambandets funktionsform Tillåta att andra saker än.
Förelasning 6 Hypotesprövning
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Egenskaper för punktskattning
Multipel linjär regressionsanalys
Hur bra är modellen som vi har anpassat?
3. Multipel regression 2005 © Rune Höglund Multipel regression.
Normalfördelningen och centrala gränsvärdessatsen
Från att värdera ett enstaka fastighetsobjekt till att göra en fastighetsprisprognos avseende Mats Wilhelmsson KTH.
Kvadratsummeuppdelning/Variansanalys
Regressionsanalys Vi vill ha svar på frågan hur mycket kommer y att förändras om x ändras med enhet. Sambandets funktionsform Tillåta att andra saker än.
Exempel: Vad påverkar kostnaden för produktion av korrugerat papper, dvs sådant som ingår i wellpapp och kartonger? Amerikansk studie: Kostnaden kan förmodligen.
Tidsserieregression fungerar statistiskt som vanlig regression. Regression Analysis The regression equation is Sold = 5,78 + 0,0430 time Predictor.
Regression Analysis The regression equation is Sold = 5,78 + 0,0430 time Predictor Coef StDev T P Constant 5,7761 0,9429 6,13 0,000 time 0, ,03420.
Regressions- och tidsserieanalys
Kapitel 2 Nationalekonomiska verktyg. 1 Modeller och data En modell –är en teoretisk referensram baserad på förenklande antaganden –som hjälper en att.
1 Om sambandet inte är linjärt? Om sambandet till en variabel inte är linjärt så kan vi inkludera ytterligare en term i regressionsmodellen I en modell.
IDAG: Varumarknaden i balans + penningmarknaden i balans.
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Tidsserieanalys Exempel:
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. NORMALFÖRDELNING 4. HYPOTESPRÖVNING a) t-test b) ickeparametriska test c) chitvåtest.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
1 Dummyvariabler (se 15.7) Man stöter ofta på förklaringsvariabler där den skala som använts vid mätning ej ger intervall- eller kvotskala. Denna typ av.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Föreläsning 5 Kap 13 Tidsserier- vad är det? Trend/Säsong/Konjuktur/Slump Identifiering av trender (Glidande medelvärde) Säsongsmedelvärdesmetoden Säsongsdummymetoden.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
1 Icke-linjär regression Sid (i kapitel 16.1)
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Kostvetenskapliga Metoder 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test c)
Föreläsning 4 (Kajsa Fröjd) Multipel regression Kap 11.3 A.Man har en kvantitativ responsvariabel som är linjärt relaterad till en/flera kvantitativa förklarande.
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Idag: Repetition av Chi2-test Kap 6*, Kodning av svaren Kap 10*, Olika feltyper Kap 12*, Rapportskrivning *Dahmström.
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Introduktion. 2 Vad är statistik? ”En massa siffror” Beskrivning av staten Metodlära.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
1 Utvärdering och tolkning: MBA Program Admission Policy Rektorn vid ett stort universitet vill höja standarden på de som antas till deras populära MBA-program.
Tidsserieanalys Kap 18, samt Baudin Tidsserieanalys En tidsserie är en mängd mätningar som är tidsordnade. Med tidsserieanalys försöker man upptäcka.
K2: sid. 1 Kapitel 2 Varumarknaden   Hur bestäms produktionen på kort sikt?   Cirkulärt samband   Produktionen bestäms av efterfrågan   Efterfrågan.
Kan vi mäta effekter besökares konsumtion med hjälp av rAPS?
Multipel regression och att bygga (fungerande) modeller
Trender och fluktuationer
Relation mellan variabler – samvariation, korrelation, regression
Presentationens avskrift:

Modell för konsumtionen i Sverige Från Baudins kompendium

Analysstrategi Teori Datainsamling/deskription Modellbyggnad (som bygger på teorin) Modellkontroll Slutsatser & jämförelse med teori

Teori: Vi vill förklara storleken på konsumtionen (Y) med några förklaringsvariabler (X). Vi tror att konsumtionen påverkas av: –Inkomsten, ju mer pengar desto mer konsumtion. –Vilket kvartal det är då jul, semester mm påverkar konsumtionen. Speciellt jul borde öka konsumtionen. –Real räntan. Låga räntor borde stimulera konsumtionen.

Datainsamling/deskription Datainsamling: vi har lyckligtvis data redan Deskription –Plottar mellan X & Y variabler Verkar det finnas ett linjärt samband? –Korrelationstabell Är korrelationen mellan Y & X noll, positiv, negativ, signifikant? Vi vill ha korrelation här! Är korrelationen mellan X variabler hög? Är den det har vi troligtvis multikollinjäritetsproblem!

Insamlat data:

Plottar: Tecken på: Trend Säsongsvariation

Boxplott bra för dummyvariabler

Inkomst verkar ha en positivt samband på konsumtionen

Hög ränta verkar leda till hög konsumtion! Tänkbar förklaring är att vi har en ”störande” variabel. X=Ränta Y=Konsumtion Z=konjunktur

Korrelationstabell Hög korrelation mellan Y & X bra! Hög korrelation mellan X & X Dåligt!

Modellbyggnad: Formulera regressions modellen:

Skatta modellen & reducera ev. Förklaringsgraden: hög SSR SSE SST MSR MSE= F-obs Att jämföra med kritiskt F-värde med 6 & 91 df. P-värde Som kan jämföras med

Parameterskattningar Räntan ej signinfikant

Utan ränta Spara DW-test pga tidsserie- data

Skattad modell:

Hypotesprövning: Följ hypotesprövningsgången när ni gör F- & t-test men ni kan hänvisa till tabell för F-, t- & p-värden.

F-test Hypotes: Teststatistika: F=MSR/MSE som är F-fördelad med k=5 & n-k-1=91 df. Förkastelseregel: Vi förkastar nollhypotesen för p-värden mindre än Observation: F-obs= 282 & p-värde=0.00 Slutsats: P-värdet är < Förkasta H-noll. Åtminstone någon av parametrarna verkar vara skilt från noll.

T-test för : Hypotes: Teststatistika: som är t-fördelad med n-k-1=91 df. Förkastelseregel: Vi förkastar nollhypotesen för p-värden mindre än Observation: t-obs=1.986, p-värde=0.05 Slutsats: P-värdet är = 0.05 !. Precis på gränsen att vi ska förkasta H noll.

Modellkontroll: Spar residualer och predikterade värden. –Histogram för residualer –Plotta residualer mot predikterade. –Eftersom det är tidsseriedata plotta residualerna mot tiden och gör Durbin-Watson test.

Histogram Viss avvikelse från normalfördelning en kan anas

Residualer mot predikterade värden Ökande varians?

Residualer mot tiden Tecken på autokorrelation!

Durbin-Watson test Hypotes: Teststatistika: –Fördelning enligt tabell Förkastelseregel: k=5, n=98 (ca 100), –Förkasta H-noll om d-obs < 1.44 eller d-obs>4-1.44=2.56 Observation: Från tabell: d-obs=0.512 Slutsats:Vi kommer i det nedre förkastelse området, vi har troligtvis autokorrelation av första ordnigen.

Prediktioner: Vad blir konsumtionen i nästa period om inkomsten blir lika hög som perioden innan? För hand: –Sätt in i den skattade modellen:

Något annorlunda i SPSS: Avrundningsfel?

Slutsatser: Vi har fått fram en hyfsad modell där inkomsten förklarar av variationen som förväntat. Vi har dock en stark autokorrelation kvar som vi skulle kunna testa att bli av med genom att ha y laggad en period som förklaringsvariabel.

Med laggad y

Jämför med gammal modell: