Presentation laddar. Vänta.

Presentation laddar. Vänta.

1 Regressions- och tidserieanalys, 5 p Projekt 1: Index och efterfrågeanalys, 0.5 hp Projekt 2: Tidserieanalys, 1.5 hp Tenta: 5.5 hp Lärare: Lotta Hallberg,

Liknande presentationer


En presentation över ämnet: "1 Regressions- och tidserieanalys, 5 p Projekt 1: Index och efterfrågeanalys, 0.5 hp Projekt 2: Tidserieanalys, 1.5 hp Tenta: 5.5 hp Lärare: Lotta Hallberg,"— Presentationens avskrift:

1 1 Regressions- och tidserieanalys, 5 p Projekt 1: Index och efterfrågeanalys, 0.5 hp Projekt 2: Tidserieanalys, 1.5 hp Tenta: 5.5 hp Lärare: Lotta Hallberg, lohal@ida.liu.selohal@ida.liu.se

2 2

3 3 Enkel linjär regression: hyran kan förklaras av lägenhetsstorlek

4 4 Kvadratisk regression

5 5 Efterfrågeanalys: Efterfrågan förklaras av priset. Priselasticiteten kan skattas.

6 6 Tidserieanalys: en variabel som observeras över flera år kan förklaras av tiden, månaden,...

7 7 Varför behövs regressionsanalys? Värdet på responsvariabeln (t.ex. hyra) varierar med värdet på den förklarande variabeln (t.ex storlek på lägenheten): Vi kan använda informationen om lägenhetsstorleken för att göra en bättre skattning/prediktion –av den förväntade hyran eller –av hyran för en lägenhet av en speciell typ

8 8 Hur mycket betalar man (i genomsnitt) i hyra om man har en lägenhet på 50 kvadratmeter? ca 3747.6 SEK

9 9 Varför behövs regressionsanalys? Värdet på responsvariabeln (t.ex. hyra) varierar med värdet på den förklarande variabeln (t.ex. storlek på lägenheten): Vi kan använda informationen om lägenhetsstorleken för att göra en bättre skattning/prediktion –av den förväntade hyran eller –av hyran för en speciell lägenhet Vi kan beskriva datamaterialet och beskriva och dra slutsatser om samband mellan variabler. Därmed kan vi (i vissa fall) öka förståelsen av hur världen omkring oss ser ut.

10 10 För varje ytterligare kvadratmeter i lägenhetsyta får man betala ca 60 kronor i månaden mer. 10 kvadratmeter mer = 605 SEK

11 11 Enkel linjär regression: Till datamaterialet kan vi anpassa en rät linje: som är en skattning av det verkliga sambandet (det som vi skulle kunna observera om vi visste hyran och ytan på alla lägenheter som finns): E (y ) = μ y|x =  0 +  1 · x eller y = μ y|x +  =  0 +  1 · x + 

12 12 E (y ) = μ y|x =  0 +  1 · x eller y = μ y|x +  =  0 +  1 · x +  μ y|x... det förväntade värdet på y om värdet på den förklarande variabeln är givet.  0... interceptet (intercept). Det förväntade värdet på y om x=0.  1... lutningen (slope). Anger förändringen i y om x ökar med en enhet. ... felterm (error term). Den del av variationen i datamaterialet som inte går att beskriva med regressionslinjen.

13 13 Hur anpassar man en rät linje till ett datamaterial? Man väljer linjen som har det minsta avståndet till alla observationer.

14 14 Detta görs genom ‘Minsta-kvadrat-metoden’: Summan av alla kvadrerade avstånd ska bli så liten som möjligt.

15 15 Minsta-kvadrat-skattningen för enkel linjär regression

16 16 Det går enklare att beräkna b 0 och b 1 om vi skriver om formlerna för SS xx och SS xy :

17 17 Kv-meterHyra x i *y i x i *x i 61449061*4490=2738903721 503211 1605502500 3232651044801024 7447503515005476 6140632478433721 7054713828704900 5241202142402704 6454323476484096 6550203263004225 3835121334561444 372456 908721369 372560 947201369 5031791589502500 1177110831870 13689 8670196036347396 5031991599502500 7349533615695329 7756234329715929 5239192037882704 5638982182883136 9262195721488464 Σ 1294 93469 6271637 88196

18 18 Då får vi:

19 19 Alltså: Skattningen av regressionslinjen är För varje ytterligare kvadratmeter i lägenhetsyta kommer man i genomsnitt betala 60.53 kronor mer i hyra. För en lägenhet med 0 kvadratmeter kommer man att betala 720.92 kronor i hyra (??!?)

20 20 Statistisk slutledning (Inference) i regressionsmodellen Signifikanstest för parametrarna  0 och  1. t.ex. ökar hyran verkligen med storleken på lägenheten, eller skulle man kunna sätta b 1 =0? Konfidensintervall för parametrarna  0 och  1. Konfidensintervall för ett medelvärde av y (givet x). Prediktionsintervall för en individuell prognos av y (givet x). För att kunna göra signifikanstest och för att kunna beräkna konfidensintervall måste vi göra vissa antaganden.

21 21 Antagande i regressionsmodellen y =  0 +  1 · x +  Feltermen  har medelvärde 0 och varians  2. (Variansen är konstant över hela datamaterialet) Feltermen  är normalfördelad. Feltermen  är statistisk oberoende. Varje värde för  är oberoende av alla andra värden av . Hur man undersöker om feltermen verkligen uppfyller de här kraven kommer vi att se senare (residualanalys). Feltermens varians  2 måste skattas.

22 22 Hur bestämmer man, skattningen för, variansen av feltermen? I ett vanligt stickprov bestäms s som stickprovsvariansen: I regressionssammanhang gör vi på ett liknande sätt, men vi måste ta hänsyn till den del av variationen i datamaterialet som kan förklaras av x. ‘Residual’

23 23 Kv-meterHyra b 0 +b 1 *x i y i -(b 0 +b 1 x i ) 614490720.92+60.53*61=4413.25 76.75 503211 3747.42 -536.42 3232652657.88 607.12 7447505200.14 -450.14 6140634413.25 -350.25 7054714958.02 512.98 5241203868.48 251.52 6454324594.84 837.16 6550204655.37 364.63 3835123021.06 490.94 3724562960.53 -504.53 3725602960.53 -400.53 5031793747.42 -568.42 11771107802.93 -692.42 8670195926.5 1092.5 5031993747.42 -548.42 7349535139.61 -186.61 7756235381.73 241.27 5239193868.48 50.52 5638984110.6 -212.6 9262196289.68 -70.68 Residualerna

24 24 Skattning av s s e betecknas ofta bara med s.

25 25 Signifikanstest för parametrarna  0 och  1 Nollhypotesen: H 0 :  1 =0 Alternativhypotesen: H 1 :  1 ≠ 0 t-test: Skattning Nollhypotes Standardavvikelse för skattningen av b 1 (standard error) t-fördelad med n-2 frihetsgrader

26 26 Hur beräknar man, skattningen för ? I vårt fall:

27 27 Signifikanstest för b 1 : Jämför med t-fördelningen med 19 frihetsgrader. → högt signifikant Slutsats: Lutningen i regressionsmodellen är signifikant skild från noll. Ytan på en lägenhet har betydelse för hur hög hyran är. Ju större lägenhet desto högre hyra (positivt samband). Signifikanstest för interceptet se sidan 107 i boken.

28 28 Konfidensintervall för lutningen  1 : Med hjälp av skattningarna vi har tagit fram, kan vi även beräkna ett konfidensintervall för  1. Med 95% säkerhet ligger  1 i intervallet 48.58 – 72.48.

29 29 Ett datorprogram, som MINITAB, kan beräkna en regressionsanalys åt oss. Där får vi ut t.ex.: –Regressionlinjen –Parameterskattningar b 0 och b 1 –Signifikanstest för  0 och  1 –Skattningen s (spridningen i residualerna)

30 30 Regression Analysis: Hyra versus Kv-meter The regression equation is Hyra = 721 + 60.5 Kv-meter Predictor Coef SE Coef T P Constant 720.9 370.2 1.95 0.066 Kv-meter 60.533 5.713 10.60 0.000 S = 525.5 R-Sq = 85.5% R-Sq(adj) = 84.8% Analysis of Variance Source DF SS MS F P Regression 1 31002923 31002923 112.26 0.000 Residual Error 19 5247087 276162 Total 20 36250010 Regressionslinjen t-tester och deras p-värden Parameterskattningar och deras standardavvikelser Residualspridningen Konfidensintervall för parametrarna  0 och  1 måste man dock beräkna själv.

31 31 Punktskattningar och punktprognoser För ett givet värde på x (säg x 0 ) kan man –skatta det genomsnittliga värdet på y (Vad är hyran för en lägenhet på 60 kvadratmeter i genomsnitt?) –prediktera värdet på y för en ny observation (Hur mycket kommer just den här lägenheten på 60 kvadratmeter att kosta i hyra?) Både punktskattningen och punktprognosen beräknas som

32 32 Punktskattningar och punktprognoser är naturligtvis osäkra. Därför ska man helst ange dem tillsammans med ett intervall: Punktskattningen med ett konfidensintervall och punktprognosen med ett prediktionsintervall ‘Distance value’ anger hur ‘centralt’ x 0 -värdet är i datamaterialet.

33 33 För ett x 0 som ligger nära får vi ett litet ‘distance value’ och därför även ett smalare konfidens- eller predikitonsintervall.

34 34 Vad är hyran för en lägenhet på 60 kvadratmeter i genomsnitt?

35 35 Vad är hyran för en lägenhet på 60 kvadratmeter i genomsnitt? Med 95% säkerhet kommer hyran att ligga mellan 4112 och 4593.3 kronor i månaden.

36 36 Hur mycket kommer jag att betala om jag hyr just den här lägenheten på 60 kvadratmeter? Med 95% säkerhet kommer hyran för just den här lägenheten ligga mellan 3226.8 och 5478.63 kronor i månaden. enda skillnaden

37 37 Även punktskattningar och punktprognoser kan beräknas med hjälp av MINITAB The regression equation is Hyra = 721 + 60.5 Kv-meter Predictor Coef SE Coef T P Constant 720.9 370.2 1.95 0.066 Kv-meter 60.533 5.713 10.60 0.000 S = 525.5 R-Sq = 85.5% R-Sq(adj) = 84.8%.... Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 4353 115 ( 4112, 4594) ( 3227, 5479) Values of Predictors for New Observations New Obs Kv-meter 1 60.0


Ladda ner ppt "1 Regressions- och tidserieanalys, 5 p Projekt 1: Index och efterfrågeanalys, 0.5 hp Projekt 2: Tidserieanalys, 1.5 hp Tenta: 5.5 hp Lärare: Lotta Hallberg,"

Liknande presentationer


Google-annonser