Presentation laddar. Vänta.

Presentation laddar. Vänta.

Tidsserieanalys Kap 18, samt Baudin 1-4.4. Tidsserieanalys En tidsserie är en mängd mätningar som är tidsordnade. Med tidsserieanalys försöker man upptäcka.

Liknande presentationer


En presentation över ämnet: "Tidsserieanalys Kap 18, samt Baudin 1-4.4. Tidsserieanalys En tidsserie är en mängd mätningar som är tidsordnade. Med tidsserieanalys försöker man upptäcka."— Presentationens avskrift:

1 Tidsserieanalys Kap 18, samt Baudin 1-4.4

2 Tidsserieanalys En tidsserie är en mängd mätningar som är tidsordnade. Med tidsserieanalys försöker man upptäcka och förstå regelbundenheter i variationen i data över tiden. Regelbundenhet i tidserier kan vara ett resultat av en tendens att öka eller minska med tiden - trend- eller en tendens att följa ett cykliskt mönster över tiden – säsongsvariation eller cyklisk variation (t ex konjukturer). Prognoser/Förutsägelser (Forecasting) är extrapolering av värden utanför den region där man har data. Regelbunden variation kan förutsägas, men slumpmässig variation kan inte förutsägas. Exempel: Med data över glassförsäljning från 1980 till 2002 försöker vi förutsäga glassförsäljningen 2003 och 2004.

3 Tidsserieanalys (forts.) Tidsserieanalys handlar ofta om att dela upp tidsserievariabeln, Y t, i komponenter så som trend (T), konjunkur (C), säsong (S) och slump (I). Additiv modell Y t = T t + S t + C t + I t Multiplikativ modell Y t = (T t )(S t )(C t )(I t )

4 Random walk När skillnaden mellan Y vid tidpunkten t och föregående tidpunkt t-1 endast är ett slumpmässigt fel kallas tidserien för en random walk. Felet betecknar vi med a t. Y t - Y t-1 =a t eller ekvivalent: Y t =Y t-1 +a t 50403020100 15 10 5 0 t Z Random Walk a

5 Cykliska mönster En tidsserie som skulle kunna modelleras som bestående av två cykliska funktioner plus ett slumpmässigt fel. Till skillnad från en sk random walk, uppvisar den här serien en cyklisk variation. Den underliggande cykliska variationen kan analyseras och förutsägas.

6 Säsongsvariation 888786 11000 10000 9000 8000 7000 6000 t P a s s e n g e r s Monthly Numbers of Airline Passengers 89909192939495 95949392919089888786858483828180 20 15 10 5 Year E a r n i n g s Gross Earnings: Annual AJJMAMFJDNOSAJJMAMFJDNOSAJJMAMFJ 200 100 0 Time S a l e s Monthly Sales of Suntan Oil När ett cykliskt mönster har en period på ett år, ett kvartal, en månad etc. kallas den oftast för säsongsvariation. Om mönstret är ett annat kallas det bara cyklisk variation.

7 Trendanalys Med trend avses den långsiktiga utvecklingen. Linjär trend: Y t =  0 +  1 t+a t, där a t =S t + C t + I t Exempel : = 696.89 + 109.19t + a t, där 1994 är kodad som t=1,1995 som t=2 osv 1679.61

8 Trendanalys Exponentiell trend: Y t = a t Skattas via logaritmering: lnY t = ln  0 + ln  1 t + ln a t, Där ln  0 samt ln  1 skattas “som vanligt”med MK-metoden Därefter exponentiering (antilogaritmering) Se vidare: Baudin sid 40

9 Trendrensning Ibland är syftet med att skatta en trend att man sedan vill göra en trendrensning, dvs ta bort trenden från sina serier så att man lättare ska kunna se om det finns cykliska eller säsongs variationer. Trendrensning för en additiv modell: 1) Skatta trendmodellen. 2) Beräkna residualerna, dvs ta observerade värden minus skattade värden, dvs Y t - = Y t - (b 0 + b 1 t) Trendrensning för en multiplikativ modell: 1) Skatta trendmodellen. 2) Ta observerade värden delat med skattade värden, dvs Y t / = Y t /(b 0 + b 1 t)

10 Säsongsdummymetoden En additiv regressionsmodell med säsong: Y t =  0 +  1 t+  2 S 1 +  3 S 2 +  4 S 3 +  t där S 1 =1 om observationen är från första kvartalet och 0 annars S 2 =1 om observationen är från andra kvartalet och 0 annars S 3 =1 om observationen är från tredje kvartalet och 0 annars Säsongsrensingen sker genom att skatta modellen och beräkna residualerna. Dessa innehåller då varken säsong eller trend. Här är kvartal fyra referenskvartal.

11 Säsongsmedelvärdesmetoden Utgå från trendrensade observationer, bilda medelvärden (M i ) för varje säsong Ger prognoser identiska med de som fås via säsongsdummymetoden, med den skillnaden att inget kvartal sätts som referenskvartal. =b 0 + b 1 t+ M 1 S 1 + M 2 S 2 + M 3 S 3 + M 4 S 4 I säsongdummymetoden ingår ju effekten av referenskvartalet i b 0 … Se vidare i Baudin avsnitt 4.3

12 Löpande medelvärde (moving average, MA) Ett löpande medelvärde för en tidserie är ett medelvärde av ett fixt antal observationer, som flyttar sig när längs med serien. Det löpande medelvärdet visar trend och längre cykliska komponenter, dvs kan ses som en säsongsrensningsmetod. Denna metod kan även användas för en multiplikativ modell. För att få en riktig utjämning är det viktigt att alla säsongstypiska värden inkluderas. Ex. 1) Dagsdata, 5/7 dagar per vecka: “Fem-/Sju- termers löpande medelvärde” Ex. 2) Månadsdata, 12 mån per år: “12-termers löpande medelvärde” Ex. 3) Kvartalsdata: “Fyratermers löpande medelvärde” OBS! I alla exemplen ovan måste vi har flera upprepningar av hela perioderna, dvs flera hela veckor (ex. 1) och flera hela år (ex. 2-3).

13 Löpande medelvärde (exempel) t: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Y t : 15 12 11 18 21 16 14 17 20 18 21 16 14 19 5-termers MA: 15.4 15.6 16.0 17.2 17.6 17.0 18.018.4 17.8 17.6 t: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Y t : 15 12 11 18 21 16 14 17 20 18 21 16 14 19 (15 + 12 + 11 + 18 + 21)/5=15.4 (12 + 11 + 18 + 21 + 16)/5=15.6 (11 + 18 + 21 + 16 + 14)/5=16.0..... (18 + 21 + 16 + 14 + 19)/5=17.6

14 Löpande medelvärde (exempel)

15 The Ratio-to-Moving Average Method Det löpande medelvärdet (MA) visar trend och längre cykliska komponenter. Om orginalserien divideras med MA har vi alltså isolerat säsongs- och slumpvariationen. Om detta multipliceras med 100 kallas det för ratio-to-moving average. Om medelvärdet av detta beräknas för respektive säsong fås ett säsongsindex (S) där (det mesta av) slumpvariationen är borta. Säsongsrensning fås genom att beräkna

16 Exempel 151050 170 160 150 140 130 S a l e s Time Actual Smoothed Actual Smoothed MSD: MAD: MAPE: Length: Moving Average 152.574 10.955 7.816 4 Four-Quarter Moving Averages Simple Centered Ratio Moving Moving to Moving QuarterSales Average Average Average 1998W170*** 1998S148*** 1998S141*151.12593.3 1998F150152.25148.625100.9 1999W161150.00146.125110.2 1999S137147.25146.00093.8 1999S132145.00146.50090.1 1999F158147.00147.000107.5 2000W157146.00147.500106.4 2000S145148.00144.000100.7 2000S128147.00141.37590.5 2000F134141.00141.00095.0 2002W160141.75140.500113.9 2002S139140.25142.00097.9 2002S130140.75** 2002F144143.25**

17 Exempel (forts.) Quarter Year Winter Spring Summer Fall 199893.3100.9 1999110.293.890.1107.5 2000106.4100.790.595.0 2002113.997.9 Sum330.5292.4273.9303.4 Average110.1797.4791.3101.13 Sum of Averages = 400.07 Seasonal Index = (Average)(400)/400.07 Seasonal Index110.1597.4591.28101.11 Säsongsindex

18 Exempel (forts) Quarter Sales Seas. Index (S) Des.Series(Y/S)*100 1998W170110.15154.34 1998S14897.45151.87 1998S14191.28154.47 1998F150101.11148.35 1999W161110.15146.16 1999S13797.45140.58 1999S13291.28144.51 1999F158101.11156.27 2000W157110.15142.53 2000S14597.45148.79 2000S12891.28140.23 2000F134101.11132.53 2002W160110.15145.26 2002S13997.45142.64 2002S13091.28142.42 2002F144101.11142.42

19 Cyklisk komponent 180 170 160 150 140 130 120 1992F1992S1992S1992W t S a l e s Trend Line and Moving Averages Den cykliska komponenten tillsammans med trenden är det som återstår sedan i MA. En jämförelse mellan MA och den skattade trendlinjen: Vi ser att den cykliska komponenten är försumbar i denna serie.

20 Förutsägelser (multiplikativ modell)

21 Sammanfattning (multiplikativ modell)

22 Exponentiell utjämning Utjämning används för att förutsäga en serie genom att först ta bort variation, så som löpande medelvärden också gör. Exponentiell utjämning är en metod för att förutsäga som baseras på ett viktat medelvärde av nuvarande och tidigare observationer av serien. Störst vikt får nuvarande observationen och därefter den just innan osv. Vikterna summerar till ett. 0-5-10-15 0.4 0.3 0.2 0.1 0.0 Lag W e i g h t Weights Decline as We Go Back in Time and Sum to 1 Vikterna minskar när vi går bakåt i tiden -10 0 Weight Lag

23 Exponentiell utjämning (forts.)

24 Exempel DayZw=.4w=.8 1925925.000925.000 2940925.000925.000 3924931.000937.000 4925928.200926.600 5912926.920925.320 6908920.952914.664 7910915.771909.333 8912913.463909.867 9915912.878911.573 10924913.727914.315 11943917.836922.063 12962927.902938.813 13960941.541957.363 14958948.925959.473 15955952.555958.295 16*953.533955.659 Original data: Smoothed, w=0.4:...... Smoothed, w=0.8: ----- Day 151050 960 950 940 930 920 910 w =. 4 Exponential Smoothing: w=0.4 and w=0.8

25 Regression - är slumptermerna oberoende? (Durbin–Watsons test) Modell: Y=  0 +  1 x 1 +…+  p x p +  j  k ober. j ≠ k Som vi har sett kan det finnas många slags beroenden med avseende på ordning hos en variabel som är observerad i en särskild ordning (oftast är ordningen tidsordning). Om beroende (autokorrelation) finns så är antagandet om oberoende slumptermer naturligtvis ej uppfyllt. D-W är ett test för beroende (autokorrelation) vid “lag 1”, dvs. testar om det finns något beroende mellan residualen vid aktuell tidpunkt och residualen ett steg bakåt. “Missar” andra typer av beroende…

26 Durbin–Watson-test: D-W är ett test för autokorrelation vid lag 1. Om autokorrelation finns så är antagandet om oberoende slumptermer ej uppfyllt. Residual vid tidpunkt t Denna teststatistika kan anta värden mellan 0 och 4, dvs 0 ≤ d ≤ 4

27 Positiv autokorrelation med lag 1 + + + + + + + Residualer Tid Om residualerna med ett stegs förskjutning, tenderar att ha samma tecken så har vi positiv autokorrelation med lag 1. Det observerade värdet på d är då “litet” (mindre än 2). 0 +

28 Negativ autokorrelation med lag 1 + ++ + + + + 0 Residualer Tid Om residualerna med ett stegs förskjutning, tenderar att ha olika tecken så har vi negativ autokorrelation med lag 1. Det observerade värdet på d är då “stort” (större än 2).

29 Enkelsidigt test av positiv autokorrelation med lag 1 Autokorrelationskoefficienten kallas i Anderson (och oftast även hos andra författare) för  Vi testar till att börja med: H 0 :  =0 H 1 :  >0 Tabell över kritiska värden för given signifikansnivå  finns i Anderson sid 847- 849.

30 Om d<d L förkastas H 0. Det finns empiriskt stöd för positiv autokorrelation vid lag 1. Om d>d U kan ej H 0 förkastas. Det finns inte empiriskt stöd för positiv autokorrelation vid lag 1. Om d är mellan d L och d U har vi fått en observation i en “gråzon” där vi ej kan dra någon slutsats. (Misstänkt men otillräckliga bevis…) Enkelsidigt test av positiv autokorrelation med lag 1 dLdL Stöd för positiv autokor- relation vid lag 1 “Gråzon” Nollhypotesen kan ej förkastas dUdU 0 4

31 Enkelsidigt test av negativ autokorrelation med lag 1 Vi testar här: H 0 :  =0 H 1 :  <0 Om d>4-d L förkastas H 0. Det finns empiriskt stöd för negativ autokorrelation vid lag 1.. Om d<4-d U kan ej H 0 förkastas. Det finns inte empiriskt stöd för negativ autokorrelation vid lag 1. Om d är mellan 4-d U och 4-d L har vi fått en observation i “gråzonen” där vi ej kan dra någon slutsats. Stöd för Negativ Autokor- relation med lag 1 4-d U 4-d L “Gråzon”Nollhypotesen kan ej förkastas 0 4

32 Vi testar här: H 0 :  =0 H 1 :  ≠0. Om d 4-d L förkastas H 0. Det finns empiriskt stöd för autokorrelation vid lag 1. Om vi får en observation på d mellan d U och 4-d U kan ej H 0 förkastas. Det finns inte empiriskt stöd för autokorrelation vid lag 1. Om vi får en observation på d mellan d L och d U eller mellan 4-d U och 4-d L kan vi ej dra någon slutsats. dLdL dUdU 20 4 4-d U 4-d L Förkasta nollhypo- tesen Förkasta nollhypo- tesen Ingen slutsats Ingen slutsats Förkasta ej nollhypo- tesen Tvåsidigt test av autokorrelation med lag 1

33 Exempel Test av autokorrelation vid lag 1 Vi har observationer på Y och x tagna i tidsordning. Modell 1: Y t =  0 +  1 x+  t

34 Exempel Test av autokorrelation vid lag 1 txYtxY 16,589,29168,678,37 28,1611,81172,414,71 38,9911,12183,185,47 42,069,65193,034,20 50,118,32202,534,01 67,559,72213,904,47 72,566,91220,861,61 82,917,24234,454,12 91,295,92248,607,23 101,904,80258,137,80 115,397,72264,586,47 128,998,13270,365,39 136,807,90284,569,63 141,374,64295,039,19 154,036,10306,5810,79

35 Regression Analysis: y versus x The regression equation is y = 4,60 + 0,550 x Predictor Coef SE Coef T P Constant 4,6037 0,6871 6,70 0,000 x 0,5504 0,1299 4,24 0,000 S = 1,95673 R-Sq = 39,1% R-Sq(adj) = 36,9% Analysis of Variance Source DF SS MS F P Regression 1 68,752 68,752 17,96 0,000 Residual Error 28 107,206 3,829 Total 29 175,959 Unusual Observations Obs x y Fit SE Fit Residual St Resid 4 2,06 9,650 5,738 0,479 3,912 2,06R R denotes an observation with a large standardized residual. Durbin-Watson statistic = 0,328224 Vi har autokorrelation!!

36 Vi har alltså:  t =  t-1 + U t, U t ~ N(0,  ) Vi kan använda observationerna på  t, dvs. e t, från skattningen av modell 1, och göra en ny modell där vi tar hänsyn till residualerna i föregående tidpunkt Modell 2: Y t =  0 +  1 x+  e t-1 + U t, U t ~ N(0,  )

37 Regression Analysis: y versus x; et-1 The regression equation is y = 4,69 + 0,540 x + 0,853 et-1 Predictor Coef SE Coef T P Constant 4,6899 0,3954 11,86 0,000 x 0,53978 0,07543 7,16 0,000 et-1 0,8532 0,1123 7,60 0,000 S = 1,12525 R-Sq = 80,7% R-Sq(adj) = 79,3% Analysis of Variance Source DF SS MS F P Regression 2 138,036 69,018 54,51 0,000 Residual Error 26 32,921 1,266 Total 28 170,957 Unusual Observations Obs x y Fit SE Fit Residual St Resid 4 2,06 9,650 7,139 0,333 2,511 2,34R 6 7,55 9,720 11,884 0,524 -2,164 -2,17R R denotes an observation with a large standardized residual. Durbin-Watson statistic = 2,06234 Ingen autokorrelation kvar!


Ladda ner ppt "Tidsserieanalys Kap 18, samt Baudin 1-4.4. Tidsserieanalys En tidsserie är en mängd mätningar som är tidsordnade. Med tidsserieanalys försöker man upptäcka."

Liknande presentationer


Google-annonser