Trender och fluktuationer Föreläsning kvantitativ metod C-kurs Ekonomisk historia, HT 2017
Tidsserier
Påverkan på tidsserier Trender – naturliga eller ”onaturliga” trender (BNP vs internationell handel) Regelbundna fluktuationer – t.ex. årstiders påverkan på skördar Oregelbundna fluktuationer – krig och krisers påverkan (på t.ex. internationell handel)
Trend och fluktuationer – dop och begravningar i St Martin 1554-1583
Trender Gör att det kan uppstå skenbara samband mellan variabler Besvärliga för statistiska modeller, måste eller bör kompenseras för Olika typer: linjära, icke-linjära, kvadratiska
Trendlinje Trendlinje är den linje som har ”best fit”, alltså minimerar det summerade avståndet till alla punkterna i grafen Linjär trend: räta linjens ekvation Y = a+bx (Y=datavärdet, a=intercept, b=lutningen, x=tidsenheten) Kvadratisk trend: Y = a+b1x+b2x2
Hur läser man trender i grafer? I minitab: plotta tidsserien och fundera på om trenden är linjär eller kvadratisk – Stat Time series time series plot Serien Baptisms (från tidigare) har inslag av både linjär och kvadratisk trend: Stat Time series Trend analysis Olika mått på vad som är bäst: MSE, MAD, MAPE – lågt värde bättre än högre
Serie med trendlinje
Övning 1 Gör linjär och kvadratisk trend på serierna Marriage och Burials (se excel-fil). Vilka tycks stämma bäst?
Forecast och extrapolering Det går att extrapolera data när man har trenden Extrapolering är användbart när man saknar datapunkter före början av en serie eller efter slutet MEN, det ska göras med stor försiktighet och på rätt sätt!
Vad gör man när man saknar data?
Kan extrapolera utifrån en annan serie (med goda argument varför)
Interpolering av data Användbart när man saknar datapunkter i en tidsserie Vanligaste sätt: linjär interpolering, använder medelvärdet av datapunkterna före och efter Även här, ska göras med försiktighet – särskilt vanskligt om man saknar många punkter i en tidsserie
Om man saknar ett år (en punkt) i sin data är interpolering inget större problem
Saknas flera år (punkter) i sin serie är det svårare att göra interpolering
Övning 2 Testa att göra forecast på serierna Marriages och Burials (se excel-filen) Stat time series trend analysis generate forecast
Att avtrenda serier När två serier har en naturlig trend är det risk att man får en falsk samvariation (kallas ”spuriöst samband”) Avtrending gör att vi kan använda serier med linjär trend för andra analyser (regression t.ex.) I minitab: Stat Time series Trend analysis Storage: tick box Residuals
Differentiering Annat sätt att ”avtrenda” – gör om sin data till procentuell förändring per år Lätt att räkna ut ”för hand” (dvs, via formel i excel) Viktigt; mäter då förändring istället för nivå – får betydelse för analys och slutsats!
Avtrenda serierna Marriages och Burials (se excel-filen) Övning 3 Avtrenda serierna Marriages och Burials (se excel-filen)
Fluktuationer Man kan använda rörliga medelvärden för att jämna ut serier över längre tid 5-års glidande medelvärde: medelvärdet av fem observationer, ersätter det mittersta värdet i serien Vid sex observationer (O1, O2, O3, O4, O5, O6), medelvärde för O3: (O1+O2+O3+O4+O5)/5
Exempel på utjämnad serie – vinimport 1807-1914
Annat exempel – produktion av råg 1860-1930
Övning 4 Man kan också göra det i minitab: Stat Time series Moving average MA length 5, tick box Center the moving averages Övning: gör 5-års glidande medelvärde för både antal fångar och längd
Säsongsfluktuationer Stöter man på i data som är uppdelade efter kvartal, månader, etc (t.ex. spannmålspriser, hos SCB även arbetslöshet och BNP) Att ”säsongsrensa”, för kvartal: Stat Time series Decomposition Seasonal length = 4, Seasonal only, multiplicative Testa själva att säsongsrensa en serie! (Data ”säsonger” i excel-fil)
Säsongsrensad data – antal sysselsatta i Sverige
Till nästa gång Läs Hudson kap 6, s. 137-159 Läs artikel Lindert & Williamson (1983) – fundera på användningen av index, trend i serierna, samt implikationerna för resultaten Läs också kritiken av denna: Feinstein (1998)