Prognoser Prognoser i tidsserier: ”Gissa” ett framtida värde i tidsserien Skillnad gentemot prognoser i regression: Det framtida värdet tillhör inte dataområdet.

Slides:



Advertisements
Liknande presentationer
Föreläsning 3 25 jan 2010.
Advertisements

Rätt jobb eller jobb snabbt? AEA:s opinionsundersökning 2013.
Inferens om en population Sid
Talföljder formler och summor
Patientenkät sommaren -13
X-mas algebra Är du redo? Klicka!!.
Tematräff 4 vid distriktsträffen 2012 Micke Melander.
En genomgång av spelet: Dubbelkrig-Grön
PowerPoint av Bendik S. Søvegjarto Koncept, text och regler av Skage Hansen.
”Språk, lärande och identitetsutveckling är nära förknippade
hej och välkomna EKVATIONER Ta reda på det okända talet.
Vad är skillnaden på klimat och väder?
Exempel: Försäljning av dagligvaror i USA Year Sales values
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inledning Vi har valt mikrovågsugnen som tekniskpryl.
Klusterurval, forts..
Leif Håkansson’s Square Dancer Rotation
Studenter Lär Av Studenter ”SLAS”
Föreläsning 7 Analys av algoritmer T(n) och ordo
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Skogsbarometern är en årlig rapport om det ekonomiska läget i familjeskogsbruket 750 skogsägare har av Sifo intervjuats under september månad och undersökningen.
Fastighetsbyrån Konjunkturundersökning Oktober 2012.
Grunderna - Från ett logiskt perspektiv André Bodin, Anders Edholm – 2011.
Turismens historia kapitel 2.
Robert Gidehag & Jonas Arnberg. Studiens frågeställningar Övergripande: Är den svenska alkoholpolitiken effektiv på 2000-talet?
Byggnadsmekanik gk 2.1 SNITTKRAFTER
Beräkna en ekvation (metod 1)
Procent.
Informationskompetens. Eleven ska kunna… orientera sig i en komplex verklighet med stort informationsflöde och snabb förändringstakt. Deras förmåga att.
Vibeke Horstmann, Inst för hälsa, vård, samhälle, Centre for Ageing and Supportive Environments Jämförelse av två behandlingar.
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
Brukarundersökning individ- och familjeomsorg Resultat från pilotundersökningen hösten 2014 Sveriges Kommuner och Landsting, SKL Rådet för främjande av.
Prognoser En prognos i tidsserieanalysen görs för ett framtida värde i tidsserien. Syftet med en prognosmodell är att göra en prognos, inte att förklara.
Kognitiv psykologi Tänk på en situation när det gick riktigt bra för dig. Varför gick det bra? Tänk på en situation när det gick riktigt dåligt för dig.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Skattning av trendkurvor/trendytor och förändringar över tiden Claudia von Brömssen SLU.
Logikprogrammering 21/10 Binära träd
Binomialsannolikheter ritas i ett stolpdiagram
Egenskaper för punktskattning
Simulering Introduktion Exempel: Antag att någon kastar tärning
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
Hur bra är modellen som vi har anpassat?
Leda och planera sokratiska samtal
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
Skriftlig framställning
Säsongrensning: Serien rensas från säsongkomponenten genom beräkning av centrerade och viktade glidande medelvärden (centered moving averages, CMA): där.
Tidsserieanalys Exempel:
Big bang ca 13,7 miljarder år sedan
Olika sätt att resonera kring hur människor bör handla
Olika sätt att resonera kring hur människor bör handla
Föreläsning 5 Kap 13 Tidsserier- vad är det? Trend/Säsong/Konjuktur/Slump Identifiering av trender (Glidande medelvärde) Säsongsmedelvärdesmetoden Säsongsdummymetoden.
1 Icke-linjär regression Sid (i kapitel 16.1)
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Föreläsning 5 (Kajsa Fröjd) Tidsserier Kap 13.1 Man har en kvantitativ responsvariabel som mäts vid olika tidpunkter. 1.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Tidsserieanalys Kap 18, samt Baudin Tidsserieanalys En tidsserie är en mängd mätningar som är tidsordnade. Med tidsserieanalys försöker man upptäcka.
B D A C Vems påstående stämmer? A 5x + 10 = 5x – 10 B
Nationalekonomi – vad är det?
Multipel regression och att bygga (fungerande) modeller
Trender och fluktuationer
Fördelning av data och index
Handelsbarometern April 2019.
Handelsbarometern Maj 2019.
Presentationens avskrift:

Prognoser Prognoser i tidsserier: ”Gissa” ett framtida värde i tidsserien Skillnad gentemot prognoser i regression: Det framtida värdet tillhör inte dataområdet. Syftet med en prognosmodell är att göra prognos, inte att förklara det historiska skeendet.  Modeller för prognoser behöver inte vara korrekta ur ekonomisk-teoretisk synvinkel. Sunt förnuft i kombination med effektiv matematik ger i regel de bästa prognoserna.

Exempel 1: Om utomhustemperaturen under två dagar är c:a -20°C är en förnuftiga prognos att temperaturen under nästkommande dag nog kan vara mellan -15 °C och -25 °C . Med mer kunskap om meteorologi och insamlande av information runt luftfuktighet, vindar, tryckförändringar m m kan dock en precisare prognos med fysikaliska modeller räknas fram. Blir den bättre? En kombination av vad meteorologerna säger och vad man själv tror resulterar förmodligen i en tillfredsställande prognos: Ställ in långfärdsskridskoturen i morgon!

Exempel 2: En historisk studie av försäljningen av satellit-TV-abonnemang visar en genomsnittlig ökning med ungefär 3% per år de senaste tre åren. Vidare har den genomsnittliga försäljningen varit lägre i maj än i september. Om man i augusti innevarande år vill göra en prognos av försäljningen i september kan man skriva upp den genomsnittliga årsförsäljningen föregående år med (9/12)3% (eftersom det i september har gått 9 månader sedan föregående år) multiplicera eller addera en faktor/term som motsvarar september månads avvikelse från genomsnittet. ev. kan man också göra en bedömning av konjunkturläget och justera prognosen efter detta.

Man kan också: sätta sig ned och resonera om hur man tror att försäljningen kommer att bli i september, baserat på diverse personers individuella känslor om hur försäljningsutvecklingen ser ut. Vad verkar mest förnuftigt? Kanske en kombination?

Ett klassiskt exempel inom prognosticering är aktiekursförändring Jakten på bra prognosmodeller för kommande dags aktiekurs kan liknas vid alkemisternas försök att på artificiell väg framställa guld. Ingen av de hittills gjorda försöken har lyckats! Varför? Ingen ekonomisk eller statistik modell har lyckats förklara den variation i aktiekurs som finns från dag till dag. Det mesta ”hamnar i ”.  Bästa prognos hittills av morgondagens aktiekurs är dagens kurs, s k persistensprognos . …och är inte detta egentligen ganska sunt? Obs! Aktieportföljer är något vars värdeförändring är lättare att prognositicera

Varför skall vi då lära oss om prognosmodeller? Modellerna hjälper till med att ta hand om den variation, som trots allt kan ordnas in i en modell. I många fall kan inte olika subjektiva uppfattningar samlas i en enda prognos, då krävs något objektivt. I flera fall blir de modellbaserade prognoserna bra och bättre än alla konkurrerande alternativ. Engelskspråkig term: forecasting Svenska språket använder termerna prognos och prediktion, men skulle kanske ha bruk av termen framåtskrivning

Statistiska prognosmodeller: Anpassad modell för tidsserieregression kan framåtskrivas Klassisk modell för komponentuppdelning kan framåtskrivas beträffande trend och säsong, i mer subjektiv anda beträffande konjunktur Exponentiella utjämningsmetoder: Enkel exponentiell utjämning Dubbel exponentiell utjämning (Holt’s metod) Winters’ metod kan ta hand om de flesta komponenterna i en tidsserie utan att kräva en historiskt anpassad modell. 4. Autoregressiv modellering av tidsserien ger såväl historisk och nulägesbeskrivning som en användbar modell för prognoser, men är matematiskt svårare.

Enkel exponentiell utjämning Bygger på tanken att den studerade tidsserien varken innehåller trend-eller säsongskomponenter, t ex årlig försäljning av bildäck Tänkbar modell: yt=0 + t Modellen skall dock inte ses som statisk utan vi kan tillåta att nivån (0 ) kan ändras, dock inte enligt någon typisk trendstruktur. Enkel exponentiell utjämning innebär att man använder historiska data för att ”jämna ut” serien och därmed plocka bort den rent slumpmässiga variationen. Vid utjämningen kan man låta gamla värden och nyare värden spela olika stora roller. Den utjämnade serien framskrivs efter det sista värdet.

Beteckna de tillgängliga historiska observationerna y1,y2,…yT Inför följande uppdateringsmodell: dvs vi har här infört termen l(t) som anger det utjämnade värdet vid tidpunkt t  är den s k utjämningskonstanten eller utjämningsparametern (smoothing parameter). 0    1 Med ett lågt värde på  (nära 0) kommer de tidigare värdena i serien att spela en större roll än de senare  Serien blir mer utjämnad (mer lik ett medelvärde av samtliga observationer) Med ett högt värde på  kommer de senare värdena i serien att spela en större roll än de tidigare  Serien blir mindre utjämnad och l(t) kommer i högre grad att fånga upp de successiva förändringarna i tidsserien.

Som prognos för ett framtida värde (vilket som helst!) används: Uppdateringsformeln kallas rekursionsformel och ger vid handen två viktiga frågor: Hur skall vi välja  ? Var skall vi börja, dvs vilket värde skall vi välja på l0? Valet av  är mer invecklat och får ofta lösas med ”trial-and-error”.  anger antal tidssteg efter tidpunkten T och kallas på engelska lead.

Många historiska värden: Valet av l0 kan göras på litet olika sätt beroende på tillgången till historiska data: Många historiska värden: Använd 10-50% av de historiska värdena och beräkna ett medelvärde av dessa. Detta medelvärde är en skattning av 0 i modellen och blir också det värde vi sätter l0 till. Låt y1 vara endera den första observationen i det resterande datamaterialet och börja utjämningen från denna. den första observationen i hela datamaterialet och börja utjämningen från denna. Ett fåtal historiska värden: Använd samtliga historiska data och beräkna ett medelvärde av dessa. Detta medelvärde är en skattning av 0 i modellen och blir också det värde vi sätter l0 till. Låt y1 vara den första observationen i hela datamaterialet och börja utjämningen från denna.

Exempel: Försäljning av dagligvaror i USA Year Sales values 1985 151 1986 151 1987 147 1988 149 1989 146 1990 142 1991 143 1992 145 1993 141 1994 143 1995 145 1996 138 1997 147 1998 151 1999 148 2000 148

Tidsserieplott Med annan skala på y-axeln

Antag modellen: Skatta β0 med medelvärdet av de första 8 observationerna i tidsserien  Låt l0= =146.75

Antag först att försäljningen är ganska stabil, dvs, under den studerade perioden antas inte genomsnittsvärdet β0 ändra sig nämnvärt. Välj ett relativt lågt värde på . Detta innebär att de tidigare värdena i serien kommer att spela en större roll i prognoserna än de senare. Vi låter =0.1 Vi använder nu uppdateringsformeln, som egentligen uppdaterar skattningen av β0. Vi låter vårt y1 här vara det första värdet i tidsserien.

Prognoser

Analys med hjälp av Minitab StatTime SeriesSingle Exp Smoothing…

Year T Sales val. lT yT - lT Forecasts 1985 1 151 146,750 4,25000 * 1986 2 151 147,175 3,82500 * 1987 3 147 147,558 -0,55750 * 1988 4 149 147,502 1,49825 * 1989 5 146 147,652 -1,65158 * 1990 6 142 147,486 -5,48642 * 1991 7 143 146,938 -3,93778 * 1992 8 145 146,544 -1,54400 * 1993 9 141 146,390 -5,38960 * 1994 10 143 145,851 -2,85064 * 1995 11 145 145,566 -0,56557 * 1996 12 138 145,509 -7,50902 * 1997 13 147 144,758 2,24188 * 1998 14 151 144,982 6,01770 * 1999 15 148 145,584 2,41593 * 2000 16 148 145,826 2,17433 * 2001 17 146,043 2002 18 146,043 2003 19 146,043 2004 20 146,043

Antag nu att försäljningsvärdena är mindre stabila, dvs Antag nu att försäljningsvärdena är mindre stabila, dvs. under den studerade perioden kan β0 tänkas ändra sig Låt  vara relativt stor, vilket innebär att senare observationer får större betydelse i prognosen. Låt =0.5

Ett alternativ kunde vara att successivt ändra värdet på  beroende på hur utjämningen blir. Det utjämnade värdet i en tidpunkt utgör ju prognosen av nästa tidpunkt och via jämförelse med det verkliga värdet denna tidpunkt kan man se hur bra det går. Ett annat och kanske rimligare alternativ är att göra uppdateringen med olika  och sedan välja det  som ger bäst successiva prognoser. Det senare alternativet finns inbyggt i Minitab’s procedur:

Dubbel exponentiell utjämning Data antas här innehålla en linjär trend. Modell: I AJÅ (och i Minitab) används en metod med två utjämningsparametrar  och  (Holt’s metod): Uppdateringsschema: Prognoser:

Exempel: Miljöstatistik! Nedanstående diagram visar koncentrationen i juli månad av kväve i alla dess tänkbara former i Råån vid Helsingborg, åren 1987-2001 Diagrammet tyder på en nedåtgående trend. Vad kan värdet i juli 2002 tänkas bli?

StatTimes SeriesDouble Exp Smoothing… Två utjämningspara-metrar  Holt-Winters’ metod Prognos i en tidpunkt begärs Vill man ha sina prognoser beräknade efter sista värdet i tillgängliga data låter man denna vara tom

Double Exponential Smoothing Data Total-N Length 15 Smoothing Constants Alpha (level) 0.2 Gamma (trend) 0.2 Accuracy Measures MAPE 46 MAD 1873 MSD 5111241 Forecasts Period Forecast Lower Upper 2002 2560.25 -2027.74 7148.24

Exponentiell utjämning av tidsserier med trend och säsong: (Holt-)Winters’ additiva metod (Holt-)Winters’ multiplikativa metod Bägge metoderna använder tre utjämningsparametrar ,  ,  för nivå, lutning och säsongssvängning Val av metod görs enligt samma principer som vid klassisk komponentuppdelning

Exempel: Kvartalsvisa försäljningsdata year quarter sales 1991 1 124 1991 2 157 1991 3 163 1991 4 126 1992 1 119 1992 2 163 1992 3 176 1992 4 127 1993 1 126 1993 2 160 1993 3 181 1993 4 121 1994 1 131 1994 2 168 1994 3 189 1994 4 134 1995 1 133 1995 2 167 1995 3 195 1995 4 131

StatTime SeriesWinters’ Method… Ingen optimeringsmöjlig-het här

Winters' Method for sales Multiplicative Method Data sales Length 20 Smoothing Constants Alpha (level) 0.2 Gamma (trend) 0.2 Delta (seasonal) 0.2 Accuracy Measures MAPE 2.6446 MAD 3.8808 MSD 23.7076 Forecasts Period Forecast Lower Upper Q1/1996 135.625 126.117 145.133 Q2/1996 174.430 164.773 184.087

Exempel Nyregistrerade bilar

Multiplikativ modell Additiv modell

Med användande av Minitab’s komponentuppdelning, multiplikativ metod: