Tails and outliers in financial time series Examensarbete, Fredrik Strandberg HypoVereinsbank Risk Control, München.

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
Icke-linjära modeller:
Point Estimation Dan Hedlin
Klusterurval, forts..
Numeriska beräkningar i Naturvetenskap och Teknik
Algoritmer och data strukturer -Länkade listor
Föreläsning 7 Analys av algoritmer T(n) och ordo
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
Lösta och olösta problem i tidsvärdesestimering
Asymptotic evaluations Dan Hedlin
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Kontinuerliga system: Differentialekvationer
Statistikens grunder, 15p dagtid
Schedule F6: Segmentation and Clustering F7: Multispectral Images (Sune Svanberg) F8: Segmentation and Fitting F9: Segmentation, Recognition and Classification.
Workshop i statistik för medicinska bibliotekarier!
Stickprovsförfaranden
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
2. Enkel regressionsanalys
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Regressionsanalys Vi vill ha svar på frågan hur mycket kommer y att förändras om x ändras med enhet. Sambandets funktionsform Tillåta att andra saker än.
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
Samhällsvetenskapliga metoder
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Skattning av trendkurvor/trendytor och förändringar över tiden Claudia von Brömssen SLU.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Egenskaper för punktskattning
Sannolikhet Stickprov Fördelningar
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Datorseende TexPoint fonts used in EMF: AA.
Linjär regression föreläsning 9
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S.
Slumptal Pseudoslumptal Fysikexperiment 5p Föreläsning 2
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Några allmänna räkneregler för sannolikheter
Lotka-Volterra: predator-bytes-modell
Grundläggande statistik, ht 09, AN
Säsongrensning: Serien rensas från säsongkomponenten genom beräkning av centrerade och viktade glidande medelvärden (centered moving averages, CMA): där.
Tidsserieanalys Exempel:
Dagens ämnen Numeriska serier Definition av konvergens
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
Föreläsning 5 Kap 13 Tidsserier- vad är det? Trend/Säsong/Konjuktur/Slump Identifiering av trender (Glidande medelvärde) Säsongsmedelvärdesmetoden Säsongsdummymetoden.
Modell för konsumtionen i Sverige Från Baudins kompendium.
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
1. Kontinuerliga variabler
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Föreläsning 5 (Kajsa Fröjd) Tidsserier Kap 13.1 Man har en kvantitativ responsvariabel som mäts vid olika tidpunkter. 1.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
1 Utvärdering och tolkning: MBA Program Admission Policy Rektorn vid ett stort universitet vill höja standarden på de som antas till deras populära MBA-program.
Tidsserieanalys Kap 18, samt Baudin Tidsserieanalys En tidsserie är en mängd mätningar som är tidsordnade. Med tidsserieanalys försöker man upptäcka.
Icke-linjära modeller:
Multipel regression och att bygga (fungerande) modeller
Trender och fluktuationer
Data och att presentera data
Fördelning av data och index
Relation mellan variabler – samvariation, korrelation, regression
Presentationens avskrift:

Tails and outliers in financial time series Examensarbete, Fredrik Strandberg HypoVereinsbank Risk Control, München

Examensarbete, Fredrik Strandberg Situation och målsättning Situation: Kovariansen mellan ett antal urvalda ”representativa” tidserier av längd n  250 skall skattas som vanlig stickprovsvarians Intresserade av ”ej representativa”, typiskt inflytelserika värden - ev. elimineras dessa! Mål: Hitta dessa s k ”outliers”!

Examensarbete, Fredrik Strandberg Vad är en outlier? Tekniska fel: Överföringsfel, decimalfel etc …12.34,12.35,1234,12.33,12.34, … Övriga fel (”marknadsoutliers”?): Finansiella avkastningar oftan nästan normalfördelade – men tjocksvansade: => Def. svansen som outlier m.a.p. N-förd???

Examensarbete, Fredrik Strandberg …m.a.p. en modell! Outlier := realiserat värde: mkt avvikande från vad det ”borde” vara. Alltså: En outlier är alltid en outlier map. en modell! Olika former i olika sammanhang (Univariat, multivariat, …)

Examensarbete, Fredrik Strandberg Klassificering av outliers Univariata: (intuitiv) Outlier map. sin egen univariata serie Multivariata: (en tidpunkt) Outlier map. sin egen multivariata serie Marginal: (Viktigast) Outlier map. de andra komponentserierna i en fix tidpunkt

Examensarbete, Fredrik Strandberg IID-data Standard: En kvantil!  +/- 3  etc Hake 1: Beroende - kan ignoreras Hake 2: Icke-stationäritet - stort problem!! 2 klasser av problem: - En outlier döljer andra outliers (masking) - En outlier får ett korrekt värde att verka vara en outlier (swamping)

Examensarbete, Fredrik Strandberg Robust skattning av  1. (Ev. Släng bort de 1 % största värdena) 2. Ersätt medelvärdet med medianen 3. Ersätt kvadraterna med absolutbelopp 4. Ta medelvärde eller medianen (MAD) 5. Kör Monte-Carlo och skala om till konsistens (Under H 0 : Inga outliers)

Examensarbete, Fredrik Strandberg Finans: Typiska egenskaper Avkastningen över [t-1,t]: [P(t)-P(t-1)]/P(t-1)  log(P(t)/P(t-1)) =: X(t) Icke-konstant volatilitet - kluster! Ungefär: t(f)-fördelad, typiskt f  (3,5) Ungefär: X  WN (utan minne) MEN: Processen X 2 eller |X| har ett (långt) minne! (Långminnet skall dock tolkas försiktigt)

Examensarbete, Fredrik Strandberg GARCH Typisk form (X = log-avkastningen) X(t) = 0 +  (t)Z(t) där Z(t)  IID N(0,1) eller Z(t)  IID t(f)  (t), Z(t) oberoende  (t) =  0 +  1 X 2 (t-1)+  1  2 (t-1) ”volatilitet” Stationär omm  0 > 0 och  1 +  1 < 1 ”EWMA”:  0 = 0,  1 =0.94,  1 = 0.06

Examensarbete, Fredrik Strandberg Parameterskattning ML: L(  0,  1,  1 ) :  0 > 0 och  1 +  1 < 1 Obetingad varians EX 2 =  0 /(1-  1 -  1 ) =:  2 ( Ser nu:  2 (t) =   2 +  1 X 2 (t-1)+  1  2 (t), med  +  1 +  1 =1, dvs ett viktat medelvärde) Skatta  2 med stickprovsvarians =>L(  1,  1 )

Examensarbete, Fredrik Strandberg Sampelstorlek n stort: Modell med konstanta parametrar passar kanske inte längre! (klustren…) Tycks kunna ge upphov till feltolkad ”långminneseffekt” (Mikosch & Starica) Finns flera goodness-of-fit tester. n litet: Numeriskt problem: Ojämn ML-yta med många lokala maxima. För n < 400 gör MATLAB, Splus etc ofta fel

Examensarbete, Fredrik Strandberg Outliers i tidsserier Idé (Fox, 1973): Istället för tjock svans, lägg till en term  vid en okänd tidpunkt  Modellera sedan effekterna av  för t  =  X*(t) = X(t) +  (B)  I(t=  ) (X*(t) observerad, X(t) ej observerad)  (B) är sekvensen av effekter från 

Examensarbete, Fredrik Strandberg Additiva outliers Enklast: Additativa outliers (AO) X*(t) = X(t) +  I(t=  ) (Påverkar bara vid t=  ). Således  (B) = 1

Examensarbete, Fredrik Strandberg Innovativa outliers En AO i bruset. För en ARMA-modell  (B)X(t) =  (t)Z(t) är modellen:  (B)X*(t) =  (t)[Z(t)+  I(t=  )] => X*(t) = X(t) + [  (t)/  (B)]  I(t=  ) Således  (B) =  (t)/  (B)

Examensarbete, Fredrik Strandberg The Joint Estimation method ”JE-methoden” för ARMA Chen och Liu, (Tsay, 1986) 1. Antag först  är känd. Antag modell. 2. Filtrera X*(t) med underliggande => residualerna: r(t) = X*(t)  (t)/  (t) För AO: r(t) =  I(t=  )  (t)/  (t) + Z(t) För IO:r(t) =  I(t=  ) + Z(t)

Examensarbete, Fredrik Strandberg JE-metoden för ARMA 3. Definiera en ”indikatorserie” x(t) så att r(t) kan skrivas som en regression r(t) =  x(t) + Z(t) x(t)=0 för t < , x(  ) = 1. För t=  +k är x(  +k) = -  (k)/  (k) för AO x(  +k) = 0, för IO

Examensarbete, Fredrik Strandberg JE-metoden för ARMA 4. Nu kan outliern  skattas som vanligt! 5. Standardisera skattningen  ’ med   6. Gör detta för alla  och använd max|  ’/   | = M(  ) som test-statistika 7. Kör Monte Carlo och undersök fördelningen av M(  ) under H 0 :  = 0 8. Metod: Om outlier, ta bort den och iterera!

Examensarbete, Fredrik Strandberg JE för GARCH Transformera GARCH till ARMA: [1 -  (B) -  (B)]X 2 (t) = [1 -  (B)][X 2 (t)-  2 (t)] +  0 Använd nu JE-metoden, enklast på IO. Resultat: Fungerar förvånansvärt bra, omm 1. ”Hyfsad” serie 2. Välskattad GARCH

Examensarbete, Fredrik Strandberg Marginal outliers 1. Ansätt multivariat normalfördelade 2. För fix tidpunkt: Betingade marginalfördelningen också normal, med kända moment. 3. Gör konfidensintervall! 4. Den standardiserade variabeln är dock snarare t(4)-fördelad än N(0,1).

Examensarbete, Fredrik Strandberg Multivariata outliers Multidimensionellt spridningsmått: Mahalanobis-avståndet: MD 2 = x(t) T  -1 x(t) Ungefär  2 -fördelat Ex: 11 sept 2001 multivariat outlier (WTC)

Examensarbete, Fredrik Strandberg Fasrummet Betrakta fasen av en univariat serie. WN => ett sfäriskt ”moln” (Tex) AR(p) => ett elliptiskt moln Deterministisk process => deterministisk struktur Använd nu MD >  2 som outlier-detektor! (Funkar bra!)

Examensarbete, Fredrik Strandberg Extremvärdesteori För univariata ”stora” outliers Modell för svansen. Antag svansen på formen x -  L(x), L(x) en långsamt varierande funktion  kallas tail index. Skattas ofta med Hill-skattningen, eller någon variant av denna Komplement till medelvärdesbaserad teori

Examensarbete, Fredrik Strandberg POT Vanligast: POT (Peaks Over Threshold) Steg 1: För ett sampel y 1,y 2,…, y n med okänd fördelningsfunktion F, välj en hög tröskel u. Betrakta nu observationerna ovan u, x 1,x 2,…, x N(u) IID-fallet: N(u)  Bin(n,P[y>u])

Examensarbete, Fredrik Strandberg POT Steg 2. Vill inte bara veta hur ofta ett överskott inträffar, utan även storleken! Betrakta överskotten x i -u. Överskottens fördelning F u approximeras av den Generaliserade Paretofördelningen G( ,  ) = 1 - (1+  x/  ) -1/  ,  kan skattas med ML

Examensarbete, Fredrik Strandberg POT Steg 3. Beteckna svansen F’ := 1-F För överskottens svans fås att F’ u (y)=P[x - u > y|X > y] = F’(u + y)/F’(u) Skatta F’(y) med N(u)/n, F’ u (y) med G( ,  ) => erhåller skattning för F’(u+y) !!!

Examensarbete, Fredrik Strandberg GARCH+EVT Idé: Kombinera GARCH för  (t) med EVT Applicera POT-metoden på Z(t) = X(t)/  (t) Z(t) mer likt ett stationärt WN än X(t) => Betingat riskmått (VaR etc…) Bra? Teoretiskt: JA! I praktiken: NJA! (Nu två besvärliga ML-skattningar)

Examensarbete, Fredrik Strandberg Sammanfattning GARCH svårskattad (ML) för korta serier En outlier är en outlier map. en modell! Tidsserier: JE-metoden för ARMA bra Multivariat: MD 2 >  2 fungerar bra! Univariat: Kan använda detta på fasvektorn EVT: Modell för svansen. Bara ”stora” data betraktas => bör ha lång serie