Regressions- och tidsserieanalys

Slides:



Advertisements
Liknande presentationer
Regressions- och tidserieanalys, 5 p
Advertisements

Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
Hur bra är modellen som vi har anpassat?
Regressions- och tidsserieanalys
FL10 732G81 Linköpings universitet.
Inferens om en ändlig population Sid
Linda Wänström och Elisabet Nikolic (Karl Wahlin)
Undersökningsmetodik och statistisk dataanalys, grundnivå, 15 p VT 2008.
Algoritm analys och rekursiva metoder kap 5,7
Olika mått på grad av fetma - Spelar det någon roll hur vi mäter?
Något om val mellan olika metoder
Antag att följande värden hos kapitalet har gällt:
Problemlösning, andragradare och kubikrötter Sid 75-85
Workshop i statistik för medicinska bibliotekarier!
Beskrivande statistik för två beroende slumpvariabler
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Chitvå-test Regression forts.
2. Enkel regressionsanalys
732G81 Statistik för internationella civilekonomer
Ekonometrisk analys av fastighetsmarknader
Fastbasindex--Kedjeindex
Multipel regressionsanalys
732G71 STATISTIK B Vad förväntas man egentligen kunna efter genomgången kurs? Exempel: Du sitter i ett projektmöte på din arbetsplats. Din chef (om det.
1 Regression Analysis: Hyra versus Kv-meter The regression equation is Hyra = Kv-meter Predictor Coef SE Coef T P Constant
Multipel linjär regressionsanalys
Sannolikhet Stickprov Fördelningar
Tidsserieanalys Vad karaktäriserar data? Exempel:
Hur bra är modellen som vi har anpassat?
Kombinerade serie- och parallellnät
Sambandsmodeller, 10 p = 15 hp
y=β0 + β1·x1 + β2·x2 + β3·x3 + β4·x4 + β5·x32 + ε
Icke-linjära modeller:
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S.
Kvadratsummeuppdelning/Variansanalys
Exempel: Vad påverkar kostnaden för produktion av korrugerat papper, dvs sådant som ingår i wellpapp och kartonger? Amerikansk studie: Kostnaden kan förmodligen.
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Tidsserieregression fungerar statistiskt som vanlig regression. Regression Analysis The regression equation is Sold = 5,78 + 0,0430 time Predictor.
Regression Analysis The regression equation is Sold = 5,78 + 0,0430 time Predictor Coef StDev T P Constant 5,7761 0,9429 6,13 0,000 time 0, ,03420.
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
1 Om sambandet inte är linjärt? Om sambandet till en variabel inte är linjärt så kan vi inkludera ytterligare en term i regressionsmodellen I en modell.
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Säsongrensning: Serien rensas från säsongkomponenten genom beräkning av centrerade och viktade glidande medelvärden (centered moving averages, CMA): där.
Styrteknik 7.5 hp distans: Tidskretsar, räknare PLC4B:1 Bilder Olika exempel med Timers och Counters En Enkel Timer med MELSEC IL Om BTN_DGVG.
Kvadratisk regression, forts.
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Tidsserieanalys Exempel:
Musikkompendium Test. Musikkompendium Test 2 Musikkompendium Test 3.
Multipel regressionsanalys Den generella metoden i vilken Enkel linjär regression är ett specialfall Syften: –Att förklara variationen i en intressant.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Statistik för AT-läkare Robert Hahn, Södertälje sjukhus.
Föreläsning 5 Kap 13 Tidsserier- vad är det? Trend/Säsong/Konjuktur/Slump Identifiering av trender (Glidande medelvärde) Säsongsmedelvärdesmetoden Säsongsdummymetoden.
Modell för konsumtionen i Sverige Från Baudins kompendium.
1 Icke-linjär regression Sid (i kapitel 16.1)
Föreläsning 4 (Kajsa Fröjd) Multipel regression Kap 11.3 A.Man har en kvantitativ responsvariabel som är linjärt relaterad till en/flera kvantitativa förklarande.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Tidsserieanalys Kap 18, samt Baudin Tidsserieanalys En tidsserie är en mängd mätningar som är tidsordnade. Med tidsserieanalys försöker man upptäcka.
3.6 Area Parallellogram A = b ∙ h Romb A = b ∙ h Kvadrat A = s ∙ s
X 4.6 Hur stor är delen? Andelen = Delen Det hela Delen =
Icke-linjära modeller:
Multipel regression och att bygga (fungerande) modeller
Trender och fluktuationer
Fördelning av data och index
Relation mellan variabler – samvariation, korrelation, regression
Presentationens avskrift:

Regressions- och tidsserieanalys Statistik B, 8 hp Regressions- och tidsserieanalys Projekt 1: Index och efterfrågeanalys Projekt 2: Tidserieanalys Projekten ger 2.5 hp Tenta: 5,5 hp Lärare: Lotta Hallberg, ann-charlotte.hallberg@liu.se Isak Hietala

Enkel linjär regression: hyran kan förklaras av lägenhetsstorlek

Kvadratisk regression

Efterfrågeanalys: Efterfrågan förklaras av priset Efterfrågeanalys: Efterfrågan förklaras av priset. Priselasticiteten kan skattas.

Tidserieanalys: en variabel som observeras över flera år kan förklaras av tiden, månaden, ...

Hur mycket betalar man (i genomsnitt) i hyra om man har en lägenhet på 50 kvadratmeter? ca 3747.6 SEK

För varje ytterligare kvadratmeter i lägenhetsyta får man betala ca 60 kronor i månaden mer. 10 kvadratmeter mer = 605 SEK

Residualerna Kv-meter Hyra b0+b1*xi yi-(b0+b1xi) 61 4490 720.92+60.53*61= 4413.25 76.75 50 3211 3747.42 -536.42 32 3265 2657.88 607.12 74 4750 5200.14 -450.14 61 4063 4413.25 -350.25 70 5471 4958.02 512.98 52 4120 3868.48 251.52 64 5432 4594.84 837.16 65 5020 4655.37 364.63 38 3512 3021.06 490.94 37 2456 2960.53 -504.53 37 2560 2960.53 -400.53 50 3179 3747.42 -568.42 117 7110 7802.93 -692.42 86 7019 5926.5 1092.5 50 3199 3747.42 -548.42 73 4953 5139.61 -186.61 77 5623 5381.73 241.27 52 3919 3868.48 50.52 56 3898 4110.6 -212.6 92 6219 6289.68 -70.68 Residualerna

Detta görs genom ‘Minsta-kvadrat-metoden’: Summan av alla kvadrerade avstånd ska bli så liten som möjligt.

Σ 1294 93469 6271637 88196 Kv-meter Hyra xi*yi xi*xi 61 4490 61*4490= 273890 3721 50 3211 160550 2500 32 3265 104480 1024 74 4750 351500 5476 61 4063 247843 3721 70 5471 382870 4900 52 4120 214240 2704 64 5432 347648 4096 65 5020 326300 4225 38 3512 133456 1444 37 2456 90872 1369 37 2560 94720 1369 50 3179 158950 2500 117 7110 831870 13689 86 7019 603634 7396 50 3199 159950 2500 73 4953 361569 5329 77 5623 432971 5929 52 3919 203788 2704 56 3898 218288 3136 92 6219 572148 8464 Σ 1294 93469 6271637 88196 3721 2500 1024 5476 4900 2704 4096 4225 1444 1369 13689 7396 5329 5929 3136 8464

Regression Analysis: Hyra versus Kv-meter The regression equation is Hyra = 721 + 60.5 Kv-meter Predictor Coef SE Coef T P Constant 720.9 370.2 1.95 0.066 Kv-meter 60.533 5.713 10.60 0.000 S = 525.5 R-Sq = 85.5% R-Sq(adj) = 84.8% Analysis of Variance Source DF SS MS F P Regression 1 31002923 31002923 112.26 0.000 Residual Error 19 5247087 276162 Total 20 36250010 Regressionslinjen t-tester och deras p-värden Parameterskattningar och deras standardavvikelser Residualspridningen Konfidensintervall för parametrarna b0 och b1 måste man dock beräkna själv.

Även punktskattningar och punktprognoser kan beräknas med hjälp av MINITAB The regression equation is Hyra = 721 + 60.5 Kv-meter Predictor Coef SE Coef T P Constant 720.9 370.2 1.95 0.066 Kv-meter 60.533 5.713 10.60 0.000 S = 525.5 R-Sq = 85.5% R-Sq(adj) = 84.8% .... Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 4353 115 ( 4112, 4594) ( 3227, 5479) Values of Predictors for New Observations New Obs Kv-meter 1 60.0