Outliers – avvikande värden

Slides:



Advertisements
Liknande presentationer
Talföljder formler och summor
Advertisements

X-mas algebra Är du redo? Klicka!!.
Här ser ni några sidor som hjälper er att lösa uppgifterna:
Kap 1 - Algebra och linjära modeller
Innehåll, huvudpresentation 4. Rangordning av ordningsstörningar (fråga 1) 5. Problem med nedskräpning (fråga 1a) 6. Problem med skadegörelse (fråga 1b)
Att söka till högskolan
Index Uttrycker värdet av en storhet relativt värdet av en annan storhet. Serier av värden i tid (eller rum) uttrycks i en viss enhet Index anger alla.
1 Tillämpning av Koden Innehåll •Undersökningens metod och uppläggning, inkl. bolagsurval •Sammanfattning •Genomgång av svar på fokusfrågor.
MS Excel 2010 – Dag 2 Mahmud Al Hakim
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inspira/Silverbäckens förskola
Kundundersökning mars 2010 Operatör: Granbergs Buss AB Trafikslag: Buss Sträcka: Skellefteå - Bodö.
Kundundersökning mars 2010
Tillämpning av bolagsstyrningskoden vid årsstämmor 2005 och 2006.
Avvikande i y-led.
Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Trots att COST verkade ha ett tydligt positivt samband.
Redovisning av drogvaneundersökning åk 7-9 Strömsunds kommun 2010
Kundundersökning mars 2010 Operatör: Västtrafik Trafikslag: Tåg Sträcka: Göteborg - Nässjö.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Förvaltningshögskolan Makroekonomi Osvaldo Salas
MEDELVÄRDE, MEDIAN & TYPVÄRDE
KONJUNKTURBAROMETERN 29 okt 2008 ROGER KNUDSEN. KONJUNKTURBAROMETERN 29 okt 2008 ROGER KNUDSEN Innehåll Barometerindikatorn Konjunkturbarometern Företag.
Karolinska Institutet, studentundersökning Studentundersökning på Karolinska Institutet HT 2013.
Kommunpussel Din uppgift är att sortera de organisatoriska delar på nästa sida på ett sådant sätt att det överensstämmer med hur din kommun är organiserad.
Punktprevalensmätning av trycksår 2011, v.40 Resultat från landstingen
V E R S I O N N R 2. 0 T A V E L I D É E R I M I L J Ö.
Bastugatan 2. Box S Stockholm. Blad 1 Läsarundersökning Maskinentreprenören 2007.
Tillväxt i Lidköping Tillväxtrapport för Lidköping Utveckling åren och benchmarking med Grupp24 och Hela landet
Enkätresultat för Fritidshem Föräldrar 2014 Skola - Hällby skola.
Fakta om undersökningen
INFÖR NATIONELLA PROVET
Företagarpanelen – Q SEPTEMBER 2011 Hallands län.
Enkätresultat för Grundskolan Elever 2014 Skola:Hällby skola.
Avgiftsstudie Nils Holgersson år 2007 Bild 1 Baserat på rapportversion
(2) Avvikelse från std. kostnad (5) Andel inv 65+ med insats (4) Andel 80+ i befolkningen (1) Kronor/ invånare (65+) (3) Kronor/ brukare (6) Ytterfall.
Fakta om undersökningen
Kostnader för läkemedelsförmån Utveckling t.o.m. september 2014 Materialet: avser kostnader inklusive moms är ej åldersstandardiserat Lennart Tingvall:
1 Figur 1.1 Utveckling av Sveriges BNP per invånare under perioden 1990–2010 jämfört med OECD och ett genomsnitt för de sex närmaste konkurrentländerna.
Beräkna en ekvation (metod 1)
Beräkna en ekvation (metod 1)
Från Gotland på kvällen (tågtider enligt 2007) 18:28 19:03 19:41 19:32 20:32 20:53 21:19 18:30 20:32 19:06 19:54 19:58 20:22 19:01 21:40 20:44 23:37 20:11.
Procent.
Det handlar om multiplikation
Ekonomirapporten. April 2014
TÄNK PÅ ETT HELTAL MELLAN 1-50
Grundskola Elever 2013 Grundskoleenkät - Elever ( per klass)
Fastighetsrelaterade index Vad tänker ni på ?. ALLMÄN INFORMATION OM OMSÄTTNINGEN PÅ FASTIGHETSMARKNADEN OCH OM PRISER OCH PRISUTVECKLINGEN PÅ FÖRSÅLDA.
Greppa Näringen Medlemsundersökning, kvartal 1. 1.
/hp Beräkning av kommunernas och samkommunernas utgifter år 2013 Övriga utgifter 0,81 md € Investeringar 4,70 md € Övr. verksamhetskostn. 0,79.
1 Joomla © 2009 Stefan Andersson 1. 2 MÅL 2 3 Begrepp Aktör: en användare som interagerar med webbplatsen. I diagrammet till höger finns två aktörer:
Kouzlo starých časů… Letadla Pár foteček pro vzpomínku na dávné doby, tak hezké snění… M.K. 1 I Norrköping får man inte.
Enkätresultat för Fritidshem Elever 2014 Skola:Fritidselever, Gillberga skola.
1 PROGNOSMODELLENS RESULTAT I BILDER Jouko Kinnunen & Richard Palmer 10 mars 2006.
Innehåll, kommunpresentation 3. Rangordning av ordningsstörningar (fråga 1) 4. Problem med nedskräpning (fråga 1a) 5. Problem med skadegörelse (fråga 1b)
Grundskola Föräldrar 2013 Grundskoleenkät - Föräldrar Enhet:Gillberga skola.
RALS 2007 – Lite siffror mars anställda 50,2 % kvinnor 49,8 % män.
Enkätresultat för Grundskolan Föräldrar 2014 Skola - Gillberga skola.
Fastbasindex--Kedjeindex
Binomialsannolikheter ritas i ett stolpdiagram
Vägda medeltal och standardvägning Index
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Vara kommun Grundskoleundersökning 2014 Föräldrar 2 Levene skola årskurs 5 Antal svar 2014 för aktuell årskurs i skola: 12 Antal svar 2014 för årskurs.
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
Räkna till en miljard 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14,15,16,17,18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, En miljard är ett.
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Föreläsning 12 Sökning och Sökträd.
Förskoleenkät Föräldrar 2012 Förskoleenkät – Föräldrar Enhet:Hattmakarns förskola.
Ekonomirapporten. December 2014 Diagrammen.. 1 Resultat i kommuner och landsting Miljarder kronor Ekonomirapporten. December 2014.
Bild 1 Prognos för länets arbetsmarknad Stefan Tjb.
Grundskola Elever 2013 Grundskoleenkät - Elever Enhet: Gillberga skola.
Fördelning av data och index
Presentationens avskrift:

Outliers – avvikande värden Värden som avviker från det allmänna mönstret i datamaterialet kan störa analysen. Det är viktigt att undersöka om det finns sådana värden och från fall till fall bedöma om observationen ska finnas med i analysen eller ej. Vi skiljer mellan värden som avviker i y-led (de resulterar vanligtvis i stora residualer) och värden som avviker i x -led (de har ofta stort inflytande på regressionslinjens lutning).

Avvikande i y-led

Leverage point, avviker i x- led

Det är ofta svårt att upptäcka avvikande värden om man har fler än en förklaringsvariabel (en kombination av x-värden kan vara extrem, även om vart och ett inte avviker) Unusual Observations Obs C2 C1 Fit SE Fit Residual St Resid 6 250 24.000 36.746 3.655 -12.746 -4.22RX 27 140 32.000 22.453 1.051 9.547 2.06R 32 130 31.000 21.154 0.889 9.846 2.11R R denotes an observation with a large standardized residual X denotes an observation whose X value gives it large influence. Observationer som bara avviker i y-led kan vanligtvis upptäckas genom att plotta residualerna.

Index Index används för att redovisa en utveckling över tiden Det uttrycker värdet av en storhet relativt värdet av en annan storhet (värdet vid en tidpunkt relativt värdet vid en bastidpunkt) Därför är index enhetsoberoende.

Exempel Priset på Hasses superstrumpa 1996-2000 i kronor år pris i SEK pris i Euro 1996 35.00 4.02 1997 36.00 4.14 1998 37.50 4.31 1999 39.00 4.48 2000 40.00 4.60 Priserna i Euro utgår från en fast växelkurs (1 EURO=8.70 SEK).

Om vi nu delar varje pris med priset för 1996 År Kronpris Europris 1996 35/35=1 4.02/4.02=1 1997 36/35=1.03 4.14/4.02=1.03 1998 37.50/35=1.07 4.31/4.02=1.07 1999 39/35=1.11 4.48/4.02=1.11 2000 40/35=1.14 4.60/4.02=1.14 Notera att vi får samma värdeserie oavsett vilken valuta vi använder (Observera dock att fast växelkurs är ett nödvändigt villkor för detta) De erhållna värdena kallas relativtal.

Omräkning till index: Multiplicera relativtalen med 100.  Indexserie 1996 100 1997 103 1998 107 1999 111 2000 114 Indexvärdet för 1996 är exakt 100 av naturliga orsaker. 1996 kallas därför basår. Varje indexvärde innehåller den procentuella förändringen av priset jämfört med basåret. T ex index för 1998=107  Priset har ökat med 7% mellan 1996 och 1998.

För att uttrycka den procentuella förändringen från år t1 till år t2 beräknas [(Index år t2-Index år t1)/Index år t1]100 t ex från 1998 till 2000: [(114-107)/107]100=6.5  6.5% ökning

Basåret kan bytas genom att dividera varje värde i indexserien med värdet för det nya basåret, samt multiplicera med 100 Index år t, basår t1 = (Index år t, basår t0 /Index år t1, basår t0)100 = It (t1 ) = [It (t0 ) / It1 (t0 ) ]  100

Ex. Byte till basår 1998 År Basår 1996 Basår 1998 1996 100 (100/107)  100=93.5 1997 103 (103/107)  100=96.3 1998 107 100 1999 111 (111/107)  100=103 200 114 (114/107)  100=107 Notera att indextal < 100 förekommer

Allmän formel: Beräkning av enkla index:

Några vanliga användningar av index: direkt tolkning av indexvärdena deflatering: om man har en värdeserie av konsumtionen i löpande priser och en indexserie över prisutvecklingen, så kan man få den deflaterade värdeutvecklingen relativprisindex: för att jämföra en varas prisutveckling med ett mer generellt index (t.ex. konsumentprisindex)

Kvantiteter och försäljningsvärden Om qt är försäljningskvantiteten och pt priset av en vara år t, då kan försäljningsvärdet beräknas som vt =pt  qt Ex. Priser, kvantiteter och försäljningsvärden för Hasses superstrumpa: År Pris Kvantitet Försäljningsvärde 1996 35.00 150 5250 1997 36.00 145 5220 1998 37.50 165 6187.50 1999 39.00 160 6240 2000 40.00 155 6200

Deflatering: Försäljningsvärdena är uttryckta i så kallade löpande priser Genom deflatering kan vi uttrycka dem i priser för ett visst år (i så kallade fasta priser) En värdeserie i löpande priser divideras värde för värde med en prisindexserie. Dessutom kan man sen ändra basåret genom att multiplicera samtliga deflaterade värden med prisindex för det nya basåret.

Hasses superstrumpa, forts År Värden i Index Värden i 1997 års löpande priser priser _ 1996 5250 100 (5250/100)  103=5407.50 1997 5220 103 5220 1998 6187.50 107 (6187.50/107)  103=5956 1999 6240 111 (6240/111)  103=5790 2000 6200 114 (6200/114)  103=5602 En deflaterad värdeserie brukar kallas konsumption i fasta priser (värdet av den årliga konsumptionen av strumpor i 1997 års priser). Den uttrycker alltså en kvantitet.

Implicitprisindex Man kan också räkna “baklänges” om vi har en serie med löpande försäljningsvärden och en motsvarande serie uttryckt i (fasta) priser för basår t Genom att dividera löpande pris-serien värde för värde med fastpris-serien och sen multiplicera med 100, får vi en ny index-serie med basår t. Detta kallas ett implicitprisindex.

Hasses superstrumpa, forts År Värden i Värden i Implicitprisindex löpande 1998 års (Basår=1998) priser priser _ 1996 5250 5617.50 (5250/5617.50)  100 = 93.5 1997 5220 5423 (5220/5423)  100 = 96.3 1998 6187.50 6187.50 100 1999 6240 6015 (6240/6015)  100=104 2000 6200 5819 (6200/5819)  100=107 Avvikelser från tidigare framräknad indexserie beror på avrundningsfel

Sammansatta prisindex Ofta producera ett företag (eller en bransch) fler än en vara. Då baserar man indexet vanligtvis på flera (ev. samtliga) varor. Generell konstruktion: där It,i =prisindex år t för vara i wt,i =vikt år t för vara i och summationen görs över alla varor som ingår.

Olika viktsystem Laspeyre’s viktsystem: wt,i =(pi,0·qi,0)/j (pj,0·qj,0) dvs vikten för vara i utgörs av varans andel av totalförsäljningen (av ingående varor) för basåret. Paasche’s viktsystem: wt,i =(pi,0·qi,t)/j (pj,0·qj,t) dvs vikten för vara i utgörs av varans andel av totalförsäljningen för år t i basårspriser . Laspeyre’s system är vanligast. Vikterna baseras på försäljningsfördelningen under basåret. Det är dock problematiskt om försäljningen varierar starkt mellan varugrupper från år till år. Paasche’s system används i det senare fallet och är mindre stabilt.

Exempel forts. Hasses kläder Priser och försäljningskvantiteter på Hasses superstrumpa och Hasses boxershorts Strumpor Boxershorts Pris Kvantitet Pris Kvantitet 1998 37.50 1400 85.00 630 1999 39.00 1310 90.00 488 2000 40.00 1492 93.00 513 Sammansatt prisindex med Laspeyre’s viksystem (Basår 1998): År Index 1998 100 1999 2000

Ovanstående index kallas fastbasindex Ovanstående index kallas fastbasindex. Beräkningarna utgår från priser och/eller kvantiteter under ett basår. Vid långa indexserier blir detta ett problem. Vikterna måste återspegla förändringen i försäljningsvärden. Då använder man kedjeindex istället och man beräknar förändringen från ett år till det nästa (genom så kallade länkar).

Länkar och kedjor En indexlänk från år t-1 till år t beräknas som ett sammansatt index med år t-1 som basår. Länken är då det värdet som indexet får år t. Länken konstrueras som där pi,t är priset på vara i år t och pi,t-1 är priset på vara i år t –1 och wi,t-1,t är den vikt som används för varan mellan år t till år t –1 samt n är antalet varor som skall ingå i indexet

Med t ex Laspeyre’s viktsystem beräknas årslänken som Ett (kedje)index för år t med basår 0 fås därefter som It = L0,1 · L1,2 · … · Lt-1,t · 100

Användande av representantvaror För företag och branscher med många varor blir det opraktiskt att beräkna vikter med alla varors priser och försäljningskvantiteter. I stället väljs ur varje varugrupp en representantvara, vars pris- och kvantitetsutveckling speglar varugruppen väl. Priserna på representantvaran används i formeln för det sammansatta indexet. Vikterna bestäms utifrån totalförsäljningen i respektive varugrupp.

Om pi,t = Priset på representantvaran från grupp i år t, och vi,t = Värdet hos totala försäljningen av grupp i år t kan årslänken med Laspeyrevikter beräknas som där summeringen görs över alla grupper av varor (el. tjänster) Observera att i denna formel (och även i tidigare formler) summerar vi också i nämnaren över alla grupper, men för att inte blanda ihop med den första summan används summationsindexet j där.

År Hasse’s kläder Försäljningsvärden Försäljningsvärde   Försäljningsvärden  År Försäljningsvärde Strumpor och sockor Underkläder 1998 210650 151300 1999 245400 179500 2000 266300 199100 Priser för representantvaror År Strumpor och sockor Underkläder Hasses superstrumpa Hasses boxer 1998 37.50 85.00 1999 39.00 90.00 2000 40.00 93.00  

Årslänkar Kedjeindex med basår 1998   År Index 1998 100 1999 1.048100=104.8 2000 1.0481.029100=107.8

Relativprisindex Antag att vi har ett framräknat prisindex för någon vara, tjänst eller grupp av varor och tjänster. Indexet i sig mäter prisutvecklingen på just den varan/tjänsten/gruppen, men det är ofta intressant att studera utvecklingen i förhållande till den allmänna prisutvecklingen (totalt eller för en större grupp till vilken varan/tjänsten/ gruppen hör). Man kan då använda sig av s k relativprisindex.

Låt It0 vara prisindexet för den aktuella varan/tjänsten/gruppen och låt Itv vara prisindexet för den större gruppen. Relativprisindexet blir då (It0 / Itv ) ·100 Itv är ofta konsumentprisindex (se nedan) eller något branschindex. Relativprisindex är egentligen bara en variant av deflatering. Man vill alltså tolka den ’lokala’ prisförändringen när den generella prisförändringen har räknats bort. (den aktuella varan har en högre (index>100) eller lägre (index<100) prisutveckling än varorna generellt. Användningsområdena är många, men speciellt blir detta sätt att räkna viktigt i efterfrågeanalys.

Exempel: Nedan visas det nyligen framräknade kedjeprisindexet för Hasses kläder tillsammans med konsumentprisindex för motsvarande period. Kedjeprisindex KPI (basår 1980) KPI (basår 1998) 1998 100 257.3 100 1999 104.8 258.5 100.5 2000 107.8 260.8 101.4

Värdena visar direkt att prisutvecklingen hos Hasses är högre än den allmänna prisutvecklingen. Uttryckt i ett relativprisindex blir den alltså: 1998 100 1999 (104.8/100.5)·100 = 104.3 2000 (107.8/101.4) 100 = 106.3 dvs 6.3% högre än den allmänna prisutvecklingen mellan 98 och 00

Konsumentprisindex Indelning av marknaden i grupper av varor och tjänster görs med jämna mellanrum. Val av representantvaror/tjänster från varje grupp (regelbunden revision av val) Basår byts med långa intervall: F n 1980, innan dess 1949 Beräkning för hela marknaden men också för diverse undergrupper (Nationalräkenskaperna)

Indexets utformning: Uppdelning i långtidsindex (årsvisa) och korttidsindex (månadsvisa) Båda är kedjeprisindex Årslänkar beräknas f n med Edgeworths viktsystem (ett medelvärde av Laspeyre’s och Paasche’s viktsystem) Månadslänkar beräknas f n med Laspeyre’s viktsystem Sammanjämkning i januari och december http://www.scb.se/templates/Standard____33937.asp

Konsumentprisindex används för att Mäta inflation Omräkna värden i löpande priser till värden i priser för ett visst år. Detta används bl a för att bedöma försäljningsutveckling och efterfrågan. Konsumentprisindex kan bestämmas implicit genom