Fördelning av data och index

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Visual Basic - Genomgång
Talföljder formler och summor
FL3 732G81 Linköpings universitet.
Möte med kundrepresentanterna i fjärrvärmeuppdraget Stockholm 29 november.
Robert Gidehag & Jonas Arnberg. Studiens frågeställningar Övergripande: Är den svenska alkoholpolitiken effektiv på 2000-talet?
Positiv Livskraft © Att komma dit du vill
Vad ingår kursen? i korta drag
Outline för dagens övning
Skattningens medelfel
Förelasning 1 Kursintroduktion Statistiska undersökningar
Centrala Gränsvärdessatsen:
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Skattning av trendkurvor/trendytor och förändringar över tiden Claudia von Brömssen SLU.
Binomialsannolikheter ritas i ett stolpdiagram
Sannolikhet Stickprov Fördelningar
Vägda medeltal och standardvägning Index
Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
PROCENT. Centum betyder 100 på latin 1 Century = 1 århundrade 100 cent = 1€ Procenttecknets utveckling Centurion – Romersk officer som ledde mellan 80.
Samband och förändring. Delen i procent Finns två metoder. Antingen räknar man först 1 % (genom att dividera med 100) och multiplicerar till den procenten.
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
1 Icke-linjär regression Sid (i kapitel 16.1)
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
DESKRIPTION Bearbeta, tolka och redovisa resultat. Vad ingår? Tabeller - Sammanfatta material Diagram - Åskådliggöra material Lägesmått - ”Genomsnitt”
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Lite matterepetition Räknesätten, bråk, förkorta, parenteser
Kap 4 - Statistik.
Marknadsundersökning Kap 12
Indexberäkning Svarsalternativ Poäng per alternativ Antal svar
Regiongemensam elevenkät 2016
Regiongemensam elevenkät 2016
Kvaliteten på regionala data kan vara bristfällig
Kvaliteten på regionala data kan vara bristfällig
Kvaliteten på regionala data kan vara bristfällig
Kvaliteten på regionala data kan vara bristfällig
Kvaliteten på regionala data kan vara bristfällig
Regiongemensam elevenkät 2016
Kvaliteten på regionala data kan vara bristfällig
Regiongemensam elevenkät 2016
Aritmetik & algebra Geometri & bevis Förändring & procent Funktioner
Regiongemensam elevenkät 2016
Kvaliteten på regionala data kan vara bristfällig
Multipel regression och att bygga (fungerande) modeller
Trender och fluktuationer
Data och att presentera data
Relation mellan variabler – samvariation, korrelation, regression
Förelasning 1 Kursintroduktion Statistiska undersökningar
tUTΩPIA Mål Nystartad student förening Verksamhet
Regiongemensam elevenkät 2016
Regiongemensam elevenkät 2016
Information om SCB:s Export-/importregister 2015
Regiongemensam elevenkät 2016
Kvaliteten på regionala data kan vara bristfällig
Regiongemensam elevenkät 2016
Kvaliteten på regionala data kan vara bristfällig
Pivotdiagram.
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Kvaliteten på regionala data kan vara bristfällig
Handelsbarometern April 2019.
Handelsbarometern Maj 2019.
Kvaliteten på regionala data kan vara bristfällig
Presentationens avskrift:

Fördelning av data och index Föreläsning, kvantitativ metod C-kurs Ekonomisk Historia, HT 2017

Kvartiler och rankade distributioner Utgår ifrån medianen och delar in den rankade datan i lika stora delar Kvartil = fyra delar, Percentil = 100 delar, osv Används ganska ofta för att dela in studenter beroende på studieresultat (andra exempel i Hudson, s. 98-103)

Normalfördelning Matematiskt/statistiskt ideal – helt normalfördelade serier finns i princip inte i samhällsvetenskap och humaniora Kan dock få stora konsekvenser för statistiska test och är något man bör ta i beaktning Det finns olika metoder för att lösa problem (t.ex. ta bort outliers)

Normalfördelningskurva

Exempel på skeva fördelningar

Exempel på ”positiv” skev fördelning i en serie

Histogram Histogram tas fram för att grafiskt visa på hur sin data förhåller sig till normalfördelningen Görs lättast i Minitab: Graph  histogram  simple with fit Krångligare i excel, men är möjligt att göra även där

Histogram för fångars ålder

Indexserier Gör olika tidsserier enhetliga, gör det möjligt att jämföra serier med olika typer av värden (priser i kronor och pund t.ex.) Görs om till procent: (observation indexår)/(observation basåret) *100 Man måste alltid ange basåret! (1871 = 100)

Exempel på indexering Antal (strejker) Index 1760 20 67 1761 23 77 1762 22 73 1763 26 87 1764 29 97 1765 45 150 1766 30 100 1767 33 110 1768 35 117 1769 36 120 1770 38 127

Övning 1 Beräkna index för de tre serierna i tabell 5.2, s. 111 i Hudson. Använd basår 1930 istället för 1929 som i tabellen (annars får ni ju svaren gratis rakt upp och ner…)

Sammansatta index Bra för att samla mycket data i en serie och beskriva allmänna utvecklingar (lönenivå, prisnivå, etc.) ”Vikta” serier: ge varje del i sammansatta indexet ett värde som anger hur stor andel av totalen det bör utgöra Nyckeln är alltid hur man viktar på rätt sätt, vilket kan ge upphov till diskussion. Får ibland stor påverkan på hur serierna ser ut

Exempel på sammansatt/viktat index Vikter: Beer – 0,05, Wine – 0,65, Spirits – 0,30 Beer index Wine Index Spirits Index Alkohol index Weighted index 100 92 101 80 91 82 79 85 68 77 70 83 114 73 90 94 107 97 99 98 112 106 104 121 141 139 119 108 95 129 103 89 126

Skillnad mellan viktat och oviktat index

Räkna ut index för levnadskostnader, s. 118. Basår = 1900 Övning 2 Räkna ut index för levnadskostnader, s. 118. Basår = 1900

Realindex Används när man måste ”göra sig av med” inflation i serier Dividera t.ex. med kostnadsindex (KPI) för samma år, multiplicera med 100 Använd samma basår för varje enskild serie (viktigt)

Exempel på realindex – Svenskt löneindex 1782-1830

Räkna ut reallöner, s. 119 i Hudson. Basår = 1900. Övning 3 Räkna ut reallöner, s. 119 i Hudson. Basår = 1900.

Till nästa gång Läs sid 122-135 i Hudson Gå igenom dagens genomgång och övningar Läs Dobson & Goddard (1998) artikel – fundera först och främst på vilken data som presenteras, hur den presenteras och vad den säger