Data och att presentera data Föreläsning 1, kvantitativ metod C-kurs Ekonomisk historia HT 2017
Kvantitativ metod i Ekonomisk Historia Växt sedan 1970-talet i och med ett antal inflytelserika publikationer Användning av ekonometriska metoder, men skiljer sig oftast (men inte alltid) från Nationalekonomi Kontroversiellt i vissa fall – men man kan fråga sig hur mycket som skiljer sig från kvalitativ metod?
Vad man kan förvänta sig av kursen Att man bättre ska kunna förstå och tillgodogöra sig kvantitativ metod och dess användning i ekonomisk historia Att man ska bli medveten om centrala problem inom kvantitativ metod och möjliga lösningar till problemen Att man själv praktiskt ska kunna utföra kvantitativ metod och veta varför vi gör som vi gör
Data och beskrivande statistik i Ekonomisk Historia Grunden för kvantitativ metod – utan korrekt och bra data kan vi inte arbeta Historisk data kan vara problematisk på flera sätt – hur hanterar man problem? Ofta använder vi oss av tidsseriedata, vilket får betydelse för hantering och presentation av data
Olika typer av data/variabler Beskrivning Exempel Nominal* Ger endast kvalitativ information Namn, yrken, länder, etc Ordinal Ranking eller ordning är viktigt Social status, ekonomisk klass, betyg, etc. Intervall Distans mellan två värden Datum, temperatur, lönesteg, skattenivå, etc. Kvot Förhållandet mellan två värden Bnp/capita, skatt/tull (i %)
Olika sätt att presentera data Stapeldiagram Cirkeldiagram Linjediagram Ytdiagram
Stapeldiagram – Tre bankers utlåning per typ av säkerhet 1880
Cirkeldiagram – Utlåningsformer i % av total
Linjediagram - Sveriges alkoholimport 1830-1906
Ytdiagram – Sveriges alkoholimport 1830-1906 i % av tot
Olika typer av spridningsmått Medelvärde Median Typvärde
Medelvärde Exempel: 3,4,4,4,4,5,7,9,11,11,71 12,1 i medelvärde (summan av alla värden delat med antal värden) Fördel: Använder alla värden, samt stor användbarhet som spridningsmått Nackdel: Känsligt för extremvärden
Att känna till – olika medelvärden Aritmetiskt medelvärde – det ”vanliga” medelvärdet Geometriskt medelvärde – blir oftast mindre än det aritmetiska (använder produkten av talen, sedan roten ur av resultatet) Finns även andra: kvadratiska, kubiskt, harmoniskt, generaliserat, glidande
Median Exempel: 3,4,4,4,4,5,7,9,11,11,71 5 (den ”mittersta” observationen i serien) Fördel: Immunt mot extremvärden Nackdel: Mindre användbart som spridningsmått och i statistiska test
Typvärde Exempel: 3,4,4,4,4,5,7,9,11,11,71 4 (det vanligast förekommande värdet i serien) Fördel: Representerar den mest typiska observationen Exkluderar andra observationer, missar information
Övning 1 - Spridningsmått Gör passande graf över data på strafflängd (Hudson, s. 61) Analysera medelvärde, median och typvärde Diskutera resultat
Variansmått Viktigt för att komplettera spridningsmått (medelvärde, etc.) Dataserier med samma medelvärde kan se mycket olika ut (se exempel, s. 94 i Hudson) Två varianter: varians och standardavvikelse (se exempel i Hudson, s. 95)
Övning 2 – Varians och standardavvikelse Varians: genomsnittet av avvikelsen från medelvärdet (all värdens avvikelse från medelvärdet delat med antalet värden i serien) Standardavvikelse: roten av variansen (variansen är SD upphöjt i två) Använd data på fängelsestraff (från förra övningen) och räkna ut varians samt standardavvikelse
Variationskoefficient (CV) Räknas ut som en kvot mellan standardavvikelse och medelvärdet Fördel: Går att jämföra olika seriers avvikelse från medelvärdet, särskilt när serierna har olika värden (pris i kronor jämfört med pris i pund) s/X*100 (procent)
Exempel på variationskoefficient (CV) B C CV 75,8 96,0 2,8
Variationskoefficient över tid (regional BNP för Sverige 1860-2000)
Till nästa gång Läs: Hudson kapitel 3-5 (fram till avsnitt 5.7, s. 122) Gå igenom dagens genomgång och övningar Fundera över eventuella frågor inför fortsättningen