Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig) 3 - 1025

Slides:



Advertisements
Liknande presentationer
Inferens om en population Sid
Advertisements

FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Kvantitativa forskningsmetoder I Föreläsning 2
Samband mellan kvalitativa variabler Sid
Grundläggande statstik, ht 09, AN1 F9 Analys av frekvenstabeller Hittills har vi analyserat eller jämfört 2 grupper avseende variabler på intervall- eller.
Workshop i statistik för medicinska bibliotekarier!
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
2. Enkel regressionsanalys
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Binomialsannolikheter ritas i ett stolpdiagram
Sannolikhet Stickprov Fördelningar
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Hur bra är modellen som vi har anpassat?
Linjär regression föreläsning 9
Normalfördelningen och centrala gränsvärdessatsen
F8 Hypotesprövning. Begrepp
F8 Hypotesprövning. Begrepp
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Statistik Lars Valter Fil.lic. Statistik
Några allmänna räkneregler för sannolikheter
732G22 Grunder i statistisk metodik
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
Kvantitativ metod. 2 Vad är statistik? En massa siffror Beskrivning av staten Metodlära.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Verksamhetsrapport 2016 Verksamhet xx - medarbetare Svarsfrekvens Verksamhet xx 100% (100 svarande/100 mottagare) Svarsfrekvens AcadeMedia totalt 76% (6103.
Lite repetition och SAMBAND & INFERENS. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Modell för konsumtionen i Sverige Från Baudins kompendium.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Man har två kvalitativa variabler som man vill gemensamt undersöka. 1.
Verksamhetsrapport 2016 Verksamhet xx - elever Svarsfrekvens Verksamhet xx 100% (1000 svarande/1000 mottagare) Svarsfrekvens AcadeMedia gymnasium 100%
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
1. Kontinuerliga variabler
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Idag: Repetition av Chi2-test Kap 6*, Kodning av svaren Kap 10*, Olika feltyper Kap 12*, Rapportskrivning *Dahmström.
Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Två/flera populationer och en kvalitativ variabel (”The first model” i Moore)
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
Så kan det låta! … Mätinstrumentets reliabilitet och validitet ökades avsevärt genom en pilotstudie och för att nå bästa generaliserbarhet valdes ett representativt.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
1 UNDERSÖKNINGSMETODIK Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Statistiska undersökningar kan vara.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
DESKRIPTION Bearbeta, tolka och redovisa resultat. Vad ingår? Tabeller - Sammanfatta material Diagram - Åskådliggöra material Lägesmått - ”Genomsnitt”
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Marknadsundersökning Kap 12
Multipel regression och att bygga (fungerande) modeller
Data och att presentera data
Relation mellan variabler – samvariation, korrelation, regression
Förelasning 1 Kursintroduktion Statistiska undersökningar
Vad ingår kursen? i korta drag
Grundläggande begrepp
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)

Samband Social klass (X)Sjukfrånvarodagar (Y) (medelvärde) Arbetare30 Tjänstemän - lägre20 Tjänstemän - mellan10 Tjänstemän - högre7 Exempel 1

Samband Kön (X)Inkomst (Y) (medelvärde) Män21000kr Kvinnor18500kr Exempel 2

Samband Exempel 3

Samband mellan… Social klass –Sjukfrånvaro Kön – Inkomst Ålder –Inkomst

Beskrivning av samband Vilken är den oberoende, vilken den beroende variabeln? Positivt, negativt eller nollsamband? Sambandets form: linjärt eller kurvlinjärt (U-kurva, exponentiell kurva, S-kurva…)? Sambandets styrka och signifikans (med hjälp av statistiska mått).

Samband – orsakssamband? Sambandet bör vara någorlunda starkt. Sannolikhet (signifikans) – det bör vara sannolikt att sambandet som vi finner i vårt urval av fall även finns i populationen. Konsensus - andra studiers resultat bör (helst) inte stå i motsats till våra. Mekanism – kan vi förklara hur sambandet har kommit till?

Samband – orsakssamband? Hur är det med tidsordningen? X måste komma före Y i tiden! (Eller vara mer beständig). Sambandet får ej förklaras av andra variabler, dvs. det bör inte vara ett skensamband. Kontroll för tänkbara bakomliggande variabler! Är sambandet generellt, dvs. gäller det oavsett plats och tidpunkt?

Att undersöka kausala mekanismer Tänk på sannolika skäl för varför sambandet kan existera. Klargör Dig vilken hypotes som testas och vilket/vilka är alternativen! Operationalisera de variabler som ingår i resp. hypotes och gör modeller som visar hur kausaliteten är tänkt att fungera. Testa om de förväntade sambanden finns i Ditt material! Resultat: antingen finns de (och då kan vi förkasta ”nollhypotesen”), eller också inte (och då var förväntningen fel).

Variabeltyper och mätnivåer Typ av variabel Skala Variabel- värden EgenskaperExempel KvantitativKvotDiskreta eller kontinuerliga Absolut nollpunkt Mäta avstånd Rangordna Klassificera Ålder Antal barn Inkomst KvantitativIntervallDiskreta eller kontinuerliga Mäta avstånd Rangordna Klassificera Temperatur C (Attityder) KvalitativOrdinalDiskretaRangordna Klassificera Betyg (Attityder) KvalitativNominalDiskretaKlassificeraKön Civilstånd Djurfeldt mfl. (2003) Statistisk verktygslåda – samhällsvetenskaplig orsaksanalys med kvantitativa metoder. Sid. 40.

Sambandsmått Sambandsmåtten ger oss en uppfattning om hur stark samvariationen är mellan två variabler. Finns många. Tre allmänt använda mått är: Chi-två – används för nominella variabler. Räknas på basis av skillnaden mellan de värden som observerats och de som kunde ha förväntats om det hade rått en jämn fördelning. Chi-tvåvärdets signifikans beror på antalet kategorier och måste kontrolleras i en chi- tvåtabell. Pearsons korrelationskoefficient r – kräver kvotnivåvariabler. Mäter styrkan på samband mellan två sådana variabler. Värdena varierar mellan -1 (fullständigt negativt samband) och +1 (fullständigt positivt samband). 0 = inget samband. Spearmans rangkorrelationskoefficient r s – ordinal skalnivå räcker. Mäter styrkan på samband mellan ordinala variabler (två rangordningar, t ex). Värdena varierar mellan -1 (fullständigt negativt samband) och +1 (fullständigt positivt samband). 0 = inget samband.

Samband i fördelnings(kors)tabell 60 studenters svar på favoritämne MänKvinnor Statskunskap2416 Nationalekonomi164 Vid en jämn fördelning skulle båda könen ha valt i lika proportioner mellan olika ämnen. Men har könsfördelningen blivit ojämn av en slump?

Samband i tabell 60 studenters svar på favoritämne MänKvinnor Statskunskap2416 Nationalekonomi164 Totalt 40 studenter, dvs. 2/3 av alla, valde statskunskap. 20 studenter, dvs. 1/3, valde nationalekonomi. Om män och kvinnor skulle välja lika, skulle de välja i samma proportioner.

Samband i tabell 60 studenters svar på favoritämne MänKvinnor Statskunskap26,713,3 Nationalekonomi13,36,7 Om män och kvinnor skulle välja i samma proportioner, skulle tabellen se ut så här:

Samband i tabell 60 studenters svar på favoritämne Män [(O-E) 2 delat med E] Kvinnor [(O-E) 2 delat med E] Statskunskap (24-26,7) 2 =7,29 7,29/26,7 = 0,27 (16-13,3) 2 =7,29 7,29/13,3=0,55 Nationalekonomi (16-13,3) 2 =7,29 7,29/13,3 = 0,55 (4-6,7) 2 =7,29 7,29/6,7=1,09 Chi-två-beräkning: chi-två är lika med summan av [(O- E) 2 delat med E], där O är det observerade, E det förväntade värdet (vid jämn fördelning).

Chi-två och arbetet med formler χ 2 = Σ [(O-E) 2 /E] Först: se till att Du förstår alla tecken i formeln Sedan: skilj mellan räkneoperationer och andra symboler Sedan: fundera på vilken ordning som beräkningarna skall göras i – och räkna ut resultatet

Chi-tvåberäkning för en variabel Chi-två-beräkning: summan av [(O-E) 2 delat med E] blir 0,27 + 0,55 + 0,55 + 1,09 = 2,46 Chi-två-värdet är 2,46 Antalet frihetsgrader = 1 (i ett fyrfält) Det kritiska värdet på 5%-signifikansnivå för chi-två vid en frihetsgrad (från tabellen) är 3,84 2,46 < 3,84, chi-två värdet understiger det kritiska värdet Chi-två-värdet är inte statistiskt signifikant: det är möjligt att sambandet har kommit till av en slump

Korrelationsanalys med Pearsons r Analyser av linjära samband mellan två variabler på intervall- eller kvotnivå. Pearsons produktmomentkorrelationskoefficient r (r xy ) är ett mått på samvariationens (korrelationens) styrka. Ett standardiserat mått med värden som varierar mellan -1 (perfekt negativt samband) till +1 (perfekt positivt samband).

Korrelation: ett prickdiagram Exempel r = +0.43

Korrelation: prickdiagram med ålder och hälsa

Korrelation - beräkning Exempel… x = ålder y = hälsa (på en skala 1-10, där 1 innebär en mycket dålig hälsa och 10 en mycket bra)

Korrelation - beräkning

Vilken metod skall jag använda? Är frågeställningen en en-, två- eller flervariabelsfråga? Vilken skalnivå är våra variabler på?

Vilken metod ska jag använda? Typ av analys VariabeltypMetodexempel UnivariatKvalitativTabell, diagram, median, typvärde, chi 2 -test UnivariatKvantitativDiagram, medelvärde, standardavvikelse, t-test BivariatKvalitativ (x) – Kvalitativ (y)Korstabell, chi 2 -test BivariatKvalitativ (x) – Kvantitativ (y)T-test, variansanalys BivariatKvantitativ (x) – Kvantitativ (y)Bivariat regression, bivariat korrelation MultivariatKvalitativ (x, w, z…) – Kvantitativ (y)Multipel regression MultivariatKvantitativ (x, w, z…) – Kvantitativ (y)Multipel regression Djurfeldt mfl. (2003) Statistisk verktygslåda – samhällsvetenskaplig orsaksanalys med kvantitativa metoder. Sid. 40.