Presentation laddar. Vänta.

Presentation laddar. Vänta.

Surveymetodik 732G04 Lärare: Ann-Charlotte (Lotta) Hallberg.

Liknande presentationer


En presentation över ämnet: "Surveymetodik 732G04 Lärare: Ann-Charlotte (Lotta) Hallberg."— Presentationens avskrift:

1 Surveymetodik 732G04 Lärare: Ann-Charlotte (Lotta) Hallberg

2 Kursupplägg 7 föreläsningar 4 lektioner 1 datorövning Projektarbete om insamling och analys av primärdata (3.5hp) Tentamen (4hp)

3 Kurslitteratur Huvudlitteratur Räkna på urval! av Anders Nordgaard Rekommenderad bredvidläsning Från datainsamling till rapport av Karin Dahmström Skriftlig tentamen 28 november – Hjälpmedel: ”fusklapp” och miniräknare Aktivt deltagande i arbete och redovisning av projektarbetet Examination

4 Dagens föreläsning(ar) Introduktion till statistisk surveymetodik Repetition – Populationer, urval (stickprov) – Variabler (typer, skalor) – Diagram – Chitvå-test – Beskrivande mått Introduktion till projektet Insamling av primärdata

5 Population och urval Målpopulation Den population som vi vill undersöka Rampopulation Den population som vi faktiskt kan undersöka Urvalsram (Eventuellt) register över rampopulationen Urval Urval av enheter från rampopulationen Urvalsenhet De enheter man undersöker (ex individer, företag)

6 Variabler och Skalor Diagram Variabler: Kvalitativa eller Kvantitativa Nominalskala Ordinalskala Intervallskala Kvotskala Diagram: Stapeldiagram Stolpdiagram Cirkeldiagram Histogram

7 Exempel Företagshälsovården vid ett företag sänder ut en enkät där de anställda bland annat får svara på frågan Resultaten sammanställs i följande tabell Åsikt (x)Antal (f) Mycket goda42 Ganska goda61 Varken bra eller dåliga84 Ganska dåliga23 Mycket dåliga10 Totalt220 Hur bedömer Du Din närmaste chefs ledaregenskaper? ( ) Mycket goda ( ) Ganska goda ( ) Varken bra eller dåliga ( ) Ganska dåliga ( ) Mycket dåliga

8 Att åskådliggöra fördelningen för en kvalitativ variabel: stapeldiagram

9 Alternativ metodik för att åskådliggöra fördelningen för en kvalitativ variabel: cirkeldiagram

10 Exempel En annan fråga på enkäten löd Resultaten sammanställs enligt Antal dagar (x)Antal (f)Andel (%) Totalt220100% Hur många dagar i veckan motionerar Du? ( ) Ingen ( ) 1 ( ) 2 ( ) 3 ( ) 4 ( ) 5 ( ) 6 ( ) 7

11 Att åskådliggöra fördelningen för en diskret kvantitativ variabel: stolpdiagram Stolpdiagrammet är likt stapeldiagrammet, men ritas med smalare staplar

12 Exempel Dygnsmedeltemperatur (grader Celsius) i centrala Linköping under juli månad Dag Temp Dag Temp Dag Temp Dag Temp Dag Temp

13 Att åskådliggöra fördelningen för en kvantitativ variabel: histogram

14 Tänk på att inte ”kapa” diagram!

15 Exempel Vid ett experiment lät man 51 personer välja vilken av tre informationsbroschyrer A, B eller C man fann mest informativ och pålitlig. Följande resultat erhölls. Finns det några skillnader i popularitet mellan broschyrtyperna på 5% signifikansnivå? BroschyrAntal personer (f) A13 B21 C17 Totalt51

16 Chitvå-test för analys av frekvenstabell där V = antalet grupper i frekvenstabellen

17 Chitvåtest för analys av frekvenstabell

18 Minitab: Stat -> Tables -> Chi-Square Goodness-of-Fit Test Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: C1 Test Contribution Category Observed Proportion Expected to Chi-Sq N DF Chi-Sq P-Value

19 Exempel Finns det ett samband mellan föräldrarnas politiska åskådning och ens egen? Man drog ett OSU om 365 personer och frågade dels om moderns, dels om ens egen politiska tillhörighet (vänster eller höger). Följande resultat erhålles. Går det att på 5% signifikansnivå att påvisa något samband mellan respondenternas och föräldrarnas politiska åskådning? Modern vänsterModern höger Respondenten vänster Respondenten höger 6759

20 Exempel (forts)

21 Chitvåtest för korstabell Krav: det råder oberoende mellan cellerna. Innebörden är att samma element (person) inte får förekomma i flera celler i tabellen max 20% av de förväntade frekvenserna är mindre än 5 alla förväntade frekvenser är större än 1 Steg 1: Välj signifikansnivå och formulera hypoteser H 0 : Det finns inga skillnader i fördelning mellan grupperna (alternativt: det finns inget samband mellan grupperna) H a : Det finns skillnader i fördelning mellan grupperna (alternativt: det finns samband mellan grupperna)

22 Chitvåtest för korstabell

23 Minitab: Stat -> Tables -> Chi-Square Test Chi-Square Test: C1; C2 Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts C1 C2 Total Total Chi-Sq = 4.934; DF = 1; P-Value = 0.026

24 Krav för att använda chitvå-test 1.Oberoende 2.Max 20% av de förväntade frekvenserna < 5 3.Alla förväntade frekvenser > 1 Hur gör vi om inte dessa krav uppfylls? Strategi 1: (Logisk) Sammanslagning Exempel: Hur många träningspass i veckan genomför du? K12 (9.68)10 (12.58)0 (2.90)8 (4.84) M8 (10.32)16 (13.42)6 (3.10)2 (5.16) Förväntade frekvenser inom parentes K12 (9.68)10 (12.58)8 (7.74) M8 (10.32)16 (13.42)8 (8.26)

25 Beskrivande mått för variabler Beskrivande mått används för att sammanfatta en variabels fördelning. Olika metoder används beroende på variabelns skala. Exempel: En population består av 8 socialdemokrater (kodat som 1) 10 moderater (2) 4 folkpartister (3) 1 miljöpartist (4)

26 Variabler på nominalskala Typvärde Andelar Konfidensintervall för andelar * Hypotesprövning för andelar * * = beräknas på olika sätt beroende på vilken undersökningsdesign vi valt.

27 Variabler på ordinalskala Median Kvartiler Kvartilavstånd Andelar Konfidensintervall för andelar * Hypotesprövning för andelar * * = beräknas på olika sätt beroende på vilken undersökningsdesign vi valt.

28 Kontinuerliga variabler Medelvärde Standardavvikelse Median Kvartiler Kvartilavstånd Andelar Konfidensintervall för medelvärde * Konfidensintervall för andelar * Hypotesprövning för medelvärde * Hypotesprövning för andelar * * = beräknas på olika sätt beroende på vilken undersökningsdesign vi valt.

29 Samband mellan variabler på nominalskala eller ordinalskala dvs kvalitativa variabler Chitvå-test Korrelationskoefficient Regressionsanalys Samband mellan kontinuerliga variabler

30 Projektarbete – insamling och analys av primärdata: Syfte Syfte: att träna i första hand planering men också genomförande av en statistisk undersökning av den typ som ofta används för att inskaffa underlag för beslut. Tyngdpunkten i genomförandet ligger på konstruktion av frågeformulär bearbetning och analys av insamlade data (primärdata) rapportering (muntligt och skriftligt), särskilt resultatredovisning i tabeller och diagram och tolkning av dessa. Projektet genomförs i grupper om 4-5 personer.

31 Projektarbete – insamling och analys av primärdata: Tillvägagångssätt Definiera ett undersökningsproblem. Definiera målpopulation och översätt denna i en rampopulation. Bestäm hur urvalet ska dras. För detta projekt krävs att få in svar från 50 personer per gruppmedlem. Fundera över vilka data som behövs för att man ska kunna besvara frågeställningarna och hur data ska bearbetas och analyseras. Glöm ej att fundera över hur bortfall så långt som möjligt ska undvikas, hur bortfallet kan undersökas och hur effekter av det slutliga bortfallet ändå ska hanteras.

32 Projektarbete – insamling och analys av primärdata: Tillvägagångssätt (forts) Konstruera frågeformulär. Frågeformuläret ska bestå av omkring frågor som är relevanta för problemområdet. Genomför datainsamling Genomför datorbearbetning av insamlade data. Använd särskilt korstabellering (inklusive chitvå ‑ test) och illustrativa diagram, så att olika samband kan beskrivas och studeras. Det kan också, beroende på undersökningsproblemet, vara intressant att analysera samband mellan kvantitativa variabler med hjälp av regressionsanalys. Skriv en rapport.

33 Projektarbete – insamling och analys av primärdata: Rapport I rapporten ska följande finnas formulering av undersökningsproblemet med kort problembakgrund undersökningsplan enkäten faktiskt genomförd bearbetning och analys av undersökningsdata med hjälp av tabeller, diagram och beskrivande mått, liksom analyser med chitvå-test och eventuellt regressionsanalys. något om hur bortfallet kan tänkas påverka resultaten slutsatser, där det är viktigt att tillse att frågeställningarna i inledningen faktiskt besvaras. Rapporten ska vara på ca 20 sidor plus bilagor.

34 Projektarbete – insamling och analys av primärdata: Enkätseminarium Under detta seminarium kommer enkäterna och dess frågor att diskuteras. Grupperna presenterar (väldigt) kort sitt undersökningsproblem så att seminariedeltagarna blir insatta i vad som ska undersökas, och därefter redovisas de olika enkätfrågorna med tillhörande motiveringar. Denna presentation görs med fördel med hjälp av Powerpoint och beräknas ta ungefär 10 minuter per grupp. Därefter kommenterar opponentgruppen enkäten och slutligen får övriga deltagare komma med synpunkter. De olika synpunkter som tas upp på detta seminarium tar grupperna med sig och fortsätter utveckla sin enkät. När de anser sig klara med enkäten skickas den till handledaren (Lotta) för slutligt godkännande. Datainsamlingen får ej påbörjas innan handledare godkänt enkäten!

35 Projektarbete – insamling och analys av primärdata: Projektseminarium Vid projektseminariet redogör varje arbetsgrupp för sitt arbete, och en opponentgrupp kommer med synpunkter och därefter vidtar diskussion. Respektive författargrupp redovisar sitt arbete under cirka 15 minuter. Enkäten samt viktiga tabeller och/eller diagram visas med PowerPointstöd. Opponentgruppen ska noggrant ha läst igenom rapporten, reflekterat över den och ska under opponeringen lyfta fram några viktiga synpunkter. Härefter följer diskussion av arbetet med tyngdpunkt på metodfrågor under ca 15 minuter. Opponentgruppen ska också skriftligen (ca en sida) förse författare och lärare med sina synpunkter på rapporten, och denna text överlämnas i samband med opponeringen. Det råder obligatorisk närvaro vid projektseminariet och för att bli godkänd på projektarbetet krävs aktivt deltagande i både redovisning och opponering.

36 Projektarbete – insamling och analys av primärdata: Tidplan HållpunktMoment V 44 måndag  Projektintroduktion, gruppindelning. V 44 tisdag  Gruppindelning definitiv. Inlämning av förslag till undersökningsproblem. V 44 onsdag-torsdag  Definition av målpopulation och urvalsdesign klar.  Börja med frågeformuläret.  Datorlaboration om inmatning av enkätdata och analys av sådana. V 44 fredag  Arbete med frågeformulär, inklusive pilotundersökning. V 45 tisdag Enkätseminarium. Enkäten skickas senast måndag 10:00 till:  opponentgruppen  Lärare V 45 torsdag - fredag V 46 måndag - tisdag  Datainsamling V 46  Sammanställning av inkomna frågeformulär: kodning och analys.  Rapportskrivning V 47 tisdag Rapport klar! Skickas senast tisdag 12:00 till:  opponentgruppen  Lärare V 47 torsdag  Seminarium med redovisning.

37 Om enkäter och enkätkonstruktion En enkätundersökning genomförs genom att till slumpmässigt utvalda individer sprida ett frågeformulär med i förväg konstruerade svarsalternativ för att sedan med statistiska metoder bearbeta denna information och dra slutsatser om populationen som stickprovet dragits ur. Data från en enkätundersökning är exempel på primärdata, till skillnad från information som redan är insamlat, vilket kallas sekundärdata. Viktiga begrepp är, precis som vanligt inom statistiken, population och urval (stickprov): vi definierar en population som vi önskar dra slutsatser om och drar sedan ett urval (om inte populationen är så liten och välavgränsad att alla individer i populationen kan undersökas. Resultaten från urvalet används för att dra slutsatser om populationen. Även begreppet variabel spelar en stor roll: när vi genomför en enkätundersökning betraktas varje fråga som en variabel.

38 Förberedelser Första steget i arbetet med en enkätundersökning är att formulera undersökningens syfte och översätta detta syfte i en problemformulering. Problemformuleringen kan med fördel uttryckas i form av en punktlista med konkreta men övergripande frågor. Problemformuleringen har en nyckelroll vid konstruktion av enkäter. Nästa steg är att definiera målpopulation, den grupp av individer som vi vill dra slutsatser om och omsätta målpopulationen i en rampopulation, som utgörs av de individer som vi faktiskt vet (åtminstone i teorin) att vi kan få tag i. Vi väljer sedan en lämplig urvalsdesign (för mindre undersökningar oftast OSU) för att ur rampopulationen kunna göra ett stickprov som är så representativt för målpopulationen som möjligt. Fundera på klusterurval, stratifierat urval eller OSU.

39 Enkätkonstruktion 1.Inled enkäten med bakgrundsfrågor (ålder, kön och liknande). 2.Eftersträva enkelhet i frågorna: korta, koncisa frågor som är neutralt formulerade. 3.Håll nere antalet frågor. För denna undersökning – omkring frågor. 4.Se till att det finns svarsalternativ för samtliga tänkbara åsikter på varje fråga. 5.Undvik att låta respondenten ”hoppa” för mycket i enkäten (av typen Du som svarat ”Nej” på fråga 12, gå direkt till fråga 15). Konstruera istället enkäten så att man successivt betar av respondenterna efter hur de indelas av enkätfrågorna. 6.Undvik att be respondenten att rangordna svarsalternativ (frågor av typen Sätt en etta på det tvättmedel du helst köper, en tvåa på det som du näst helst köper och så vidare). 7.Avsluta gärna enkäten med en öppen fråga.

40 Följeinformation Informera i introduktionsbrev (följebrev) eller i enkätens ingress alltid om Vad undersökningen handlar om. Vem som har skickat enkäten (och på vems uppdrag). När enkäten senast ska besvaras. Varför det finns identifikationsnummer, om sådant finns. Identifikationsnummer används ofta vid postenkäter, för att man ska veta vilka som har besvarat enkäten och vilka som behöver få en påminnelse. Var, när och hur man kan ta del av resultaten av undersökningen. Vem man ska vända sig till (namn och telefonnummer) om man har frågor eller problem att fylla i enkäten. (Ej nödvändigt om undersökningen genomförs genom på stan-urval). Tänk i detta sammanhang på att aldrig utlova anonymitet i studien – för det kan aldrig garanteras. Däremot kan och bör man se till att de ifyllda enkäterna hanteras konfidentiellt och detta bör också framgå i introduktionsbrevet eller ingressen.

41 Bortfallshantering Totalbortfall När enkäten inte har besvarats alls. Totalbortfall inträffar på grund av att respondenten inte har tid, vilja eller möjlighet att besvara enkäten. Det kan också bero på problem med det register som har använts, exempelvis genom att registret är föråldrat så att den utvalda respondenten inte bor kvar på den adress enkäten utsänts till och därmed aldrig får den. Partiellt bortfall När en eller flera av frågorna på enkäten inte har besvarats eller inte har besvarats korrekt. Partiellt bortfall inträffar särskilt på känsliga frågor, exempelvis sådana som berör respondentens ekonomi.

42 Bortfallshantering Redan innan enkäten sänds ut finns det flera åtgärder som kan vidtas för att minska bortfallet. Lägg mycket arbete på utformningen av introduktionsbrevet och enkäten. Se till att layouten är snygg och professionell. Se till att det finns tillräckligt med tid för respondenten att besvara enkäten. Skicka ut minst en påminnelse. Ge en belöning om man svara på enkäten, t ex en trisslott. Att lotta ut en belöning är inte tillåtet.

43 Hansen-Hurvitz bortfallsplan Vid totalbortfall Dra ett OSU (stickprovsstorleken bestäms av tid och ekonomi) bland de som fått en enkät men inte svarat på den. Kontakta dessa respondenter på ett annat sätt än det tidigare. Vanligt är att använda telefonintervju i detta steg. För att spara tid kan man nöja sig med att bara ställa de viktigaste frågorna till de respondenter som vi får kontakt med i denna fas. Den stora frågan när det handlar om bortfall är kan bortfallet betraktas som slumpmässigt? Genom att separat studera data från den ursprungliga undersökningen och bortfallsuppföljningen kan vi utreda om det föreligger några markanta skillnader mellan materialen eller om bortfallet kan betraktas just som slumpmässigt. Vi kan ta ett steg ytterligare genom att väga ihop resultaten från den ursprungliga undersökningen och bortfallsuppföljningen. Detta görs genom att använda metodik för stratifiering, där vi betraktar de som svarade i den ursprungliga undersökningen som ett stratum och de som besvarade bortfallsuppföljningen som ett annat stratum.

44 Substitution Vid totalbortfall eller partiellt bortfall Om antalet svarande är så pass litet att ingen analys kan göras kan man tillämpa substitution. Man fyller då på med respondenter som vill svara tills önskad urvalsstorlek uppnåtts. Det inses att man därmed inte får reda på om bortfallet kan betraktas som slumpmässigt: individer som tillhör den grupp som av ett eller annat skäl inte vill besvara enkäten i första urvalet kommer heller inte att vilja göra det vid substitutionen. Det är därför viktigt att fundera över om urvalet efter substitution kommer att vara representativt för målpopulationen.

45 Kodning Kodning innebär att översätta svarsalternativen på varje fråga i sifferform, och att mata in dessa siffror i en statistisk programvara i datorn. Den som kodar har stor frihet, men även här kan några generella råd ges. Fundera på hur variabler ska kodas när enkäten konstrueras och innan den lämnas ut. Börja sedan med att tilldela varje enkät ett löpnummer. Detta löpnummer skrivs också in i första kolumnen i programvaran. Arbetsbladet i den statistiska programvaran läggs sedan upp på ett sådant sätt att varje kolumn innehåller en fråga och varje rad en respondents enkätsvar. I vissa fall upptar en fråga flera kolumner

46 Kodning av frågor med endast ett tillåtet svarsalternativ Exempel: Vilken är Din huvudsakliga sysselsättning? ( ) Anställd( ) Egen företagare ( ) Studerande( ) Pensionär/långtidssjukskriven ( ) Arbetslös( ) Annat, nämligen ……………… Vi har alltså att göra med en kvalitativ fråga (variabel) eftersom svarsalternativen ej fås i sifferform. Frågan kodas med löpnummer 1, 2, 3, 4, 5 eller 6. Kommentarer skrivna under alternativet annat skrivs in i en egen kolumn eller i ett separat dokument. Kommentarerna kan inte analyseras med statistiska metoder men bör ändå sammanställas och presenteras i rapporten. Innehar företaget F-skattesedel? ( ) Ja ( ) Nej En sådan fråga kodas vanligen enligt Ja = 1, Nej = 0 Om frågan dessutom skulle ha ett Vet ej-alternativ kodas detta exempelvis med 2. Försök så långt det är möjligt att konstruera frågor med endast ett tillåtet svarsalternativ, för det är denna typ av frågor som är enklast att analysera.

47 Kodning av frågor med flera tillåtna svarsalternativ Eftersom flera svarsalternativ är tillåtna inses att kodning med löpnummer ej skulle fungera. Lösningen är istället att låta varje svarsalternativ utgöra en egen kolumn på arbetsbladet och om ett specifikt alternativ är markerat kodas det som 1, annars som 0. Nackdelen med frågor med flera tillåtna svarsalternativ är att det är svårt att göra några statistiska analyser, bortsett från diagram, av resultaten. Frågor av denna typ bör därför så långt det är möjligt undvikas. Exempel: Vilka av följande faktorer anser Du tala för internethandel? Fyll gärna i flera alternativ. ( ) Möjlighet att handla när och var som helst( ) Lägre priser ( ) Enkelt att jämföra varor( ) Tidsvinst ( ) Stort utbud av varor( ) Bekvämt att få varorna hemkörda ( ) Annat, nämligen ……………………………( ) Vet ej

48 Öppna frågor Exempel: Vad är Din månadsinkomst före skatt? ……………………………… kr Vad är Din månadsinkomst före skatt? ( ) Upp till kr( ) kr ( ) kr( ) kr ( ) kr( ) Mer än kr Skriv in resultaten på arbetsbladet som de är, men för analysernas skull är det ofta nödvändigt att klassindela variabeln i efterhand. Alternativt:  Fördel: för respondenten mindre utelämnande att besvara en så pass känslig fråga som inkomst med ett kryss i ett intervall än att faktiskt skriva in den exakta summan  Nackdel: på förhand kan det vara svårt att bestämma klassernas bredd och att man därför råkar få väldigt många kryss i en enda klass, vilket försvårar eller omöjliggör analys av korstabeller baserade på frågan.

49 Kodning av partiellt bortfall Om svar saknas på en fråga där respondenten inte förutsätts svara (legalt partiellt bortfall) sätts en speciell bortfallskod. Denna väljer man ofta som ett negativt tal som ligger långt borta från de vanliga siffrorna man kodar med, ofta  99. Vid analys måste de legala partiella bortfallen tas speciell hänsyn till, normalt genom att de tas bort ur tabeller och diagram. Om svar saknas på en fråga där respondenten förutsätts svara (illegalt partiellt bortfall) lämnas cellen tom eller. / *. Exempel: Fråga 7: Använder Du internetbank? ( ) Ja( ) Nej Om Du svarade Nej på fråga 7, fortsätt till fråga 9. Om Du svarade Ja, fortsätt till fråga 8. Fråga 8: Hur länge har Du använt internetbank? ( ) Upp till 1 år( ) 2-3 år ( ) 4-5 år( ) 6 år eller fler

50 Statistisk bearbetning 1.Rita diagram över svarsfördelningen på varje fråga. Viktigt: ta hänsyn till vilken typ av fråga (variabel) det handlar om, eftersom olika diagramtyper används för kvalitativa, diskreta kvantitativa och kontinuerliga kvantitativa variabler. 2.Beräkna beskrivande mått för varje fråga. Även här är det viktigt att hålla reda på vilken variabeltyp respektive fråga är av. 3.Sök samband. Bilda korstabeller (kvalitativa variabler) eller beräkna korrelationskoefficienten/gör regressionsanalys (kvantitativa variabler). 4.Bilda, där så är intressant, konfidensintervall och genomför hypotesprövning.

51 Arbetsgång 1.Formulera syfte och problemformulering samt genom att definiera målpopulation och rampopulation. 2.Välj om undersökningen ska göras som en totalundersökning, där samtliga enheter i populationen ska ingå, eller som en urvalsundersökning, i vilken ett urval av enheter undersöks. Vi måste också välja urvalsstorlek och denna bestäms framförallt av tillgänglig tid och budget. 3.Utforma enkäten. 4.Vi prövar nu vår enkät på ett litet antal försökspersoner – vi gör en så kallad pilotundersökning. Korrigera enkäten efter vad som framkommer här. 5.Genomför datainsamling genom att skicka ut enkäten. Genomför bortfallsuppföljning. 6.Koda in svaren i statistisk programvara. 7.Analysera resultaten utifrån syfte och problemformulering. rapport. 8.Ge självkritik, genom att kritiskt betrakta ditt arbete och fundera över vad som fungerade bra och vad som kunnat göras annorlunda eller kanske bättre.


Ladda ner ppt "Surveymetodik 732G04 Lärare: Ann-Charlotte (Lotta) Hallberg."

Liknande presentationer


Google-annonser