2013 HT, dagtid Statistiska institutionen

Slides:



Advertisements
Liknande presentationer
Seminarieboken Kapitel 4 – Metodmedvetenhet
Advertisements

Inferens om en population Sid
Naturvetenskap.
Från Fanta till Fleece Lokal pedagogisk planering Biologi åk 5
Deduktion och induktion ”Välgrundade” vetenskapliga (slut)satser förutsätter giltiga eller åtminstone trovärdiga slutledningar.
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
Vetenskaplig Metod.
”Språk, lärande och identitetsutveckling är nära förknippade
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
Statistikens grunder, 15p dagtid
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inferens om en ändlig population Sid
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Statistikens grunder, dagtid
Vetenskaplighet En gissning blir inte vetenskap för att den råkar visa sig vara sann. Vetenskap handlar om att ge tillräckligt goda /rimliga skäl för att.
Karl Popper ( ) Tre världar, Poppers ”kosmologi” Värld 1 består av fysiska objekt inklusive biologiska varelser. Värld 2 består av.
Del 1: Naturvetenskap s. 6-7
Forsknings- och utvärderingsmetoder, 15 hp
Kunskap 2 Egna upplevelser
Skattningens medelfel
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 6 Hypotesprövning
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statsvetenskap 3, statsvetenskapliga metoder
Föreläsning 4: Sannolikhetslära
Sannolikhet Stickprov Fördelningar
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Grundläggande statistik ht 09, AN
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Några allmänna räkneregler för sannolikheter
732G22 Grunder i statistisk metodik
Formellt, skarpt och snyggt
Krav på vetenskaplig tolkning
Metod i samhällsvetenskap
Klassificeringen av vetenskaper bygger åtminstone delvis på skillnader i metodik. Klassificeringen av vetenskaper kan även baseras på forskningsområden.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Lars Madej  Talmönster och talföljder  Funktioner.
Introduktion. Exempel: Till ett försök med bantningsmedlet Bantomid anmälde sig 14 personer frivilligt, alla med övervikt. De delades slumpmässigt in.
Metod i samhällsvetenskap s Ur centralt innehåll och kunskapskrav  Tillämpning av samhällsvetenskapliga begrepp, teorier, modeller och metoder.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Diskreta slumpvariabler. Stokastiskvariabel En slumpvariabel (stokastisk variabel) är en Funktion eller regel som tilldelar ett tal till varje Utfall.
1 Metodpraktikan Del II Hur man samlar in och analyserar data kapitel 15 Källkritik Esaiasson, Peter, Gilljam, Mikael, Oscarsson, Henrik & Wängnerud, Lena.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
1 UNDERSÖKNINGSMETODIK Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Statistiska undersökningar kan vara.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
STATISTISK METODIK 1. INLEDNING / VAD ÄR STATISTIK? 2. UNDERSÖKNINGSMETODIK 3. DESKRIPTION 4. SAMBAND.
4 processer att behärska:
Kemins karaktär och arbetssätt
generellt deduktion induktion specifikt Deduktiva slutsatser är giltiga och med nödvändighet och sanna, om premisserna är sanna. Induktiva slutsatser.
Statistikens grunder 1 (dagtid)
Grundlägande statistik,ht 09, AN
Att skriva uppsats Metodfrågor.
Grundläggande statistik och dataanalys, 732G45
Ett verktyg för systematisk uppföljning i missbruksbruksvården
Presentationens avskrift:

2013 HT, dagtid Statistiska institutionen F1 Statistikens grunder 2013 HT, dagtid Statistiska institutionen

Webbsajt och kursinfo http://www.statistics.su.se ⟹ Student ⟹ Kurshemsidor ⟹ Statistikens grunder, dagtid Läs kursbeskrivningen! MONDO: https://mondo.su.se/portal ⟹ Logga in, välj kursen/fliken ”Statistikens grunder, dag” 2018-09-19 Michael Carlson, Statistiska institutionen

Kurslitteratur Nyquist, H., ”Statistikens grunder, kompendium” (N) finns att ladda ner på kurshemsidan & Mondo Thurén, T. (2007), ”Vetenskapsteori för nybörjare”, 2:a upplagan, Liber: Stockholm (T) Övrigt kursmaterial såsom övningstentor, instruktioner till datorövningarna m.m. läggs löpande ut på Mondo 2018-09-19 Michael Carlson, Statistiska institutionen

Lärare på kursen Michael Carlson Kursansvarig, föreläsare, examinator Karl Hellström Övningslärare Grupp A Lisa Nikiforova Övningslärare Grupp B Karin Stål Övningslärare Grupp C Mikael Havasi Övningslärare Grupp D 2018-09-19 Michael Carlson, Statistiska institutionen

Kursens upplägg Kursen består av fyra moment i två block: SG1: Moment 1: tentamen (6 poäng) Salsskrivning + frivillig uppgift Moment 2: inlämningsuppgift (1,5 poäng) Två deluppgifter som redovisas skriftligt och första även muntligt SG2: Moment 3: tentamen (6 poäng) Moment 4: inlämningsuppgift (1,5 poäng) Två deluppgifter som redovisas skriftligt 2018-09-19 Michael Carlson, Statistiska institutionen

Kursens upplägg Frivillig inlämningsuppgift Ger bonuspoäng på Moment 1 resp. 3 Övningsuppgifter som lämnas in skriftligt; sedan rättar ni någon kurskamrats lösning Betyg: Moment 1&3: A, B, C, D, E, Fx ,F Moment 2&4: Godkänd, Underkänd Slutbetyg på hela kursen enligt Kursbeskrivningen 2018-09-19 Michael Carlson, Statistiska institutionen

Betyg SG2 A B C D E SG1 + Godkänt på Moment 2 och 4 2018-09-19 Michael Carlson, Statistiska institutionen

Kursens innehåll SG1: Vetenskap, modeller, kunskapsbildning Lite matematik, repetition Sannolikheter utfallsrum, händelser, sannolikheten för en händelse Stokastiska variabler, slumpvariabler diskreta och kontinuerliga 2018-09-19 Michael Carlson, Statistiska institutionen

Kursens innehåll SG2: Deskription, beskrivande statistik Sampling, centrala gränsvärdessatsen (CGS) Estimation, punktskattning och intervallskattning Hypotesprövning Chi-två metoden (χ2-metoden) Tidsserier och index Beslutsteori 2018-09-19 Michael Carlson, Statistiska institutionen

Vad är det som krävs i tid? Lärarledd undervisning - föreläsningar 223 - räkneövningar 217 - datorlabbar 26 92 h Läsning egen tid 100 h Övningar/inluppar Restid ca 70 h Totalt 362 h Nio veckor heltid 360 h 2018-09-19 Michael Carlson, Statistiska institutionen

Matematik Allmän räknefärdighet, använda lite sunt förnuft, t.ex. bedöma om en lösning verkar rimlig eller ej Förstå vad en formel säger, kunna uttrycka sig med hjälp av formler Elementär algebra, funktioner, summatecken, mängdlära, kombinatorik, potenser och logaritmer Lästips: ”Mot bättre vetande i matematik”, Dunkels et al. Studentlitteratur, 3.e uppl. Ej kurslitteratur på Statistik I, men se avsnitt 1-3 och 5 Kurslitteratur på Statistik II 2018-09-19 Michael Carlson, Statistiska institutionen

Sannolikheter och slumpförsök SG1 Vi kommer att tala om sannolikheter i samband med slumpförsök. Ett slumpförsök är ett försök, som kan upprepas under likartade förhållanden, och där resultatet vid varje enskild upprepning inte kan förutsägas med säkerhet. ”Försök” i vid mening (aktivitet, process, förlopp) 2018-09-19 Michael Carlson, Statistiska institutionen

SG1 Sannolikheter, forts. Exempel på slumpförsök: Tärningskast (1, 2, 3, 4, 5 eller 6) Lottdragning (vinst eller förlust) Befruktning av äggcell (pojke eller flicka) Radioaktivt sönderfall (antal partiklar under ett visst tidsintervall) Industriell tillverkning av en enhet (fungerar eller trasig) Slumpmässigt urval från en population (vilka blir utvalda) 2018-09-19 Michael Carlson, Statistiska institutionen

SG1 Stokastisk variabel En stokastisk variabel är en kvantitativ variabel (numerisk, tal, siffror) vars värde bestäms av ett slumpförsök. Annat namn: slumpvariabel Utfallet av slumpförsöket bestämmer vilket värde (tal) den stokastiska variabeln ska anta. Vi kan i förväg ange vad som möjliga värden och sannolikheterna för dessa. 2018-09-19 Michael Carlson, Statistiska institutionen

Stokastisk variabel, forts. SG1 Exempel på stokastiska variabler: Antal prickar vid ett kast med en tärning Summan av antal prickar vid två tärningskast Antal kast tills man för första gången får en sexa Antal flickor i en slumpmässigt vald trebarnsfamilj Längden hos ett slumpmässigt valt nyfött barn Livslängden hos en slumpmässigt vald glödlampa Årsinkomsten i ett slumpmässigt valt hushåll Vilka är de möjliga värdena för dessa stokastiska variabler? 2018-09-19 Michael Carlson, Statistiska institutionen

Stokastisk variabel, forts. SG1 En diskret stokastisk variabel kan anta ett ändligt antal möjliga värden eller oändligt men uppräkneligt antal värden (”listbara”). En kontinuerlig stokastisk variabel kan anta alla värden inom ett intervall på den reella talaxeln (intervallet kan ha ändlig eller oändlig utsträckning). 2018-09-19 Michael Carlson, Statistiska institutionen

Sannolikhetsfördelningar SG1 Utifrån ganska standardmässiga slumpförsök och experiment kan vi definiera de möjliga utfallen och dessas sannolikheter. ⟹ dvs. stokastiska variabler En funktion där man för ett givet utfall x kan beräkna sannolikheten att just det ska inträffa mha sannolikhetsfördelningen: f(x) = P(X = x) = sannolikheten 2018-09-19 Michael Carlson, Statistiska institutionen

Inferens = slutledning, att dra en slutsats Statistisk inferens SG2 Inferens = slutledning, att dra en slutsats En slutledning är en process vid vilken man från ett antal premisser och i kraft av en slutledningsregel framställer en slutsats. Statistisk inferens handlar om slutledning om det generella mha av en ändlig uppsättning observationer, dvs. ett stickprov, samt osäkerheten kring slutsatsen. 2018-09-19 Michael Carlson, Statistiska institutionen

Statistisk inferens, forts. SG2 Inferensteori baseras på sannolikhetsteorin. Kvantifiering av osäkerheten i slutsatserna, dvs. ge ett mått på hur säkert/osäkert ett resultat är. Underlag för prediktioner och beslut. Vad är den genomsnittliga inkomsten i Stockholm? Är det säkert att Centern har gått upp? Ska jag köpa aktie A eller B? Eller en portfölj? 2018-09-19 Michael Carlson, Statistiska institutionen

Statistisk inferens, forts. SG2 Punktskattning skatta genomsnittlig inkomst för män och kvinnor Intervallskattning ge ett osäkerhetsintervall för skillnaden i inkomst Hypotesprövning pröva om det är statistiskt säkerställt att män har högre inkomst än kvinnor pröva om val av bilmärke är oberoende av ålder 2018-09-19 Michael Carlson, Statistiska institutionen

Studiebesök på SCB 7 oktober kl 13-15, anmälan till studievagledare@stat.su.se senast 1 oktober Först till kvarn, mer information kommer! 2018-09-19 Michael Carlson, Statistiska institutionen

Inledning till Statistik, N Kap 1 Att lära sig något från observationer Sammanfatta erfarenheter Dra slutsatser (inferens) Göra förutsägelser (prediktion) Fatta beslut Typiskt ofullständig information Vi kan inte fråga alla, vi har inte tid att pröva varje kombination ⟹ Statistiska metoder! 2018-09-19 Michael Carlson, Statistiska institutionen

Ofullständig information Population U stlk = N Stickprov s stlk = n Urval, stickprov (urvalsdesign d) Inferens: säga något generellt gällande för hela populationen med ledning av informationen i stickprovet 2018-09-19 Michael Carlson, Statistiska institutionen

Ofullständig information Modell M stlk → ∞ Stickprov s stlk = n Urval, stickprov (iid observationer) Inferens: säga något generellt gällande om en universell egenskap, datagenererande process eller ”superpopulation” (som typiskt beskrivs med hjälp av en modell) med ledning av informationen i stickprovet 2018-09-19 Michael Carlson, Statistiska institutionen

Varför observerar vi? Typ av studier: Deskriptiva, beskrivande (”så här ser det ut”) Förklarande, kausalitet (”för att”) Normativa , preskriptiva (”gör så här”) Explorativa syften, sökande efter (ny) kunskap Konfirmativa syften, bekräftande av kunskap Oavsett typ så är syftet att öka vår kunskap om omvärlden 2018-09-19 Michael Carlson, Statistiska institutionen

En idé Ta en titt i dagstidningen, webben, Text-TV … Hur många nyheter verkar bygga på en statistisk undersökning? Inferens? Är nyheten baserad på beskrivande, förklarande, eller normativ studie? Tänk brett: opinionsundersökning, medicinska experiment, registerdata … 2018-09-19 Michael Carlson, Statistiska institutionen

Inledning, forts. Statistiska undersökningar, dvs. insamling av data, observationer som studerar och analyserar för att (förhoppningsvis) ge oss de svar som vi söker. Ordet statistik kan avse själva metoderna men kanske oftare används det som benämning på samlingen av observationer eller snarare sammanfattningar av data med beskrivande mått och grafiska presentationer. 2018-09-19 Michael Carlson, Statistiska institutionen

Lite vetenskapsteori Thurén Kap 2: Vetenskapen söker sanningen Vetenskapen går ständigt framåt Dogmatism ”Detta är den (absoluta sanningen)” Relativism ”Sanningen förändras (på flera sätt) hela tiden, allstå finns ingen absolut sanning” 2018-09-19 Michael Carlson, Statistiska institutionen

Lite vetenskapsteori, forts. Thurén Kap 3: Definitioner Klargör alltid hur ni har definierat begreppen och vilka antaganden (premisser) som ligger bakom påståendena Annars kan inte din omgivning ta ställning till validiteten och reliabiliteten i dina påståenden 2018-09-19 Michael Carlson, Statistiska institutionen

Lite vetenskapsteori, forts. Thurén Kap 4: Iakttagelse och logik Empirisk kunskap dvs. det vi ser, hör, smakar, … vi drar slutsatser om det allmänna genom det vi ser per definition är detta ofullständig information slutsatsen är mer eller mindre trolig eller sannolik 2018-09-19 Michael Carlson, Statistiska institutionen

Lite vetenskapsteori, forts. Thurén Kap 4: Iakttagelse och logik Logik utgår ifrån premisser lagar som styr hur vi härleder slutsatser slutsatsen är alltid sann eller falsk premisserna kan vara mer eller mindre verklighetsförankrade 2018-09-19 Michael Carlson, Statistiska institutionen

Vetenskap, N Kap 2 Ett litet försök att bringa lite ordning bland begreppen. Kunskapstyper: Propositionell kunskap När föddes Astrid Lindgren? Icke propositionell kunskap Färdigheter (simning) Den här kursen: Kunskap = Propositionell kunskap Proposition = Påstående Ett begrepp inom logiken. Ett påstående kan vara sant eller falskt. 2018-09-19 Michael Carlson, Statistiska institutionen

Sanningsteori Vad är sanning? Korrespondensteori Sant om det finns en motsvarande verklighet eller fakta Koherensteori Sant om det ”hänger ihop” med andra etablerade sanningar, ska inte leda till paradoxer Ska höra till det system som är ”bäst” Pragmatism Satsens sanning ligger i dess brukbarhet 2018-09-19 Michael Carlson, Statistiska institutionen

Sanning och kunskap Ett påstående måste vara sant för att vara kunskap. Låter som en självklarhet? Motiveringen är att vi kan välja våra handlingar och nå de mål vi satt upp endast om vi väljer utifrån det vi vet är sant. 2018-09-19 Michael Carlson, Statistiska institutionen

Sanning Påstående som verkar vara sant Nya observationer, nya fakta Reviderat påstående Sanna påståenden Falska påståenden Vem bestämmer vad som är sant? Det vi tror är sant 2018-09-19 Michael Carlson, Statistiska institutionen

Epistemologi Läran om vad man kan veta och hur man når kunskap Rationalism Ren tankeverksamhet Empirism Genom observationer och erfarenheter 2018-09-19 Michael Carlson, Statistiska institutionen

Vetenskap Ordet vetenskap kan avse: Processen, dvs. hur får vi kunskap Resultatet av processen, den kunskap vi erhållit Vetenskaper kan delas in i: Generaliserande, nomotetiska Fysik, matematik, kemi, ekonomi, beteendevetenskaper, … Inte bara naturvetenskaperna! Partikulariserande, idiokratiska Enskilda händelser Historia, konsterna 2018-09-19 Michael Carlson, Statistiska institutionen

Vetenskap, forts. Även efter vilken typ av objekt som studeras: Formella Studerar konstruerade objekt Logik, matematik, (fysik) Empiriska Studerar verkliga objekt Medicin, ekonomi, historia, (fysik) Med objekt avses till vardags ofta ”saker” men även händelser och relationer studeras givetvis inom båda klasserna. 2018-09-19 Michael Carlson, Statistiska institutionen

Vetenskap, forts. Var placerar vi ämnet statistik? Som vetenskap har ämnet sin grund i matematik och logik: Generell och formell dvs. allmängiltig, nomotetisk konstruerade objekt (tal, sannolikheter) Men tillämpningen av statistiska metoder: Typiskt inom de generella och empiriska vetenskaperna baseras på empiriska observationer 2018-09-19 Michael Carlson, Statistiska institutionen

Sannolikheter ”Om gud har gjort världen till en fullkomlig mekanism, har han åtminstone givit så mycket till vårt ofullkomliga intellekt att vi, för att kunna förutsäga små delar av den, inte behöver lösa oräkneliga differentialekvationer, utan med hygglig framgång kan använda tärningar.” MAX BORN 2018-09-19 Michael Carlson, Statistiska institutionen

Vad är en teori? Betyder något mer än bara ett antagande eller hypotes Vardagligt: ”Månen är gjord av ost” är en proposition och inte en teori En teori är ett logiskt sammanhängande system av satser (påståenden) som beskriver relationer mellan väldefinierade objekt el. begrepp samt tolkningar av dessa relationer och objekt 2018-09-19 Michael Carlson, Statistiska institutionen

Teorier Formella vetenskaper Empiriska vetenskaper Axiom dvs. elementära grundantaganden som antas vara sanna Logiska härledningar ur sanna påståenden till nya sanningar Rationalism, koherens Empiriska vetenskaper Vedertagna sanningar, påståenden Logiska härledningar ur sanna påståenden till nya sanningar och prediktioner Måste verifieras empiriskt Empirism, korrespondens, korherens 2018-09-19 Michael Carlson, Statistiska institutionen

Bra teorier? En bra (empirisk) teori ska Vara så generell som möjligt Förklara så mycket som möjligt Möjliggöra verifierbara förutsägelser Ange riktlinjer (handling, beslutsunderlag) Men även Enkelhet och tydlighet (Occam’s razor) Objektivitet En teori brukar inte betraktas som sann eller falsk, snarare bedöms efter sin användbarhet (pragmatism) 2018-09-19 Michael Carlson, Statistiska institutionen

Vetenskapens utveckling Kumulativitet Att alla nya forskningsresultat (dvs. sanningar) läggs till den etablerade teorin Står ej i konflikt med det etablerade (koherens) Ny pusselbit som passar in Paradigmskiften Nya fakta som står i konflikt med etablerade sanningar (bristande koherens, korrespondens) Gamla påståenden ger ”falska” resultat eller felaktiga prediktioner Krävs en helt ny teori 2018-09-19 Michael Carlson, Statistiska institutionen