Skånes Universitetssjukhus

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
MEDELVÄRDE, MEDIAN & TYPVÄRDE
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Vetenskaplig utveckling Läkarprogrammet KI HT 2010 termin 4
Workshop i statistik för medicinska bibliotekarier!
Kap 4 - Statistik.
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
Sammanfatta siffrorna…
Skattningens medelfel
Grundläggande Biostatistik
Experimentell utvärdering Språkteknologisk forskning och utveckling (HT 2006)
Förelasning 1 Kursintroduktion Statistiska undersökningar
Centrala Gränsvärdessatsen:
FK2002,FK2004 Föreläsning 2.
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Sannolikhet Stickprov Fördelningar
FL6 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Normalfördelningen och centrala gränsvärdessatsen
Övningsexempel till Kapitel 7 Ex 1. BRÄNNBOLLSDILEMMAT ! En person funderar över hur man bäst uppskattar 28 meter. Av erfarenhet vet han att hans steglängd,
Grundläggande statistik ht 09, AN
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Statistik Lars Valter Fil.lic. Statistik
Mål Matematiska modeller Biologi/Kemi Statistik Datorer
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
732G22 Grunder i statistisk metodik
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
Grundläggande statistik, ht 09, AN
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
Lägesmått. Lägesmått Vad är lägesmått? Sammanfatta en mängd data Exempelvis hur mycket veckopengar får elever som går i åk7… En klass består av ca.
Medicinsk statistik Läkarprogrammet HT Medicinsk statistik Varför behöver Ni kunskap i medicinsk statistik? Självständigt arbete Kunna tolka resultat.
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Vetenskaplig metod Statistik 1. VAD ÄR STATISTIK? 2. DESKRIPTION 3. URVAL 4. STATISTISK INFERENS OCH HYPOTESPRÖVNING a) t-test b) ickeparametriska test.
Deskription Normalfördelningsmodellen 1. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
1. Kontinuerliga variabler
1 Numeriska Deskriptiva Tekniker. 2 Centralmått §Vanligtvis fokuserar vi vår uppmärksamhet på två typer av mått när vi beskriver en population: l Centraläge.
Sannolikhet och statistik Tabell Används för att ge en bra överblick av svaren man fått in, datan. Består av rader och kolumner. Frekvens Är hur många.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
DESKRIPTION Bearbeta, tolka och redovisa resultat. Vad ingår? Tabeller - Sammanfatta material Diagram - Åskådliggöra material Lägesmått - ”Genomsnitt”
Introduktion. 2 Vad är statistik? ”En massa siffror” Beskrivning av staten Metodlära.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Kap 4 - Statistik.
Marknadsundersökning Kap 12
Data och att presentera data
Fördelning av data och index
Förelasning 1 Kursintroduktion Statistiska undersökningar
Grundläggande begrepp
Ett verktyg för systematisk uppföljning i missbruksbruksvården
Y 5.4 Tabeller och diagram Frekvens och relativ frekvens
Presentationens avskrift:

Skånes Universitetssjukhus Medicinsk statistik I Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus

Medicinsk statistik Varför behöver Ni kunskap i medicinsk statistik? Självständigt arbete Framtida arbete Kunna tolka resultat från andra studier Analysera data Presentera resultat …

Medicinsk statistik LITTERATURTIPS Jonas Björk ”Praktisk statistik för medicin och hälsa”

Beskrivning Analys Slutsats Stickprov Stickprov Målpopulation Datainsamling Beskrivning Deskriptiv statistik Analys Analytisk statistik Slutsats

Vilka personer gäller resultatet för? Gruppen personer som man vill kunna dra slutsatser om kallas målpopulation Exempel på målpopulationer: Personer som kommer till akuten med bröstsmärtor Barn under 5 år Rökare Typ 2-diabetiker

Systematiska fel - bias Kan ge fel tolkning av resultatet Olika typer av systematiska fel: Urvalet inte är representativt för populationen Icke-slumpmässigt urval Bortfall Felaktigheter i datainsamling Fel svar från apparatur Otydligt formulerade enkätfrågor Bristande jämförbarhet i de grupper som jämförs Skillnader i utgångsläge mellan patientgrupper

Undersökningsupplägg Undersökningen påverkar skeendet Experiment, tex klinisk prövning Undersökningen påverkar inte skeendet Observationsundersökning Tvärsnittsundersökning Longitudinell undersökning

Observationsundersökning Påverkar inte skeendet utan jämför grupperingar som har uppstått utan påverkan Rökare jämfört med icke rökare Boende i stad jämfört med boende på landsbygd Personer med en viss diagnos jämfört med personer utan den diagnosen Gruppskillnaden behöver inte bero på den faktor vi vill studera

Experiment - Randomisering Slumpvis bestämning av vilka patienter som får vilken av två (eller flera) behandlingar Är ofta lämpligt vid kliniska prövningar Ger två grupper som är lika vid start-tillfället och eventuella skillnader som uppstår kan antas bero på behandlingseffekten

Placeboeffekt Patientens förväntade effekt av behandlingen Kan medföra att effekt kan observeras av verkningslös behandling Kontrollgrupp kan användas för att skilja på behandlingseffekt och placeboeffekt Bäst att låta kontrollgruppen använda nuvarande behandling, ”gold standard” Blindning Enkelblind Dubbelblind

Datatyper Kontinuerliga data – mäts på en intervallskala Exempel: Vikt, längd, ålder, blodtryck Diskreta data – data som mäts på en intervallskala men bara kan anta vissa värden Exempel: Antal barn, antal bakterier

Datatyper Ordinaldata – klassdata/kategoriindelning med rangordning Exempel: klassificering av smärta enligt låg – måttlig – hög – outhärdlig, 1 – 2 – 3 – 4 Ej säkert att 2-1 = 3-2 Ej säkert att 4 är dubbelt så mycket som 2 Nominaldata – klassdata/kategoriindelning utan rangordning Exempel: Kön, bostadsort, behandlingsgrupp

Beskrivning Analys Slutsats Stickprov Stickprov Målpopulation Datainsamling Beskrivning Deskriptiv statistik Analys Analytisk statistik Slutsats

Deskriptiv statistik Beskrivning av materialet Grafiskt Figurer Numeriskt Genomsnittsmått Spridningsmått

Genomsnittsmått Lägesmått, centralmått, tyngdpunkt Var ligger tyngdpunkten? Hur kan tyngdpunkten anges?

Genomsnittsmått Medelvärde Median Summan av observationerna dividerat med antalet observationer Median Den mittersta observationen om observationerna sorteras i storleksordning

Medelvärde eller median ? Valet görs utifrån hur data ser ut Symmetriska data på intervallskala Asymmetriska data på intervallskala Ordinaldata

Symmetriska kontinuerliga data Medelvärde = Median Exempel: Födelsevikt, längd I figuren: Medelvärde = 24 Median = 24 Använd medelvärdet!

Asymmetriska kontinuerliga data Data är skevt åt höger eller åt vänster Medelvärdet < Medianen Medelvärdet > Medianen I figuren: Medelvärdet = 8 Medianen = 5 Använd medianen!

Utfall på ordinalskala – Exempel Modified Ranking Scale – Grad av handikapp efter stroke (Hacke et al. 2008) Använd medianen! (Kasner 2006)

Varför inte alltid använda medelvärdet? Exempel I en enkätundersökning fanns följande fråga: Hur ofta tränar du? Aldrig 0 poäng 0 poäng 1-4 gånger i månaden 1 poäng 1 poäng eller 5-8 gånger i månaden 2 poäng 3 poäng Mer än 8 gånger i månaden 3 poäng 6 poäng Medelvärdet blir beroende av hur man kodar variabeln!

Nominaldata Här är lägesmått inte meningsfulla. I figuren: Malmö = 24% (60) Göteborg = 50% (125) Stockholm = 26% (65) Ange andelar och antal!

Sammanfattning Lägesmått Symmetriska data Medelvärde Asymmetriska data Median Ordinaldata

Spridning Liten spridning Stor spridning

Spridningsmått Beskriver hur pass koncentrerade data är kring centralvärdet Olika mått används för symmetriska och asymmetriska data Symmetri – spridningsmått baseras på medelvärde Asymmetri – spridningsmått baseras INTE på medelvärde

Spridningsmått Standardavvikelse, genomsnittliga avvikelsen från medelvärdet Percentiler och kvartiler, delar data i bestämda proportioner Variationsvidd, differensen mellan max och min

Percentiler Beskriver hur stor andel av observationerna som ligger under värdet 10% ligger under 10:e percentilen 20% ligger under 20:e percentilen etc. Kvartiler delar upp data i fyra lika stora delar; Undre kvartil = Övre kvartil =

Sammanfattning Lägesmått Spridning Symmetriska data Medelvärde Varians/ Standardavvikelse Asymmetriska data Median Percentiler Ordinaldata

Hur vet vi om det är symmetriskt? Grafiskt se om värdena ser symmetriska ut, tex med histogram eller boxplot (lådagram) Medianen och medelvärdet skall vara lika Avståndet mellan median och symmetriska percentiler skall vara lika stora, t.ex. jämföra avståndet av övre kvartilen med medianen och undre kvartilen med medianen. Dessa avstånd skall vara lika. Max Övre kvartil Median Undre kvartil Min

Normalfördelningen Referensintervall X=medelvärde S=SD=standardavvikelse Referensintervall Medelvärdet ± 1 SD täcker 68% av data Medelvärdet ± 2 SD täcker 95% av data Medelvärdet ± 3 SD täcker 99.7% av data

Beskrivning Analys Slutsats Stickprov Stickprov Målpopulation Datainsamling Beskrivning Deskriptiv statistik Analys Analytisk statistik Slutsats

Punktskattning Stickprovet används för att skatta värden i studiepopulationen - Medelvärdet är exempel på en punktskattning.

Skattningar – standardfel (medelfel) Varje skattning har en osäkerhet Osäkerheten kan mätas med standardfelet (standard error, SE) SE för medelvärde: s = standardavvikelsen n = antal observationer Ju större n ju mindre blir SE

Standardfel - exempel Medellängden hos individer i två populationer Stor spridning Patienter i ett väntrum på en akutmottagning Medelvärde=150cm; standardavvikelse=25 Liten spridning Barn i årskurs 5 Medelvärde=150cm; standardavvikelse=10

Standardfel - exempel Patienter i ett väntrum på en akutmottagning Elever i årskurs 5 Medel=150, s=10 Medel=150, s=25 100 observationer Medel = 150,4 s = 28,9 SE = 2,9 100 observationer Medel = 149,2 s = 8,6 SE = 0,9 10 observationer Medel = 141,2 s = 32,4 SE = 10,2 10 observationer Medel = 149,2 s = 8,2 SE = 2,6

Konfidensintervall Konfidensintervallets bredd beror av SE kan användas för att beräkna ett konfidensintervall (KI) Med en viss säkerhet täcker konfidensintervallet det sanna värdet Konfidensintervallets bredd beror av Storleken på SE (och därmed antalet individer i stickprovet samt spridningen) Konfidensgraden – hur säker man vill vara

Konfidensintervall Om man gör 100 konfidensintervall med konfidensgrad 95% så kommer i genomsnitt 95 av de 100 intervallen att innehålla den sanna parametern.

Beräkning av konfidensintervall Generell formel för konfidensintervall Skattning ± konstant*SE Konfidensgrad på 90% ger en konstant = 1.64 Konfidensgrad på 95% ger en konstant = 1.96 Konfidensgrad på 99% ger en konstant = 2.58 Konstanterna kommer från Normalfördelningen.

Konfidensintervall Exempel Patienter i ett väntrum på en akutmottagning Tar ut ett stickprov på 100 individer Beräknar ett 95% KI Med 95 procent säkerhet finns den genomsnittliga längden i den underliggande målpopulationen mellan 144.7 och 156.1 cm. Det ”sanna” medelvärdet ligger med 95% säkerhet i intervallet medelvärdet ± 2*SE

Referensintervall Ett referensintervall säger något om spridningen i studiepopulationen Istället för att använda SE används standardavvikelsen, s.

Referensintervall Exempel Stickprov om 100 individer till patienter i ett väntrum på en akutmottagning Beräkning av 95% referensintervall = 150,4 ± 1.96*28.9 = [93.8; 207.0] 95% av målpopulationen bör vara mellan 94 och 207 cm ”medelvärde ± 2* standardavvikelser ” täcker 95% av data i studiepopulationen

Sammanfattning Konfidensintervall och referensintervall är beräknade baserat på data från stickprovet men drar slutsatser om studiepopulationen! KONFIDENSINTERVALL: Medelvärdet i studiepopulationen ligger med 95% säkerhet inom gränserna REFERENSINTERVALL: 95% av studiepopulationen har ett värde inom gränserna

Förutsättningar för konfidens – och referensintervall Stickprovet måste vara representativt för studiepopulationen Kontinuerlig data måste vara approximativt normalfördelade Stickprovet är normalfördelat eller Stickprovet stort

T-fördelningen Konstanten c=1.96 i formeln Medelvärdet ± c*SE kommer från den standardiserade normalfördelningen vid konfidensgraden 95% För små stickprov blir KI för snäva, går inte upp till den önskade konfidensgraden Hur löser vi det?

T-fördelningen Vi löser det genom att använda t-fördelningen med n-1 frihetsgrader för att bestämma konstanten c - Ex. om vi har n=10 så blir antalet frihetsgrader 10-1=9 I en tabell kan man ta reda på att c=2.26

T-fördelningen En fördelning som mycket påminner om normalfördelningen men som för små stickprov gör att vi bättre uppnår den önskade konfidensgraden Vad är små stickprov?

Tumregel - stickprovsstorlek Antal oberoende observationer Tumregel n<20 Beräkna bara konfidensintervall om det sedan tidigare är känt att den variabel som studeras är normalfördelad. Använd t-fördelningen med n-1 frihetsgrader för att bestämma konstanten c n: 20-50 Beräkna konfidensintervall om mätvariabeln är någorlunda normalfördelad. Använd t-fördelningen med n-1 frihetsgrader för att bestämma n>50 Konfidensintervall kan beräknas oavsett hur variabeln som undersöks är fördelad i studiepopulationen. Den standardiserade normalfördelningen ger fortfarande något för låga värden på c; skillnaden jämfört med korrekta värdet hämtat från t-fördelningen är dock försumbart

Hur gör vi med data som inte är kontinuerliga/normalfördelade?

Exempel Ett nytt läkemedel ska testas. Hur många kände sig bättre av det nya läkemedlet?

Konfidensintervall för en andel Antag att q = punktskattningen q är andelen i stickprovet, q ligger mellan 0-1 Konfidensintervall för andelar beräknas n=antalet individer i stickprovet c=konstant (samma som i tidigare beräkningar) Förutsättning: q*(1-q)*n > 10

Konfidensintervall för en andel Exempel: Ett nytt läkemedel ska testas. Hur många kände sig bättre av det nya läkemedlet? En studie med 100 individer, n=100 q=andel som kände sig bättre av det nya läkemedlet. q=70% Konfidensgrad=95% c=1.96

Exempel fortsättning 95% KI: 95% KI: 61% - 79%