Beskrivande statistik för två beroende slumpvariabler

Slides:



Advertisements
Liknande presentationer
ETT SÄTT ATT BESKRIVA VERKLIGHETENS SITUATIONER MED MATEMATIK
Advertisements

Akustik eller läran om Ljud
1 Plan för ny panelmatris och större panel och hösten 2005 Presentation för Referensgruppen 22 juni 2005.
Tolkutbildningar inom folkbildningen
Rummet som medium Åsa Thelander Fil.dr.. Vad ska vi diskutera?  Rummet som medium - betydelse  Olika perspektiv på rummet  Rummet i förhållande till.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Arbete och effekt Vad är arbete Vad är effekt Vilka enheter
Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
FL3 732G81 Linköpings universitet.
Linda Wänström och Elisabet Nikolic (Karl Wahlin)
Dette har skjett i tidigere episode:
Undersökningsmetodik och statistisk dataanalys, grundnivå, 15 p VT 2008.
Tomas Johansson, Kyrkerörsskolan, Falköping –
Skala Jenny Malmjärn, Fisksätraskolan, Saltsjöbaden –
Vad är  ? Och vad har man det till?. Nio uppgifter Välj en av dessa nio uppgifter och utför den så bra du kan. Välj en av dessa nio uppgifter och utför.
Robert Gidehag & Jonas Arnberg. Studiens frågeställningar Övergripande: Är den svenska alkoholpolitiken effektiv på 2000-talet?
Workshop i statistik för medicinska bibliotekarier!
Vad ingår kursen? i korta drag
Tillämpad statistik Naprapathögskolan
1 Föreläsning 7 Repetition Instansvariabler och klassvariabler Klassmetoder och Instansmetoder.
Kraft och tryck Sid
Bilden av Östersund Östersunds befolkning oktober 2008.
Förelasning 1 Kursintroduktion Statistiska undersökningar
FK2002,FK2004 Föreläsning 2.
Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.
Binomialsannolikheter ritas i ett stolpdiagram
Neonatalvårdens resultat, redovisat per region PNQ:s årsrapport 2007 Vårdresultat, samtliga gestationsåldrar Rapporten omfattar samtliga vårdtillfällen.
Skala ToM Anders Pallin.
Täthetsfunktion f(x) (”pdf”) Och fördelningsfunktion F(x) (”cdf”)
Åska Moln Nederbörd Fronter Vind 1pt 1 pt 1 pt 1pt 1 pt 2 pt 2 pt 2pt
ORDET AREA BETYDER STORLEKEN AV ETT OMRÅDE
Hur bra är modellen som vi har anpassat?
Resistans Resistorsymbolen skrivs på två sätt:
Välkomna Bakgrund Vad ska vi förhålla oss till?  Attraktiv stadsmiljö  Affärs- /Näringslivsverksamhet  Trafiksäkerhet  Cyklister  Gående.
Några allmänna räkneregler för sannolikheter
Regressions- och tidsserieanalys
Allmänheten om skolan En rapport om allmänhetens syn på vissa skolfrågor. Juni 2015.
1 Normalfördelningsmodellen. 2 En modell är en förenklad beskrivning av någon del av verkligheten. Beskrivningen måste vara relevant för det vi skall.
1 Stokastiska variabler. 2 Variabler En variabel är en egenskap hos en individ /objekt. En variabel kan, som vi tidigare sett, vara kvalitativ eller kvantitativ.
Manada.se Förändringshastighet och derivator. Förklara och använda begreppet lutning ändringskvot manada.se.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Samband och förändring. Delen i procent Finns två metoder. Antingen räknar man först 1 % (genom att dividera med 100) och multiplicerar till den procenten.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Vad är Statistik? Inom statistik teorin studeras -Hur vi samlar in data. -Hur data analyseras och vilka slutsatser som kan dras från data. -Hur insamlad.
Manada.se Kapitel 4 Ekvationer och formler. 4.1 Ekvationer och uttryck.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)
1. Kontinuerliga variabler
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
EFTER DAGENS LEKTION SKA NI HA LÄRT ER OM Tyngdpunkt, hur man hittar den och hur man ritar kraftpilen som påverkar föremålet Stabilitet och stödyta och.
Lite matterepetition Räknesätten, bråk, förkorta, parenteser
Kostnader sjuklighet Östergötland 2006 milj kr
X 4.6 Hur stor är delen? Andelen = Delen Det hela Delen =
Att beskriva en tabell/ en figur/ ett diagram
Vetenskapsprojekt, rubrik
Multipel regression och att bygga (fungerande) modeller
Relation mellan variabler – samvariation, korrelation, regression
Förelasning 1 Kursintroduktion Statistiska undersökningar
Vad ingår kursen? i korta drag
Samband mellan ohälsa i munnen och MNA ≤ 7 – data från Senior alert Jan 2013 – Juli Dennis Nordvall Statistiker, Qulturum.
Kundprofil - statistik som beskriver företagets kundkrets
Öppna jämförelser – Grundskola 2018
Grundläggande begrepp
Presentationens avskrift:

Beskrivande statistik för två beroende slumpvariabler Vi har som ex observerat X = antal kvadrat-meter och Y = hyrans storlek på 20 lägenheter. För att illustrera hur dessa två variabler hör ihop ritar vi ett spridningsdiagram (scatter plot)

I grafen ser vi ett positivt beroende mellan variablerna I grafen ser vi ett positivt beroende mellan variablerna. Stora värden på x medför stora värden på y. Ex på samband Antal rum ----- yta på lägenhet Utbildningsnivå ----- lönenivå Hastighet ----- bromssträcka Valreseultat ----- antal pos löften Tillgång till vaccin ----- antal sjuka Befolkningstäthet ----- brottslighet Attityd ------ kön Blodtryck ----- ålder Höjd över havet ----- temperatur

Anta att vi har n observationer på två s.v. X och Y. Skrivs Med hjälp av dessa n observationer kan vi beräkna sen sk korrelations-koefficienten r som är ett mått på hur starkt två variabler hänger ihop. -1<r<1

Ex: 10 obs på flickors x = vikt, y = längd x 63 52 72 57 63 54 49 57 61 51 y 165 161 170 163 169 164 161 161 165 162

Vi räknar ut r

Korrelationskoefficienten har egentligen sammansättningen Måttet på beroende ligger alltså i täljaren och så standardiserar vi med stickprovsstandardavvikelserna för x och y för att få ett tal som är lättolkat. Det finns en teoretisk korrelation mellan slumpvariabler som vi kallar r (rå), men först

Vi sammanställer Datamaterial Medelvärde Stickprovsvarians Teori Stickprovsstandaravvikelse s Korrelationskoefficient r Teori Väntevärde E[X] Varians Var[X] Standardavvikelse Korrelation r

Kap4,4 Teoretisk korrelation r

läses; Kovariansen mellan slumpvariablerna X och Y. Kovariansen mäter det linjära beroendet mellan X och Y. Den standardiserade kovariansen är korrelationen r. Kovariansen beräknas via där

Vi tittar återigen på ex med lägenheterna X = antal rum i en lägenhet X och Y är beroende, dvs de är relaterade till varann X 1 2 3 p(y) Y 1 0,45 0,05 0 0,05 0,25 0,20 0,50 p(x) 0,50 0,30 0,20 1,00

Detta värde är svårtolkat. Är 0,3 stort eller litet?

Beräkna r Detta är enklare att förstå. Vi har ganska stark positiv korrelation.

Kap 4,5 En linjär kombination mellan två slumpvariabler ser ut som där a,b,c är konstanter Vi ska främst studera specialfallet X+Y och summan av n st s.v. Först tittar vi på hur man kan finna sannolikhetsfördelningen för X+Y via ett ex

Vid ett lotteri kan en lott ge vinst på 0, 20 och 100kr Vid ett lotteri kan en lott ge vinst på 0, 20 och 100kr. Låt oss dra två lotter. Vinstchansen är lika vid de båda dragningarna X= vinsten på 1:a lotten Y= vinsten på 2:a lotten X och Y är oberoende X 0 20 100 p(y) Y 20 100 0,5625 0,18 0,0075 0,18 0,0576 0,0024 0,0075 0,0024 0,0001 0,75 0,24 0,01 p(x) 0,75 0,24 0,01 1,00

Bestäm sannolikhetsfördelningen för totala vinsten S=X+Y= totala vinsten på två lotter ex p(20)=0,18+0,18 p(120)=0,0024+0,0024 s 0 20 40 100 120 200 p(s) 0,5625 0,36 0,0576 0,015 0,0048 0,0001

Anta nu lite mer allmänt att vi har n st s.v. som vill tar summan på. Om dessa n s.v. är oberoende så gäller Där