Fysikexperiment 5p Föreläsning 6 2005-10-19 01 Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i.

Slides:



Advertisements
Liknande presentationer
Inferens om en population Sid
Advertisements

Kap 1 - Algebra och linjära modeller
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Ellära Fysik 1 / A Översiktlig beskrivning av en del av innehållet i Ellära – Fysik A För djupare studier hänvisar jag till kurslitteratur som finns.
Numeriska beräkningar i Naturvetenskap och Teknik
Numeriska beräkningar i Naturvetenskap och Teknik
Matematik Kurs C Grafer och derivator.
Logikprogrammering Ons, 25/9
Olika mått på grad av fetma - Spelar det någon roll hur vi mäter?
MaB: Andragradsekvationer
Opinion Pension - Oro och levnadsstandard Maj 2008.
Beskrivande statistik för två beroende slumpvariabler
Vibeke Horstmann, Inst för hälsa, vård, samhälle, Centre for Ageing and Supportive Environments Jämförelse av två behandlingar.
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
2. Enkel regressionsanalys
Arbete, energi och effekt
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Logikprogrammering 21/10 Binära träd
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Binomialsannolikheter ritas i ett stolpdiagram
Statsvetenskap 3, statsvetenskapliga metoder
Föreläsning 5 Tekniker för riskhantering Portföljval Hedging
Täthetsfunktion f(x) (”pdf”) Och fördelningsfunktion F(x) (”cdf”)
KOMPLETTERING AV MA1202 MATMAT02bb OK8028 Versionsdatum:
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
N V M DIAGRAM Samband mellan q V och M
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
Hur bra är modellen som vi har anpassat?
Linjär regression föreläsning 9
F8 Hypotesprövning. Begrepp
F8 Hypotesprövning. Begrepp
Slumptal Pseudoslumptal Fysikexperiment 5p Föreläsning 2
Fysikexperiment, 7.5 hp1 Oviktad linjär anpassning Om är det bästa estimatet (enligt minsta kvadratmetoden) av parametrarna a och b: Uppskattat.
Fysikexperiment 5p Föreläsning Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 I allmänhet är den asymptotiska fördelningen.
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Matematisk statistik och signal-behandling - ESS011 Föreläsning 1 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Några allmänna räkneregler för sannolikheter
Hur ser universum ut? När vi tittar upp på himlen en natt så kan vi med blotta ögat se ett antal små prickar & ofta en större prick, månen. Den del av.
K9: sid. 1 Kapitel 9 Phillipskurvan, jämviktsarbetslösheten och inflationen   IDAG:   Arbetslöshet, priser och inflation.   Phillips-kurvan – en.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Verksamhetsrapport 2016 Verksamhet xx - medarbetare Svarsfrekvens Verksamhet xx 100% (100 svarande/100 mottagare) Svarsfrekvens AcadeMedia totalt 76% (6103.
Samband och förändring. Delen i procent Finns två metoder. Antingen räknar man först 1 % (genom att dividera med 100) och multiplicerar till den procenten.
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
  2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen.
Verksamhetsrapport 2016 Verksamhet xx - elever Svarsfrekvens Verksamhet xx 100% (1000 svarande/1000 mottagare) Svarsfrekvens AcadeMedia gymnasium 100%
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Kvantitativa forskningsmetoder Sociologi A VT 2015 Ilkka Henrik Mäkinen (momentansvarig)
1. Kontinuerliga variabler
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Korstabeller och logistisk regression Samband mellan kvalitativa variabler.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning –Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband.
Samband & Inferens Konfidensintervall Statistisk hypotesprövning
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
INFERENS OCH SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ.
Lite matterepetition Räknesätten, bråk, förkorta, parenteser
Att rita en funktion i ett koordinatsystem
Marknadsundersökning Kap 12
Aritmetik & algebra Geometri & bevis Förändring & procent Funktioner
Relation mellan variabler – samvariation, korrelation, regression
Grundläggande begrepp
Presentationens avskrift:

Fysikexperiment 5p Föreläsning Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i ett spridningsdiagram (eng. scatterplot). Varje observationspar blir en punkt i diagrammet. Till vardags används ordet korrelation ofta ungefär som synonym för samband. I mera strikt mening talar man om korrelation som ett uttryck för riktningen och styrkan hos ett linjärt samband. Variabler som uppvisar samband (som är korrelerade) är t.ex. Ålder och motorisk förmåga. – Längd och vikt. – Skolbetyg och yrkesframgång. – Inflammatoriska tillstånd och sänka. Det är viktigt att notera att man kan inte automatiskt sätta likhetstecken mellan siffersamband (korrelationsmått skilt från 0) och orsakssamband. Det faktum att två variabler är korrelerade bevisar inte att det föreligger ett orsaksförhållande mellan dem. Två variabler som är korre- lerade är också beroende. Motsatsen gäller dock inte: två variabler som är beroende kan vara okorrelerade. Positiv och negativ korrelation. 1.Det finns en positiv korrelation mellan längd och vikt; längd och vikt är positivt korrelerade. Samvariationen innebär att ju större längden är desto större är i allmänhet vikten och ju mindre längden är desto mindre är i allmänhet vikten. 2. Det finns ett negativt samband mellan ålder och ögats förmåga att anpassa sig till seende på 1.nära håll. Ju högre åldern i år är desto sämre är i allmänhet denna förmåga och ju lägre åldern är desto bättre är den i allmänhet. Korrelationens styrka Korrelation mäts med en korrelationskoefficient. Normalt kan denna anta värden mellan –1 och +1. Värdena –1 och +1 innebär att variablerna är fullständigt negativt korrelerade respektive fullständigt positivt korrelerade. Styrkan avtar ju mer värdet närmar sig 0. Värdet 0 anger nollkorrelation. Korrelationskoefficien Den vanligaste korrelationskoefficenten är produktmomentkorrelationskoefficienten. Den kallas ofta Pearsons korrelationskoefficient efter upphovsmannen, den brittiske statistikern Karl Pearson (1857–1936). En lämplig form för beräkningar är: Observera att detta är identiskt med vår tidigare definition (se problem 9.10 i läroboken):

Föreläsning 6 Fysikexperiment 5p Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 Det finns en uppenbar kvalitativ skillnad mellan dessa bägge datamängder. Hur skaffar vi oss en kvantitativ uppskattning av denna skillnad? Här ger vi ett exempel på observationspar i ett spridningsdiagram, dvs vi anger den ena variabeln på x-axeln och den andra på y-axeln. Datamängd 1 Datamängd 2

Fysikexperiment 5p Föreläsning Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 Vi beräknar korrelationskoeffi- cienten för de två fördelningarna och finner att i det första fallet blir r = - 0,016 och i det andra fallet blir r = -0,78. Vi citerar några lämpliga rader ur Appendix C i Taylor Sannolikheten att 50 par av okorrelerade variabler har |r| > 0,05 är mindre än 73% => det verkar relativt sannolikt att första bokstaven i gatunamnet inte har något att göra med de två sista siffrorna i telefonnumret. Sannolikheten att 25 okorrelerade par av variabler har |r| > 0.7 är mindre än 0,05% => vi kan utesluta (med mer än 99,5% sannolikhet) att breddgrad inte påverkar årsmedeltemperaturen, dvs med 99,5% sannolikhet gör den det. Korrelationskoefficienten, r, definieras som: För variabler som har en linjär relation kommer r att ligga nära ±1 (idealt exakt lika med ±1), linjära relationer med positiv riktningskoefficient har r = 1 (oavsett storleken på riktnings- koefficienten) och samband med negativ riktningskoefficient har r = -1. Poängen är att vi kan testa hypotesen om ett linjärt samband även om vi inte har någon uppfattning om mätfelen i de enskilda punkterna. Men korrelationskoefficienten har en vidare betydelse än så. r = 0 är ett nödvändigt, men inte tillräckligt, villkor för att två variabler skall vara oberoende. Finner vi r signifikant skilt från noll finns det däremot anledning att tro att variablerna i fråga inte är oberoende. Några exempel:

Föreläsning 6 Fysikexperiment 5p Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004 Ett exempel på korrelerade fel är osäkerheterna i parametervärdena vid en anpassning till en rät linje y = a + b·x alltså är a och b negativt korrelerade! a ökar b minskar RÄTT!

Fysikexperiment 5p Föreläsning Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005