Ladda ner presentationen
Presentation laddar. Vänta.
Publicerades avAnders Sandström
1
Fysikexperiment 5p Föreläsning 6 2005-10-19 01 Korrelationer Ett effektivt sätt att beskriva sambandet mellan två variabler (ett observationspar) är i ett spridningsdiagram (eng. scatterplot). Varje observationspar blir en punkt i diagrammet. Till vardags används ordet korrelation ofta ungefär som synonym för samband. I mera strikt mening talar man om korrelation som ett uttryck för riktningen och styrkan hos ett linjärt samband. Variabler som uppvisar samband (som är korrelerade) är t.ex. Ålder och motorisk förmåga. – Längd och vikt. – Skolbetyg och yrkesframgång. – Inflammatoriska tillstånd och sänka. Det är viktigt att notera att man kan inte automatiskt sätta likhetstecken mellan siffersamband (korrelationsmått skilt från 0) och orsakssamband. Det faktum att två variabler är korrelerade bevisar inte att det föreligger ett orsaksförhållande mellan dem. Två variabler som är korre- lerade är också beroende. Motsatsen gäller dock inte: två variabler som är beroende kan vara okorrelerade. Positiv och negativ korrelation. 1.Det finns en positiv korrelation mellan längd och vikt; längd och vikt är positivt korrelerade. Samvariationen innebär att ju större längden är desto större är i allmänhet vikten och ju mindre längden är desto mindre är i allmänhet vikten. 2. Det finns ett negativt samband mellan ålder och ögats förmåga att anpassa sig till seende på 1.nära håll. Ju högre åldern i år är desto sämre är i allmänhet denna förmåga och ju lägre åldern är desto bättre är den i allmänhet. Korrelationens styrka Korrelation mäts med en korrelationskoefficient. Normalt kan denna anta värden mellan –1 och +1. Värdena –1 och +1 innebär att variablerna är fullständigt negativt korrelerade respektive fullständigt positivt korrelerade. Styrkan avtar ju mer värdet närmar sig 0. Värdet 0 anger nollkorrelation. Korrelationskoefficien Den vanligaste korrelationskoefficenten är produktmomentkorrelationskoefficienten. Den kallas ofta Pearsons korrelationskoefficient efter upphovsmannen, den brittiske statistikern Karl Pearson (1857–1936). En lämplig form för beräkningar är: Observera att detta är identiskt med vår tidigare definition (se problem 9.10 i läroboken):
2
Föreläsning 6 Fysikexperiment 5p 02 2005-10-19 Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 Det finns en uppenbar kvalitativ skillnad mellan dessa bägge datamängder. Hur skaffar vi oss en kvantitativ uppskattning av denna skillnad? Här ger vi ett exempel på observationspar i ett spridningsdiagram, dvs vi anger den ena variabeln på x-axeln och den andra på y-axeln. Datamängd 1 Datamängd 2
3
Fysikexperiment 5p Föreläsning 6 2005-10-19 03 Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005 Vi beräknar korrelationskoeffi- cienten för de två fördelningarna och finner att i det första fallet blir r = - 0,016 och i det andra fallet blir r = -0,78. Vi citerar några lämpliga rader ur Appendix C i Taylor Sannolikheten att 50 par av okorrelerade variabler har |r| > 0,05 är mindre än 73% => det verkar relativt sannolikt att första bokstaven i gatunamnet inte har något att göra med de två sista siffrorna i telefonnumret. Sannolikheten att 25 okorrelerade par av variabler har |r| > 0.7 är mindre än 0,05% => vi kan utesluta (med mer än 99,5% sannolikhet) att breddgrad inte påverkar årsmedeltemperaturen, dvs med 99,5% sannolikhet gör den det. Korrelationskoefficienten, r, definieras som: För variabler som har en linjär relation kommer r att ligga nära ±1 (idealt exakt lika med ±1), linjära relationer med positiv riktningskoefficient har r = 1 (oavsett storleken på riktnings- koefficienten) och samband med negativ riktningskoefficient har r = -1. Poängen är att vi kan testa hypotesen om ett linjärt samband även om vi inte har någon uppfattning om mätfelen i de enskilda punkterna. Men korrelationskoefficienten har en vidare betydelse än så. r = 0 är ett nödvändigt, men inte tillräckligt, villkor för att två variabler skall vara oberoende. Finner vi r signifikant skilt från noll finns det däremot anledning att tro att variablerna i fråga inte är oberoende. Några exempel:
4
Föreläsning 6 Fysikexperiment 5p 04 2005-10-19 Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2004 Ett exempel på korrelerade fel är osäkerheterna i parametervärdena vid en anpassning till en rät linje y = a + b·x alltså är a och b negativt korrelerade! a ökar b minskar RÄTT!
5
Fysikexperiment 5p Föreläsning 6 2005-10-19 05 Utdrag ur Sten Hellmans föreläsning i Experimentella Metoder 2005
Liknande presentationer
© 2024 SlidePlayer.se Inc.
All rights reserved.