Generaliserade linjära modeller, individvariationer och Rasch-modeller

Slides:



Advertisements
Liknande presentationer
Fritidshem Elever 2013 Fritidshem - Elever 2013 Enhet:
Advertisements

Talföljder formler och summor
Här ser ni några sidor som hjälper er att lösa uppgifterna:
Romersk skulptur Exempel Förutsättningar Kännetecken
Samhällsvetarkåren vid Lunds universitet Forum för internationalisering
Point Estimation Dan Hedlin
1 Tillämpning av Koden Innehåll •Undersökningens metod och uppläggning, inkl. bolagsurval •Sammanfattning •Genomgång av svar på fokusfrågor.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
1 Medarbetarenkät 2011 • 573 svar. 2 Kön 3 Jag är knuten till en klass, undervisningsgrupp eller barngrupp.
BENÄMNA lätta ord SPRÅKTRÄNING VID AFASIKg VIII
Leif Håkansson’s Square Dancer Rotation
Projektföljeforskning
Referensgruppsmöte Kvalitet i fältforskningen 2 oktober 2008
Eddie Arnold - Make The World Go Away Images colorées de par le monde Déroulement automatique ou manuel à votre choix 1 för dig.
Elkraft 7.5 hp distans: Kap. 3 Likströmsmotorn 3:1
Budgetpropositionen för 2013 Bertil Holmlund Nationalekonomiska institutionen Uppsala universitet Nationalekonomiska föreningen 24 september 2012.
Karolinska Institutet, studentundersökning Studentundersökning på Karolinska Institutet HT 2013.
1 Medarbetarenkät svar. 2 Kön 3 Jag är knuten till en klass, undervisningsgrupp eller barngrupp.
Kommunpussel Din uppgift är att sortera de organisatoriska delar på nästa sida på ett sådant sätt att det överensstämmer med hur din kommun är organiserad.
Statistikens grunder, 15p dagtid
V E R S I O N N R 2. 0 T A V E L I D É E R I M I L J Ö.
Bastugatan 2. Box S Stockholm. Blad 1 Läsarundersökning Maskinentreprenören 2007.
Enkätresultat för Fritidshem Föräldrar 2014 Skola - Hällby skola.
INFÖR NATIONELLA PROVET
Enkätresultat för Grundskolan Elever 2014 Skola:Hällby skola.
15 x 25 meter. Skriv banenavn Skriv designet af Skriv dato MÅL sväng vänster 6 sväng höger 5 runt 7 Vänster runt hund höger runt.
1 Vänsterskolan Debattartiklar. 2 Aktuell krok 3 Aktuella krokar 1. Direkt krok.
(2) Avvikelse från std. kostnad (5) Andel inv 65+ med insats (4) Andel 80+ i befolkningen (1) Kronor/ invånare (65+) (3) Kronor/ brukare (6) Ytterfall.
Hittarps IK Kartläggningspresentation år 3.
Från Gotland på kvällen (tågtider enligt 2007) 18:28 19:03 19:41 19:32 20:32 20:53 21:19 18:30 20:32 19:06 19:54 19:58 20:22 19:01 21:40 20:44 23:37 20:11.
Arbetspensionssystemet i bilder Bildserie med centrala uppgifter om arbetspensionssystemet och dess funktion
TÄNK PÅ ETT HELTAL MELLAN 1-50
Grundskola Elever 2013 Grundskoleenkät - Elever ( per klass)
Skattningens medelfel
Helhet Händelse Agerande Kunskap om vardagsverksamheten Förståelse av vardagsverksamheten.
1 Joomla © 2009 Stefan Andersson 1. 2 MÅL 2 3 Begrepp Aktör: en användare som interagerar med webbplatsen. I diagrammet till höger finns två aktörer:
Kouzlo starých časů… Letadla Pár foteček pro vzpomínku na dávné doby, tak hezké snění… M.K. 1 I Norrköping får man inte.
Best pictures on the internet 2007 Awards 1http:// Är vänsteralliansen trovärdig i Norrköping.
Student Ekonomi Erik Nygårds Hang-Jin Lee Vina Balaghi Projektarbete 2 732G22 Grunder i statistisk metodik Ht-08.
Enkätresultat för Fritidshem Elever 2014 Skola:Fritidselever, Gillberga skola.
Diskreta, deterministiska system Projekt 1.2; Vildkatt
Grundskola Föräldrar 2013 Grundskoleenkät - Föräldrar Enhet:Gillberga skola.
1(31) Ett omdiskuterat ämne. Vad är det som händer? 2.
Best pictures on the internet 2007 Awards 1http:// (s), (v), och (mp) i Norrköping, gillar inte att vi använder grundlagarna.
Styrteknik: Grundläggande logiska funktioner D2:1
BREDDAD REKRYTERING.
Vem som svarat på enkäten Fig 1. Män =75 år Boende Fig 2 Eget boende, ej hemtjänst Eget boende med hemtjänst.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Enkätresultat för Grundskolan Föräldrar 2014 Skola - Gillberga skola.
OpCon/xps - A case study. Club2200Page 1 OpCon/xps – A case study Club2200 Magnus Nyman & Hans Forslind.
Binomialsannolikheter ritas i ett stolpdiagram
Praktisk epidemiologi för allmänläkare
Sannolikhet Stickprov Fördelningar
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Vara kommun Grundskoleundersökning 2014 Föräldrar 2 Levene skola årskurs 5 Antal svar 2014 för aktuell årskurs i skola: 12 Antal svar 2014 för årskurs.
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
Räkna till en miljard 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14,15,16,17,18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, En miljard är ett.
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Föreläsning 12 Sökning och Sökträd.
Hur bra är modellen som vi har anpassat?
Förskoleenkät Föräldrar 2012 Förskoleenkät – Föräldrar Enhet:Hattmakarns förskola.
The information contained in this document is Volvo Aero Corporation Proprietary Information and it shall not – either in its original or in any modified.
Matematisk statistik och signal-behandling - ESS011 Föreläsning 3 Igor Rychlik 2015 (baserat på föreläsningar av Jesper Rydén)
Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S.
Bild 1 Prognos för länets arbetsmarknad Stefan Tjb.
1 Mönstermatchning och rekursion Nr 4. 2 Förenklad notation val fnname = fn name => expression Förenklas till fun fnname name = expression Exempel fun.
Grundskola Elever 2013 Grundskoleenkät - Elever Enhet: Gillberga skola.
1 Jan Lundström OV’s Hemsida Utbildning Ledare. 2 Jan Lundström OV’s Hemsida Standard Lagrum.
När infaller Julafton och hur ofta?
Presentationens avskrift:

Generaliserade linjära modeller, individvariationer och Rasch-modeller Sture Holm 2011-11-30

Linjära modeller Linjära modeller = parameterlinjära modeller Parametrar, ”inställningspunkter”, kontinuerliga eller diskreta Linjära ekvationssystem inga svåra numeriska problem Lättförståelig additivitet Klassisk normalteori

Generaliserade linjära modeller Fördelning, fördelningsparametrar, länkfunktion, linjärmodell Exempel: Poissonfördelning λ, positiv parameter, loglänk Exempel: Binomialfördelning p, parameter i intervallet (0;1), logistisk länk

Individvariation i linjär modell Oberoende och beroende Additiva felkomponenter i linjära modeller Alltid positiv korrelation i modellen ! Variationer inom individer och variationer mellan individer Stegvisa ”övergripande variationer” går in i flera observationer Försöksplaneringssynpunkter

Individvariation i generaliserad linjär modell Inte lika självklart Relation mellan variation inom och mellan Slumpvariansen i fördelningen behöver inte vara konstant i linjärmodellen ! Transformationen i generaliserade modellen behöver inte ge approximativt konstant varians

Variabeltransformationer för konstant varians Rottransformation ger approximativt konstant varians i Poisson Poisson λ=10, μ=3.12, σ=0.51 Poisson λ=25, μ=4.97, σ=0.50 Basal grundnivå ? Additivt tillskott i undersökningsgrupp Individvariation proportionell mot roten ur λ ? Binomialfördelning arksin-transformation ger approximativt konstant varians. Inte så bra för additiva tillskottsmodeller?

Lognormalfördelning Positiva variabler, logaritmen normalfördelad Oberoende multiplikativa effekter Större varians för större variabler Additiva effekter i normalmodellen är multiplikativa effekter för originalvariablerna Ett naturligt basval för positiva variabler, doch inte livslängdsvariabler

Individvariation kan ge ökad varians I Poisson- och binomialfördeningen syns individvariationen som ökad varians Poissonfördelning med λ=25, varians 25 100 observationer på individer med egna Poissonparametrar normala μ=25, σ=6 empirisk varians 59.4. Klart större än 25, tyder på individvariation Kan man få minskad varians i någon praktisk situation ?

I enstaka indikatorvariabler syns inte individvariationer Summan av 100 indikatorobservationer med p=0.6 har varians 4.9 Med individer som har 50 % sannolikhet för p=0.4 och p=0.8 har en slumpmässig individ också sannolikheten 0.5∙0.4+0.5∙0.8=0.6 och samma varians 4.9 Gäller på samma sätt även för kontinuerliga fördelningar för individeffekter (väntevärdet är lika med effektiva p-värdet)

Samspel mäter individvariation Två indikatorvariabler mäts för alla individer Indikation på individvariation om p10 p11 p1∙ p00 p01 p∙1

Binomiala och multinomiala fördelningar 1. Ej upprepade (0,1) 2. Flera lika eller olika (0;1) inom individ 3. Ej upprepad kategori-fördelning 4. Upprepad dito 5. Ej upprepad fördelning för ordnade kategorier 6. Upprepad dito Principiellt ingen individinformation i fallen 1, 3 och 5

Grundkomponenten i Rasch-modellerna En sannolikhet p beror av individeffekt Z som

Kan inte i sig själv identifieras Konstant sannolikhet utan variation och en fördelning (frekvensfunktion f(z)) med individeffekter kan inte särskiljas om Till exempel gruppskillnader ej mätbara ( och eller två fördelningar ??)

Rasch model….represents the structure which data should exhibit in order to obtain measurements…….different from statistical modelling…. Rasch model…..the objective to obtain data which fit the model. Rasch model is not altered to suit data. Instead the method of assessment should be changed… (grundbeskrivning i Wikipedia)

What is a Rasch Analysis What is a Rasch Analysis? The Rasch model, where the total score summarizes completely a person's standing on a variable, arises from a more fundamental requirement: that the comparison of two people is independent of which items may be used within the set of items assessing the same variable. Thus the Rasch model is taken as a criterion for the structure of the responses, rather than a mere statistical description of the responses. For example, the comparison of the performance of two students' work marked by different graders should be independent of the graders. (Introduction in rasch-analysis.com)

Rasch-analysen förutsätter en ”endimensionell” styrvariabel Äldre människors livskvalitet Kan lösa normalsvåra korsord Kan gå en tur i skogen för att plocka svamp Är det rimliga resultat av en och samma endimensionella styrvariabel för att mäta livskvalitet ?

Imputering används ofta i program This is how many specific-purpose statistical packages prepare the raw data for IRT analysis. These packages set aside any items or persons that provide no useful information for the analysis. They analyze the IRT model with the remaining data. From the solutions derived from the remaining data, these packages extrapolate to come up with estimates for items and persons first set aside. (www.unt.edu/rss/rasch_models)

Logittransformationen ger observationer i oändligheten för de maximala och minimala originalobservationerna Alternativa varianter? Avrundningsprincip för empiriska observationer? ”Delningstal” med en enhet mer? Jämför ordnade statistikor. Om jag är 176 cm lång, hur lång är jag då? N kontinuerliga likformiga (0,1). Den ordnade nummer j har väntevärdet j/(N+1)

Principförklaring av hur gemensam modell kan påverka KONTROLL BEHANDLING Dubbel förekomst (uppe till höger) har större andel än oberoende förklarar (1.4 resp 7.2). Indikerar individvariation. Gemensam modell ger ungefär balans mellan förekomsterna. Mellanfallen ((0,1) och (1,0)) skattas som ganska lika sannolika i Rasch-modellen. 6 4 78 12 19 11 57 13

Typisk individvariation för två ordningsvariabler Över oberoendefallet nära diagonalen och under oberoendefallet långt därifrån (positivt samspel) - +

Raschmodellen för ordnade kategorier Sannolikheten för kategori j där är en konstant, en individparameter en ”stegparameter” och en normering för individen. Vid flera ordnade variabler alla parametrar byts utom individparametern .

Figur över Raschmodellen för ordnade kategorier

För en enda ordnad kategorivariabel kan inte individeffekten skiljas från fördelningen på kategorier. ”Tänka-efter”-exempel: Kategorifördelning 0.2, 0.3, 0.4, 0.1 med 10% ”grannspill” kan inte skiljas från fördelningen 0.2-0.02+0.03=0.21, 0.3-0.06+0.02+0.04=0.30 0.4-0.08+0.03+0.01=0.36, 0.1-0.01+0.04=0.13

För samma individer i fristående 0-1-försök kommer individeffekten in i samvariationen För en ordnad kategorivariabel är samvariationen given av strukturen (kategoriresultat uteslutande, kumulativa resultat implicerande)

Principskillnad på summaskala och ordningsskala Ordningsskala uteslutande fall 5 möjligheter Summaskala 16 möjligheter 5 summor A B C D E 1 1 1 2 3 4 1 1

Logistiska metoder med kumulativa sannolikheter för ordningsvariabler För kumulativa sannolikheten för kategori j och bakgrundsvariabel x Man kan arbeta med alla ”brytningspunkter” simultant (Agresti) Eller betingade ”övergångssannolikheter” som i livslängdsproblem (McCullagh)

Stokastisk ordning Y är minst lika stor som X om för alla z

Inte lätt att genomskåda i massfördelning

Lehmann-alternativ Exponent på ”överlevnadssannolikhet” Tendens till värden över norm för och tendens till värden under norm för Koppling till Wilcoxon-parametern fundamentalt ickeparametriskt mått

Separata direktberäkningar Kontroll Behandling och analogt för övriga. P10 P11 P00 P01 q10 q11 q00 q01

Direkta skillnader mellan behandling och kontroll eller skillnader i logitskala genom räknelagar. Information om varje item och möjlighet till samtidig utsaga om båda.

Ett enkelt exempel Kontroll Behandling ”Radskillnad” 0.30-0.10 = 0.20 6 4 78 12 19 11 57 13 Kontroll Behandling ”Radskillnad” 0.30-0.10 = 0.20 Varians 0.0030 (SE 0.055) ”Kolonnskillnad” 0.24-0.16=0.08 Varians 0.0032 (SE 0.056) Kovarians 0.00062 (positiv !) Ingen modell för eventuell individvariation

Tillämpningssynpunkter på modellbyggnad och modellval Fundamentala grundkarakteristika för data måste man få in. Diskret eller kontinuerlig, positiv, betingade bidrag osv. Klassiska modeller med närhetskomplettering, andragradsterm, beroende osv. Ockhams rakkniv, så enkelt som möjligt (för både analys och förstående) ANALYSERA MÅLSÄTTNINGEN och inrikta modell och analys på den.

Några få författare och årtal om man vill fördjupa sig Rasch G. (Berkeley symposium 1961) Andrich D. (Biometrics 1979) Andersen E.B. (Scand Journ Stat 1982) Tjur T (Scand Journ Stat 1982) Agresti A. Categorical Data Analysis. (Wiley 1990) McCullagh P. (J Roy Stat Soc 1980) McCullagh P, Nelder J.A. Generalised Linear Models. (Chapman and Hall 1983)