y=β0 + β1·x1 + β2·x2 + β3·x3 + β4·x4 + β5·x32 + ε

Slides:



Advertisements
Liknande presentationer
PTS Bredbandskartläggning
Advertisements

Talföljder formler och summor
Resultat av brukarenkäter 2012 Funktionsstöd. Svarsfrekvens.
Kap 1 - Algebra och linjära modeller
Innehåll, huvudpresentation 4. Rangordning av ordningsstörningar (fråga 1) 5. Problem med nedskräpning (fråga 1a) 6. Problem med skadegörelse (fråga 1b)
Joomla © 2009 Stefan Andersson 1. Kontaktformulär  På varje seriös webbplats bör det finnas ett kontaktformulär.  Använd ej maillänkar, risk för spam!
Konstföreningen Dragning På sista sidan finns konstnärerna för respektive tavla.
BENÄMNA lätta ord SPRÅKTRÄNING VID AFASIKg VIII
Kund: Akademikerförbundet SSR Kontakt: Stina Andersson/Linus Isaksson
Hur bra är modellen som vi har anpassat?
Tillämpning av bolagsstyrningskoden vid årsstämmor 2005 och 2006.
The regression equation is Price = Area Acres Rooms Area*Rooms Baths Area*Baths Predictor Coef SE Coef.
Regressions- och tidsserieanalys
Hela Sverige ska leva Totalrapport. Regeringens bidrag har medverkat till kunskapsförmedling?
Projektföljeforskning
Eddie Arnold - Make The World Go Away Images colorées de par le monde Déroulement automatique ou manuel à votre choix 1 för dig.
FL10 732G81 Linköpings universitet.
UNIONEN - tillgänglighet under semestern 2014
Karolinska Institutet, studentundersökning Studentundersökning på Karolinska Institutet HT 2013.
Punktprevalensmätning av trycksår 2011, v.40 Resultat från landstingen
Bastugatan 2. Box S Stockholm. Blad 1 Läsarundersökning Maskinentreprenören 2007.
| Trycksår Kommun/Områdes-skillnader (inklusive könsdimensionen) Dennis Nordvall Statistiker/Datamanager,
Fastighetsbyrån Konjunkturundersökning Oktober 2012.
INFÖR NATIONELLA PROVET
Enkätresultat för Grundskolan Elever 2014 Skola:Hällby skola.
Från binära till hexadecimala
Robert Gidehag & Jonas Arnberg. Studiens frågeställningar Övergripande: Är den svenska alkoholpolitiken effektiv på 2000-talet?
Sveriges utrikeshandel (Andelar i procent) ImportExport EU (25) EFTA NAFTA Central- och Östeuropa Asien - Japan - Kina Övriga 59,9.
Finländarnas uppfattningar om äldrevården Kirsi Markkanen Utvecklingschef Tehy rf.
1 Vänsterskolan Debattartiklar. 2 Aktuell krok 3 Aktuella krokar 1. Direkt krok.
Konsumenter om Svanen och EU Ecolabel Om undersökningen Utförd av: Response Analys, Oslo i dec 2010 Cirka personer från respektive land Totalt.
Kostnader för läkemedelsförmån Utveckling t.o.m. september 2014 Materialet: avser kostnader inklusive moms är ej åldersstandardiserat Lennart Tingvall:
Hittarps IK Kartläggningspresentation år 3.
Från Gotland på kvällen (tågtider enligt 2007) 18:28 19:03 19:41 19:32 20:32 20:53 21:19 18:30 20:32 19:06 19:54 19:58 20:22 19:01 21:40 20:44 23:37 20:11.
Arbetspensionssystemet i bilder Bildserie med centrala uppgifter om arbetspensionssystemet och dess funktion
1 Bakgrund & Genomförande MÅLGRUPP Män och kvinnor år, dvs ca 7 miljoner Riksrepresentativt urval från Novus Sverigepanel som är slumpmässigt rekryterad.
TÄNK PÅ ETT HELTAL MELLAN 1-50
Greppa Näringen Medlemsundersökning, kvartal 1. 1.
/hp Beräkning av kommunernas och samkommunernas utgifter år 2013 Övriga utgifter 0,81 md € Investeringar 4,70 md € Övr. verksamhetskostn. 0,79.
Helhet Händelse Agerande Kunskap om vardagsverksamheten Förståelse av vardagsverksamheten.
1 Joomla © 2009 Stefan Andersson 1. 2 MÅL 2 3 Begrepp Aktör: en användare som interagerar med webbplatsen. I diagrammet till höger finns två aktörer:
Chitvå-test Regression forts.
Kouzlo starých časů… Letadla Pár foteček pro vzpomínku na dávné doby, tak hezké snění… M.K. 1 I Norrköping får man inte.
Enkätresultat för Fritidshem Elever 2014 Skola:Fritidselever, Gillberga skola.
Resultat sammanhållen vård och omsorg om de mest sjuka äldre i Örebro län Västra länsdelen mätperiod 2014.
Arbetspensionssystemet i bilder Bildserie med centrala uppgifter om arbetspensionssystemet och dess funktion
Källa: FHI, Folkhälsodatabas
Enkätresultat för Grundskolan Föräldrar 2014 Skola - Gillberga skola.
Multipel regressionsanalys
Regional handlingsplan ”Det goda livet för sjuka äldre” RESULTAT i VG+Skaraborg.
UNIONEN – ALLMÄNHETEN OM EGET FÖRETAGANDE MINDRE MÄTNING I SYFTE ATT TITTA PÅ INTRESSET FÖR MENTORSKAP VID START AV FÖRETAG Kund: Unionen Kontakt: Åsa.
1 Regression Analysis: Hyra versus Kv-meter The regression equation is Hyra = Kv-meter Predictor Coef SE Coef T P Constant
Multipel linjär regressionsanalys
Projekt 5.3 Gilpins och Ayalas θ-logistiska modell A Course in Mathematical Modeling - Mooney & Swift.
© Anders Broberg, Ulrika Hägglund, Lena Kallin Westin, 2003 Föreläsning 12 Sökning och Sökträd.
Hur bra är modellen som vi har anpassat?
Förskoleenkät Föräldrar 2012 Förskoleenkät – Föräldrar Enhet:Hattmakarns förskola.
Kvadratsummeuppdelning/Variansanalys
Bild 1 Prognos för länets arbetsmarknad Stefan Tjb.
Grundskola Elever 2013 Grundskoleenkät - Elever Enhet: Gillberga skola.
Exempel: Vad påverkar kostnaden för produktion av korrugerat papper, dvs sådant som ingår i wellpapp och kartonger? Amerikansk studie: Kostnaden kan förmodligen.
Tidsserieregression fungerar statistiskt som vanlig regression. Regression Analysis The regression equation is Sold = 5,78 + 0,0430 time Predictor.
Regression Analysis The regression equation is Sold = 5,78 + 0,0430 time Predictor Coef StDev T P Constant 5,7761 0,9429 6,13 0,000 time 0, ,03420.
Regressions- och tidsserieanalys
1 Om sambandet inte är linjärt? Om sambandet till en variabel inte är linjärt så kan vi inkludera ytterligare en term i regressionsmodellen I en modell.
Kvadratisk regression, forts.
Föreläsning 4 (Kajsa Fröjd) Multipel regression Kap 11.3 A.Man har en kvantitativ responsvariabel som är linjärt relaterad till en/flera kvantitativa förklarande.
1 Multipel Regression Kapitel Modell Vi har p oberoende variabler som vi tänker oss kan vara relaterade till den beroende variabeln. Y ~ N( , 
Föreläsning 4 Kap 11.3 Icke-linjära modeller Indikatorvariabel (dummyvariabel) Interaktionsterm.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Presentationens avskrift:

y=β0 + β1·x1 + β2·x2 + β3·x3 + β4·x4 + β5·x32 + ε Om sambandet inte är linjärt? Om sambandet till en variabel inte är linjärt så kan vi inkludera ytterligare en term i regressionsmodellen I en modell med alla förklaringsvariabler inkluderade: y=β0 + β1·x1 + β2·x2 + β3·x3 + β4·x4 + β5·x32 + ε Intercept Area Acres Rooms Baths Rooms2 Felterm Den nya variabeln är alltså antal rum i kvadrat och har ingen praktisk tolkning, men vi kan genomföra en analys där vi förväntar oss ett högt pris om fastigheten har lagom många rum.

Pris mot antal rum

y=β0 + β3·x3 + β5·x32 + ε Vi använder en kvadratisk term i modellen: men vi behåller även originalvariabeln (alltså x3) för att göra modellen mer flexibel.

Regression Analysis: Price versus Rooms The regression equation is Price = 37969 + 15966 Rooms Predictor Coef SE Coef T P Constant 37969 13776 2,76 0,007 Rooms 15966 1860 8,58 0,000 S = 34115 R-Sq = 33,2% R-Sq(adj) = 32,8%

parametern b5 är negativ: den anpassade funktionen har ett maximum Regression Analysis: Price versus Rooms, Rooms_sq The regression equation is Price = - 45920 + 39680 Rooms - 1606 Rooms_sq Predictor Coef SE Coef T P Constant -45920 38935 -1.18 0.240 Rooms 39680 10477 3.79 0.000 Rooms_sq -1606.4 698.8 -2.30 0.023 S = 33631 R-Sq = 35.6% R-Sq(adj) = 34.7% parametern b5 är negativ: den anpassade funktionen har ett maximum båda signifikanta

Om parametern b5 är positiv skulle vi istället ha en funktion som visar ett minimum. Jämfört med en regression där alla termer är linjära är parametrarna i en kvadratisk regression svårare att tolka. I modellen y=b0 + b3·x3 + ε kan vi säga att priset för fastigheten ökar med b3 USD för varje ytterligare rum. I modellen y=b0 + b3·x3 + b5·x32 + ε ökar priset för fastigheten med varje ytterligare rum, men bara upp till ett visst antal rum, sen minskar priset.

Komplexa samband mellan en förklarande variabel och en responsvariabel kan alltså tas med i modellen genom kvadratiska eller även kubiska termer (x3). Samtidigt måste man fundera på om det verkligen är den här variablen själv som har ett krökt samband till priset eller om det istället är en samspel variabeln ‘antal rum’ och andra förklarande variabler: en liten fastighet med många rum eller en stor fastighet med få rum.....

Interaktionstermer – samspelstermer Vi bildar då nya variabeln x1·x3 och analyserar modellen y=β0 + β1·x1 + β3·x3 + β5·x32 + β6 ·x1·x3 + ε bostadsyta antal rum (antal rum)2 bostadsyta*antal rum

Regression Analysis: Price versus Area; Rooms; Rooms_sq The regression equation is Price = - 15812 + 49,3 Area + 22544 Rooms - 1529 Rooms_sq Predictor Coef SE Coef T P Constant -15812 34481 -0,46 0,647 Area 49,326 7,379 6,68 0,000 Rooms 22544 9549 2,36 0,020 Rooms_sq -1529,1 613,6 -2,49 0,014 S = 29528 R-Sq = 50,7% R-Sq(adj) = 49,6%

Samspelstermen har tagit över den kvadratiska termens roll. The regression equation is Price = 862 + 163 Area - 9248 Rooms + 2161 Rooms_sq - 14.0 Area*Rooms Predictor Coef SE Coef T P Constant 862 34085 0.03 0.980 Area 162.78 39.23 4.15 0.000 Rooms -9248 14262 -0.65 0.518 Rooms_sq 2161 1390 1.56 0.122 Area*Roo -14.002 4.759 -2.94 0.004 S = 28783 R-Sq = 53.4% R-Sq(adj) = 52.2% Samspelstermen har tagit över den kvadratiska termens roll.

Regression Analysis: Price versus Area; Rooms; Area*Roo The regression equation is Price = - 28051 + 109 Area + 11862 Rooms - 7,32 Area*Roo Predictor Coef SE Coef T P Constant -28051 28707 -0,98 0,330 Area 108,55 18,06 6,01 0,000 Rooms 11862 4401 2,70 0,008 Area*Roo -7,321 2,058 -3,56 0,001 S = 28923 R-Sq = 52,7% R-Sq(adj) = 51,7%

1... upp till 5 rum; 2... mellan 6 och 8 rum; 3...mer än 8 rum

Regressionslinjen som bekriver sambandet mellan priset och bostadsytan är beroende på hur många rum det finns i huset. I regressionsanalysen för detta datamaterial kan vi alltså ersätta den kvadratiska termen för antal rum med en samspelsterm (bostadsyta * antal rum). Modellen är då: y=β0 + β1·x1 + β3·x3 + β6 ·x1·x3 + ε De motsvarande linjära termerna (x1 och x2) behåller vi vanligtvis också i modellen.

Kvalitativa variabler inga numeriskt tolkningsbara värden utan värden som är koder för olika klasser av observationer. Ett exempel är en variabel för kön, som kan anta värdet man eller kvinna En sådan variabel skulle man kunna koda som 0 för män och 1 för kvinnor och därmed använda i en regressionsanlays Ett annat exempel är en variabel som är 1 för småföretag, 2 för mellanstora företag och 3 för stora företag.

För att kunna använda sådana kvalitativa variabler i regressionsanalysen krävs att de görs om till s k indikatorvariabler eller dummyvariabler. (Andra namn är 0/1-variabler resp. dikotoma variabler) Om vi inför en kodning 0 för män och 1 för kvinnor så har vi redan en indikatorvariabel som direkt kan användas. I fallet där vi kodar företagen, måste vi skapa flera nya variabler: en som är 1 om företaget är liten och 0 annars en som är 1 om företaget är mellanstor och 0 annars Den tredje variabel som vi kunde skapa (1 om stor, 0 annars) får inte vara med i analysen.

Alltså: Företag Företagstyp Ursprunglig kod D1 D2 1 Liten 2 Mellanstor 3 Stor 4 5  Grundregel: Om den kvalitativa variabeln har m olika koder eller värden (kallas också nivåer) skall m1 indikatorvariabler användas.

Minitab har funktioner för att manuellt koda om en variabels värden till andra värden skapa indikatorvariabler för att ersätta en kvalitativ variabel

I datamaterialet med fastighetspriser skulle vi kunna koda om variabeln ’antal rum’ på följande sätt: fastigheter med högst 6 rum fastigheter med fler än 6 rum För att göra detta kan vi skapa en indikatorvariabel som är =0 för fastigheter med högst 6 rum och 1 för övriga, dvs

bostadsyta dummy som är 1 om fastigheten har mer än 6 rum Nu kan vi använda denna indikatorvariabel (dummy) istället för originalvariabeln. y=β0 + β1·x1 + β7·D + ε bostadsyta dummy som är 1 om fastigheten har mer än 6 rum Regression Analysis: Price versus Area, D The regression equation is Price = 65668 + 44.2 Area + 10544 D Predictor Coef SE Coef T P Constant 65668 8072 8.14 0.000 Area 44.157 5.445 8.11 0.000 D 10544 7098 1.49 0.140 S = 29824 R-Sq = 49.3% R-Sq(adj) = 48.6%

Predictor Coef SE Coef T P Constant 65668 8072 8.14 0.000 Area 44.157 5.445 8.11 0.000 D 10544 7098 1.49 0.140 Om man ignorerar att dummyvariabeln D inte är signifikant så går det att tolka modellen på följande sätt. Varje fastighet som har 7 rum eller fler får ett försäljningspris som är 10544 USD högre än jämförbar fastighet med färre rum. Med D=1: Med D=0:

Parallella linjer, men skillnad i y-nivån

Eftersom vi såg förut att en samspelsterm (för interaktioner mellan bostadsyta och antal rum) verkar vara bra, kan vi lägger till en sådan även nu. y=β0 + β1·x1 + β7·D + β8·x1·D + ε Regression Analysis: Price versus Area, D, Area*D The regression equation is Price = 110370 + 7.45 Area - 117259 D + 0.949 Area*D Predictor Coef SE Coef T P Constant 110370 3269 33.76 0.000 Area 7.454 2.306 3.23 0.002 D -117259 4856 -24.15 0.000 Area*D 0.94940 0.03055 31.07 0.000 S = 10846 R-Sq = 93.3% R-Sq(adj) = 93.2% Samtliga variabler är signifikanta och förklaringsgraden är mycket bra.

Hur blir nu tolkningen av denna modell? Predictor Coef SE Coef T P Constant 110370 3269 33.76 0.000 Area 7.454 2.306 3.23 0.002 D -117259 4856 -24.15 0.000 Area*D 0.94940 0.03055 31.07 0.000 Hur blir nu tolkningen av denna modell? Vi måste återigen skilja på de två fallen med D=0 och D=1. Med D = 1 Med D = 0

I detta fall får vi alltså två regressionslinjer som skiljer sig i både y-nivån (intercept) och lutningen. Högst 6 rum: Priset ökar med i genomsnitt 7454 dollar då bostadsytan ökar med 1000 ft2 7 eller fler rum: Priset ökar med i genomsnitt 8403 dollar då bostadsytan ökar med 1000 ft2

Det finns ett samband mellan dummyvariabeln (fler än 6 rum eller ej) och bostadsytan. Regressionslinjernas lutningar är olika.

Om vi har fler än 2 grupper behöver vi fler dummy variabler. t.ex. grupp 1: 0-4 rum grupp 2: 5-8 rum grupp 3: 8:10 rum grupp 4: 11- rum Vi skapar 3 dummy variabler: antal rum D1 D2 D3 3 1 6 10 8 13

Ibland kan vi även arbeta med en annan kodning: t.ex. grupp 1: 0-4 rum 1 grupp 2: 5-8 rum 2 grupp 3: 8-10 rum 3 grupp 4: 11- rum 4 men detta är bara möjligt om man kan anta att effekten (prisökningen) är samma när man går över från grupp 1 till grupp 2, som när man går över från grupp 2 till grupp 3, osv.

Partiellt F-test Vi har nu en modell för fastighetspriset som använder sig av följande förklarande variabler: bostadsyta (area) antal rum (rooms) samspelsterm (area*rooms) Dessutom har vi sett att även tomtyta har betydelse. För den sista förklarande variabeln som är tillgänglig (antal badrum) skulle vi kunna anta att den beter sig som variabeln ‘antal rum’. Vi skulle därför kunna använda oss av själva variabeln, men också inkludera en samspelsterm (area*baths).

The regression equation is Price = - 13702 + 76.1 Area + 7323 Acres + 15438 Rooms - 8.59 Area*Rooms - 8432 Baths + 11.8 Area*Baths Predictor Coef SE Coef T P Constant -13702 22936 -0.60 0.551 Area 76.12 15.24 5.00 0.000 Acres 7322.9 859.6 8.52 0.000 Rooms 15438 4829 3.20 0.002 Area*Roo -8.589 2.470 -3.48 0.001 Baths -8432 12664 -0.67 0.507 Area*Bat 11.761 6.305 1.87 0.064 S = 22897 R-Sq = 70.9% R-Sq(adj) = 69.7% Förklaringsgraden är ganska bra, men ingen av variablerna som har med antal badrum att göra är signifikant på 5%-nivån.

Analysis of Variance Source DF SS MS F P Regression 6 1.83020E+11 30503276149 58.18 0.000 Residual Error 143 74968921395 524258192 Total 149 2.57989E+11 Source DF Seq SS Area 1 1.25271E+11 Acres 1 44104488077 Rooms 1 166184643 Area*Roo 1 5897295563 Baths 1 5756044237 Area*Bat 1 1824349748 F-testet anger att minst en av de ingående x-variablerna har betydelse. t-testen (på föreg. sida) visar att fyra variabler har det, men inte de två sista. Räcker det då med 4 förklarande variabler (area, acres, rooms, area*rooms)?

Alla variabler signifikanta, något lägre justerat R2-värde. Vi kan köra regressionsanalysen en gång till och då lämna bort de två variablerna som inte var signifikanta. The regression equation is Price = - 12280 + 88.2 Area + 7429 Acres + 10230 Rooms - 5.51 Area*Rooms Predictor Coef SE Coef T P Constant -12280 23758 -0.52 0.606 Area 88.15 15.10 5.84 0.000 Acres 7428.8 890.9 8.34 0.000 Rooms 10230 3636 2.81 0.006 Area*Roo -5.510 1.712 -3.22 0.002 S = 23860 R-Sq = 68.0% R-Sq(adj) = 67.1% Analysis of Variance Source DF SS MS F P Regression 4 1.75439E+11 43859815727 77.04 0.000 Residual Error 145 82549315379 569305623 Total 149 2.57989E+11 Alla variabler signifikanta, något lägre justerat R2-värde.

Kan vi jämföra de två modellerna och bestämma om vi ska ha med antal badrum som förklarande variabel? Den fullständiga modellen kan skrivas: y=  0 + 1 · x1  2· x2 + 3· x3 + 5· x1x3 + 4· x4 + 6· x1x4 +  där x1=area, x2=acres, x3=rooms, x4=baths och därmed x1x3 samspelet mellan ’area’ och ’rooms’, och x1x4 samspelet mellan ’area’ och ’baths’. Den reducerade modellen kan skrivas y=  0 + 1 · x1  2· x2 + 3· x3 + 5· x1x3 +  Det är alltså den modellen, som vi tror kan räcka för att förklara fastighetspriset.

Vi vill nu testa om någon av de variabler som vi har tagit bort har (signifikant) betydelse för vilket värde responsvariabeln antar. Om vi vill testa om någon av x4 och x1x4 skall läggas till blir nollhypotesen: H0: 4= 6=0 Alternativhyptesen: H1: minst en av 4, 6 är skild från 0

Som testfunktion kan vi använda där SSER=Residualkvadratsumman (SSE) i den Reducerade modellen och SSEC=Residualkvadratsumman i den Fullständiga modellen p-1=Antal förklaringsvariabler i den fullständiga modellen q-1=Antal förklaringsvariabler i den reducerade modellen Vi testar alltså om minskningen i residualkvadratsumman är så pass stor (när vi lägger till de två variablerna) att vi inte kan ignorera den.

I vårt fall: Den reducerade modellen Om H0 är sann får F en F-fördelning med k-g och n-k-1 frihetsgrader och vi kan alltså jämföra värdet på F med F[](k-g,n-k-1) I vårt fall: Den reducerade modellen Analysis of Variance Source DF SS MS F P Regression 4 1.75439E+11 43859815727 77.04 0.000 Residual Error 145 82549315379 569305623 Total 149 2.57989E+11 Den fulla modellen Regression 6 1.83020E+11 30503276149 58.18 0.000 Residual Error 143 74968921395 524258192 SSER SSEF

F(0.05;2,143) 3.07 < 7.2296 H0 ska förkastas! Fastän varken antal badrum eller samspelstermen bostadsyta/antal badrum var signifikant, finns det ändå information i minst en av variablerna.

Testmetoden kallas Partiellt F-test eftersom vi i ett test testar om en del (partition) av modellen skall uteslutas. Om vi bara vill testa en enda variabel (om den ska uteslutas eller ej), så är det partiella F-testet ekvivalent med t-testet för denna variabel.

Om vi kommer (som i det här fallet) till slutsatsen att det finns information i minst en variabel av alla de vi testade, så får vi gå vidare med att ta reda på vilken variabel det kunde vara. I vårt fall skulle vi kanske välja att ta bort samspelstermen area*baths och behålla variabeln baths. The regression equation is Price = - 9323 + 73.3 Area + 7210 Acres + 9236 Rooms - 5.15 Area*Rooms + 13864 Baths Predictor Coef SE Coef T P Constant -9323 23011 -0.41 0.686 Area 73.33 15.30 4.79 0.000 Acres 7210.0 864.8 8.34 0.000 Rooms 9236 3532 2.62 0.010 Area*Roo -5.153 1.660 -3.10 0.002 Baths 13864 4220 3.29 0.001 S = 23093 R-Sq = 70.2% R-Sq(adj) = 69.2%

I vissa fall kan vi förenkla beräkningen något: Vi kan skriva: SSER –SSEF = SSRF –SSRR Det går alltså att använda regressionskvadratsummorna istället för residualkvadratsummorna.

SSRF=SSR(Area) + SSR(Acres | Area) + SSR(Rooms | Area, Acres) + Analysis of Variance Source DF SS MS F P Regression 6 1.83020E+11 30503276149 58.18 0.000 Residual Error 143 74968921395 524258192 Total 149 2.57989E+11 Source DF Seq SS Area 1 1.25271E+11 Acres 1 44104488077 Rooms 1 166184643 Area*Roo 1 5897295563 Baths 1 5756044237 Area*Bat 1 1824349748 Vi kan då använda utskriften för enbart den kompletta modellen för att beräkna det partiella F-testet. SSRF=SSR(Area) + SSR(Acres | Area) + SSR(Rooms | Area, Acres) + + SSR(Area*Rooms | Area, Acres, Rooms ) + SSR(Baths | Area, Acres, Rooms, Area*Rooms) + SSR (Area*Baths | Area, Acres, Rooms, Area*Rooms, Baths) Observera ordningen! sekventiella regressionskvadratsummor

I den reducerade modellen blir: SSRR= SSR(Area) + SSR(Acres | Area) + SSR(Rooms | Area, Acres) + SSR(Area*Rooms | Area, Acres,Rooms ) SSRF – SSRR= SSR(Baths | Area, Acres, Rooms, Area*Rooms) + + SSR(Area*Baths | Area, Acres, Rooms, Area*Rooms, Baths) Source DF Seq SS Area 1 1.25271E+11 SSR(Area) Acres 1 44104488077 SSR(Acres|Area) Rooms 1 166184643 SSR(Rooms|Area, Acres) Area*Roo 1 5897295563 SSR(Area*Rooms|Area, Acres, Rooms) Baths 1 5756044237 osv. Area*Bat 1 1824349748 SSRF-SSRR=5756044237+1824349748=7580393985 SSRR= 1.75439E+11