Ladda ner presentationen
Presentation laddar. Vänta.
Publicerades avUlla Nyberg
1
1 Regression Analysis: Hyra versus Kv-meter The regression equation is Hyra = 721 + 60.5 Kv-meter Predictor Coef SE Coef T P Constant 720.9 370.2 1.95 0.066 Kv-meter 60.533 5.713 10.60 0.000 S = 525.5 R-Sq = 85.5% R-Sq(adj) = 84.8% Analysis of Variance Source DF SS MS F P Regression 1 31002923 31002923 112.26 0.000 Residual Error 19 5247087 276162 Total 20 36250010
2
2 Följande datamaterial innehåller uppgifter om 150 slumpmässigt valda fastigheter i USA Column NameCountDescription ModellÖversättning C1Price150Price ypris C2Area150Area in square feetx1bostadsyta C3Acres150Acresx2tomtyta C4Rooms150Number of roomsx3antal rum C5Baths150Number of bathsx4antal badrum Källa: ”MTBWIN”/Student12/HOMES.MTW
3
3 Pris mot bostadsyta
4
4 Pris mot tomtyta
5
5 Pris mot antal rum
6
6 Pris mot antal badrum
7
7 Vi börjar med en modell som inte inkluderar alla förklarande variabler, men bara de som verkar viktigast: bostadsyta och antal rum.
8
8 Regression Analysis: Price versus Area, Rooms The regression equation is Price = 64221 + 49.7 Area - 141 Rooms Predictor Coef SE Coef T P Constant 64221 12766 5.03 0.000 Area 49.673 7.507 6.62 0.000 Rooms -141 2934 -0.05 0.962 Signifikanstest för t.ex. 1: är den skattade standardavvikelsen av b 1 Vi jämför t med t-fördelningen med n-k-1=150-2-1 frihetsgrader.
9
9 S = 30047 R-Sq = 48.6% R-Sq(adj) = 47.9% Analysis of Variance Source DF SS MS F P Regression 2 1.25273E+11 62636682991 69.38 0.000 Residual Error 147 1.32715E+11 902824574 Total 149 2.57989E+11 F-testet är signifikant
10
10 Punktskattning och punktprognos Nu vill vi göra en prognos för priset på en fastighet med –bostadsytan: 3000 ft2 och –antal rum: 6, och ett 95% prediktionsintervall i MINITAB
11
11 Regression Analysis: Price versus Area, Rooms Samma utskrift som tidgare Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 212396 12307 ( 188076, 236717) ( 148229, 276564) XX X denotes a row with X values away from the center XX denotes a row with very extreme X values Values of Predictors for New Observations New Obs Area Rooms 1 3000 6.00 Prediktionsintervall
12
12 Regression Analysis: Price versus Area, Rooms Samma utskrift som tidgare Predicted Values for New Observations New Obs Fit SE Fit 95.0% CI 95.0% PI 1 212396 12307 ( 188076, 236717) ( 148229, 276564) XX X denotes a row with X values away from the center XX denotes a row with very extreme X values Values of Predictors for New Observations New Obs Area Rooms 1 3000 6.00 Konfidensintervall för det genomsnittliga priset på fastigheter med 3000 ft2 och 6 rum.
13
13 ‘Distance value’ kan, som sagt, inte enkelt beräknas från datamaterialet om vi har fler än en förklarande variabel. Men den kan beräknas ur New Obs Fit SE Fit 95.0% CI 95.0% PI 1 212396 12307 ( 188076, 236717) ( 148229, 276564) XX SE Fit är standardavvikelsen för punktskattningen
14
14 Om vi t.ex bara har bostadsytan som förklarande variabel: Prediktioner utanför området där vi har observationer är inte tillförlitliga
15
15 Pris mot bostadsyta Få observation med bostadsyta 3000 ft2 eller större, men ändå väl inom området där vi har observation
16
16 Pris mot antal rum
17
17 Vad är då problemet? Om vi tittar på datamaterialet så ser vi att de fastigheter som ingår och har exakt 6 rum har en bostadsyta mellan 1008 och 1900 ft2. Det är alltså kombinationen 3000 ft2 och 6 rum som är extrem och vi måste fundera över om det är rimligt att anta att modellen är giltig även för denna typ av fastighet. 11700010086 10800010366 12650010926 13300011006 11600011006 9800011656 12900012006 12600012326 11700012486 11000012896 11750013006 12190013006 10000013386 12850013446 13500014006 14000014036 15200014506 11000014506 14250015526 15000015646 12050016006 14190016326 14590016806 14490019006 pris area rooms
18
18
Liknande presentationer
© 2024 SlidePlayer.se Inc.
All rights reserved.