Phi tuyến tính

Chương 11 Hàm hồi quy phi tuyến

Cho mang đến giờ ta mang định hàm hồi quy là đường tính, tức là tmê mẩn số nghiêng của hàm hồi quy là hằng số. Vấn đề này ngụ ý, ảnh hưởng lên (Y) của một đơn vị thay đổi của (X) không phụ thuộc vào quý hiếm của (X). Nếu tác động này thiệt sự nhờ vào vào quý giá của (X), ta rất cần được áp dụng hàm hồi quy phi đường.

Bạn đang xem: Phi tuyến tính


# prepare the datadata(CASchools)CASchools$size CASchools$students/CASchools$teachersCASchools$score (CASchools$read + CASchools$math) / 2cor(CASchools$income, CASchools$score)
## <1> 0.7124308Ta thấy có sự đối sánh con đường tính dương ở hai biến hóa này: thu nhập cá nhân bên trên mức độ vừa phải thì điểm thi trên mức độ vừa phải. Liệu hồi quy tuyến tính có khoảng chừng được tình dục dữ liệu.


# fit a simple linear modellinear_Mã Sản Phẩm lm(score ~ income, data = CASchools)# plot the observationsplot(CASchools$income, CASchools$score, col = "steelblue", pch = đôi mươi, xlab = "District Income (thousands of dollars)", ylab = "Test Score", cex.main = 0.9, main = "Test Score vs. District Income and a Linear OLS Regression Function")# add the regression line khổng lồ the plotabline(linear_mã sản phẩm, col = "red", lwd = 2)

*

Ta thấy rằng lúc thu nhập cá nhân cao thì mặt đường hồi quy đã ước lượng “lố” quan hệ đúng nhưng lại lúc các khoản thu nhập mức độ vừa phải thì con đường hồi quy lại ước tính “không đủ”.

Ta để ý một mô hình bậc nhị nhỏng sau.

< extĐiểm thi = eta_0 + eta_1 extThu nhập_i + eta_2 extThu nhập_i^2 + u_i>

khi đó ( extThu nhập_i^2) được sử dụng nhỏng một vươn lên là phân tích và lý giải khác mang đến điểm thi. Ta xem xét hiệu quả vào R như sau.

income3.851***
(0.268)
I(income2)-0.042***
(0.005)
Constant607.302***
(2.902)
Notes:***Significant at the 1 percent level.
**Significant at the 5 percent cấp độ.
*Significant at the 10 percent level.

Mô hình này cho phép ta kiểm nghiệm quan hệ tình dục thân các khoản thu nhập và điểm thi là tuyến đường tính xuất xắc phi tuyến bậc hai. Nói giải pháp khác:

<egincases H_0: eta_2 = 0 \ H_A: eta_2 e 0 endcases>

Ta thấy rằng (H_0) bị bác quăng quật ngơi nghỉ bất kỳ mức ý nghĩa sâu sắc thường thì nào, do đó ta Kết luận quan hệ tình dục thân nhị biến là phi tuyến. Như vậy cũng trùng khớp với hình mẫu vẽ dưới đây.


# draw a scatterplot of the observations for income & test scoreplot(CASchools$income, CASchools$score, col = "steelblue", pch = trăng tròn, xlab = "District Income (thousands of dollars)", ylab = "Test Score", main = "Estimated Linear và Quadratic Regression Functions")# add a linear function to the plotabline(linear_mã sản phẩm, col = "black", lwd = 2)# add quatratic function to the plotorder_id order(CASchools$income)lines(x = CASchools$income, y = fitted(quadratic_model), col = "red", lwd = 2)

*


11.2 Hàm phi con đường đối với biến chuyển đơn nhất


11.2.1 Hàm đa thức

Từ phát minh hàm bậc nhị, ta có thể không ngừng mở rộng ra thành hàm nhiều thức tổng quát:

Trong R ta sử dụng hàm poly() nhằm biểu hiện số bậc mô hình. Chẳng hạn cùng với mô hình bậc 3 ta code nhỏng sau.


# estimate a cubic modelcubic_mã sản phẩm lm(score ~ poly(income, degree = 3, raw = TRUE), data = CASchools)
Ta hoàn toàn có thể sử dụng kiểm nghiệm thống kê (F) để xác nhận mô hình tuyến đường tính giỏi phi đường mang đến bậc như thế nào đó. Chẳng hạn, ta quan tâm mang đến bậc 3 mô hình.


# test the hypothesis of a linear Model against quadratic or polynomial# alternatives# mix up hypothesis matrixR rbind(c(0, 0, 1, 0), c(0, 0, 0, 1))# do the testlinearHypothesis(cubic_Mã Sản Phẩm, hypothesis.matrix = R, trắng.adj = "hc1")
## Linear hypothesis test## ## Hypothesis:## poly(income, degree = 3, raw = TRUE)2 = 0## poly(income, degree = 3, raw = TRUE)3 = 0## ## Model 1: restricted model## Model 2: score ~ poly(income, degree = 3, raw = TRUE)## ## Note: Coefficient covariance matrix supplied.## ## Res.Df Df F Pr(>F) ## 1 418 ## 2 416 2 37.691 9.043e-16 ***## ---## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Ở trên đây ta sẽ cẩn thận giả tngày tiết (H_0: eta_2 = eta_3 = 0) bằng cách lợi dụng phép tân oán ma trận:

<eginaligned mathbfReta &= s \ eginpmatrix 0 & 0 và 1 và 0 \ 0 và 0 và 0 và 1 endpmatrix eginpmatrix eta_0 \ eta_1 \ eta_2 \ eta_3 endpmatrix &= eginpmatrix 0 \ 0 endpmatrix \ eginpmatrix eta_2 \ eta_3 endpmatrix &= eginpmatrix 0 \ 0 endpmatrix endaligned>

Bởi vị hàm linearHypothesis() thực hiện các vector (0) cho nên việc sử dụng một ma trận (mathbfR) đang rút ngắn được đoạn code. Ta thấy (p)-value tương đối bé dại cùng vì vậy ta chưng bỏ (H_0).

Trong thực tiễn, nhằm xác định được bậc quy mô, ta đề nghị kiểm định (t) các lần từ bỏ một số bậc lớn số 1 làm sao đó (r). Ta hoàn toàn có thể thấy trong đoạn code sau đây.


summary(cubic_model)
## ## Call:## lm(formula = score ~ poly(income, degree = 3, raw = TRUE), data = CASchools)## ## Residuals:## Min 1Q Median 3Q Max ## -44.28 -9.21 0.đôi mươi 8.32 31.16 ## ## Coefficients:## Estimate Std. Error t value## (Intercept) 6.001e+02 5.830e+00 102.937## poly(income, degree = 3, raw = TRUE)1 5.019e+00 8.595e-01 5.839## poly(income, degree = 3, raw = TRUE)2 -9.581e-02 3.736e-02 -2.564## poly(income, degree = 3, raw = TRUE)3 6.855e-04 4.720e-04 1.452## Pr(>|t|) ## (Intercept)
# demo the hypothesis using robust standard errorscoeftest(cubic_model, vcov. = vcovHC, type = "HC1")
## ## t test of coefficients:## ## Estimate Std. Error t value## (Intercept) 6.0008e+02 5.1021e+00 117.6150## poly(income, degree = 3, raw = TRUE)1 5.0187e+00 7.0735e-01 7.0950## poly(income, degree = 3, raw = TRUE)2 -9.5805e-02 2.8954e-02 -3.3089## poly(income, degree = 3, raw = TRUE)3 6.8549e-04 3.4706e-04 1.9751## Pr(>|t|) ## (Intercept) lúc sử dụng ước lượng vững vàng, ta thấy hiệu quả bao gồm sự biến hóa ở mức ý nghĩa của thông số biến chuyển bậc 3. Điều này còn có nghĩa ta bác bỏ bỏ trả tmáu (H_0) hàm hồi quy là bậc hai cùng với (H_A) hàm hồi quy bậc ba trên mức chân thành và ý nghĩa (5\%).


11.2.2 Giải mê thích hệ số hồi quy

Chẳng hạn mô hình hồi quy tất cả dạng

bởi thế khi tăng các khoản thu nhập từ bỏ (10) lên (11) thì điểm thi tăng (2.96) điểm, dẫu vậy Lúc các khoản thu nhập tăng từ (40) lên (41) thì điểm thi chỉ tăng (0.42). Cho thấy độ nghiêng của hàm hồi quy dốc hơn tại mức thu nhập thấp với thoải rộng ở tại mức thu nhập cao.


# compute và assign the quadratic modelquadriatic_model lm(score ~ income + I(income^2), data = CASchools)# mix up data for predictionnew_data data.frame(income = c(10, 11))# vày the predictionY_hat predict(quadriatic_model, newdata = new_data)# compute the differencediff(Y_hat)
## 2 ## 2.962517

11.2.3 Hàm Logarithms

Một biện pháp không giống để quy phương pháp hàm số phi đường là cần sử dụng hàm lograthims lên biến chuyển (Y) hoặc/cùng (X). Chuyển hàm logarithms chuyển đổi những đổi thay lịch sự Phần Trăm biến hóa. Có các cách để gây ra quy mô Theo phong cách tiếp cận logarithm.

Trường đúng theo 1: logarithm (X)

Mô hình trlàm việc thành:


# estimate a level-log modelLinearLog_mã sản phẩm lm(score ~ log(income), data = CASchools)# compute robust summarycoeftest(LinearLog_model, vcov = vcovHC, type = "HC1")
## ## t chạy thử of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 557.8323 3.8399 145.271 Ta vẽ đường hồi quy hệt như sau.


# draw a scatterplotplot(score ~ income, col = "steelblue", pch = trăng tròn, data = CASchools, main = "Linear-Log Regression Line")# add the linear-log regression lineorder_id order(CASchools$income)lines(CASchools$income, fitted(LinearLog_model), col = "red", lwd = 2)

*

Ta có thể phân tích và lý giải (hateta_1) nlỗi sau. (1\%) lớn lên các khoản thu nhập thì điểm thi tăng (0.01 imes 36.42 = 0.36) điểm.

Trường đúng theo 2: logarithm (Y)

Mô hình trong trường thích hợp nàgiống như sau.


# estimate a log-linear Mã Sản Phẩm LogLinear_model lm(log(score) ~ income, data = CASchools)# obtain a robust coefficient summarycoeftest(LogLinear_Model, vcov = vcovHC, type = "HC1")
## ## t kiểm tra of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 6.43936234 0.00289382 2225.210 Lúc thu nhập cá nhân tăng 1 đơn vị thu nhập cá nhân, điểm thi tăng ((100 imes 0.00284)\% = 0.284\%).

Khi cần sử dụng hàm chuyển dạng cho thay đổi (Y) ta nên cảnh giác. Mô hình hồi quy vẫn mang đến ta ước chừng của (ln(Y)), một giải pháp thông thường, ta rất có thể gửi về (hatY) bởi hàm exp(). lúc đó, mô hình bao gồm dạng:

Từ đó, ta có:

Vì (E(u_i|X_i)=0) cần (E(e^u_i|X_i) = 1), nói theo cách khác, (E(e^u_i|X_i) e 0). Do kia khoảng chừng (hatY = e^hateta_0 + hateta_1X_i) sẽ ảnh hưởng thiên lệch vì thiếu mất thành tố (E(e^u_i|X_i)). Hình vẽ sau đây đã biểu thị sự thiên lệch này.


# draw a scatterplotorder_id order(CASchools$income)par(mfrow = c(1,2))plot(score ~ income, col = "steelblue", pch = đôi mươi, data = CASchools, main = "Regression Line with Log Transformation")abline(linear_Model, col = "black", lwd = 2)# add the linear-log regression linelines(CASchools$income, exp(fitted(LogLinear_model)), col = "red", lwd = 2)# draw with different y-axisplot(log(score) ~ income, col = "steelblue", pch = 20, data = CASchools, main = "Log-Linear Regression Function")lines(CASchools$income, fitted(LogLinear_model), col = "red", lwd = 2)

*

Một giải pháp giải quyết đó là nỗ lực ước chừng thành tố thiếu (E(e^u_i|X_i)). Tuy nhiên trường hợp (u_i) tất cả hiện tượng kỳ lạ heteroskedasticity thì Việc ước chừng càng tinh vi rộng.

Một bí quyết giải quyết và xử lý không giống đó là không thay đổi (ln(Y)). Trong tài chủ yếu, điều đó có thể gật đầu đồng ý được Khi phân tích tình tiết giá gia sản, tức là phiên phiên bản (ln(Y)) có ý nghĩa sâu sắc kinh tế.

Trường hòa hợp 2: logarithm (X) và (Y)

Hồi quy log-log có dạng nhỏng sau


# estimate the log-log modelLogLog_mã sản phẩm lm(log(score) ~ log(income), data = CASchools)# print robust coefficient summary khổng lồ the consolecoeftest(LogLog_Model, vcov = vcovHC, type = "HC1")

# generate a scatterplotplot(log(score) ~ income, col = "steelblue", pch = 20, data = CASchools, main = "Log-Linear Regression Function")# add the log-linear regression lineorder_id order(CASchools$income)# add the log-log regression linelines(sort(CASchools$income), fitted(LogLog_model), col = "red", lwd = 2)

*

Ta hoàn toàn có thể không ngừng mở rộng thay đổi logarithms bằng phương pháp kết hợp với đa thức, ta gồm hàm polylog, chẳng hạn như sau.

< extĐiểm thi_i = eta_0 + eta_1 ln( extThu nhập_i) + eta_2 ln( extThu nhập_i)^2 + eta_3 ln( extThu nhập_i)^3 + u_i>


# estimate the polylog modelpolyLog_Mã Sản Phẩm lm(score ~ log(income) + I(log(income)^2) + I(log(income)^3), data = CASchools)# print robust summary lớn the consolecoeftest(polyLog_mã sản phẩm, vcov = vcovHC, type = "HC1")

# compute the adj. R^2 for the nonlinear modelsadj_R2 rbind("Quadratic" = summary(quadratic_model)$adj.r.squared, "Cubic" = summary(cubic_model)$adj.r.squared, "LinearLog" = summary(LinearLog_model)$adj.r.squared, "LogLinear" = summary(LogLinear_model)$adj.r.squared, "LogLog" = summary(LogLog_model)$adj.r.squared, "PolyLog" = summary(polyLog_model)$adj.r.squared)

Adjusted (R^2)
Quadratic0.5540444
Cubic0.5552279
LinearLog0.5614605
LogLinear0.4970106
LogLog0.5567251
PolyLog0.5599944
Ta thấy các thông số (R^2) hiệu chỉnh ngay gần giao động nhau. Ta hoàn toàn có thể đối chiếu đồ gia dụng thị của những mô hình này, chẳng hạn như sau.


# generate a scatterplotplot(score ~ income, data = CASchools, col = "steelblue", pch = trăng tròn, main = "Linear-Log và Cubic Regression Functions")# add the linear-log regression lineorder_id order(CASchools$income)lines(CASchools$income, fitted(LinearLog_model), col = "darkgreen", lwd = 2)# add the cubic regression linelines(x = CASchools$income, y = fitted(cubic_model), col = "darkred", lwd = 2)

*

Cả hai tuyến đường phần nhiều gần giống hệt. Tuy nhiên ta thấy quy mô linear-log được ưu tiên hơn bởi vì ít tđắm say số hơn, ta ko cần những hàm bậc cao.


11.3 Sự tác động thân các biến độc lập

Có các vấn đề trong thực tế tương quan mang lại tác động lên trở thành (Y) của sự việc biến đổi một vươn lên là (X_i) lại dựa vào vào cực hiếm của một biến chuyển (X_j) ((j e i)) không giống. Chẳng hạn, liệu các khoanh vùng các học viên học tiếng Anh đã đạt được lợi gì về mặt điểm số không từ việc sút đồ sộ lớp học. Ttốt do thắc mắc hồi quy thông thường: điểm số sẽ ảnh hưởng ảnh hưởng tác động ra làm sao giả dụ bớt quy mô lớp học tập. Để Review vụ việc này, ta bắt buộc cấp dưỡng mô hình một sự địa chỉ thân những biến (X).

Ta xét cha ngôi trường hợp:

sự ảnh hưởng thân hai vươn lên là nhị phân.sự cửa hàng thân một vươn lên là nhị phân cùng một thay đổi thường xuyên.sự can hệ thân nhì đổi thay liên tiếp.

Xem thêm: Có Nên Gắn 2 Card Màn Hình, Gắn 2 Card Màn Hình Trên 1 Main


11.3.1 Sự cửa hàng giữa nhì biến chuyển nhị phân

Mô hình gồm dạng

Giả sử:

<eginaligned Y_i &= ln( extThu nhập)_i \ D_1i &= egincases 1 ext nếu như người sản phẩm công nghệ i bao gồm bằng cao đẳng \ 0 endcases \ D_2i &= egincases 1 ext giả dụ người thiết bị i là nữ \ 0 endcases endaligned>

Ta biết rằng (eta_1) giám sát sự khác biệt trong logarithm thu nhập cá nhân trung bình giữa nhì team người có bằng cao đẳng cùng người ko, còn (eta_2) đo lường sự khác hoàn toàn trong logarithm các khoản thu nhập mức độ vừa phải thân nam cùng nữ giới. Tuy nhiên mô hình này sẽ không chất nhận được ta nhận xét sự ảnh hưởng tác động của một người dân có đặc điểm của cả (D_1) cùng (D_2). Do kia ta điều chỉnh quy mô khuyến nghị thành:

(D_1i imes D_2i) được Gọi là đổi mới can hệ. Ta thấy:

<eginaligned &E(Y_i|D_1i = 0, D_2i= d_2) = eta_0 + eta_2 imes d_2 \ &E(Y_i|D_1i = 1, D_2i= d_2) = eta_0 +eta_1+eta_2 imes d_2 +eta_3 imes d_2 \&E(Y_i|D_1i = 1, D_2i= d_2) -E(Y_i|D_1i = 0, D_2i= d_2) = eta_1+eta_3 imes d_2 endaligned>

<eginaligned &E(Y_i|D_1i = d_1, D_2i= 0) = eta_0 + eta_1 imes d_1 \ &E(Y_i|D_1i = d_1, D_2i= 1) = eta_0 +eta_1 imes d_1+eta_2 +eta_3 imes d_1 \&E(Y_i|D_1i = d_1, D_2i= 1) -E(Y_i|D_1i = d_1, D_2i= 0) = eta_2+eta_3 imes d_1 endaligned>

Theo đó ta đã lý giải được ý nghĩa sâu sắc hệ số (eta_3).

Trong R, ta khảo sát sự tác động giữa đổi mới STR cùng PctEL. Đặt:

<eginaligned &HiSTR = egincases 1 ext ví như STR ge trăng tròn \ 0 endcases \ &HiEL = egincases 1 ext nếu như PctEL ge 10 \ 0 endcases endaligned>


# appover HiSTR khổng lồ CASchoolsCASchools$HiSTR as.numeric(CASchools$kích cỡ >= 20)# append HiEL lớn CASchoolsCASchools$HiEL as.numeric(CASchools$english >= 10)
Ta ước tính quy mô.


# estimate the mã sản phẩm with a binary interaction termbi_Model lm(score ~ HiSTR * HiEL, data = CASchools)# print a robust summary of the coefficientscoeftest(bi_Model, vcov. = vcovHC, type = "HC1")
## ## t chạy thử of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 664.1433 1.3881 478.4589

11.3.2 Sự ảnh hưởng giữa một biến đổi thường xuyên với đổi thay nhị phân

Đặt (X_i) thể hiện thời gian tay nghề của người thứ (i), là vươn lên là bỗng dưng liên tiếp. Ta chuyển đổi (D_1i) thành biến chuyển (D_i). Mô hình bắt đầu đề xuất:

Ta sản xuất ảnh hưởng tương tác bằng cách thêm biến chuyển ((X_i imes D_i)) vào mô hình. Như vậy vẫn làm cho độ nghiêng con đường hồi quy dựa vào vào vươn lên là (D_i). Có tía ngôi trường hợp:

thuộc độ nghiêng tuy vậy không giống intercept: (Y_i = eta_0 + eta_1 X_i + eta_2 D_i + u_i)thuộc intercept tuy thế không giống độ nghiêng: (Y_i = eta_0 + eta_1 X_i + eta_2 (X_i imes D_i) + u_i)khác intercept không giống độ nghiêng: (Y_i = eta_0 + eta_1 X_i + eta_2 D_i + eta_3 (X_i imes D_i) u_i)

# generate artificial datamix.seed(1)X runif(200,0, 15)D sample(0:1, 200, replace = T)Y 450 + 150 * X + 500 * D + 50 * (X * D) + rnorm(200, sd = 300)# divide plotting area accordinglym rbind(c(1, 2), c(3, 0))graphics::layout(m)# estimate the models and plot the regression lines# 1. (baseline model)plot(X, log(Y), pch = đôi mươi, col = "steelblue", main = "Different Intercepts, Same Slope")mod1_coef lm(log(Y) ~ X + D)$coefficientsabline(coef = c(mod1_coef<1>, mod1_coef<2>), col = "red", lwd = 1.5)abline(coef = c(mod1_coef<1> + mod1_coef<3>, mod1_coef<2>), col = "green", lwd = 1.5) # 2. (baseline Model + interaction term)plot(X, log(Y), pch = trăng tròn, col = "steelblue", main = "Different Intercepts, Different Slopes")mod2_coef lm(log(Y) ~ X + D + X:D)$coefficientsabline(coef = c(mod2_coef<1>, mod2_coef<2>), col = "red", lwd = 1.5)abline(coef = c(mod2_coef<1> + mod2_coef<3>, mod2_coef<2> + mod2_coef<4>), col = "green", lwd = 1.5)# 3. (omission of D as regressor + interaction term)plot(X, log(Y), pch = đôi mươi, col = "steelblue", main = "Same Intercept, Different Slopes")mod3_coef lm(log(Y) ~ X + X:D)$coefficientsabline(coef = c(mod3_coef<1>, mod3_coef<2>), col = "red", lwd = 1.5)abline(coef = c(mod3_coef<1>, mod3_coef<2> + mod3_coef<3>), col = "green", lwd = 1.5)

*

Ta vận dụng trong R bằng phương pháp nhận xét liên can giữa kích thước cùng HiEL theo dạng sản phẩm cha.


# estimate the modelbci_Model lm(score ~ form size + HiEL + kích thước * HiEL, data = CASchools)# print robust summary of coefficients khổng lồ the consolecoeftest(bci_model, vcov. = vcovHC, type = "HC1")
# identify observations with PctEL >= 10id CASchools$english >= 10# plot observations with HiEL = 0 as red dotsplot(CASchools$size, CASchools$score, xlyên = c(0, 27), yllặng = c(600, 720), pch = trăng tròn, col = "red", main = "", xlab = "Class Size", ylab = "Test Score")# plot observations with HiEL = 1 as green dotspoints(CASchools$size, CASchools$score, pch = đôi mươi, col = "green")# read out estimated coefficients of bci_modelcoefs bci_model$coefficients# draw the estimated regression line for HiEL = 0abline(coef = c(coefs<1>, coefs<2>), col = "red", lwd = 1.5)# draw the estimated regression line for HiEL = 1abline(coef = c(coefs<1> + coefs<3>, coefs<2> + coefs<4>), col = "green", lwd = 1.5 )# add a legend lớn the plotlegend("topright", pch = c(20, 20), col = c("red", "green"), legend = c("HiEL = 0", "HiEL = 1"))

*


11.3.3 Sự xúc tiến giữa nhì trở thành liên tục

Sự ảnh hưởng giữa hai biến liên tục (X_1) cùng (X_2) được review trải qua (X_1 imes X_2). Lúc kia, mô hình trở thành:

Đánh giá bán đạo hàm theo (X_1) và (X_2) ta sẽ có:

Áp dụng trong R, ta review kích cỡ cùng english.


# estimate regression Model including the interaction between 'PctEL' and 'size'cci_mã sản phẩm lm(score ~ form size + english + english * kích thước, data = CASchools) # print a summary to lớn the consolecoeftest(cci_Model, vcov. = vcovHC, type = "HC1")
## ## t thử nghiệm of coefficients:## ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 686.3385268 11.7593466 58.3654

11.3.4 Phân tích tài liệu Cầu Economic Journals

Trong phần này, ta phân tích dữ liệu Journals trong package AER, gồm các quan tiền gần kề của 180 tạp chí kỹ thuật trong thời điểm 2000. Ta đo lường và thống kê mức giá cho mỗi citation cùng tính toán tuổi của journal với con số cam kết từ bỏ cho từng journal.


data("Journals")# define và rename variablesJournals$PricePerCitation Journals$price/Journals$citationsJournals$Age 2000 - Journals$foundingyearJournals$Characters Journals$charpp * Journals$pages/10^6Journals$Subscriptions Journals$subs
Vùng quý hiếm của PricePerCitation tương đối rộng và trang trải.


# compute summary statistics for price per citationsummary(Journals$PricePerCitation)
(ln (Subscriptions_i) = eta_0 + eta_1 ln (PricePerCitation_i) + u_i)(ln (Subscription_i) = eta_0 +eta_1 ln(PricePerCitation_i) + eta_4ln(Age_i) + eta_6 ln(Characters_i) + u_i)(ln (Subscription_i) = eta_0 +eta_1 ln(PricePerCitation_i) + eta_2 ln(PricePerCitation_i)^2+eta_3 ln(PricePerCitation_i)^3 + eta_4ln(Age_i) + eta_5 + eta_6 ln(Characters_i) + u_i)(ln (Subscription_i) = eta_0 +eta_1 ln(PricePerCitation_i) + eta_4ln(Age_i) +eta_5+ eta_6 ln(Characters_i) + u_i)

# Estimate models (I) - (IV)Journals_mod1 lm(log(Subscriptions) ~ log(PricePerCitation), data = Journals)Journals_mod2 lm(log(Subscriptions) ~ log(PricePerCitation) + log(Age) + log(Characters), data = Journals)Journals_mod3 lm(log(Subscriptions) ~ log(PricePerCitation) + I(log(PricePerCitation)^2) + I(log(PricePerCitation)^3) + log(Age) + log(Age):log(PricePerCitation) + log(Characters), data = Journals)Journals_mod4 lm(log(Subscriptions) ~ log(PricePerCitation) + log(Age) + log(Age):log(PricePerCitation) + log(Characters), data = Journals)
Sử dụng summary() ta đã có được kết quả sau.

(ln (hatSubscriptions_i) = 4.77 - 0.53 ln (PricePerCitation_i))(eginalignedln (hatSubscriptions_i) = &3.21 - 0.41 ln(PricePerCitation_i) + 0.42ln(Age_i) \&+ 0.21 ln(Characters_i) endaligned)(eginalignedln (hatSubscriptions_i) = &3.41 -0.96 ln(PricePerCitation_i) + 0.02 ln(PricePerCitation_i)^2\&+0.004 ln(PricePerCitation_i)^3 + 0.37ln(Age_i) \&+ 0.16 + 0.23 ln(Characters_i)endaligned)(eginalignedln (hatSubscriptions_i) = &3.43 -0.90 ln(PricePerCitation_i) + 0.37ln(Age_i) \&+0.14+ 0.23 ln(Characters_i)endaligned)

Ta rất có thể cần sử dụng kiểm nghiệm (F) để kiểm soát quy cách polylog so với trở nên (ln(PricePerCitation_i)).


# F-Test for significance of cubic termslinearHypothesis(Journals_mod3, c("I(log(PricePerCitation)^2)=0", "I(log(PricePerCitation)^3)=0"), vcov. = vcovHC, type = "HC1")
## Linear hypothesis test## ## Hypothesis:## I(log(PricePerCitation)^2) = 0## I(log(PricePerCitation)^3) = 0## ## Model 1: restricted model## Model 2: log(Subscriptions) ~ log(PricePerCitation) + I(log(PricePerCitation)^2) + ## I(log(PricePerCitation)^3) + log(Age) + log(Age):log(PricePerCitation) + ## log(Characters)## ## Note: Coefficient covariance matrix supplied.## ## Res.Df Df F Pr(>F)## 1 175 ## 2 173 2 0.1943 0.8236Ta thiết yếu bác bỏ quăng quật (H_0:eta_3 = eta_4 = 0) so với quy mô (III). Kết quả quy mô được thể hiện vào bảng sau đây.

log(Subscriptions)
(I)(II)(III)(IV)
(1)(2)(3)(4)
log(PricePerCitation)-0.533***-0.408***-0.961***-0.899***
(0.034)(0.044)(0.160)(0.145)
I(log(PricePerCitation)2)0.017
(0.025)
I(log(PricePerCitation)3)0.004
(0.006)
log(Age)0.424***0.373***0.374***
(0.119)(0.118)(0.118)
log(Characters)0.206**0.235**0.229**
(0.098)(0.098)(0.096)
log(PricePerCitation):log(Age)0.156***0.141***
(0.052)(0.040)
Constant4.766***3.207***3.408***3.434***
(0.055)(0.380)(0.374)(0.367)
Observations180180180180
R20.5570.6130.6350.634
Adjusted R20.5550.6070.6220.626
Residual Std. Error0.750 (df = 178)0.705 (df = 176)0.691 (df = 173)0.688 (df = 175)
F Statistic224.037*** (df = 1; 178)93.009*** (df = 3; 176)50.149*** (df = 6; 173)75.749*** (df = 4; 175)
Notes:***Significant at the 1 percent level.
**Significant at the 5 percent cấp độ.
*Significant at the 10 percent màn chơi.

Hình hoạ các quy mô như sau.


# divide plotting aream rbind(c(1, 2), c(3, 0))graphics::layout(m)# scatterplotplot(Journals$PricePerCitation, Journals$Subscriptions, pch = trăng tròn, col = "steelblue", ylab = "Subscriptions", xlab = "ln(Price per ciation)", main = "(a)")# log-log scatterplot và estimated regression line (I)plot(log(Journals$PricePerCitation), log(Journals$Subscriptions), pch = trăng tròn, col = "steelblue", ylab = "ln(Subscriptions)", xlab = "ln(Price per ciation)", main = "(b)")abline(Journals_mod1, lwd = 1.5)# log-log scatterplot & regression lines (IV) for Age = 5 và Age = 80plot(log(Journals$PricePerCitation), log(Journals$Subscriptions), pch = đôi mươi, col = "steelblue", ylab = "ln(Subscriptions)", xlab = "ln(Price per ciation)", main = "(c)")JM4C $coefficients# Age = 80abline(coef = c(JM4C<1> + JM4C<3> * log(80), JM4C<2> + JM4C<5> * log(80)), col = "darkred", lwd = 1.5)# Age = 5abline(coef = c(JM4C<1> + JM4C<3> * log(5), JM4C<2> + JM4C<5> * log(5)), col = "darkgreen", lwd = 1.5)

*

Những Tóm lại hoàn toàn có thể được rút ít ra:

Cầu của tạp chí giãn nở nhiều đối với những tạp chí trẻ tuổi.Việc ko bác bỏ vứt (H_0) của kiểm định (F) đối với quy mô (III) thống duy nhất với dục tình đường tính giữa log(subscriptions) và log(price).Cầu cao hơn nữa so với tập san các ký từ bỏ, với giá và tuổi ko thay đổi.

Cầu tập san phi co và giãn cùng với giá: ta thấy quy mô (IV), bao gồm cả tập san trẻ tuổi ((Age=5)) ta thấy ước tính độ co và giãn giá chỉ (-0.899+0.374 imes ln(5)+ 0.141 imes approx -0.3), tức thị một trong những phần trăm đội giá dẫn đến cầu bớt chỉ (0.3) Tỷ Lệ. Kết trái này không có gì kinh ngạc do nguồn tiêu thụ Áp sạc ra của các tạp chí hay là những tlỗi viện.


11.4 Bài tập


11.4.1 Bài 1: Hệ số đối sánh với Phi đường 1

Xem xét mô hình đơn giản:

với (medv) là trung vị giá nhà cùng (lstat) là Tỷ Lệ hộ gia đình cùng với tình trạng kinh tế thấp, trong bộ tài liệu Boston.

Tính thông số đối sánh tương quan thân (medv) và (lstat) cùng lưu lại vào đổi mới corr.Đồ thị hoá medv cùng lstat và cấp dưỡng đường hồi quy thủ thuật. Nhận xét.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiJkYXRhKFwiQm9zdG9uXCIpXG5tb2QgPC0gbG0obWVkdiB+IGxzdGF0ICwgZGF0YSA9IEJvc3RvbilcbiMgY29tcHV0ZSB0aGUgY29ycmVsYXRpb24gYmV0d2VlbiBtZWR2IGFuZCBsc3RhdFxuXG5cbiMgcGxvdCBtZWR2IGFnYWluc3QgbHN0YXQgYW5kIGFkZCB0aGUgcmVncmVzc2lvbiBsaW5lIiwic29sdXRpb24iOiIjIGNvbXB1dGUgdGhlIGNvcnJlbGF0aW9uIGJldHdlZW4gbWVkdiBhbmQgbHN0YXRcbmNvcnIgPC0gY29yKEJvc3RvbiRtZWR2LCBCb3N0b24kbHN0YXQpXG5cbiMgcGxvdCBtZWR2IGFnYWluc3QgbHN0YXQgYW5kIGFkZCB0aGUgcmVncmVzc2lvbiBsaW5lXG5wbG90KG1lZHYgfiBsc3RhdCwgZGF0YSA9IEJvc3RvbilcbmFibGluZShyZWcgPSBtb2QsIGNvbCA9IFwicmVkXCIpIn0=

11.4.2 Bài 2: Hệ số đối sánh và Phi con đường 2

Ta chú ý mối quan hệ tiếp sau đây.

Thực hiện nay hồi quy với tàng trữ vào đổi mới log_thủ thuật.Mô tả điểm rải với sản xuất con đường hồi quy. So sánh cùng với hiệu quả bài trước.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGNvbmR1Y3QgdGhlIHJlZ3Jlc3Npb24gYW5kIGFzc2lnbiBpdCB0byBtb2RfbG9nXG5cblxuIyBkcmF3IGEgc2NhdHRlcnBsb3QgYW5kIGFkZCB0aGUgcmVncmVzc2lvbiBsaW5lIiwic29sdXRpb24iOiIjIGNvbmR1Y3QgdGhlIHJlZ3Jlc3Npb24gYW5kIGFzc2lnbiBpdCB0byBtb2RfbG9nXG5tb2RfbG9nIDwtIGxtKG1lZHYgfiBsb2cobHN0YXQpLCBkYXRhID0gQm9zdG9uKVxuXG4jIGRyYXcgYSBzY2F0dGVycGxvdCBhbmQgYWRkIHRoZSByZWdyZXNzaW9uIGxpbmVcbnBsb3QobWVkdiB+IGxvZyhsc3RhdCksIGRhdGEgPSBCb3N0b24pXG5hYmxpbmUobW9kX2xvZywgY29sID0gXCJyZWRcIikifQ==

11.4.3 Bài 3: Bậc nhiều thức về tối ưu

Ta thấy sinh hoạt bài xích tập trước quy phương pháp (medv_i = eta_0 + eta_1 imes log(lstat_i) + u_i) là 1 trong sự chọn lọc phải chăng. Tuy nhiên, nhiều thức bậc cao so với (log(lstat_i)) rất có thể cân xứng hơn.

Giả sử bậc tối đa chú ý là (r=4), thực hiện for() nhằm lựa chọn ra bậc buổi tối ưu theo cách sau đây.

Ước lượng quy mô, mod, bắt đầu từ bỏ (r=4).Lưu trở thành (p)-value vững vàng của các tmê mẩn số liên quan cùng đối chiếu với mức ý nghĩa sâu sắc (0.05).Nếu không thể bác bỏ vứt mô hình, lặp lại bước (i) với (ii) so với bậc phải chăng hơn.Dừng lại cho tới lúc lựa chọn ra được bậc tối ưu.

Tính (R^2) của quy mô được lựa chọn và phân bổ vào R2.


eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGZpbmQgdGhlIG9wdGltYWwgcG9seW5vbWlhbCBvcmRlciBvZiB0aGUgcG9seWxvZyBtb2RlbFxuXG5cblxuXG5cblxuXG5cblxuIyBleHRyYWN0IHRoZSBSXjIgZnJvbSB0aGUgc2VsZWN0ZWQgbW9kZWwgYW5kIGFzc2lnbiBpdCB0byBSMiIsInNvbHV0aW9uIjoiIyBmaW5kIHRoZSBvcHRpbWFsIHBvbHlub21pYWwgb3JkZXIgb2YgdGhlIHBvbHlsb2cgbW9kZWxcbmZvcihpIGluIDQ6MSl7XG5tb2QgIDwtIGxtKG1lZHYgfiBwb2x5KGxvZyhsc3RhdCksIGksIHJhdyA9IFQpLCBkYXRhID0gQm9zdG9uKVxucHZhbCA8LSBjb2VmdGVzdChtb2QsIHZjb3YgPSB2Y292SEMpWyhpKzEpLCA0XVxuaWYocHZhbCA8IDAuMDUpe1xuICBwcmludChpKVxuICBicmVha1xuICB9XG59XG5cbiMgZXh0cmFjdCB0aGUgUl4yIGZyb20gdGhlIHNlbGVjdGVkIG1vZGVsIGFuZCBhc3NpZ24gaXQgdG8gUjJcblIyIDwtIHN1bW1hcnkobW9kKSRyLnNxdWFyZWQifQ==

11.4.4 Bài 4: Tương tác giữa những đổi thay hòa bình 1

Xem mô hình hồi quy

trong số đó (chas_i) với (old_i) là những trở thành mang. Đối cùng với thay đổi đầu, mang quý giá (1) nếu như sông Charles (một con sông kề bên Boston) đi qua khu vự (i), phát triển thành sau có quý giá (1) nếu như (age ge 95).

Tạo lập đổi mới giả old.Thực hiện hồi quy vào mod_bb.Tổng hợp hệ số hồi quy vững.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGdlbmVyYXRlIHRoZSBiaW5hcnkgdmFyaWFibGUgYG9sZGAgYW5kIGFwcGVuZCBpdCB0byB0aGUgZGF0YXNldFxuXG5cbiMgY29uZHVjdCB0aGUgcmVncmVzc2lvbiBhbmQgYXNzaWduIGl0IHRvIGBtb2RfYmJgXG5cblxuIyBwcmludCBhIHJvYnVzdCBzdW1tYXJ5IHRvIHRoZSBjb25zb2xlIiwic29sdXRpb24iOiIjIGdlbmVyYXRlIHRoZSBiaW5hcnkgdmFyaWFibGUgYG9sZGAgYW5kIGFwcGVuZCBpdCB0byB0aGUgZGF0YXNldFxuQm9zdG9uJG9sZCA8LSBhcy5udW1lcmljKEJvc3RvbiRhZ2UgPj0gOTUpXG5cbiMgY29uZHVjdCB0aGUgcmVncmVzc2lvbiBhbmQgYXNzaWduIGl0IHRvIGBtb2RfYmJgXG5tb2RfYmIgPC0gbG0obWVkdiB+IGNoYXMqb2xkLCBkYXRhID0gQm9zdG9uKVxuXG4jIHByaW50IGEgcm9idXN0IHN1bW1hcnkgdG8gdGhlIGNvbnNvbGVcbmNvZWZ0ZXN0KG1vZF9iYiwgdmNvdi4gPSB2Y292SEMpIn0=

11.4.5 Bài 5: Tương tác giữa các biến hóa hòa bình 2

Bây giờ đồng hồ lưu ý quy mô hồi quy

Dùng ?Boston để tham khảo ý nghĩa các đổi mới trong mô hình. Biến old đã được append vào bộ dữ liệu Boston.

Ước lượng quy mô hồi quy và lưu vào vươn lên là mod_bc.Lấy những thông số hồi quy giữ vào đổi thay params.Vẽ mặt đường hồi quy medv với indus cho hai trường hòa hợp của old.
eyJsYW5ndWFnZSI6InIiLCJzYW1wbGUiOiIjIGNvbmR1Y3QgdGhlIHJlZ3Jlc3Npb24gYW5kIGFzc2lnbiBpdCB0byBtb2RfYmMuXG5cblxuIyBleHRyYWN0IHRoZSBlc3RpbWF0ZWQgbW9kZWwgY29lZmZpY2llbnRzIGFuZCBhc3NpZ24gdGhlbSB0byBwYXJhbXMuXG5cblxuIyBwbG90IG1lZHYgYWdhaW5zdCBpbmR1cyBhbmQgYWRkIHRoZSByZWdyZXNzaW9uIGxpbmVzLiIsInNvbHV0aW9uIjoiIyBjb25kdWN0IHRoZSByZWdyZXNzaW9uIGFuZCBhc3NpZ24gaXQgdG8gbW9kX2JjLlxubW9kX2JjIDwtIGxtKG1lZHYgfiBpbmR1cypvbGQsIGRhdGEgPSBCb3N0b24pXG5cbiMgZXh0cmFjdCB0aGUgZXN0aW1hdGVkIG1vZGVsIGNvZWZmaWNpZW50cyBhbmQgYXNzaWduIHRoZW0gdG8gcGFyYW1zLlxucGFyYW1zIDwtIGNvZWYobW9kX2JjKVxuXG4jIHBsb3QgbWVkdiBhZ2FpbnN0IGluZHVzIGFuZCBhZGQgdGhlIHJlZ3Jlc3Npb24gbGluZXMuXG5wbG90KG1lZHYgfiBpbmR1cywgZGF0YSA9IEJvc3RvbilcbmFibGluZShhID0gcGFyYW1zWzFdLCBiID0gcGFyYW1zWzJdLCBjb2wgPSBcInJlZFwiKVxuYWJsaW5lKGEgPSBwYXJhbXNbMV0gKyBwYXJhbXNbM10sIGIgPSBwYXJhbXNbMl0gKyBwYXJhbXNbNF0sIGNvbCA9IFwiZGFya2JsdWVcIikifQ==