Ví dụ về hiện tượng phương sai sai số thay đổi

Giả định sự đồng nhất phương sai của phần dư

Trước khi tiến hành kiểm tra tính chất đồng nhất của phương sai phần dư chúng ta nhắc lại, các giả định quan trọng của ước lượng OLS:

  • Linearity - Biến phụ thuộc là một hàm tuyến tính của các biến độc lập và thành phần sai số ngẫu nhiên.
  • Normality - Thành phần sai số ngẫu nhiên phải có phân phối chuẩn. Điều này là cần thiết và quan trọng hơn cả tính phân phối chuẩn của biến phụ thuộc và biến độc lập. May mắn là, giả thuyết này thường được đảm bảo khi cở mẫu lớn [Định lí giới hạn trung tâm - Central Limit Theorum].
  • Homoscedasticity - Điều đó có nghĩa, phương sai biến phụ thuộc có các mức thay đổi bằng nhau [phương sai không đổi] đối với mỗi giá trị của các biến độc lập.
  • Independence – Các sai số của một quan sát không tương quan với các sai số của các quan sát khác. Đồng thời, thành phần sai số ngẫu nhiên không có tương quan với các biến độc lập. Đọc thêm hồi quy với tùy chọn cluster.
  • Errors in variables – Các biến giải thích không có sai số trong đo lường. Ví dụ, đánh giá điểm số các môn học hoặc cách đo lường chiều cao, cân nặng… đều có những sai số nhất định. Việc xảy ra sai số ở các biến giải thích sẽ đánh giá dưới mức cho các hệ số ước lượng.
  • Model specification – Mô hình phải được xác định đúng [bao gồm tất cả các biến liên quan và loại bỏ tất cả những biến không liên quan].

Ngoài ra, còn có những vấn đề khác có thể xảy ra trong phân tích, tuy nhiên, không vi phạm nghiêm trọng các giả định của ước lượng OLS. Các giả định này chủ yếu liên quan đến phân tích dữ liệu như:

  • Influence - Một số quan sát ảnh hưởng quá mức đến hệ số ước lượng.
  • Collinearity - Các biến giải thích có cộng tuyến cao với nhau, ảnh hưởng đến các hệ số ước lượng.

Như vậy, tính chất đồng nhất về phương sai của phần dư [homogeneity of variance of the residuals] là một trong những giả định chính của hồi quy OLS. Nếu mô hình hồi quy là hoàn toàn phù hợp [well-fitted] thì không có mẫu hình [no pattern] đối với phần dư nào trên đồ thị phân tán của phần dư và giá trị dự đoán. Nếu phương sai của phần dư không còn là hằng số hay có sự thay đổi về phương sai của phần dư thì hiện tượng này được gọi là phương sai thay đổi [heteroskedastic].

Trang 2 sẽ trình bày cách phát hiện phương sai thay đổi.

Loading Preview

Sorry, preview is currently unavailable. You can download the paper by clicking the button above.

NỘI DUNG

 Khái niệm PSSSTĐ

   Hậu quả PSSSTĐ

    Phát hiện PSSSTĐ

      Khắc phục PSSSTĐ

Phương sai sai số thay đổi là gì? Phương sai sai số thay đổi [Tiếng Anh: Heteroscedasticity hoặc Heteroskedasticity] là hiện tượng mà tại đó phần dư [residuals] hoặc các sai số [e] của mô hình sau quá trình hồi quy không tuân theo phân phối ngẫu nhiên và phương sai không bằng nhau. Điều này vi phạm giả thuyết của mô hình hồi quy tuyến tính là phương sai thay đổi của các sai số phải giống nhau [Tiếng Anh: Homoskedasticity].

Vậy bản chất hiện tượng phương sai sai số thay đổi là gì?

1. Phương sai sai số thay đổi là gì?

Khái niệm

Phương sai sai số thay đổi là gì? [Tiếng Anh: What is Heteroscedasticity or Heteroskedasticity?] Đó là hiện tượng mà tại đó phần dư [residuals] hoặc các sai số [e] của mô hình sau quá trình hồi quy không tuân theo phân phối ngẫu nhiên và phương sai không bằng nhau. Điều này vi phạm giả thuyết của mô hình hồi quy tuyến tính là phương sai thay đổi của các sai số phải giống nhau [Tiếng Anh: Homoskedasticity]. Đó là câu trả lời cho câu hỏi “Bản chất của hiện tượng phương sai sai số thay đổi là gì?” phía trên.

Hiện tượng phương sai sai số thay đổi thường hay xuất hiện trong dữ liệu bảng [panel-data]dữ liệu cắt ngang [cross-sectional data].

Xem thêm định nghĩa: Phương sai [Variance] và Hiệp phương sai [covariance] là gì?

Các loại phương sai sai số thay đổi là gì? [Heteroscedasticity]

Có 2 loại phương sai thay đổi gồm:

  • Phương sai thay đổi không có điều kiện là hiện tượng xảy ra khi phương sai thay đổi của các sai số hoặc phần dư không tương quan với các biến độc lập trong mô hình hồi quy.
  • Phương sai thay đổi có điều kiện là hiện tượng xảy ra khi phương sai thay đổi của các sai số hoặc phần dư có tương quan với các biến độc lập trong hồi qui.

2. Nguyên nhân xảy ra hiện tượng phương sai sai số thay đổi là gì?

Có hai nguyên nhân dẫn đến hiện tượng phương sai sai số thay đổi trong mô hình gồm:

  • Nguyên nhân chính xảy ra phương sai sai số thay đổi bắt nguồn từ việc sai sót trong quá trình biến đổi chỉnh sửa dữ liệu hoặc sai dạng hàm mô hình hay có thể là mô hình đã bỏ sót các biến quan trọng.
  • Một nguyên nhân khác cũng có thể bắt nguồn từ việc sử dụng các thang đo khác nhau cho các quan sát của cùng một biến trong mô hình hồi quy.

3. Hậu quả của phương sai sai số thay đổi là gì?

Phương sai sai số thay đổi [Heteroscedasticity] vẫn không làm thiên lệch và mất đi tính nhất quán [unbiased and consistent] của các ước lượng từ mô hình OLS [Ordinary Least Squares].

Tuy nhiên, hậu quả là mô hình OLS không còn là mô hình ước lượng tốt nhất nữa mà cần phải khắc phục trong các mô hình cao cấp hơn.

Ngoài ra hiện tượng này sẽ làm chệch đi các kiểm định T và F khiến chúng ta đưa ra các kết luận sai lầm.

Các bạn nên tìm hiểu thêm Mô hình OLS là gì? nếu chưa biết khái niệm nhé!

4. Kiểm định phương sai thay đổi trong STATA

khi mô hình có phương sai số thay đổi, ta luôn có thể khắc phục nó bằng hai cách bằng kiểm định phương sai thay đổi trong STATA.

Tải về bộ dữ liệu của Mosl xong rồi thực hành lun nhé!

Dưới đây là 2 cách phát hiện phương sai thay đổi trong mô hình hồi quy gồm:

Cách 1: Vẽ đồ thị sai số thể hiện phương sai thay đổi trong Stata

  • Đầu tiên hồi quy mô hình với biến phụ thuộc ROA trong phần mềm Stata.
  • Sau đó dùng lệnh rvfplotyline[0] để giá trị xuất hiện quanh đường thẳng sai số 0.

Có thể các chấm xanh là các sai số đối với từng giá trị ước lượng của các biến trong mô hình đa phần tập trung quanh đường trung bình.

Tuy nhiên các sai số này có vị trí nằm không đối xứng với nhau nên có thể mô hình đang bị hiện tượng phương sai sai thay đổi.

Để rõ ràng hơn chúng ta đi qua kiểm định phương sai thay đổi trong Stata cho chắc hơn nhé!

Xem thêm: Kiểm định phương sai phần dư không đổi trong SPSS

Cách 2: Chạy kiểm định phương sai thay đổi trong Stata

Giả thuyết:

H0: Mô hình không xảy ra hiện tượng phương sai sai số thay đổi

H1: Mô hình xảy ra hiện tượng phương sai sai số thay đổi

Kiểm định Breusch-Pagan trong Stata với lệnh: estat hettest

Kiểm định phương sai thay đổi trong Stata

Kiểm định White trong Stata bằng lệnh: estat imtest,white

Kiểm định phương sai thay đổi trong Stata

Tham khảo thêm: Kiểm định phương sai thay đổi trong SPSS Eview

Có thể thấy trong hai kiểm định thì giá trị Prob > chi2 đều bằng 0.0000 < 0.05 [mức ý nghĩa 5%], điều này chứng tỏ ta phải bác bỏ giả thuyết H0 và chấp nhận giả thuyết H1 rằng: Mô hình xảy ra hiện tượng phương sai sai số thay đổi.

Trong quá trình hồi quy mô hình các bạn sẽ kỳ vọng Prob > chi2 lớn hơn mức ý nghĩa 5%.

Bạn có biết: Trong nghiên cứu đa phần sẽ sử dụng kiểm định White trong Stata bởi vì tính thông dụng của nó!

5. Kiểm định phương sai thay đổi trong STATA nâng cao

Giả thuyết chung:

H0: Phương sai sai số trong các thực thể là không thay đổi

H1: Phương sai sai số trong các thực thể là thay đổi

Có thêm 2 cách nâng cao để phát hiện phương sai thay đổi hay kiểm định nó trong phần mềm Stata

Kiểm định Wald trong Stata

Kiểm định Phương sai sai số thay đổi Heteroskedasticity cho mô hình FEM bằng kiểm định Wald trong Stata bằng lệnh: xttest3

Từ kết quả hình trên ta thấy Prob>chi2 = 0.0000 < 5% nên bác bỏ H0 và kết luận Phương sai sai số trong các thực thể là thay đổi.

Lưu ý: Kết luận này là không tốt và chúng ta mong đợi P-value > 5% các bạn nhé!

Kiểm định Breusch and Pagan Lagrangian trong Stata

Kiểm định Phương sai sai số thay đổi Heteroskedasticity cho mô hình REM bằng kiểm định Breusch and Pagan Lagrangian trong Stata bằng lệnh: xttest0

Từ kết quả hình trên ta thấy Prob>chi2 = 0.1092 > 5% nên chấp nhận H0 và kết luận Phương sai sai số trong các thực thể là không thay đổi.

Lưu ý: Kết luận này điều mà chúng ta mong đợi vì P-value > 5% nha các bạn nè :]]]

Xem thêm: Hồi quy mô hình FEM và REM trong dữ liệu bảng

6. Khắc phục phương sai sai số thay đổi trong STATA

Có khá nhiều cách cách khắc phục phương sai sai số thay đổi như sau:

  • Sử dụng mô hình WLS [Weighted Least Squares], mô hình khá tương tự với mô hình OLS giúp khắc phục phương sai sai số thay đổi tuy nhiên cần phải sử dụng nhiều phép thử để chọn lọc ra được kết quả.

Tham khảo thêm mô hình WLS tại: //www.stata.com/manuals13/rvwls.pdf

  • Biến đổi các biến thành dạng logarit để giảm bớt và khắc phục hiện tượng phương sai thay đổi.

Tham khảo: Khắc phục phương sai thay đổi bằng Eviews

Cách này khá phổ biến để khắc phục hiện tượng phương sai thay đổi trong mô hình:

Chỉ cần bỏ thêm lệnh ,robust sau lệnh hồi quy mô hình tuyến tính.

Như vậy đến đây bạn có thể kết luận được mô hình với kết quả này và tự tin rằng đã khắc phục hiểu rõ đươc hiện tượng phương sai sai số thay đổi là gì thành công nhé!

Xem thêm: Mô hình hồi quy tuyến tính là gì?

7. Tổng kết

Như vậy MOSL đã giới thiệu đến các bạn các ý chính như sau:

  • Phương sai sai số thay đổi là gì? Bản chất của hiện tượng phương sai sai số thay đổi.
  • Nguyên nhân xảy ra hiện tượng phương sai sai số thay đổi
  • Hậu quả của phương sai sai số thay đổi
  • Kiểm định phương sai thay đổi trong STATA và cách phát hiện phương sai thay đổi trong mô hình.
  • Khắc phục phương sai thay đổi trong STATA

Bên cạnh đó đã nêu rõ khái niệm, phân loại, nguyên nhân, hậu quả, phát hiện và cách khắc phục bằng phần mềm khác như SPSS và EVIEWS. Vậy là xong khái niệm phương sai sai số thay đổi là gì? rồi nhé!

Cuối bài, MOSL xin chúc các bạn học tập và làm việc hiệu quả!

Xem thêm: Dịch vụ chạy Stata của Mosl.vn

Video liên quan

Chủ Đề