Hướng dẫn sử dụng stata 12

THỰC HÀNHKINH TẾ LƯỢNGVỚI STATA 12LÊ DUY KHÁNHVietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam Chương 1. Giới thiệu StataLời nói đầuBạn đọc thân mến,Cuốn sách bạn đang xem ban đầu chỉ là một cuốn sổ tay, được lưu hành nội bộ trong mộtnhóm nhỏ chúng tơi, những người có cùng sở thích về ứng dụng Stata trong giải quyếtcác vấn đề của thống kê, kinh tế lượng phục vụ cho mục đích nghiên cứu khoa học. Tuynhiên, sự động viên của đồng nghiệp và nhu cầu chia sẻ đã đưa cuốn sổ tay đến với đôngđảo người đọc hơn.Cuốn sách này được biên soạn dựa trên cuốn Using Stata For Principles OfEconometrics, ấn bản số 3 của các tác giả R. Carter Hill, William E. Griffiths andGuay C. Lim (2008) vốn được viết cho việc sử dụng Stata 8, chứ không phải Stata 12.Tác giả đã cải biên để cuốn sách phù hợp với Stata 12, và sẽ tiếp tục cải biên để phù hợpvới phiên bản Stata mới nhất.Bạn đọc sẽ tìm thấy trong cuốn sách này những nội dung cần thiết, được chắt lọc cho đốitượng người dùng là sinh viên các trường cao đẳng, đại học, nhưng cũng phù hợp vớisinh viên cao học và nghiên cứu sinh. Những người có nhu cầu nghiên cứu về thống kê,kinh tế lượng. Các nhà nghiên cứu cũng sẽ tìm được những thơng tin, kiến thức và kỹnăng cần thiết cho việc học tập, nghiên cứu của mình. Cuốn sách đặc biệt thích hợp chonhững người có nhu cầu và khả năng tự nghiên cứu.Tuy vậy, những kỹ năng xử lý thống kê, kinh tế lượng trên Stata 12 được đề cập trongcuốn sách này vẫn ở mức cơ bản mà một người làm nghiên cứu khoa học trong lĩnh vựckinh tế đều phải biết. Vì vậy, cuốn sách sẽ tiếp tục được cập nhật những nội dung chuyênsâu hơn trong thời gian tới.Cuốn sách được hoàn thành với sự tài trợ của nhãn hàng Tấm lót và Ga chống thấmVIETMAT (vietmat.vn). Vì vậy, tác giả xin gửi lời tri ân đến nhãn hàng này và nhữngbạn bè, đồng nghiệp đã giúp đỡ để cuốn sách đến được với bạn đọc một cách miễn phí.Mọi thiếu sót của cuốn sách và mọi vấn đề liên quan đều thuộc trách nhiệm của tác giả.Góp ý xin gửi về email: ác giảThành phố Hồ Chí Minh, tháng 7/2019LÊ DUY KHÁNHVietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam2 Chương 1. Giới thiệu StataChương 1. GIỚI THIỆU STATA1.1 Giới thiệu Tập đoàn StataStata là một phần mềm được sử dụng phổ biến trong khoa học thống kê và kinh tế lượng.Đây là phần mềm có bản quyền và được nắm giữ bởi tập đoàn Stata (StataCorp LP).StataCorp LP được sáng lập bởi William (Bill) Gould, hiện nắm giữ vị trí chủ tịch. Ơnglà đồng sáng lập và phục vụ với tư cách phó chủ tịch của Computing Resource Centervào năm 1982. Năm 1990, Bill Gould trở thành chủ tịch của Computing ResourceCenter, và năm 1993 Computing Resource Center đổi tên thành StataCorp LP.StataCorp LP có trụ sở tại 4905 Lakeway Drive College Station, Texas 77845-4512Mỹ, và có mạng lưới phân phối phần mềm Stata trên phạm vi toàn cầu. Tuy vậy,StataCorp LP chưa có đại lý tại Việt Nam nên nếu người dùng tại Việt Nam muốn muaphần mềm có bản quyền, Stata sẽ phân phối trực tiếp từ trụ sở chính đến địa chỉ củakhách hàng. Stata có thể sử dụng trên các hệ điều hành Windows, Mac OS X, Unix, hayLinux.StataCorp LP cịn có tạp chí Stata Journal, được phát hành hàng quý, công bố nhữngnghiên cứu về thống kê, phân tích số liệu, phương pháp giảng dạy, và sử dụng hiệu quảngôn ngữ Stata. Đây là tạp chí khoa học chun ngành thống kê rất có uy tín trên thếgiới. Hiện nay, theo Journal Citation Reports of the ISI Web of Knowledge mới nhất thìStata Journal xếp thứ 4 trong nhóm tạp chí về các phương pháp toán học khoa học xãhội (Social Sciences Mathematical Methods) xét về chỉ số ảnh hưởng (impact factor)trong vòng 5 năm, chỉ sau Structural Equation Modeling, Econometrica, và The Reviewof Economics and Statistics.Bên cạnh đó, Stata Press, một bộ phận của StataCorp LP là đơn vị chuyên phát hànhsách, sổ tay hướng dẫn, các bài báo khoa học về phần mềm Stata và về các chủ đề thốngkê nói chung cho các nhà nghiên cứu chuyên nghiệp ở tất cả các ngành.1.2 Khởi động và kết thúc phiên làm việc StataTrong tài liệu này, Stata phiên bản 12 (icon là) được sử dụng để xử lý đối với toàn bộcác nội dung. Số liệu để minh họa cho các nội dung thực hành các bạn có thể tải theođường dẫn: vietmat.vn > tin tức > Dữ liệu phục vụ sách “Thực hành kinh tế lượngvới Stata 12”.Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam Chương 1. Giới thiệu Stata1.2.1 Khởi động StataNgười dùng có thể khởi động Stata theo nhiều cách.-Cách 1. Nhấp double chuột trái vào icon Stata 12 trên desktop của máy tính hoặcnhấp chuột trái vào icon Stata 12 trên Taskbar.Cách 2. Vào Start > All programs > Stata 12Cách 3. Chọn một tệp tin Stata bất kỳ, nhấp double chuột trái để mở. Trường hợpnày thì khi Stata khởi động, tệp dữ liệu này cũng được mở đồng thời, và trở thànhdữ liệu hiện hành của phiên làm việc. Trong khi sử dụng cách 1 và 2 thì chỉ Statakhởi động mà chưa có tệp dữ liệu nào được mở.Sau khi khởi động, các cửa sổ quan trọng của Stata 12 bao gồm:-----Cửa sổ lệnh (command), tức cửa sổ để gõ lệnh: đây là cửa sổ để người dùng gõcác lệnh khi xử lý thống kê hay kinh tế lượng.Cửa sổ kết quả (results): kết quả xử lý các lệnh do người dùng nhập vào ở cửa sổlệnh sẽ được hiển thị ở cửa sổ này. Đây là cửa sổ trung tâm, và là cửa sổ lớn nhấtcủa Stata.Cửa sổ xem lại (review): nằm ở góc trái của màn hình. Cửa sổ này hiển thị nhữnglệnh mà người dùng đã gõ vào cửa sổ lệnh bất kể lệnh đó đúng hay sai. Khi ngườidùng cần sử dụng lại bất kỳ một lệnh nào đã được thực hiện trước đó, có thể nhấpchuột vào lệnh đó ở cửa sổ này, lệnh đó sẽ được hiển thị lại ở cửa sổ lệnh để ngườidùng sử dụng hoặc chỉnh sửa mà không cần phải gõ lại.Cửa sổ biến (variables): nằm ở góc phải, phía trên của màn hình. Cửa sổ này sẽhiển thị tất cả các biến của dữ liệu hiện hành. Tuy nhiên, các biến chỉ hiển thị tênmà thôi.Cửa sổ thông tin chi tiết của biến và dữ liệu (properties): cửa sổ này nằm phía dướicửa sổ biến, bao gồm hai cửa sổ nhỏ hơn: cửa sổ thông tin chi tiết của biến(variables) và cửa thông tin chi tiết của dữ liệu (data).o Cửa sổ thông tin chi tiết của biến hiển thị các thông tin về biến như: tên (name),nhãn (label), loại dữ liệu của biến (type), format của biến (format), giá trị củanhãn (value label) và ghi chú (notes).o Cửa sổ thông tin chi tiết của dữ liệu hiển thị các thông tin về dữ liệu như: têncủa tệp dữ liệu (filename), đường dẫn đến tệp dữ liệu (full path), nhãn (label),ghi chú (notes), tổng số lượng biến của dữ liệu (variables), tổng số quan sát củadữ liệu (observations), kích thước của dữ liệu (size) và bộ nhớ (memory).Đường dẫn (path) đến thư mục làm việc (directory): góc trái dưới của giao diệnStata hiển thị đường dẫn đến thư mục, nơi mà các kết quả của phiên làm việc sẽVietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam4 Chương 1. Giới thiệu Statađược lưu lại. Người dùng có thể thay đổi đường dẫn này nhằm lưu các kết quả làmviệc tại thư mục mong muốn.1.2.2 Kết thúc phiên làm việcKhi muốn kết thúc phiên làm việc, người dùng có thể đóng Stata bằng một trong ba cách:-Cách 1. Ở cửa sổ lệnh, gõ lệnh exit và nhấn Enter.-Cách 2. Vào File trên thanh menu, chọn exit.Cách 3. Nhấn tổ hợp phím tắt Alt + F41.3 Mở một tệp tin (file) Stata1.3.1 Mở một file Stata đang có trên máy tính của bạnCó nhiều cách để mở một file Stata cho phiên làm việc. Trước tiên, hãy để ý đường dẫn(path) đến nơi chứa các file cần mở của phiên làm việc.Cách 1. Bạn thay đổi thư mục làm việc bằng lệnh cd "tên thư mục", sau đó gõ lệnh usetên file (file có trong thư mục cần mở).Ví dụ, file có tên là solieu đang được lưu tại thư mục data trên ổ đĩa E của máy tính. Đểmở file Stata này, hãy tuần tự thực hiện các bước sau:Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam5 Chương 1. Giới thiệu StataBước 1: gõ lệnh cd “e:data”. Lệnh cd là viết tắt của change directory, nghĩa là thay đổithư mục làm việc1. Sau lệnh này thì đường dẫn mới đã xuất hiện ở góc trái, phía dưới củagiao diện Stata.Bước 2: gõ lệnh use solieu, khi đó tệp tin solieu sẽ được mở. Các biến (variables) của tệptin đã xuất hiện ở góc phải của giao diện.Cách 2. Tại thanh menu, vào biểu tượng open, tìm đến tệp tin cần mở và nhấp doublechuột trái (cách này giống với cách mở một file word/excel mà chúng ta vẫn thực hiệnmỗi ngày).Khi mở tệp tin theo cách này, tại cửa sổ kết quả xuất hiện dòng kết quả sau: use"E:\data\solieu.dta", clear. Điều này cho thấy cách làm này thực tế cũng là dùng lệnh usenhư cách 1. Chữ clear ở đây hàm ý rằng tất cả các dữ liệu đang có trong bộ nhớ của Statađã bị xóa.Lệnh cd có thể dùng để chuyển đến thư mục con, trở về thư mục cha, trở về thư mục gốc, hay có thể đến bất kỳ thưmục nào.Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam16 Chương 1. Giới thiệu StataCách 3. Như đã giới thiệu trong phần khởi động Stata, có thể chọn một file Stata bất kỳđang có máy tính, nhấp double chuột trái để mở.1.3.2 Mở một file Stata đang có trên InternetĐây là một tính năng đặc biệt của Stata. Giả sử bạn có một file theo định dạng Stata,đang lưu tại địa chỉ http://www.stata-press.com/data/r13/auto, bạn muốn tải file dữ liệunày về máy để thực hành, chỉ cần gõ use http://www.stata-press.com/data/r13/auto vàocửa sổ command, file này sẽ được mở giống như mở một file Stata có sẵn trên máy tính.1.4 Cửa sổ các biếnCửa sổ biến ở Stata 12 hiển thị như sau:Cửa sổ biến ở góc phải phía trên hiển thị 2 nội dung, bao gồm tên của biến (variable)và nhãn của biến (label). Ở hình trên, các biến chỉ bao gồm tên mà chưa có nhãn. Vìtên biến thường viết ngắn gọn, khơng có khoảng trắng nên thường khó hiểu đượcchính xác nội dung, do đó nhãn là cách giải thích cụ thể biến đó là biến gì.Có thể thêm nhãn cho các biến bằng các cách sau:Cách 1. Dùng lệnh label variable tên biến "nhãn của biến". Ví dụ, muốn đặt nhãncho biến roa là tỷ lệ sinh lời trên tài sản, hãy gõ vào cửa sổ command lệnh labelvariable roa "ty le sinh loi tren tai san". Có thể thay variable bằng var, tức chỉ cầngõ lệnh label var tên biến "nhãn của biến" là đủ.Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam7 Chương 1. Giới thiệu StataCách 2. Dùng menu: Data > Data utilities > Label utilities > Label variable. Cáchnày có thể dùng để thêm hoặc bỏ nhãn của các biến.Cửa sổ sau sẽ hiện ra, bạn có thể chọn Attach a label to a variable để thêm nhãn chobiến hoặc Remove a label from a variable để bỏ nhãn của biến.Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam8 Chương 1. Giới thiệu StataSau đó chọn biến cần thêm nhãn hoặc bỏ nhãn. Nếu chọn thêm nhãn thì gõ nhãn củabiến vào ô New variable lable: (may be up to 80 characters). Nhãn của biến có thể dàiđến 80 ký tự. Nếu chọn bỏ nhãn thì ơ New variable lable: (may be up to 80characters) sẽ không hiển thị. Sau đó nhấn OK.Lưu ý: có thể đặt nhãn cho cả tệp tin trong trường hợp có nhiều tệp tin khác nhau đểtránh nhầm lẫn. Khi đó, gõ label data "nhãn của tệp tin đang sử dụng". Ví dụ,Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam9 Chương 1. Giới thiệu Statachúng ta đang thao tác trên tệp tin solieu, hãy đặt nhãn cho tệp tin này là du lieu nganhang. Khi đó, gõ label data “du lieu ngan hang”.Cũng có thể dùng menu để quản lý một cách tồn diện các thơng tin liên quan đến tấtcả các biến như thêm nhãn, bỏ nhãn, thay đổi loại dữ liệu (type)... bằng cách sau:Trên thanh menu, vào Data > Variable Manager, giao diện sau sẽ hiện ra:Nếu cần thay đổi thông tin liên quan đến biến nào, hãy nhấp chuột vào biến đó, khi đóbên phía phải, phần Variable Properties (được đóng khung) cho phép thay đổi cácthông tin liên quan đến biến. Sau khi thay đổi hãy nhấn Apply. Bỏ thay đổi hãy nhấnReset.1.5 Xem mô tả dữ liệuĐể xem mơ tả của tồn bộ hoặc một biến nào đó của file dữ liệu hiện hành, tại cửa sổcommand gõ: describe hoặc desVietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam10 Chương 1. Giới thiệu Stata. desContains data from solieu.dtaobs:156vars:13size:9,516variable namestoragetypebankroayeardepositgrowthloan_assetliqui_assetloss_loancost_assetequity_assetinflationforeignownerbnknimstr15floatintfloatfloatfloatfloatfloatfloatfloatfloatfloatfloatdisplayformatdulieu15 Dec 2015 01:06valuelabel%15s%8.0g%ty%8.0g%8.0g%8.0g%8.0g%8.0g%8.0g%8.0g%8.0g%9.0g%8.0gvariable labelngan hangty le sinh loi tren tong tai sannamtang truong tien guidu no tren tong tai santai san thanh khoan tren tong tai sandu phong rui ro tren tong tai sanchi phi tren tong tai sanvon tren tong tai sanlam phatso huu cua nuoc ngoaigroup(bank)ty le lai can bienVới lệnh này, có thể xem tên biến (variable name), loại dữ liệu (type), format củabiến, giá trị của nhãn (value label) và nhãn của biến (variable label). Bên cạnh đó mộtsố thơng tin khác có thể xem như số quan sát (obs, ở đây là 156 quan sát), số lượngbiến (vars, ở đây là 13) hay kích thước của file dữ liệu (size, ở đây là 9,516 KB), têncủa file dữ liệu (file dữ liệu đang sử dụng có tên dulieu) và thời gian thực hiện lệnh(15/12/2015, lúc 01:06 phút).Để xem mô tả thống kê các giá trị tối đa (max), tối thiểu (min), trung bình (mean), độlệch chuẩn (std. Dev) và số quan sát của tất cả các biến đang có, gõ summarize vàocửa sổ command và nhấn Enterkết quả như sau:. summarizeVariableObsMeanbankroayeardepositgro~hloan_asset015615615615602010.5.4505222.5045899liqui_assetloss_loancost_assetequity_assetinflation156156156156156foreignownerbnknim156156156Std. Dev.MinMax01.713325.8364263.152462802008-.808699.156097020138.68105.944218.2512515.0136215.0855018.1213026.1152267.111836.0064162.0245697.0852926.0566027.033777.0019344.024384.042556.06036.640126.0378056.14508.614083.19891.082181913.5.0281628.10941457.524155.014420401-.003794.326.096073Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam11 Chương 1. Giới thiệu StataNếu chỉ cần xem mô tả thống kê của một biến hay nhiều biến cụ thể nào đó, gõsummarize [tên các biến đó]. Ví dụ, chỉ xem mô tả thống kê của biến inflation trongdữ liệu hiện có.kết quả:. summarizeinflationVariableObsMeaninflation156.1152267Std. Dev..0566027MinMax.06036.19891Nếu dùng menu, hãy thực hiện theo thứ tự sau: Statistics > Summaries, tables, andtests > Summary and descriptive statistics > Summary statistics.Hộp trên sẽ xuất hiện. Nếu trường variables để trống thì Stata sẽ thực hiện thống kê tómtắt đối với tất cả các biến. Có thể chọn một/nhiều biến ở ơ này. Phần Options, nếuStandard display được chọn thì thống kê tóm tắt của biến sẽ bao gồm số quan sát (obs),trung bình (mean), độ lệch chuẩn (Std. Dev), giá trị lớn nhất (max) và giá trị nhỏ nhất(min). Người dùng có thể lựa chọn các Options khác để có thêm các thơng tin thống kêtóm tắt của các biến. Sau khi lựa chọn, nhấn OK, kết quả sẽ được hiển thị ở cửa sổ kếtquả.Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam12 Chương 1. Giới thiệu Stata1.6 Hệ thống hỗ trợ của StataĐây là hệ thống hỗ trợ người dùng cực kỳ hữu hiệu của Stata. Với cách vận hành chủ yếudựa trên câu lệnh (command) và hệ thống menu phức tạp, gần như người dùng nào cũngsẽ phải sử dụng hệ thống này của Stata. Hiện Stata có thể hỗ trợ người dùng ở nhiều khíacạnh.1.6.1 Hỗ trợ chung (contents)Stata chia sự hỗ trợ thành các chủ đề khác nhau. Vì là những chủ đề chung nên nội dungchi tiết trong các chủ đề này là rất rộng. Nếu có thời gian, người dùng nên tìm hiểu nộidung chi tiết của từng chủ đề này, bằng cách thực hiện theo trình tự Help > Contents tạimenu.Khi đó, hộp thoại như bên dưới sẽ hiện ra. Bạn thấy danh sách các chủ đề được liệt kê, làcác mục có chữ màu xanh, nhấp chuột vào các chủ đề này sẽ có những nội dung chi tiếthơn cho bạn tham khảo. Tuy nhiên, vì nội dung các chủ đề này rộng nên ít được sử dụngmà người dùng thường sử dụng các hỗ trợ khác của Stata.1.6.2 Hỗ trợ theo từ khóa (keywords)Tại menu thực hiện theo trình tự: Help > Search… Khi đó hộp thoại sau sẽ xuất hiện,bạn hãy gõ nội dung cần tìm thơng tin vào ơ Keywords.Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam13 Chương 1. Giới thiệu StataHộp thoại này có 3 lựa chọn tìm kiếm. Lựa chọn đầu tiên Search documentation andFQAs sẽ cho các kết quả là các tệp tin hỗ trợ chính thức được Stata chấp nhận (officialhelp files), các câu hỏi thường gặp liên quan đến nội dung bạn đang tìm kiếm (FQAs Frequently Asked Questions), các ví dụ (examples) hoặc thông tin lấy từ các bản tin kỹthuật của Stata (STBs – Stata Technical Bulletins). Lựa chọn thứ hai, Search netresources, sẽ cho kết quả là nguồn web từ Stata và các nguồn khác liên quan đến nộidung mà người dùng đang cần tìm kiếm (nguồn từ Stata Journal và Stata TechnicalBulletins sẽ được liệt kê trước). Lựa chọn cuối cùng, Search all, sẽ cho kết quả là kết hợpcủa cả hai lựa chọn trên.1.6.3 Hỗ trợ tìm câu lệnh (command)Đây là một trong những nội dung hỗ trợ thường được người dùng Stata sử dụng nhất. Khibạn đang cần thực hiện một lệnh nào đó nhưng khơng nhớ chính xác cấu trúc của câulệnh, hãy thực hiện theo trình tự: Help Stata > command, sau đó gõ từ khóa của câulệnh bạn đang cần vào ơ sau:Chẳng hạn, gõ từ summarize, kết quả sẽ thực sự hữu ích khi người dùng được cung cấpcấu trúc câu lệnh, giải thích cụ thể cách sử dụng, các options đi kèm câu lệnh và đặt biệtlà các ví dụ để người dùng thực hành.Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam14 Chương 1. Giới thiệu StataHỗ trợ tìm câu lệnh có thể được thực hiện ở cửa sổ command bởi câu lệnh: help [từ khóacủa câu lệnh]. Ví dụ:Kết quả tương tự như thực hiện theo trình tự tại thanh menu: Help Stata > Command.1.7 Câu lệnh trong StataHầu hết người dùng Stata đều sử dụng câu lệnh để thực hiện các thủ tục thống kê hơn làsử dụng các thẻ trên thanh menu. Do đó, để bảo đảm thực hiện đúng câu lệnh, đòi hỏingười dùng phải nắm vững cấu trúc của câu lệnh trong Stata. Các câu lệnh trong Statathường dễ hiểu và dễ thực hiện, tuy nhiên có phân biệt giữa chữ thường và chữ hoa (tứcY và y là khác nhau). Một câu lệnh trong Stata thường có cấu trúc tổng quát như sau:command [varlist] [if] [in] [weight] [, options]Trong đó command là phần bắt buộc, trong khi trong các dấu ngoặc vuông [] là các lựachọn mà người dùng có thể sử dụng.command: là nội dung bắt buộc phải có trong một câu lệnh của Stata. Đây thường lànhững động từ (tất nhiên không phải luôn ln như vậy). Câu lệnh Stata thường có thểviết tắt mà khơng cần phải viết đầy đủ. Ví dụ, thay vì gõ đầy đủ regress (lệnh dùng để hồiquy, sẽ đề cập chi tiết ở các phần sau) thì có thể chỉ cần sử dụng lệnh reg. Để biết đượccâu lệnh có thể viết tắt như thế nào, trong kết quả tìm kiếm của Stata command (giớithiệu ở phần 1.6.3 - Hỗ trợ tìm câu lệnh), phần gạch dưới trong cú pháp (Syntax) chính làphần có thể dùng để viết tắt của câu lệnh đó.Hình trên là kết quả hỗ trợ khi gõ từ khóa summarize vào Stata command trong phầnHelp ở thanh menu. Minh họa cho thấy có thể viết tắt lệnh summarize là su. Lưu ý rằngVietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam15 Chương 1. Giới thiệu Statacác ký tự được gạch dưới là các ký tự tối thiểu để Stata hiểu đúng về một lệnh nào đó, vìvậy người dùng có thể dùng nhiều hơn các ký tự này mà Stata vẫn hiểu đúng về một lệnhcần thực hiện. Chẳng hạn, người dùng có thể gõ sum, summ, summa, summar, summari,summariz để thực hiện lệnh summarize.varlist: thường đi kèm theo sau cstrongly balance cho ta biết tất cảcác quốc gia đều có đủ dữ liệu ở các năm; nếu một năm nào đó bị thiếu dữ liệu thì dữ liệusẽ là unbalanced.Trong nhiều trường hợp khi thiết lập dữ liệu bảng, kết quả thông báo như sau:. xtset countriesvarlist: countries:r(109);string variable not allowedthì Stata báo cho chúng ta biết rằng biến countries là biến chuỗi, vì vậy chúng ta phải đưabiến chuỗi này thành biến numeric. Có thể thay đổi kiểu dữ liệu của biến countries bằngcách tạo ra một biến numeric:egen countries1 = group(countries) hoặc encode countries, gen(countries1)Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam188 Chương 10. Dữ liệu bảngSau đó, khai báo biến countries1 này bằng lệnh xtset:xtset countries1Kết quả như sau:. xtset countries1panel variable:countries1 (balanced)Tiếp theo ta khai báo biến thời gian (year), tại cửa sổ command gõ: xtset countries1year, kết quả như sau:. xtset countries1 yearpanel variable: countries1 (strongly balanced)time variable: year, 1999 to 2013delta: 1 unitNhư vậy, ta đã khai báo dữ liệu bảng đối tệp tin chuong10.dta với chiều N: countries1 vàchiều T: year.Cách 2: Dùng menu: ta thực hiện theo trình tự sau: Statistics > Longitudinal/panel data> Setup and utilities > Declare dataset to be panel data. Hộp thoại sau đây sẽ xuấthiện:Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam189 Chương 10. Dữ liệu bảngTại hộp thoại này, chọn biến đối tượng (chiều N) và biến thời gian (chiều T), sau đó chọnOK.Một số lệnh có thể sử dụng để xử lý đối với dữ liệu bảng:-xtline: dùng để vẽ biểu đồ của một biến nào đó trong mẫu nghiên cứu theo dạngđường (line). Chẳng hạn muốn vẽ đồ của cpi của tất cả các quốc gia đang nghiêncứu bằng lệnh xtline cpi:Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam190 Chương 10. Dữ liệu bảng-xtsum: mơ tả tóm tắt các biến trong mẫu nghiên cứu. Nếu lệnh xtsum đứng mộtmình thì tất cả các mẫu nghiên cứu sẽ được tóm tắt, nếu lệnh xtsum đi liền với mộtbiến cụ thể thì chỉ biến đó mới được tóm tắt. Ví dụ gõ xtsum tại cửa sổ lệnh:. xtsumVariableMeancountr~s overallbetweenwithinStd. Dev.MinMaxObservations..........N =n =T =00.yearoverallbetweenwithin20064.32952304.329523199920061999201320062013N =n =T =2401615moverallbetweenwithin.1836987.184635.0863019.164555-.1635.0892867-.28888791.2755.34008671.119112N =n =T =2401615cpioverallbetweenwithin.0618693.0831378.0448486.0708401-.085253.0206997-.0769145.857426.1683757.7509196N =n =T =2401615countr~1 overallbetweenwithin8.54.6194064.7609520118.516168.5N =n =T =2401615Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam191 Chương 10. Dữ liệu bảng-Nếu chỉ dùng lệnh sum thì kết quả như sau:. sumVariableObsMeancountriesyearmcpicountries102402402402402006.1836987.06186938.5Std. Dev.4.329523.184635.08313784.619406MinMax1999-.1635-.085253120131.2755.8574261610.2 Các phương pháp được sử dụng để ước lượng dữ liệu bảng10.2.1 Pooled OLSĐối với dữ liệu bảng, các phương pháp ước lượng thường được sử dụng là Pooled OLS,Fixed effect và Random effect. Phần này sẽ hướng dẫn sử dụng các phương pháp nàytrong Stata 12. Các phương pháp ước lượng khác đối với dữ liệu bảng sẽ được cập nhậttrong lần tái bản.Để ước lượng dữ liệu bảng bằng phương pháp Pooled OLS, câu lệnh được sử dụng làregress depvar (biến phụ thuộc) indepvars (các biến độc lập). Chẳng hạn, khi cần ướclượng lạm phát (cpi) theo cung tiền (m) đối với dữ liệu trong chuong10.dta, ta gõ lệnhsau:regress cpi mKết quả như sau:. regcpi mSourceSSdfMSModelResidual.1891078691.462833251238.189107869.006146358Total1.65194112239.006911888cpiCoef.m_cons.1523498.0338829Std. Err..027466.0071461t5.554.74Number of obsF( 1,238)Prob > FR-squaredAdj R-squaredRoot MSE======24030.770.00000.11450.1108.0784P>|t|[95% Conf. Interval]0.0000.000.0982422.0198052.2064573.0479606Như vậy, cung tiền có tác động lên lạm phát dựa trên giá trị p-value.Khi ước lượng các mơ hình với Stata, độ tin cậy thường mặc định là 95% (95% Conf.Interval). Có thể thay đổi độ tin cậy bằng cách thêm lựa chọn level vào sau câu lệnh.Chẳng hạn, ta muốn ước lượng bằng phương pháp Pooled OLS với độ tin cậy 99%, hãydùng lệnh sau: regress cpi m, level (99)Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam192 Chương 10. Dữ liệu bảng. regress cpi m, level (99)SourceSSdfMSModelResidual.1891078691.462833251238.189107869.006146358Total1.65194112239.006911888cpiCoef.m_cons.1523498.0338829Std. Err..027466.0071461t5.554.74Number of obsF( 1,238)Prob > FR-squaredAdj R-squaredRoot MSE======24030.770.00000.11450.1108.0784P>|t|[99% Conf. Interval]0.0000.000.0810303.015327.2236693.0524387Nếu muốn kiểm tra biến m có thực sự tác động lên biến cpi hay khơng, có thể thực hiệnlệnh sau: test m. Đây là kiểm định với cặp giả thiết:-H0: hệ số của m = 0, tức m khơng có tác động lên cpi.H1: hệ số của m ≠ 0, tức m có tác động đến cpi.Kết quả của kiểm định này như sau:. test( 1)mm = 0F(1,238) =Prob > F =30.770.0000Như vậy, giá trị p-value =0, ta bác bỏ giả thiết H0, tức m có tác động đến cpi.10.2.2 Fixed effect (ước lượng tác động cố định)Cách 1. Dùng câu lệnh: để thực hiện ước lượng tác động cố định đối với dữ liệu bảng,câu lệnh được sử dụng là xtreg và lựa chọn fe, chi tiết câu lệnh như sau:xtreg depvar [indepvars] [if] [in] [weight], feNhư vậy, để ước lượng tác động của m lên cpi bằng phương pháp ước lượng tác động cốđịnh thì gõ lệnh xtreg cpi m, fe. Kết quả ước lượng như sau:Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam193 Chương 10. Dữ liệu bảng. xtreg cpi m, feFixed-effects (within) regressionGroup variable: countries1Number of obsNumber of groups==24016R-sq:Obs per group: min =avg =max =1515.015within = 0.0424between = 0.5882overall = 0.1145corr(u_i, Xb)F(1,223)Prob > F= 0.3088cpiCoef.m_cons.0885971.0455942sigma_usigma_erho.03929209.07176749.23061949F test that all u_i=0:Std. Err..0282109.0069511tP>|t|3.146.560.0020.000==9.860.0019[95% Conf. Interval].033003.031896.1441913.0592923(fraction of variance due to u_i)F(15, 223) =4.07Prob > F = 0.0000Như vậy, m có tác động lên cpi theo phương pháp hồi quy ước lượng tác động cố định.Nếu muốn hồi quy với độ tin cậy khác 95% (giá trị mặc định), chẳng hạn 99%, thì sửdụng lệnh sau:xtreg cpi m, fe level (99)Cách 2: dùng menu: thực hiện theo trình tự sau: Statistics > Longitudinal/panel data >Linear models > Linear regression (FE, RE, PA, BE). Hộp thoại sau đây sẽ xuất hiện:Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam194 Chương 10. Dữ liệu bảngChọn biến phụ thuộc tại trường Dependent variable và các biến độc lập tại trườngIndependent variables, sau đó chọn phương pháp ước lượng tác động cố định tại trườngFixed-effect, rồi nhấn OK.Nếu muốn thay đổi khoảng tin cậy, chọn tab Reporting tại hộp thoại, sau đó chọn độ tincậy tại trường Confidence level theo minh họa sau:Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam195 Chương 10. Dữ liệu bảng10.2.3 Random effect (ước lượng tác động ngẫu nhiên)Cách 1: Dùng câu lệnh: để ước lượng dữ liệu bảng bằng phương pháp tác động ngẫunhiên, câu lệnh được sử dụng vẫn là xtreg, nhưng lựa chọn là re, chi tiết câu lệnh nhưsau:xtreg depvar [indepvars] [if] [in] [weight], reVietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam196 Chương 10. Dữ liệu bảng. xtregcpi m, reRandom-effects GLS regressionGroup variable: countries1Number of obsNumber of groups==24016R-sq:Obs per group: min =avg =max =1515.015within = 0.0424between = 0.5882overall = 0.1145corr(u_i, X)Wald chi2(1)Prob > chi2= 0 (assumed)cpiCoef.m_cons.1168227.0404092sigma_usigma_erho.02332613.07176749.0955468Std. Err..0274546.0091232z4.264.43==18.110.0000P>|z|[95% Conf. Interval]0.0000.000.0630127.0225281.1706328.0582902(fraction of variance due to u_i)Kết quả cho thấy m là yếu tố có tác động đến cpi, theo phương pháp ước lượng tác độngngẫu nhiên.Cách 2: dùng menu: thực hiện theo trình tự sau: Statistics > Longitudinal/panel data >Linear models > Linear regression (FE, RE, PA, BE). Hộp thoại sau đây sẽ xuất hiện:Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam197