Cách xử lý số liệu bằng phần mềm sas
PGS. TS. LÊ QUANG HƯNG ỨNG DỤNG SAS 2009 Lời mở đầu Dữ liệu lập trình trên word để xử lý thống kê của SAS ngắn gọn, khoảng 9 hàng với 24 SAS Programs and Applications). Ngoài ra SAS có thể xử lý số liệu với nhiều lệnh, bắt đầu từ 3 1.2. Nguồn số liệu theo dõi thí nghiệm 2.1. Thí nghiệm hoàn toàn ngẫu nhiên
một yếu tố 3 18 Chương 3 3.1. Khối đầy đủ hoàn toàn ngẫu nhiên một yếu tố 3.6. Thí nghiệm ba yếu tố 4.1. Tính giá trị trung bình 4.9. Đồ thị hình lưới chiếu mặt phẳng ba chiều 24 64 Chương 1 Mục tiêu: Mục tiêu của phân tích ANOVA (ANalysis Of VAriance) là xác định các nghiệm thức có ý I 1 3 2 5 4 II 2 1 5 4 3 III 3 4 2 1 5 IV 1 3 2 4 9.00 5 14.90 7.00 10.28 8.00 14.63 11.77 9.12 15.15 14.94 11.86 thấp Cách ghi số liệu lưu trong file excel 3 nthuc D25 nsuat Để phân tích kết quả, cần thực hiện: - Tạo file mẫu word 1.3. * Cách 1: K (Khối), T (nghiệm thức), Y (năng suất), có cách một khoảng hoặc dấu $ như - CARDS; lệnh nhập số, kết
thúc bằng dấu ; - PROC: PROCEDURE, cách xử lý, như ANOVA, GLM, REG, SRREG (hồi qui), - CLASS: xếp loại các biến dùng phân tích, gồm có khối (K) và nghiệm thức (T), - MODEL: mô hình phân tích năng suất (Y) = khối (K) và nghiệm thức
(T) - MEANS: liệt kê các giá trị trung bình nghiệm thức (T) MEANS T; SAS xử lý cả hai, khi đó xem trung bình các nghiệm
thức ở bảng xếp nhóm và chọn mức có Lưu ý: sau mỗi lệnh, kết thúc bằng dấu ; CARDS; 1 G22 X31 (DATA: tên dữ liệu, ghi thêm tên và kết thúc bằng dấu ;) 9.00 15.15 ; (dấu ; cho biết đã ghi xong số liệu) Tóm lại các lệnh (command, code) phân tích thống kê cho cách 1 như sau: ……Số liệu từ bảng excel Input cách 2 như sau: DATA; 6 * Ghi chú về xếp hạng các nghiệm thức: 0.01. Hình 1.1. Giao diện của SAS version 8 - Copy file word mẫu và patse vào phần Program editor. 7 Hình 1.2. Program Editor để chuyển số liệu từ file word mẫu File word mẫu để phân tích
ANOVA, khối đầy đủ ngẫu nhiên, năm nghiệm thức, bốn khối. 1 G22 D25 9.00 8.00 ; 8 MODEL Y = K T; Lưu ý: Có thể dùng mẫu này để xử lý nhiều chỉ tiêu, chỉ cần - Click vào hình NANG SUAT THUC THU Class Level Information 4 1234 5 D25 G22 K14 X31 Z15 Dependent Variable:
Y DF Sum of Mean Square F Value Model 7 170.8494350 24.4070621 8.88 Error 12 32.9776200 2.7481350 Corrected Total 19 203.8270550 R-Square 3 Coeff Var Root MSE Pr > F Y Mean 15.16212 0.3030850 Pr > F 0.11 0.9524 NANG SUAT THUC THU 0.01 9 Means with the same letter are not significantly different. Mean N T A 14.570 4 D25 A 13.755 4 Z15 C 10.905 4 K14 C 8.280 4 G22 7.158 4 X31 1. 5. Giải thích kết quả: Xem bảng ANOVA F Value Pr
> F R-Square K Coeff Var - Nghiệm thức T có F Value 15,46 với Pr > F là <0,0001, các nghiệm thức khác biệt rất có G22 Phương thức tạo file mẫu cho thí nghiệm hai yếu tố 10 Thí nghiệm khảo sát năng suất
đậu (kg/ô) với hai lượng phân lân (P1 = không bón lân, P2 = 25 1994). S2 P1 S1 P1 S3 P2 Sơ đồ thí 58 nghiệm S2 P2 Nhập số liệu với ký hiệu: K (khối), S (khoảng cách hàng), P (lượng phân lân), SP (yếu Trình tự phân tích: a. Tạo file mẫu xử lý
ANOVA và xếp nhóm nghiệm thức S và P. 1.7. 1. Tạo file mẫu tính tương tác, không xếp nhóm các nghiệm thức trung bình của S Kết quả sẽ cho bảng phân tích phương sai, tính tương tác S*P theo 59 1 11 Dunnett test. LSMEANS S*P / PDIFF ADJUST=DUNNETT; 1.7. 2. Tạo file mẫu tính tương tác, xếp nhóm các nghiệm thức trung bình của S và P. Ghi thêm cột SP (yếu tố
tương tác khoảng cách hàng và lượng phân lân để xếp nhóm khi nhóm các trung bình nghiệm thức của các yếu tố như sau: DATA; INPUT K $ S $ P $ SP $ Y; 2 1 S2P1 Class Level Information 3 123 P 2 12 Number of observations 18 12 2 YEU TO DF Sum of Mean Square F Value Model 7 684.6666667 97.8095238 14.53 67.3333333 6.7333333 Error 10 Corrected Total 17 Coeff Var Root MSE Y Mean 0.910461 4.717940 2.594867 55.00000 DF 0.0002 752.0000000 R-Square Source Pr > F Type I SS Mean Square F Value Pr > F K 2 417.3333333 208.6666667 Source DF Type III SS Mean Square F Value Pr > F 2 417.3333333 208.6666667 NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate. A Mean N 56.333 6 3 55.000 6 2 53.667 6 1 S 2 YEU TO The GLM Procedure 13 t Grouping Mean N A 57.333 9 1 B 52.667 9 2 P 2 YEU TO 1 --------------Y-------------Mean 3 59.3333333 5.13160144 2 YEU TO S P 1 1 H0:LSMean= 0.0013 0.8899 Giải thích: sử dụng mức xác suất p-value để so sánh tương tác theo Dunnett test (Adjustment Levels K 3 SP Values 123 6 S1P1 S1P2 S2P1 S2P2 S3P1 S3P2 Number of observations 18 2 YEU TO DF Sum of Mean Square F Value Model 7 684.6666667 97.8095238 14.53 67.3333333 6.7333333 Error 10 17 Pr > F 752.0000000 14 R-Square Coeff Var Root MSE Y Mean 0.910461 4.717940 2.594867 55.00000 Source DF K Type I SS 2 417.3333333 Source DF K Mean
Square Type III SS 2 417.3333333 Mean Square F Value Pr > F 30.99 <.0001 Pr > F 30.99 <.0001 2 YEU TO Number of Means 3 4 5 Means with the same letter are not significantly different. Mean A B 59.333 3 S1P1 57.667 3 S3P2 57.667 3 S2P1 55.000 3 S3P1 52.333 3 N SP S2P2 Bảng 1.2. Năng suất đậu (kg/ô) do ảnh hưởng khoảng cách hàng và lượng lân Yếu tố khoảng cách hàng Trung bình yếu tố lân P1= 0 kg/ha 52,67 B Giải thích kết quả: - So sánh giá trị xác suất p các nghiệm thức trung bình tương tác theo Dunnett cho thấy tương • Nếu thiếu một số giá trị, số trung bình khác với số trung bình bình phương nhỏ nhất. Số trung bình sẽ là: Số trung bình = (4 + 6 + 2 + ....+ 4 + 2 + 3)/8 = 3,625. Nếu quan tâm đến so sánh nhiều giá trị độc lập và không quan tâm đến nhiều tương tác, 16 - So sánh giá trị p điều chỉnh giải thích tương tác của A*B, căn cứ trên giả thiết căn bản là hai giá trị trung bình của hai dãy bằng nhau. - Số liệu là đơn vị số x từ 1 đến 35, chuyển sang yi = ln (xi), (Clewer, 2001). - Số liệu là đơn
vị số có x = 0,02 cộng 1 vào các trị số và đổi sang yi = log Trọng lượng khô của lúa cỏ (red rice) trong thí nghiệm ba nghiệm thức từ 0,08 đến 32 g/m2, - số liệu là % với trị số x từ 0 - 30 (sau khi cộng thêm 0,5
hoặc 1 cho các giá trị Chuyển đổi số liệu sang √(x + 0,5) đối với chỉ số bệnh từ 1,05 đến 2,98 theo thí - số liệu là % với trị số x từ 40 - 70% không cần chuyển đổi vì kết quả thống kê - số liệu là % với trị số x từ 1 đến 100, chuyển sang góc (angular) yi = arcsin√%, Thí nghiệm khảo sát tỉ lệ nảy mầm của hạt Echinacea purpurea từ 4 đến 82% được chuyển - chuyển tỉ lệ %: đổi p = 99 →0.99→SQRT(0.99) = x1→ASIN(x1) = x2→DEGREES(x2) = cơ sở (plot size) và lặp lại (replications) sở cho cây nhỏ: 20-40
cây, cà phê: 4 cây, cây ăn quả nhỏ: 10-20 cây, rau: - Lặp lại (n): bốn lần là phù hợp, tối thiểu là ba lần, cần xác định n = ((V%)/(e%)) 2. 1994). PHÂN TÍCH PHƯƠNG SAI THÍ NGHIỆM BỐ TRÍ trục thảo. Thí nghiệm gồm sáu nghiệm thức tiêm chủng 6 nhóm dòng vi khuẩn ảnh hưởng đến hàm đầu cho năm dòng vi khuẩn Rhizobium trifolii riêng biệt kết hợp với hỗn hợp năm dòng vi 32.6 3DOK1 27 18 3DOK1 32.1 3DOK1 33 means t / duncan waller; Class Levels T 6 Values 3DOK1 3DOK13 3DOK4 3DOK5 3DOK7 COMPOS Number of observations 30 vi khuan DF Sum of Mean Square Model 5 847.046667 169.409333 24 282.928000 11.788667 Error 29 14.37 Coeff Var Root MSE N Mean 0.749616 17.26515 3.433463 19.88667 DF Pr > F 1129.974667 R-Square Source F Value Anova SS 847.0466667 Mean Square F Value Pr > F <.0001 vi khuan Mean 28.820 5 N T 3DOK1 23.980 5 3DOK5 19.920 5 3DOK7 18.700 5 COMPOS 14.640 5 3DOK4 13.260 5 3DOK13 vi khuan 19 The ANOVA Procedure Minimum Significant Difference 4.1665 Mean N T 28.820 5 3DOK1 23.980 5 3DOK5 19.920 5 3DOK7 18.700 5 COMPOS 14.640 5 3DOK4 13.260 5 3DOK13 vi khuan Alpha 3 4 5 Means with the same letter are not significantly different. D Mean N 28.820 5 3DOK1 23.980 5 3DOK5 T 19.920 5 3DOK7 18.700 5 COMPOS 14.640 5 3DOK4 13.260 5 3DOK13 vi khuan 0.05 20 Error Degrees of Freedom Error Mean Square Mean N T 28.820 5 3DOK1 23.980 5 3DOK5 19.920 5 3DOK7 18.700 5 COMPOS 14.640 5 3DOK4 13.260 5 3DOK13 Giải thích: sự khác biệt thay đổi khi so sánh các nghiệm thức với các so sánh giá trị trung bình 2.2. Thí nghiệm hoàn toàn ngẫu nhiên hai yếu tố không cân đối 9 data; 11 A1 B2 9 2 YEU TO KHONG CAN DOI Levels Values A 2 A1 A2 B 2 B1 B2 Number of observations 7 2 YEU TO KHONG CAN DOI DF Sum of Mean Square F Value Pr > F Model 3 91.71428571 30.57142857 15.29 0.0253 Error 3 6.00000000 Corrected Total Source A*B 6 2.00000000 97.71428571 R-Square Coeff Var Root MSE Y Mean 0.938596 9.801480 1.414214 14.42857 DF Type I SS 1 80.04761905 Mean Square Type III SS 1 67.60000000 Mean
Square F Value Pr > F 40.02 0.0080 5.63 0.0982 Pr > F 33.80 0.0101 2 YEU TO KHONG CAN DOI 3 22 Error Mean Square Means with the same letter are not significantly different. Mean N A 18.333 3 A2 B 11.500 4 A1 A Giải thích: sử dụng Type III SS là phù hợp. Chương 3 f e d c e b a data; 23 cards; f 9 22.4 ; Class Levels Values k 4 1234 t 6 abcdef Number of observations 24 Thi nghiem 1 yeu to RCBD DF Sum of Squares Mean Square F Value Model 8 497.3300000 62.1662500 16.42 56.7950000 3.7863333 Error 15 23 Pr > F 554.1250000 24 R-Square Coeff Var Root MSE y Mean 0.897505 11.66927 1.945850 16.67500 Source DF k 3 Anova SS 52.8950000 Mean Square F Value Pr > F 4.66
0.0171 Thi nghiem 1 yeu to RCBD 4.054 3 4 5 Means with the same letter are not significantly different. Mean N 22.375 4 b 21.750 4 a 16.425 4 d 16.075 4 c 12.975 4 t e Giải thích: kết quả cho thấy các nghiệm thức khác biệt rất có nghĩa ở mức p < 0,01, xếp nhóm f b f a d c e f Dữ liệu được sắp xếp như sau: hàng (H), cột (C), nghiệm thức (T) và chiều cao (Y). 25 |