Sai số cho phép trong nghiên cứu khoa học

Chia sẻ bài viết bài trên:



Trong điều tra thực nghiệm, một bộ số liệu có giá trị khoa học nhất là khi nó hạn chế tối đa sai số số liệu ở tất cả các bước nghiên cứu. Do vậy, để tránh sai số, các nhà nghiên cứu cần phải nắm rõ những sai số có thể gặp phải trong quá trình nghiên cứu, giúp công trình khoa học phản ánh thực tế khách quan nhất, tránh những kết luận chủ quan sai lầm. Các sai số trong điều tra có các dạng sau đây:

Sai số cho phép trong nghiên cứu khoa học

- Sai số trong khâu chuẩn bị điều tra

Sai số do khâu xác định đối tượng điều tra

Trong nghiên cứu về tiến độ đền bù giải phóng mặt bằng, lựa chọn đối tượng “Hội phụ nữ” để thu thập thông tin thay cho việc lựa chọn “Cán bộ địa chính – người phụ trách chính về công tác GPMB” là không phù hợp

Sai số trong quá trình thiết kế bảng hỏi

Bảng hỏi thiết kế sai kĩ thuật, mắc lỗi câu hỏi không rõ ý, gây hiểu nhiều nghĩa, hoặc câu hỏi ghép. Ví dụ câu hỏi “Chị đã từng bị chồng đấm đá chưa? Ở đây đấm và đá về bản chất là 2 hành động khác nhau, một hành vi dùng tay, một hành vi dùng chân.

Sai số từ khâu tập huấn điều tra viên

Sai số này chủ yếu ở khâu thống nhất cách hiểu. Chẳng hạn hỏi về độ tuổi, nếu không thống nhất sẽ dẫn đến đáp án có thể là tuổi dương lịch và cũng có thể là tuổi dương lịch

Sai số từ khâu lựa chọn phương án điều tra

Có nhiều phương án thu thập thông tin: điều tra trực tiếp, điều tra gián tiếp, điều tra tập trung, điều tra từng người… Nếu điều tra về các vấn đề tế nhị liên quan riêng tư cá nhân mà hỏi tập trung sẽ ít được thông tin chính xác.



. Sai số do lệch về đặc trưng của phân phối mẫu so với tổng

Khi hỏi về vấn đề cách thức sản xuất rau quả, nhà nghiên cứu lựa chọn thành viên trong hộ gia đình bất kì ở nông thôn để phỏng vấn, tuy nhiên ko phải ai ở nông thôn họ cũng làm nông nghiệp, và điều tra viên vẫn hỏi những người đó dẫn đến thông tin thiếu chính xác. Sai số ở đây xuất phát từ việc mẫu không đồng nhất


. Sai số do thủ tục thu thập thông tin

Sai số này xuất phát từ việc người thu thập thông tin thay đổi mẫu phỏng vấn không theo danh sách đã lập. Mẫu thay thế không đại diện hoặc tập trung nhiều về một tiêu chí nào đó mà không phản ánh cho tổng thể

. Sai số do mẫu lập ra không thích ứng với với nhiệm vụ nghiên cứu

Khi điều tra về đời sống mọi mặt thanh thiếu niên nông thôn nhưng chỉ hỏi những thanh niên hiện đang có mặt ở nhà ở nông thôn. Điều này đã bỏ sót bộ phận thanh niên đang di cư, sống trong quân đội,… Thông tin được cung cấp sẽ không phản ánh hết được thực tế.

. Sai số do chọn mẫu tự phát

Cách chọn mẫu này dẫn đến việc không xác định chính được mẫu có đại diện cho tổng thể hay không. Ví dụ nghiên cứu về thái độ học tập của sinh viên, khi tiến hành điều tra lựa chọn thư viện là nơi tiếp cận sinh viên và chỉ chọn buổi chiều. Ở đây có thể dẫn đến sai số khi đa phần sinh viên lên thư viện là người có ý thức học tập và chỉ tiếp cận những khóa sinh viên không học buổi chiều.

. Sai số do chọn mẫu mang tính “thuận tiện”

Xuất phát từ việc thuận tiện cho việc tiếp cận nghiên cứu nên nhiều khảo sát chỉ chọn những địa bàn đã quen thuộc để thu thập thông tin.

Sự khác nhau trong sai số chọn mẫu mang tính ngẫu nhiên hay hệ thống được phân biệt, một bên là sai số trong quá trình khảo sát, cách thức chọn mẫu đúng nhưng quá trình triển khai lại không thể thực hiện theo quy trình hoặc việc lập mẫu không lường được hết thực tế. Ngược lại, sai số hệ thống trong chọn mẫu là sai số ngay từ khâu lựa chọn hình thức khảo sát. Sai số hệ thống có thể dẫn đến cả cuộc điều tra không có giá trị.  

- Sai số trong quá trình thu thập thông tin tại địa bàn

Sai số xuất phát từ điều tra viên

NTL trả lời phương án “a” nhưng ĐTV điền “b” vào phiếu hỏi, do vội vàng

. Sai số do lỗi cách hiểu

NTL trả lời “đã từng bị đánh” trong câu hỏi bị bạo lực, nhưng ĐTV điền vào phiếu hỏi ở phương án “bị bạo lực tinh thần” (thực tế phải điền p.án “bị bạo lực thể xác”)

. Sai số từ lỗi không theo nguyên tắc chung

Quy định của nghiên cứu là hỏi thứ tự từ A->B->C, nhưng ĐTV hỏi theo thức tự B->C->A

. Sai số từ thái độ nghiên cứu

Sau khi nghe NTL trả lời “đã từng ném điện thoại vì bực tức”, ĐTV tỏ thái độ bằng việc nói “sao ghê thế, thế là không được”, điều đó làm cho NTL có thể định hướng các câu hỏi về sau

. Sai số do tự điền thông tin

ĐTV tự điền câu hỏi mà không hỏi NTL

Sai số xuất phát từ người trả lời

. Sai số do cố ý trả lời sai

Thông tin trả lời không đúng thực tế theo ý thức của NTL do được định hướng để trả lời theo ý kiến của một người thứ 3, hoặc muốn che dấu sự kiện thực tế…

. Sai số do vô ý trả lời sai

Do NTL không nhớ chính xác sự kiện xảy ra, đặc biệt là trong nghiên cứu hồi cứu

. Sai số do không muốn trả lời

NTL có thể biết hoặc không biết phương án trả lời nhưng trả lời cho qua hoặc không trả lời

- Sai số trong khâu xử lý số liệu điều tra


Sai số khâu bổ sung thông tin, hiệu đính dữ liệu

Sai số này xuất phát từ việc người hiệu đính không hiểu rõ hoặc nắm bắt chính xác các thông tin thu được từ cuộc khảo sát, cũng có thể do vội vàng, chẳng hạn khi mã hóa tỉnh, thay vì ghi tỉnh A thì lại ghi thành tỉnh B, dẫn đến khâu phân tích theo nhóm tỉnh bị sai số

Sai số khâu tạo form nhập liệu

Trường hợp này xảy ra khi dựng form nhập liệu trên các phần mềm không tạo được các ràng buộc (file check) để hạn chế nhập sai, hoặc đã sử dụng phần mềm nhập liệu nhưng hình dung chưa hết các ràng buộc để gắn vào form nhập. Chẳng hạn, nếu giữ chức vụ lãnh đạo trong tổ chức Đảng thì phải là Đảng viên

Sai số từ khâu tập huấn cán bộ nhập liệu

Cũng giống như giai đoạn khảo sát, trước khi nhập liệu cũng cần phải tập huấn cho cán bộ nhập liệu để thống nhất cách hiểu, cách mã hóa. Người tập huấn phải là người tạo form mới nắm rõ được số liệu mã hóa như thế nào để hướng dẫn chính xác cho cán bộ nhập liệu. Nếu 2 người này là khác nhau thì có thể dẫn đến sai số.

Sai số quá trình nhập liệu

Đây là sai số xuất phát từ cán bộ nhập liệu, do nhập ẩu, nhập nhầm, không tuân thủ quy trình nhập được hướng dẫn hoặc nhớ sai cách mã hóa

Trong quá trình viết báo cáo, người viết “đọc”/hiểu sai dữ liệu đã được phân tích dẫn đến phân tích sai, dữ liệu không tin cậy. Chẳng hạn, trong khảo sát có 3 người trả lời về vấn đề Thông qua luật Tiếp nhận thông tin, 2 trong số đó đồng ý thì không có nghĩa là 66,7% người trả lời đồng ý việc thông qua luật Tiếp cận thông tin.