Kiểm định Student’s t và Wilconxon

Posted on November 6, 2015 by

1


Op-Economica, 6-11-2015 — Đây là một trong những kiểm định thống kê quen thuộc nhất. Có ứng dụng rộng rãi trong nghiên cứu khoa học.

Hai cách sử dụng là cho một mẫu hoặc so sánh hai mẫu ngẫu nhiên. Ví dụ như hình dưới đây.

t-test

Bản chất của kiểm định này nhằm xác định xem một trị trung bình (mean) của dữ liệu liên tục giữa hai mẫu có bằng nhau (hay khác), hoặc của một mẫu đang xét có bằng (hay khác) với một trị số cho trước.

Hai kỹ thuật hay được sử dụng (và cũng rất căn bản) là kiểm định Student’s t-testWilconxon test. Có nhiều hàm viết sẵn cho hai kỹ thuật này trong ngôn ngữ R, nhưng hai hàm hay được gọi là t.test và wilcox.test. Lưu ý “kiểm định Mann-Whitney” cũng có nội dung chính là “kiểm định Wilconxon 2-mẫu”.

Student’s t-test cho 1-mẫu

Các kiểm định t được tiến hành dựa trên giả định rằng các dữ liệu sinh ra từ phân phối chuẩn.

Trong trường hợp 1-mẫu, chúng ta có các dữ liệu x_1,x_2,\dots,x_n. Chúng được giả định là phép thể hiện độc lập của các biến ngẫu nhiên có phân phối N(\mu,\sigma^2). Trong phân phối chuẩn này, \mu là trung bình (mean) và \sigma^2 là phương sai (variance).

Giả thiết gốc ta muốn kiểm định trong trường hợp 1-mẫu là: \mu=\mu_0.

Dĩ nhiên ta chỉ có thể ước lượng từ dữ liệu để có: \mu=\overline{x}\sigma=s.

Ở đây xuất hiện một ý niệm tuy là ‘trung gian’ nhưng rất có ý nghĩa: SEM (viết tắt của ‘standard error of the mean’), được hiểu như sau:

SEM =\sigma/\sqrt{n}.

SEM là khái niệm miêu tả mức độ biến động của trị trung bình của n giá trị ngẫu nhiên với trung bình \mu và phương sai \sigma^2.

Điều này có nghĩa là, nếu ta lặp lại toàn bộ thí nghiệm (tạo ra tập dữ liệu) một số lần và tính trị trung bình cho từng thí nghiệm, thì các giá trị trung bình này sẽ tuân theo một phân phối hẹp hơn so với phân phối ban đầu N(\mu,\sigma^2).

Mấu chốt nằm ở chỗ, thậm chí chỉ dựa vào một mẫu, vẫn có thể tính được SEM thực nghiệm qua s/\sqrt{n} sử dụng chính đại lượng độ lệch chuẩn của mẫu. Giá trị này cho ta biết con số trung bình ta quan sát được có khả năng phân tán bao xa ra khỏi giá trị đích thực. (Lưu ý ta không biết giá trị đích thực khi bắt đầu một thực nghiệm thống kê.)

Đối với các dữ liệu tuân theo phân bố chuẩn, quy tắc thông dụng là: Có xác suất 95% sẽ rơi vào khoảng giá trị \mu\pm 2\sigma. Do đó, ta sẽ kỳ vọng rằng nếu \mu_0 là trị trung bình đích thực của toàn không gian, thì \bar{x} sẽ nằm trong khoảng giá trị bằng 2 lần SEM của nó.

Phát biểu một cách chính thống thì ta cần tính:

t-formulavà ta sẽ xem giá trị này có rơi vào trong khoảng giá trị gọi là vùng chấp nhận, mà nếu t nhận giá trị ngoài vùng đó thì xác suất chỉ tương ứng với mức ý nghĩa thống kê (tức là 5%).

(Sẽ tiếp tục bổ sung)


©2015 Vuong & Associates; t=\frac{\bar{x}-\mu_0}{SEM}=\frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}.