Nghĩ về cuộc khủng hoảng ‘chớp nhoáng’ trong nghiên cứu KH tâm lý

Posted on August 30, 2015 by

0


Op-Economica, 30-8-2015 — Khoảng gần một tuần nay, thế giới khoa học xôn xao vì một công bố rất nặng ký trên Science về khả năng tái lặp kết quả nghiên cứu trong các nghiên cứu khoa học tâm lý.

Đó là một công bố lớn do 270 nhà khoa học khắp thế giới hợp tác, tự nguyện tiến hành, không hề có một xu tài trợ của bất kỳ tổ chức khoa học hay chính phủ nào – cùng với hàng trăm người trợ giúp – nhằm kiểm tra khả năng tái lặp kết quả nghiên cứu (‘reproducibility’) của nhiền nghiên cứu thuộc lĩnh vực khoa học tâm lý, bao gồm các lĩnh vực con quan trọng nhất như: tâm lý học tập, nhận thức, tâm lý nơ-ron, tâm lý xã hội, v.v..

Họ tập trung kiểm tra 100 công trình đã công bố trong riêng năm 2008, từ 3 tập san khoa học hàng đầu của lĩnh vực là: Psychological Science, Journal of Personality and Social Psychology (JPSP), và Journal of Experimental Psychology: Learning, Memory, and Cognition. Về mức độ nghiêm túc thì không còn gì để bàn. Ngoài việc dốc công sức, các nhà KH còn mời chính các tác giả hợp tác để thiết kế đầu bài của việc tái lặp kết quả nghiên cứu.

Tất cả những điều này là nhằm kiểm tra chất lượng và tính tổng quát của các kết quả đã công bố. Hành động anh hùng này là phương tiện quan trọng để thế giới hàn lâm nhìn lại giá trị kiến thức được sản xuất ra.

Kết quả cho thấy, chỉ có 39% các nhận thức được công bố có khả năng tái lặp tường minh và nhất quá.

Con số này nhỏ, nhỏ hơn 50%. Tức là chưa tới 1/2 các kết quả quan trọng nhất của ngành nghiên cứu tâm lý có khả năng tái lặp trong sự kiểm tra ngặt nghèo với giám sát/tham gia của chính tác giả. Nó dấy lên sự nghi vấn về chất lượng khoa học tâm lý nói riêng, và suy rộng ra với các ngành khác, một khi việc kiểm tra này được mở rộng quy mô. Tính tái lặp là một trong những tiêu chuẩn cao nhất của khoa học, ngày càng được nhấn mạnh và trở nên khắt khe.

Hình 1 (Fig. 1) biểu diễn mật độ của mức độ xác nhận P values của nghiên cứu tái lặp so với nghiên cứu gốc. 64% không có khả năng tái xác nhận là nguồn gốc lo lắng.

Fig. 1 Density plots of original and replication P values and effect sizes. (A) P values. (B) Effect sizes (correlation coefficients). Lowest quantiles for P values are not visible because they are clustered near zero.

Fig. 1 Density plots of original and replication P values and effect sizes.
(A) P values. (B) Effect sizes (correlation coefficients). Lowest quantiles for P values are not visible because they are clustered near zero.

Trong Hình 2 (Fig. 2) là biểu đồ tán xạ.

Fig. 2 Scatterplots of original study and replication P values for three psychology journals. Data points scaled by power of the replication based on original study effect size. Dotted red lines indicate P = 0.05 criterion. Subplot below shows P values from the range between the gray lines (P = 0 to 0.005) in the main plot above.

Fig. 2 Scatterplots of original study and replication P values for three psychology journals.
Data points scaled by power of the replication based on original study effect size. Dotted red lines indicate P = 0.05 criterion. Subplot below shows P values from the range between the gray lines (P = 0 to 0.005) in the main plot above.

Hình 3 (Fig. 3) cho biết việc kiểm tra mức độ ảnh hưởng của các biến lên kết cục so sánh giữa nghiên cứu tái lặp và công trình xuất phát. Phần đông, mức ảnh hưởng công bố ban đầu có xu hướng mạnh hơn so với trong nghiên cứu tái lặp. Đồng thời quan hệ này xác lập tính đồng biến. Các mảng màu bên lề là biểu đồ mật độ; trong đó xanh là có ý nghĩa thống kê (significant) và đỏ là không có ý nghĩa (nonsignificant).

Fig. 3 Original study effect size versus replication effect size (correlation coefficients). Diagonal line represents replication effect size equal to original effect size. Dotted line represents replication effect size of 0. Points below the dotted line were effects in the opposite direction of the original. Density plots are separated by significant (blue) and nonsignificant (red) effects.

Fig. 3 Original study effect size versus replication effect size (correlation coefficients).
Diagonal line represents replication effect size equal to original effect size. Dotted line represents replication effect size of 0. Points below the dotted line were effects in the opposite direction of the original. Density plots are separated by significant (blue) and nonsignificant (red) effects.

Bên cạnh sự lo lắng và cảm giác bối rối ban đầu do khả năng reproducibility quá thấp, sau vài ngày tìm hiểu kỹ kết quả, trạng thái của cộng đồng khoa học và giới truyền thông khoa học đã trở lại bình tĩnh và điềm đạm.

Tác giả John Bohannon viết trên Science 28-8-2015 (Vol. 349 no. 6251 pp. 910-911 DOI: 10.1126/science.349.6251.910), tới lúc này nhiều tác giả các nghiên cứu gốc đã lên tiếng ủng hộ và ca ngợi nỗ lực tái lặp là một phần hoạt động giúp gia tăng độ tin cậy và giá trị của các kết quả nghiên cứu.

Đặc biệt quan trọng là sự việc này đánh dấu một bước tiến rất lớn trong văn hóa khoa học; có thể hiểu như một sự đột biến. Nếu như cách đây chưa lâu, mới chỉ vào năm 2011, việc tái lặp các thí nghiệm còn không được ủng hộ hoặc không được coi là cần thiết, thì bây giờ các nhà khoa học đã thực sự coi là một phần quan trọng của chất lượng khoa học.

Chất lượng khoa học không còn trông cậy vào sự tự nguyện đánh giá của tác giả và sự khắt khe (có phần tùy biến) của người gác đền (các chuyên gia bình xét chất lượng), mà có thể được tiến hành bởi cộng đồng rất rộng lớn, hoàn toàn minh bạch và chỉ phụng sự một mục tiêu: chất lượng nhận thức.

Người ta cũng nhận ra rằng, đây không phải là vấn đề của ngành khoa học tâm lý, mà chỉ được bắt đầu với ngành tâm lý. Trên thực tế, các nhà nghiên cứu tâm lý học hiện khá thở phào vì hành vi anh hùng xả thân vì khoa học được bắt đầu từ lĩnh vực của họ. Có rất nhiều lý do để kết quả không thể tái lặp, nhưng ngay cả trong trường hợp nghĩ theo chiều hướng xấu nhất, thì việc bắt đầu với ngành không dẫn đến kết luận tình hình chỉ giới hạn trong phạm vi tâm lý học.

Theo cách diễn đạt của giáo sư Alan Kraut, Giám đốc Hội Khoa học Tâm lý thì kết quả này có ý nghĩa: “Chúng tôi được chứng minh là trong sạch.”

Ông cho biết: “Việc đính chính này xảy ra ở mọi lĩnh vực khoa học, và tôi tự hào vì lần này tâm lý học đã đi tiên phong.”

Ngoài ra, một số nhà khoa học còn chỉ ra, bản thân các nghiên cứu tái lặp này cũng phải liên tục cải thiện về phương pháp, vì chính các nghiên cứu kiểm tra này có thể sai. Xét cho cùng, nỗ lực sẽ đến từ mọi hướng sau cú khởi động quy mô lớn và rất được chú ý này.

Điều đó thúc đẩy khoa học tiếp tục tiến bộ. Tiến bộ lớn nhất ở khía cạnh sự tiến hóa của hệ văn hóa khoa học.

Vào khoảng những năm đầu 2000, Dr. John Ioannidis (Stanford) có dự báo rằng khoảng 1/2 các nghiên cứu trong lĩnh vực y dược bị thổi phồng hoặc sai lầm. Bây giờ chính ông nói rằng, tỷ lệ tái lặp 36% kết quả của tâm lý học thậm chí có thể là mức cao đáng nể một khi các lĩnh vực khác tiến hành các điều tra tái lặp mở rộng, vd. kinh tế học, nghiên cứu động vật, sinh học tế bào, các lĩnh vực y sinh, v.v..

Ông đánh giá tình hình: “Những độ chệch phát hiện thấy trong các nghiên cứu tâm lý thực sự phổ biến trong khoa học.”

Giáo sư Jonathan Schooler (ĐH California, Santa Barbara) có 2 công trình ‘bị’ kiểm tra đợt này—kết cục là 1 khẳng định, 1 không. Ông nói rằng ông đã học cách sống với những kết cục thực tế.

“Đó là một trải nghiệm rất cá nhân, và bạn thật sự cảm thấy mình dễ bị tổn thương,” ông nói.

“Mặt khác, khi các chuyên gia trong ngành muốn điều tra kết quả của bạn, điều đó cũng có nghĩa là kết quả đó thực sự có giá trị.”

Như vậy, thử thách tâm lý có giá trị hun đúc tinh thần khoa học, thúc đẩy những giá trị tối cao của khoa học và đưa tính mỹ học của loại lao động cao quý này lên một bậc cao hơn nữa.

***

Tài liệu tham khảo (dạng pdf): Estimating the reproducibility of psychological science. (Science 28 August 2015:Vol. 349 no. 6251 DOI: 10.1126/science.aac4716)

Advertisements