Thống kê toán (1) – Ý nghĩa đối với sự tồn vong và phát triển nhân loại

Posted on August 20, 2011 by

0


© Op-Economica, 20-8-2011 — Phần đông nghĩ rằng thống kê trước tiên liên quan tới quản lý rồi xử lý rất nhiều dữ liệu, con số. Tuy nhiên, thực tế là mục tiêu cơ bản và quan trọng nhất của nghiên cứu khoa học – chính là lý do tại sao bạn lại đi thu thập số liệu – lại là làm sao để hiểu được số liệu nói lên điều gì. Người ta cần đến công việc thống kê khi nhà khoa học, kỹ sư người hoạch định chính sách phải quyết định tiến hành khảo sát, thí nghiệm mà công việc đó làm sinh ra vô số các dữ liệu, thường vượt quá khả năng xử lý đơn giản của một người bình thường (lại đơn độc).

Các nhà thống kê tin rằng hoàn toàn có phương pháp để diễn đạt ý nghĩa và những đặc tính quan trọng nhất của các con số, thông qua các mô hình, hệ thức toán học đủ giản dị để sử dụng.

Như vậy, công việc tìm hiểu về thống kê toán của chúng ta cần bắt đầu với những mô hình rất hữu ích nhưng đầu tiên phải giản dị. Mặc dù giản dị, chúng vẫn cứ là công cụ quan trọng để động viên công việc thống kê.

Hai loại mô hình chính sẽ cần phải tìm hiểu tùy theo loại thực nghiệm ta tiến hành. Trước tiên, ta nghiên cứu các thí nghiệm mà kết cục có thể đo được, ví dụ như đo nhiệt độ, lượng nước mưa hay huyết áp. Ta sẽ tìm cách đúc kết các dữ liệu thu được và tìm hiểu xem điều kiện thực nghiệm sẽ tác động tới các kết quả đo được theo cách thức ra sao?

Thứ hai, chúng ta chúng ta sẽ xem thử các loại thí nghiệm mà kết cục là một số đếm các phần tử rơi vào một số chủng loại, ví như số học sinh nam hay nữ, chết hay sống, vuông hay tròn… Cũng tương tự, làm việc này cần kèm theo ý nghĩa làm sáng tỏ các số đếm thu được thay đổi ra sao khi điều kiện thay đổi.

Trong bài viết mở màn này, chúng ta cùng xem xét những ý nghĩa đích thực rất quan trọng, khiến loài người phải tìm đến và trông cậy vào các phương pháp thống kê toán và kỹ thuật thống kê để có thể phát triển khoa học và ứng dụng tiến bộ kỹ thuật.

Ý NGHĨA ĐÍCH THỰC CỦA KỸ THUẬT THỐNG KÊ VÀ PHƯƠNG PHÁP THỐNG KÊ TOÁN

Thường ta có nhận thức sai lầm rằng thống kê là chuyện loay hoay với các con số chán chết, tẻ nhạt, thậm chí còn kỳ thị hơn là những phân tích cố tình làm sai lạc hiểu biết (không ít người nghĩ thế, do bối cảnh xã hội chẳng hạn).

Tuy vậy, ta sẽ sớm nhận thấy, thực tế và bản chất hoàn toàn ngược lại. Thống kê là khoa học đúc rút những con số và ý nghĩa vô cùng thú vị từ thế giới tự nhiên hay xã hội. Một nhà thống kê có năng lực có sức mạnh “tra tấn số liệu” để bắt chúng khai báo sự thật.

Vì lẽ đó, thống kê trở thành công cụ và phương tiện không bao giờ thiếu được của xã hội loài người hiện đại. Những ví dụ sửng sốt và đầy cuốn hút nhiều vô số suốt chiều dài phát triển của nền khoa học và tiến bộ tri thức của loài người.

i2M_chemicals

* Ví dụ 1: Vào đầu thế kỷ 19, các nhà thiên văn học tốn nhiều thời gian để quan sát thấy thiên thể nhỏ đầu tiên Ceres. Nhưng rồi, thiên thể này biến mất vào vùng sáng của Mặt Trời, khiến các nhà thiên văn lúng túng, e rằng sẽ không còn tìm thấy nó về sau (nhất là ở một thời điểm nào đó trong tương lai có thể đoán định trước – để còn chĩa ống kính lên theo dõi chứ!). Họ lo vì sao? Vì lúc đó chẳng ai biết quỹ đạo chuyển động của Ceres thế nào.

Nhưng lịch sử đã thay đổi nhờ nhà toán học người Đức vĩ đại Carl Friedrich Gauss. Ông nỗ lực hết sức để xác định qua tính toán quỹ đạo của Ceres, sử dụng các quan sát và dữ liệu thu được trước khi thiên thể Ceres này bị biến mất trên bầu trời.

Nhờ các kết quả tính ra, Gauss thông báo cho giới khoa học rằng có thể tìm Ceres ở đâu một vài tháng sau (khi nó đi ra khỏi vùng sáng của Mặt Trời) và ở khoảng vị trí nào trên bầu trời.

Thiên tài của ông có tính ứng dụng rất cao. Các nhà khoa học theo lời Gauss sau đó vài tháng đã tìm lại được dấu vết của Ceres ở đúng vị trí mà Gauss tiên liệu. Sự kiện này biến Gauss thành một trong những nhà toán học được kính trọng nhất đương thời.

Các nhà sử học về sau vẫn cứ nhấn mạnh thiên tài toán học của Gauss, và cho rằng ông vận dụng thiên tài để quan sát và dự báo chính xác quỹ đạo của Ceres thông qua các phương trình toán học và cơ học thiên thể. Có thể do họ quá đỗi kính trọng Gauss nên có phần tưởng tượng. Gauss còn làm cả cách khác.

Ông bắt đầu tìm kiếm quy luật từ một đống số liệu quá khứ, dữ liệu này hiển nhiên được ghi lại từ các quan sát mà do đặc tính thiên văn không được chính xác và đầy đủ lắm, ghi lại các vị trí của Ceres. Ta nhớ rằng, ở thời kỳ Gauss các phương tiện thiên văn như ống kính, đài quan sát, và nhất là đồng hồ không được đảm bảo chất lượng lắm, thua xa so với những gì loài người có hôm nay.

Như thế, nếu Gauss chỉ căn vào các dữ liệu thống kê để vẽ quỹ đạo Ceres trên bầu trời, đường đi của thiên thể này không được trơn mà nhảy giật cục, sai lệch so với quỹ đạo thực tế của Ceres.

Điều may mắn là Gauss chính là một thiên tài phát minh ra phương pháp kỹ thuật thống kê mới diệu kỳ của nhân loại: Phương pháp bình phương tối thiểu (LS). Phương pháp này cho phép sử dụng số liệu từ các quan sát không chính xác lắm, rút xuống thành một quy luật chính xác hơn mô tả đặc tính quỹ đạo của hành tinh.

Thành công kỹ thuật toán học của Gauss được nhân đôi. Ngoài phát hiện quy luật toán học, đó là một phát minh phương pháp thống kê và ngày nay đã trở thành một trong những phương pháp có giá trị vĩ đại bậc nhất trong lịch sử nhân loại, xuyên qua hầu như tất cả các ngành khoa học tự nhiên và xã hội.

* Ví dụ 2: Một ví dụ kinh hoàng khác liên quan tới nhà phát minh vĩ đại Alexander Fleming, người có công cứu sống hàng triệu triệu người nhờ bước tiến đầu tiên của y dược hiện đại vào phát minh kháng sinh penicillin. Mất cả một thế hệ đời người để loại kháng sinh này thực sự trở thành dược phẩm chủ yếu chữa các bệnh gây tử vong.

Quá trình này bắt đầu khi nhà bác học Fleming thông báo về số lượng vi khuẩn có trên đĩa cấy khuẩn thí nghiệm, rồi dẫn đến việc sử dụng penicillin trên bệnh nhân, rồi còn đến các báo cáo chuẩn mực từ nhiều bác sỹ về tình trạng hiệu quả sử dụng penicillin với các bệnh nhân. Quá trình này rất dài lâu, và đầy rẫy các báo cáo thống kê liên quan.

Cuối cùng, kết quả xuất sắc về điều trị và danh tiếng lẫy lừng của loại thuốc mới này (kháng sinh đầu tiên của loài người) trong cộng đồng y học đã quá đỗi mạnh, khiến cho các hãng dược phẩm chấp nhận rủi ro để đẩy mạnh đầu tư sản xuất đại trà kháng sinh.

Quá trình của ông Fleming kéo dài ghê gớm, vì thời kỳ đó chẳng có chuẩn mực của cộng đồng khoa học về thế nào là quy trình hợp lý, cách thức đánh giá giá trị điều trị thế nào thì đáng tin cậy với một loại thuốc mới.

Cũng thời đó, vô số loại dược phẩm chẳng có tác dụng gì suốt ngày được “sáng chế” ra và rêu rao, quảng cáo. Do nhiều người thì bỗng khỏi bệnh luôn, người khác thì mãi không thể khỏi, thậm chí ngay cả với loại thuốc tốt nhất, nhiều hứa hẹn điều trị nhất, chẳng thể nào phân định thuốc tốt với thuốc rởm không ra gì.

May mắn là trong những năm các nhà nghiên cứu dược phẩm nghiên cứu công năng của penicillin, các nhà thống kê toán lại đang phát minh ra các phương pháp thống kê nhằm thiết kế, kiểm soát chu trình thí nghiệm. Thực ra khởi nguồn là bài toán thí nghiệm với sản xuất nông nghiệp.

Đây lại chính là những phương pháp đáng tin cậy, đầy tính kỷ luật mà ngành sáng chế dược phẩm đang rất cần.

Ngày nay, các loại thuốc mới ra đời bắt buộc phải tuân thủ các quy trình thí nghiệm, kiểm soát, thử nghiệm ngẫu nhiên… trong những khoảng thời gian khá ngắn, nhằm cung cấp thông số đánh giá về giá trị tiềm tàng trong điều trị y học.


* Bài tiếp theo: Thống kê toán (2) – Công thức chi-squared vĩ đại của Karl Pearson


© V&A