Từng bước sử dụng ngôn ngữ R trong thống kê (2)

Posted on February 13, 2015 by

3


Op-Economica, 13-2-2015 — Người dùng tương tác với R thông qua các lệnh. Căn cứ vào mục đích phân tích, dạng số liệu, mô hình phân tích mà R có các lệnh tương ứng.

Cấu trúc lệnh trong R thường là:

đối tượng (objects) <- hàm(thông số 1, thông số 2, thông số 3, …, thông số n).

Ví dụ:

> x <- c(“female”, “male”)

thì R sẽ hiểu đối tượng (object) đang làm việc là x. Đối tượng x là một tập hợp gồm 2 giá trị bằng chữ “female” và “male” (nếu một giá trị đặt trong dấu ngoặc kép thì R sẽ hiểu giá trị đó không phải là số, không tính toán được – unnumeric value).

hoặc

> pdat <- read.table(“c:/Users/PS/P330.csv”, sep=”,”, header=TRUE)

lệnh này yêu cầu R đọc/nhập dữ liệu trong file P330.csv lưu trong ổ C theo đường dẫn của máy tính, với “,” là dấu cách các số trong file (sep=”,”), và cho phép R lấy luôn giá trị trong hàng đầu tiên có trong file .csv làm header (header=TRUE). Đối tượng sẽ làm việc là pdat (nếu sau đó không có thay đổi gì cho lệnh này thì pdat sẽ được R hiểu với những thông số đã liệt kê).

Lưu ý rằng R phân biệt rõ các chữ in thường và in hoa.

Nếu chưa rõ các thông số trong một hàm thì có thể tham khảo mục Help hoặc gõ lệnh trong R, các lệnh thường dùng là:

?(tên của hàm) hay help(tên của hàm)

ví dụ: ?(xtabs) hay help (xtabs)

Lệnh args(tên của hàm) cũng tương tự hai lệnh trên. Chẳng hạn: args(xtabs).

Cách viết x = () tương tự cách viết x <- () nhưng dấu <- được khuyến khích hơn.

Tương tự trong Latex, nếu dấu # đứng trước một dòng lệnh thì R sẽ hiểu đó không phải là một lệnh mà chỉ là một ghi chú (note) đơn thuần.

Đặt tên cho đối tượng làm việc với R

Khi làm việc gì đó nhất thiết phải biết mình làm việc với cái gì. R cũng vậy. Để yêu cầu R thực hiện các lệnh, trước tiên R cần biết “nó” sẽ làm việc với đối tượng nào. Khi ấy, cần đặt tên cho đối tượng. Thao tác này không quá khó, vì R không quá gò bó việc đặt tên, nhưng tốt nhất (và cũng là để tránh lỗi trong quá trình xử lý) không đặt tên chứa dấu cách hoặc các ký tự đặc biệt, ngôn ngữ địa phương…

Chẳng hạn, tên cho đối tượng bên trên là x, pdat.

Sau khi đã đặt tên, muốn phân tích đối tượng, cần “đính kèm” đối tượng đó bằng lệnh: attach (tên đối tượng cần phân tích).

Ví dụ: > attach(pdat)

và sau đó mới thực hiện các công việc mổ xẻ dữ liệu, vẽ biểu đồ, đồ thị khác…

Tương tự như vậy với một gói lệnh cần dùng mà đã được cài đặt trong R, dùng lệnh library(tên gói lệnh) để yêu cầu R sử dụng gói đó cho các thao tác kế tiếp.

Bằng một vài tìm hiểu nho nhỏ ban đầu cũng những cặm cụi trong quá trình sử dụng, người dùng chưa biết gì về R cũng có thể cài đặt, chạy những câu lệnh đơn giản và dần phức tạp hơn, để khi nhìn bản ghi chép phân tích bằng R không còn hoa mắt chóng mặt nữa. Nhưng vấn đề của nghiên cứu khoa học không chỉ đơn giản dừng ở việc học cách dùng một công cụ.

Advertisements
Posted in: Food for thought