Trò chơi Cournot

Posted on October 18, 2014 by

1


Op-Economica, 18-10-2014 — Dưới đây là 2 bài toán đều gọi là “trò chơi Cournot,” có tính chất hơi khác nhau chút. Hai bài toán không phức tạp, nhưng lại khá mẫu mực về lô-gich cách giải nghiệm trò chơi.

Trò chơi Cournot đơn giản ‘one-shot’

Giả sử hai hãng sản xuất sản phẩm tương tự (‘homogenous’). Giá thị trường của một sản phẩm là p=1-Q (trường hợp nếu Q>1, thì p=0), trong đó Q là tổng số lượng sp sản xuất ra. Không có chi phí sản xuất.

Mô hình: Hai hãng là hai người chơi, ký hiệu 1 và 2, i=1,2. Mỗi người chơi i chọn số lượng sp sx tương ứng q_i\geq 0, và có lợi nhuận tương ứng: K_i(q_1,q_2)=q_i(1-q_1-q_2). Cũng theo giả thiết trò chơi, nếu q_1+q_1=1 thì lợi nhuận bằng 0.

Giả sử người chơi 2 sản xuất số lượng q_2=1/3. Vậy thì người chơi 1 sẽ tối đa hóa lợi nhuận: q_1(1-q_1-1/3), và xác định được q_1=1/3. Ngược lại cũng đúng như vậy vì toàn bộ tính chất đối xứng giữa 2 người chơi. Cách kết hợp này là chiến lược kết hợp các hành động qua lại tốt nhất giữa hai người chơi; chính là cân bằng Nash.

* Lưu ý: Cân bằng Nash này cũng được gọi là cân bằng Cournot. Có thể nhận thấy rằng cân bằng Cournot trong ví dụ này không có tính ‘tối ưu Pareto’ vì nếu mỗi hãng chọn sản lượng là 1/4 thì lợi nhuận của cả hai hãng đều cao hơn.

Trò chơi Cournot tuần tự

Bài toán này tương tự trò chơi Cournot ‘one-shot’ nhưng với giả sử là hãng 1 được chọn sản lượng trước, và hãng 2 có thể quan sát lựa chọn của hãng 1 để quyết định.

Extensive form sequential Cournot game

Extensive-form sequential Cournot game

Do mỗi người chơi i=1,2 có số nhiều hành động có thể lựa chọn (vô số) q_i\geq 0, do đó sử dụng sơ đồ dích-dắc trong hình.

Người chơi 1 chọn q_1\geq 0. Sau khi quan sát, người chơi 2 chọn q_2\geq 0. Đối với người chơi 1, số lượng q_1=1/2 cho lợi nhuận tối đa. Theo đó, phần tối đa của người chơi 2, q_2=1/4.

* Giải:

Giả sử người chơi 1 chọn q_1=\alpha, hàm lợi nhuận của người chơi 2 là: K_2=q_2(1-\alpha-q_2)=(1-\alpha)q_2-q^2_2. Hàm có dạng bậc hai, hệ số của bậc hai âm, do đó có cực đại. Ta lấy đạo hàm bậc nhất để tìm q_2 cho cực đại: q_2=\dfrac{(1-\alpha)}{2}.

Bây giờ lấy q_2 này thay trở lại để có hàm lợi nhuận của người chơi 1 theo \alpha như sau:

K_2=\alpha(1-\alpha-\dfrac{1-\alpha}{2}). Hàm bậc hai này là parabolic có cực trị khi \alpha=1/2.

Nghiệm của trò chơi này còn được gọi là ‘cân bằng Stackelberg’.

Lời giải ở trên không có gì khó khăn về mặt toán học, một khi đã được trình bày. Tuy vậy, lô-gich để đi đến lời giải mẫu mực cho vấn đề cân nhắc chiến lược phản hồi (hành động) trong trò chơi. Trước tiên, có một hành động giả định của người chơi 1. Từ đó, người chơi 2 được quan sát và phản ứng; phản ứng này hiển nhiên là nhắm đạt lợi ích cao nhất cho người chơi 2. Nếu xử lý ổn thỏa, ta tính được ‘hành động tối đa hóa lợi ích’ của người chơi 2 (q_2=\dfrac{(1-\alpha)}{2}) qua hành động của người chơi 1 (\alpha). Tuy vậy, trên thực tế \alpha mới chỉ là một tham số. Việc thế giá trị q_2=\dfrac{(1-\alpha)}{2} trở lại hàm lợi ích của người chơi 1 là nhằm có được hàm một đối số (lúc này chỉ còn \alpha) và ‘hy vọng’ rằng hàm này có cực đại.

Trong trường hợp cụ thể bài toán Cournot tuần tự ở trên, chúng ta đã gặp may mắn trong cả việc tham số hóa có được q_2 khá đơn giản, và hàm bậc 2 lợi nhuận người chơi 2 theo \alpha cũng khá đơn giản.

Như vậy, sự phức tạp ở đây là do ‘tương tác’ qua lại giữa 2 người chơi và yêu cầu ‘tối đa hóa lợi ích cho cả 2 người chơi’.

The state of equilibrium… is therefore stable; i.e. if either of the producers, misled as to his true interest, leaves it temporarily, he will be brought back to it. Recherches sur les Principes Mathematiques de la Theorie des Richesses (1838)
Antoine Augustin Cournot (1801-1877)

Antoine Augustin Cournot (1801-1877)

Posted in: Economics