Mô tả trò chơi đồng thời bằng cách nào

      31
“Ngay trường đoản cú 1838, với cống phẩm Recherches sur les principes mathématiques de la théorie des richesses, lí thuyết tài chính có được … một khái niệm cân bằng, khái niệm này sẽ không gì khác rộng là việc áp dụng vào một trong những trường hợp quan trọng lời giải của một trò chơi không hợp tác ký kết mà sau này được Nash hình thức hoá -và cũng có một lý lẽ để khẳng định sự trường thọ của thăng bằng và thống kê giám sát những trạng thái thực hiện cân bằng này: hàm phản nghịch ứng”. Nhận định trên của Dos Santos Ferreira (1991) bộc lộ và biện minh cho tính chất gần như là 1 tiên đề của cách những nhà khiếp tế nhận xét tác phẩm của Cournot như là vấn đề xuất phát của lí thuyết trò chơi. Thích hợp thành bởi cục bộ những phương pháp toán học tương thích cho việc nghiên cứu việc ra quyết định của các tác nhân duy lí và thông minh đứng trước một tình thế bao gồm sự tương trợ lẫn nhau, lí thuyết này còn có hai mảng: số đông trò chơi hợp tác ký kết và rất nhiều trò chơi không phù hợp tác. Vào trường vừa lòng đầu phần đa đấu thủ hoàn toàn có thể kí kết hồ hết thoả thuận và/hoặc hứa hẹn và/hoặc nạt doạ có hiệu lực, những dữ liệu cơ bạn dạng là các nhóm với những vụ việc được tìm hiểu là sự hình thành hồ hết liên minh cùng việc phân loại những thu hoạch. Vào trường hợp sản phẩm công nghệ hai, hầu hết đấu thủ tất yêu lấy những khẳng định có tính ràng buộc trước khi hành vi và điều được nhấn mạnh là kế hoạch của họ. Minh hoạ cho việc phân biệt bên trên mà tác giả là Nash (1951), fan đã kiến nghị và nhắc nhở vượt qua sự minh bạch này bằng cách trình bày lại đều trò chơi hợp tác dưới dạng hầu như trò đùa không hợp tác và ký kết (“chương trình Nash”). Rất có thể kể một định kỳ sử nhỏ của lí thuyết trò chơi (Weintraub, 1992).

Bạn đang xem: Mô tả trò chơi đồng thời bằng cách nào


*
Augustin Cournot (1801-1877)

*
Tất cả ban đầu vào năm 1928 lúc von Neumann triệu chứng minh, cho những trò đùa không hợp tác có nhị đấu thủ cùng tổng bằng không với với một số lớn chiến lược nhưng hữu hạn, định lí minimax (maximum minimorum = minimorum maximorum). Định lí này là “hòn đá tảng” (Auman, 1987) của lí thuyết trò chơi. Rồi von Neumann với Morgenstern (VNM) làm việc với nhau trên Princeton và công dụng của sự hợp tác và ký kết này là tác phẩm, công bố năm 1944, The Theory of Games & Economic Behavior. Tiếp đó, làm lơ những tác dụng cơ phiên bản thu được về các trò chơi hợp tác có hai đấu thủ, những nhà gớm tế lưu ý đến những trò chơi hợp tác có n đấu thủ. Khái niệm mẫu lõi của nền gớm tế, công dụng của những phân tích này xuất phát điểm từ tác phẩm của Edgeworth, Mathematical Psychics xuất bản năm 1881, nổi lên vào cuối trong thời hạn 1950 như 1 khái niệm giải mã cho những vấn đề kinh tế tài chính và mang lại phép, thông qua những định lí tương đương, củng cầm lí thuyết cân bằng chung. Sau đó, những vấn đề do tin tức không đối xứng đưa ra phục hồi lại toàn bộ tầm đặc trưng ngày ni được giành riêng cho cân bằng Nash (1951). Dưới ánh sáng của rất nhiều bài tổng phù hợp của Aumann (1987), Dimand và Dimand (1996), Schmidt (1990, 1995) với Weintraub (1992) tương tự như những tuyển chọn tập vì Dimand và Dimand (1997) với Rubinstein (1990) tập hợp, hoàn toàn có thể tu chỉnh vài ba điểm bản phác thảo lịch sử hào hùng trên.
*
Dos Santos Ferreira

*
Về những xuất phát của lí thuyết trò chơi, dù chưa phải tìm ngược lên đến Thánh ghê (Brams, 1980) đề nghị nói rõ là giải mã minimax đầu tiên với chiến lược hỗn hợp của một trò nghịch (trò chơi bài tây có tên là Le Her) có hai đấu thủ và tổng không là do Waldegrave kiếm tìm ra vào năm 1713 cùng những dự án công trình của Borel, xuất bản suốt trong những năm 1920, có mang một cách ngặt nghèo khái niệm kế hoạch hỗn hòa hợp và bổ sung cập nhật định lí Zermelo (có từ bỏ 1913 về trò chơi cờ vua và áp dụng những chiến lược thuần tuý) vừa báo trước những kết quả của von Neumann được Ville khái quát hoá. Còn so với thời kì được Weintraub (1992) nghiên cứu, bắt buộc nêu, một mặt, việc triển khai “chương trình Nash” vì lí thuyết mang cả cung cấp, trong những số ấy cách tiếp cận định đề hoá (Nash, 1950) và cách tiếp cận chiến lược (Rubinstein, 1982) được phối hợp và, mặt khác, sự xuất hiện của một tính đối ngẫu bắt đầu – chuẩn chỉnh tắc, thực chứng – bởi vì sự nở rộ, như 1 đối trọng của những mô hình lí thuyết, của những công trình của tài chính học thực nghiệm về trò chơi. ở đầu cuối về thời kì ngay gần đây, phải kể đến giải Nobel về kinh tế học năm 1994 được đồng thời trao cho Harsanyi, Nash với Selten. Sự kiện này, quan trọng đặc biệt được các tạp chí International Journal of game Theory với Games & Economic Behavior kính chào mừng, đã hiểu rõ ưu thế hiện thời của lí thuyết trò đùa không hợp tác và ký kết lẫn sự nở rộ, vào lí thuyết này, của ba phát minh (Gul, 1997): cân bằng, tính đáng tin và tin tức không đối xứng. đa số sách giáo khoa vừa qua (có thể thấy một list có so sánh trong Binmore, 1992), sách cơ phiên bản (Gibbons, 1992) hay sách mũi nhọn (Fudenberg và Tirole, 1991, và bằng tiếng Pháp, Gremaq, 1988 với Demange & Ponsard, 1994) phản ảnh tình hình này. Thiệt vậy, kế bên hai ngoại lệ đặc biệt là những sách của Moulin, như Cooperative Microeconomics, 1995 và cha tập Handbook of game Theory with Economic Applications vì chưng Aumann cùng Hart nhà biên trong số những năm 1990, hồ hết tác phẩm bên trên có điểm sáng kép là bỏ qua mất lí thuyết trò chơi hợp tác để dành chỗ mang đến lí thuyết trò chơi không bắt tay hợp tác và trình diễn lí thuyết này bằng phương pháp chéo hai minh bạch cơ bản: hễ và tĩnh; thông tin đầy đủ và tin tức không đầy đủ. Dàn trình bày điển hình này được dùng lại một trong những phát triển sau đây mà mục đích là, không trở về những quan niệm toán học của những khái niệm bao gồm về cân đối nhưng chỉ ra, thông qua những ví dụ, bằng phương pháp nào tìm ra những thăng bằng này.
*
Edgeworth (1845-1926)

Trò đùa tĩnh


Xét nhị sinh viên – Camille (C) cùng Dominique (D) – ngày mai vẫn thi môn lí thuyết trò chơi. Để sẵn sàng ôn thi, cả nhì đều buộc phải đến quyển Games & Information của Ramusen nhưng thư viện chỉ có hai ấn bản: bạn dạng in trước tiên (R89) chỉ rất có thể tham khảo tại chỗ; phiên bản in lần sản phẩm công nghệ hai (R94), vừa đủ hơn bản in lần thứ nhất, có thể mượn được về nhà. Bởi vì đó, tối trước kì thi cả nhị sinh viên hầu như giáp mặt với một đối chọn: ôn thi trên thư viện (B) tốt mượn R94 (E) về ôn thi ngơi nghỉ nhà. Trường hợp C với D rất nhiều chọn B thì họ vẫn cùng thực hiện R89 cùng R94 với cả hai hầu như ôn thi tốt. Nếu 1 trong những hai lựa chọn B và bạn kia chọn E thì người sử dụng một bản thân R94 sẽ làm bài bác thi giỏi và bạn kia học trong R89 sẽ sở hữu một hiệu quả trung bình. Sau cuối nếu C với D đều chọn E thì chúng ta sẽ bao biện nhau và bị đuổi thoát ra khỏi thư viện. C và D đề nghị lấy đưa ra quyết định đồng thời. Như thế trò chơi tiên phong hàng đầu như vừa được xác minh là bao gồm thông tin tương đối đầy đủ nhưng không tuyệt vời nhất vì từng đấu thủ biết toàn bộ những phần tử của kết cấu của trò đùa nhưng, vào mức ra quyết định, lừng chừng người cơ sẽ làm gì. Vày đó, ta có trò đùa dưới dạng chiến lược và dưới dạng mở rộng:
*

*

Về mặt biểu đồ, dạng chiến lược dường như ngoài là 1 ma trận: C có những dòng, D bao gồm cột và, trong những ô, là chi trả (lợi ích VNM) của C cùng D được theo lần lượt xác định. Dạng không ngừng mở rộng được biểu trưng bởi một cây cơ mà mỗi đôi mắt không cuối cùng được gán cho mỗi đấu thủ cho thấy là địch thủ phải đem một quyết định ở tiến độ này của trò chơi, và đa số nhánh xuất phát từ cùng một mắt là số đông hành động có thể của địch thủ mà mắt này được gán đến đấu thủ ấy. Tập rất nhiều mắt trong các số ấy một đấu thủ lưỡng lự phân biệt mắt làm sao khi phải ra một quyết định vào trong 1 thời điểm của trò chơi, được lồng vào một viền tượng trưng mang đến tập thông tin của đấu thủ này. Bằng trò đùa này (trò chơi “kẻ kém gan”), rất có thể minh hoạ hai khái niệm cơ bản về cân bằng: thăng bằng Nash (1951) với chiến lược thuần tuý (được ghi lại hoa thị * trong ma trận phần lớn thu hoạch) và với kế hoạch hỗn hòa hợp và cân bằng đối sánh tương quan của Aumann (1974). Cân đối đầu là 1 trong dạng phần nhiều chiến lược làm sao để cho chiến lược của mỗi đấu thủ là đáp trả rất tốt cho những chiến lược được những đấu thủ không giống chọn. Cân bằng thứ hai phía bên trong sự tiếp diễn của thăng bằng Nash với chiến lược hỗn hợp: trong cả hai trường hợp, hành động của từng đấu thủ tuỳ ở trong vào thông điệp mà thoải mái và tự nhiên gởi cho mỗi đấu thủ nhưng, vào trường hợp thiết bị nhất, mọi thông điệp là riêng tư và tự do với nhau trong những lúc trong trường hợp thứ hai những thông điệp có đối sánh với nhau. Về có mang đầu, rất có thể phân biệt tía trường thích hợp được minh hoạ theo vật dụng tự bởi “thế lưỡng nan của fan tù”, “cặp song tiền bạc” với trò nghịch “kẻ kém gan” (Walisser, 1988). Vào trò nghịch đầu (theo đồ vật tự, thứ hai) chỉ gồm duy nhất một thăng bằng Nash với kế hoạch thuần tuý (theo máy tự, chiến lược hỗn hợp). Trong trường hợp thiết bị ba, tất cả hai thăng bằng Nash với kế hoạch thuần tuý và một cân đối Nash với chiến lược hỗn hợp. Tất cả một cách thức sơ đẳng để tìm ra ba cân bằng này trong trò nghịch số 1. Kí hiệu bằng (q, 1 - q) kế hoạch hỗn hợp từ đó D chơi B với xác suất q và bởi (p, 1 - p) kế hoạch hỗn hợp từ đó C chơi B với xác suất p. Giả dụ D đùa (q, 1 - q) thì các chi trả dự loài kiến của C là 3q + 1 (1 - q) = 2q + 1 ví như C nghịch B và 4q giả dụ C nghịch E. Vì đó, ví như q > 1/2 thì đáp trả tốt nhất có thể của C (MRC) là E (p = 0). Ngược lại, nếu như q C là B (p = 1). Sau cuối nếu q = 1/2 thì bất kì giá trị nào của phường cũng là một trong MRC. Tương tự như như vậy, trường hợp D chơi (p, 1 - p) thì các chi trả dự con kiến của D là 2p + 1 trường hợp D nghịch B và bằng 4p giả dụ D chơi E. Cho nên vì vậy nếu phường > một nửa thì đáp trả tốt nhất có thể của D (MRD) là E (q = 0). Ngược lại, nếu p. > 50% thì MRD là B (q = 1). Cuối cùng nếu p. = một nửa thì bất kỳ giá trị nào của q cũng là một trong MRD (xem biểu đồ dưới đây).
MRC và MRD cắt nhau tại cha điểm: (p = 1/2, q = 1/2), (p = 0, q = 1), cùng (p = 1 q = 0). Điểm đầu là cân bằng Nash với chiến lược hỗn phù hợp của trò đùa số 1: mục đích mỗi đấu thủ nhắm đến thông qua việc thực hiện những xổ số kiến thiết này là đặt mỗi đấu khủ khác vào trong 1 tình cố kỉnh bàng quan trong những số ấy đấu thủ đó không có chiến lược như thế nào được ưa thích trong những những kế hoạch được đấu thủ này gán đến một xác suất không bằng không. Nhì điểm còn lại tương ứng với hai cân đối Nash với kế hoạch thuần tuý: (E, B) với (B, E). Để hối hả tìm ra hai cân đối này, chỉ việc so sánh theo hàng và theo cột thể theo tư tưởng của cân đối Nash cùng gạch bên trên những bỏ ra trả khớp ứng với phần lớn đáp trả tốt nhất. đầy đủ dạng kế hoạch nào lắp với một ô trong các số ấy có hai đưa ra trả được gạch men trên là một trong những cân bởi Nash với chiến lược thuần tuý. Để lý giải sự trồi lên của một cân bằng như thế, rất có thể nêu tư luận chứng tuyên chiến đối đầu và cạnh tranh nhau: có liên lạc hiệp thương trước, đông đảo dự con kiến tự hoàn thành, lí thuyết mang điểm cùng tập huấn (xem mục thăng bằng Nash). Giải thích đầu tiên đặt các đại lý cho khái niệm cân đối tương quan. Một phương pháp nôm na, khái niệm một cân bằng đối sánh tương quan qui lại là tìm kiếm một xổ số kiến thiết trên đều kết cục của trò chơi sao cho mỗi đấu thủ buổi tối đa hoá ích lợi của bản thân tất cả tính tới những chỉ thị mình thừa nhận được. Kí hiệu bởi r1, r2, r3, r4 những tỷ lệ của (B, B), (B, E), (E, B), cùng (E, E). Trường hợp C được lệnh đùa B (theo trang bị tự E) thì quyền lợi và nghĩa vụ của C là tuân hành nếu 3r1 + r2 ³ 4r1 (theo vật dụng tự 4r3 + r2 ³ 3r3 + r4), tức là r2 ³ r1 (theo lắp thêm tự r3 ³ r4). Tựa như như thế, nếu D nhận thông tư chơi B (hay E) thì quyền lợi của D là vâng lệnh nếu r3 ³ r1 (theo thiết bị tự r2 ³ r4). Vì đó khiến cho (r1, r2, r3, r4) hợp thành một cân nặng bằng đối sánh thì r1 + r2 + r3 + r4 = 1 với Min (r2, r3) ³ Max (r1, r4). Điều này xác định một continuum những thăng bằng tương quan trong đó ta thấy bao gồm ba cân bằng Nash được định nghĩa như trên, mọi tổ hợp lồi của những cân bằng Nash với kế hoạch thuần tuý và phần nhiều cân bằng đối sánh khác, như (1/3, 1/3, 1/3, 0). Rất có thể thu được cân đối cuối này nhờ cơ chế kết hợp sau: một tín đồ thứ bố (A) ném một bé súc sắc gồm sáu mặt; nếu như mặt bé súc sắc là 1 trong hay 2 thì A nói cùng với C và D nên chơi B; nếu như mặt nhỏ súc sắc là 3 hay 4 thì A nói cùng với C (theo vật dụng tự D) bắt buộc chơi B (theo vật dụng tự E); cùng nếu mặt nhỏ súc nhan sắc là 5 xuất xắc 6 thì A nói với C (theo lắp thêm tự D) yêu cầu chơi E (theo sản phẩm tự B). Thông điệp gởi cho từng đấu thủ không cho thấy thêm lệnh ra đến đấu thủ kia. Trường hợp C với D đồng ý với nhau tiến hành cơ chế phối hợp này, thì văn bản tự bao gồm hiệu lực: quyền hạn của mỗi đấu thủ là tuân thủ những thông tư mình nhận được; làm như vậy mỗi đấu thủ sẽ nhận thấy một đưa ra trả kì vọng bởi với 8/3 và vì đó to hơn 2, vốn là đưa ra trả kì vọng gắn với cân đối Nash với kế hoạch hỗn hợp. Đặc điểm cơ phiên bản của thăng bằng này là mỗi đấu thủ không biết chắc chắn lựa chọn của từng đấu thủ khác. Sự không chắc hẳn rằng này sinh ra từ tính ít nhiều không không thiếu thốn của tin tức mỗi đấu thủ tất cả được.
Để nghiên cứu và phân tích loại tình cầm cố này, xét trò chơi số 2. Chris (C), một sv nước ngoài, trình độ tiếng Pháp trung bình, phải chuẩn chỉnh bị, hệt như D, một bài trình bày về lí thuyết trò chơi. Hay những C tương đối (b) hay những yếu (m) tiếng Anh. C biết đúng đắn kiểu của mình; ngược lại D chỉ biết rằng bao gồm 90 % là C thuộc loại b (p = 0,9). Đối chọn C buộc phải giáp khía cạnh là như sau: đem trên kệ sách hay là từ điển tiếng Anh Harrap’s (A) hay là từ điển giờ Pháp Le Petit Robert (F). Còn D, giống như trong trò đùa số 1, cần lựa lựa chọn giữa B hoặc E. Trong đầy đủ trường hợp, đề xuất học sinh sống thư viện cùng càng sẵn sàng tốt nếu đạt được R94. Một phương pháp thứ yếu, C càng có công dụng khi lựa từ điển bổ ích nhất đối với mình tuỳ theo phong cách của bạn dạng thân. D, có trình độ chuyên môn tiếng Anh trung bình, có một chiếc nhìn lưỡng phân về tình hình: thích sẵn sàng ở thư viện với C nếu C thuộc hình dạng b; ngôi trường hợp ngược lại thích tự chuẩn bị ở bên một mình. C và D nên lấy ra quyết định đồng thời. Nhị tình cố gắng này, bên dưới dạng chiến lược, là như sau:
Nhờ Harsanyi (1967-1968), tất cả thể biến đổi một trò chơi như vậy với tin tức không vừa đủ thành một trò đùa với tin tức không tuyệt vời trong đó tự nhiên (N) đi trước và lựa chọn kiểu của C:
Trong biểu trưng dưới dạng chiến lược, mỗi chiến lược của C nắm rõ lần lượt hành động của C là thuộc giao diện b cùng thuộc kiểu dáng m: nếu C chơi, ví dụ, FA thì có nghĩa là, nếu hành động của C là thuộc đẳng cấp b thì nghịch F cùng nếu hành vi của C là thuộc thứ hạng m thì C chơi A. Trong những ô, mọi thu hoạch theo thứ tự được ghi là đều thu hoạch của C trường hợp C thuộc thứ hạng b, nếu như C thuộc hình trạng m và D (có tính mang lại p). Bằng trò nghịch này, ta có thể minh hoạ cân bằng bayesian, tức là một cân đối Nash của trò đùa bayesian trong số ấy mỗi đấu thủ ước tính thu hoạch của bản thân mình bằng kì vọng ích lợi bị điều kiện hoá bởi thông tin riêng của mình. Trong trường hợp này, ở gắng cân bằng, C nghịch FA cùng D chơi B. Một giải pháp tiên nghiệm vấn đề đó là hiển nhiên vì F với A là những chiến lược khống chế của C lúc C thuộc, theo máy tự, kiểu dáng b cùng m. Đương nhiên, ví như p bé dại hơn 0,5 thì D sẽ lựa chọn E. Vấn đề trở thành ít bình thường hơn ví như ta mang lại C tài năng chơi trước D.

Xem thêm: Lâm Chấn Khang Là Ai? Tiểu Sử, Sự Nghiệp Và Đời Tư Nam Ca Sĩ


Để thấy điều này, trước tiên xét trò đùa số 1’, trò đùa này là phiên bản động của trò nghịch số 1 trong số đó C đi trước:
Bằng trò nghịch này, vốn là một trò chơi có tin tức không chỉ khá đầy đủ mà còn là hoàn hảo và tuyệt vời nhất vì D khi yêu cầu ra một quyết định biết C sẽ làm đầy đủ gì, có thể minh hoạ nhì khái niệm cân nặng bằng: thăng bằng Nash đụng và thăng bằng Nash động hoàn hảo và tuyệt vời nhất (Selten, 1965). Quan niệm sau chỉ đơn giản và dễ dàng khái quát mắng hoá thăng bằng Nash. Vào trò chơi số 1’, những so sánh theo loại và theo cột làm cho nổi lên ba cân đối loại này: (B, EE), (E, BB)* cùng (E, EB). Khi D chọn kế hoạch EE (theo lắp thêm tự BB) thì D quyết định chơi E (theo lắp thêm tự B) bất luận đưa ra quyết định của C là gì đi nữa cùng khi D lựa chọn EB thì D ra quyết định chơi E (theo thứ tự B) nếu C chơi B (theo sản phẩm công nghệ tự E). Trong hai trường thích hợp đầu, D gồm lời doạ doạ mà lại sẽ không triển khai đe bắt nạt này trường hợp bị thách thức: quả thế, D không có quyền lợi gì để chơi E (theo vật dụng tự B) nếu như C nghịch E (theo lắp thêm tự B). Trong trường hợp cuối, D là xứng đáng tin vì nếu C chơi B (hay theo thiết bị tự E), thì quyền hạn của D là đề xuất chơi E (theo thiết bị tự B). Ý tưởng này về tính đáng tin tạo cơ sở cho khái niệm cân đối Nash động tuyệt vời và hoàn hảo nhất (trong trò nghịch con), quan niệm này là một trong dạng đều chiến lược sao để cho những hành động được những chiến lược này công ty trương hợp thành một cân đối Nash trong toàn bộ những trò chơi con, một trò chơi bé trong một trò nghịch với tin tức hoàn hảo, là đầy đủ cây trò chơi bao gồm được bằng cách lấy một mắt bất cứ của cây lúc đầu như điểm gốc. Để tìm ra một thăng bằng như thế, phương pháp đơn giản độc nhất – thuật toán Kuhn - là xuất phát điểm từ cuối trò chơi và triển khai truy toán lùi. Như vậy so với trò đùa số 1’, lập luận là như sau: ví như C chơi B thì D chọn E (vì 4 > 3); giả dụ C đùa E thì D chọn B (vì 1 > 0); biết được điều đó nên quyền hạn của C là phải chơi E (vì 4 > 3); vì vậy (E, EB) là cân bằng hoàn hảo của trò đùa số 1’. Được quan niệm và minh hoạ như thế, tiêu chuẩn tính tuyệt đối tỏ ra là xác xứng đáng trong một trò đùa động với tin tức đầy đủ, không chỉ là khi tin tức là hoàn hảo mà cả khi tin tức là không hoàn hảo, nghĩa là khi, ví dụ, một trò chơi tĩnh được lặp lại.
Để nghiên cứu và phân tích trường hòa hợp này, thứ nhất giả sử là trò chơi số 1 không còn được chơi một lần nhưng mà là nhị lần. Trong trường phù hợp này C cùng D hoàn toàn có thể thay phiên nhau chơi E. Như thế, kế hoạch rất đầy đủ của C (theo thứ tự D) là, trong đợt đầu, đùa E (theo thứ tự B), cùng lần sản phẩm công nghệ nhì, bất luận lịch sử của trò chơi là như vậy nào, đùa B (theo vật dụng tự E). Những kế hoạch được xác minh như thay hợp thành một thăng bằng hoàn hảo. Thu hoạch mức độ vừa phải của từng đấu thủ là 5/2. Vớ nhiên có thể hoán thay đổi vai trò của các đấu thủ. Rộng nữa, ba cân bằng Nash của trò chơi cấu thành rất có thể được lặp lại. Cuối cùng rất có thể luân phiên chơi thăng bằng Nash với chiến lược hỗn vừa lòng và một trong các hai cân đối Nash với kế hoạch thuần tuý. Nếu trò đùa số 1 không chỉ có được đùa một lần mà lại T (T ³ 3) lần, thì xuất hiện một một cân bằng tuyệt vời mới trong các số đó C cùng D trước tiên đồng thời chơi B, T - 2 lần, tiếp đấy rồi mỗi người lần lượt chơi B (người kia nghịch E); nếu như C (theo máy tự D) chơi E (theo thiết bị tự E) ở trong số những T - 2 thời kì đầu, thì trong toàn bộ những thời kì kế tiếp sẽ đùa (B, E) (theo đồ vật tự (B, E)). Nếu những đấu thủ lựa chọn những kế hoạch này thì tổng thu hoạch của mỗi người là 3 (T - 2) + 5 = 3T - 1. Nếu như một đấu thủ đi chệch khỏi kế hoạch này tại thời khắc t £ T - 2 thì tổng thu hoạch đang là 3 (t - 1) + 4 + 1 (T - 1) £ 3T - 3
Khi số lần tái diễn trò đùa cấu thành là hữu hạn thì không duy nhất thiết là tính bội của rất nhiều cân bằng, như đã được thiết kế rõ, hiện tại ra: ví dụ, nếu như trò chơi cấu thành được đặc trưng, như vào “thế lưỡng nan của tín đồ tù”, bởi tính hiếm hoi của thăng bằng thì trò chơi lặp lại không hiện tại hoá tất cả một cân bằng tuyệt vời nhất duy nhất, tức là việc lặp lại thăng bằng của trò đùa cấu thành. Ngược lại, lúc số lần tái diễn trò nghịch cấu thành là vô hạn thì việc mở rộng tập phần nhiều vectơ bỏ ra trả trung bình triển khai được bên dưới dạng cân nặng bằng tuyệt vời nhất là qui tắc phổ biến. Tính bội này của những cân bằng cũng thường đặc thù cho số đông trò đùa động với thông tin không đầy đủ.
Để thấy điều này, xét trò đùa số 2’, là một phiên bạn dạng động của trò nghịch số 2 trong các số đó C đùa trước:
Trong biểu tượng dưới dạng không ngừng mở rộng của trò đùa này, q, 1 - q, r và 1 - r là những tin yêu hậu nghiệm của D. Ví dụ, đối với D, q là xác suất rằng C thuộc kiểu dáng b lúc biết là C đã chơi F. Ở cuối mỗi nhánh, con số nằm trên (theo trang bị tự ở dưới) chỉ thu hoạch của C (theo lắp thêm tự của D). Trò chơi biểu đạt này (đối lập với trò chơi gồm lọc đòi hỏi là đấu thủ ko được tin tức chơi đầu), trong các số đó C là tín đồ phát dấu hiệu và D là fan nhận tín hiệu tất cả hai thăng bằng (Nash động) bayesian: (FF, BE, q = 0,9, r) và (AA, EB, q, r = 0,9). Đây là hai cân bằng pha trộn: trong mỗi trường hợp, bạn phát biểu đạt vẫn đùa theo cùng một bí quyết bất luận bản thân thuộc giao diện nào và vì thế những tin cẩn của fan nhận tín hiệu bằng với những tin cậy tiên nghiệm: phường = 0,9 với 1 - p. = 0,1. Thân hai thăng bằng này rất có thể thử lựa chọn bằng phương pháp vận dụng nguyên lí tầm nã toán lùi (nguyên lí đặt cơ sở cho tính hoàn hảo) từ đó phải thải trừ những cân bằng có một nạt doạ không đáng tin. Trong vụ việc được nghiên cứu, cỗ lọc được Kreps cùng Wilson (1982) desgin tỏ ra là quá thô thiển để chống chặn 1 trong các hai cân nặng bằng bất kể nào vừa được xác minh trên đây: trong cả nhì trường hợp, đầy đủ đáp trả của bạn nhận dấu hiệu nằm quanh đó quĩ đạo cân bằng đều tương hợp với ít độc nhất vô nhị một phân phối xác suất có điều kiện. đúng mực hơn, (FF, BE, q = 0,9, r £ 0,5) và (AA, EB, q £ 0,5, r = 0,9) là hai thăng bằng bayesian hoàn hảo, tức thị những tổng hợp chiến lược cùng tin tưởng làm sao cho những kế hoạch này là tối ưu cùng với những tin cậy cho trước với những tin yêu này được xét lại theo qui tắc Bayes. Trong thăng bằng đầu (theo vật dụng tự cân đối thứ hai) r (theo vật dụng tự q) phải nhỏ tuổi hơn hay bằng 0,5 vì với điều kiện này thì răn nạt của D định nghịch E (theo trang bị tự E) ở ngoài đường cân bằng mới xứng đáng tin. Để chọn lựa giữa hai cân đối bayesian hoàn hảo được xác minh như trên, phải vận dụng nguyên lí tầm nã toán tiến đặt các đại lý cho tiêu chuẩn chỉnh trực giác của mang đến và Kreps (1987). Tiêu chuẩn này rối rắm hoá tiêu chuẩn chỉnh trước rộng nữa bằng phương pháp kéo theo là trường hợp tập tin tức theo một thông điệp nằm ngoại trừ quĩ đạo thăng bằng và nếu như ở thế cân bằng thông điệp này không bị khống chế cho toàn bộ các kiểu, thì người nhận tín hiệu yêu cầu gán một tỷ lệ bằng cấm đoán kiểu được coi như xét. Trong trò nghịch đuợc nghiên cứu, tiêu chuẩn chỉnh này chất nhận được loại trừ (AA, EB, q £ 0,5, r = 0,9): từ cân bằng này, quyền lợi của một tín đồ nhận bộc lộ thuộc hình trạng b rất có thể là đề nghị đi chệch ngoài quĩ đạo cân đối (như vậy, tín đồ này hoàn toàn có thể thu hoạch hoặc 2 hoặc 4 thay vị 3,5), trái lại một fan nhận biểu thị thuộc đẳng cấp m không bao giờ có lợi khi hành vi như cố kỉnh (vì 4 > 3 cùng 4 > 1); cho nên D đề nghị gán một tỷ lệ (1 - q) bằng cấm đoán kiểu m. Do điều kiện này với điều kiện bảo đảm tính hoàn hảo và tuyệt vời nhất của cân bằng (q £ 0,5) là không tương hợp nên (AA, EB, q £ 0,5, r = 0,9) là ko thoả xứng đáng một cách trực giác. Ngược lại, dễ dàng dàng chứng minh rằng (FF, BE, q = 0,9, r £ 0,5) là thoả xứng đáng theo trực quan và bất biến (phổ cập), để nêu ra những tiêu chuẩn tinh vi hoá chủ yếu (đặc biệt được trình diễn trong Fudenberg và Tirole, 1991) bổ sung cập nhật cho rất nhiều tiêu chuẩn chỉnh được sử dụng trên đây. Cuối cùng, xin nhấn mạnh là vào trò nghịch số 2’, không có cân bằng tách, nghĩa là thế nào cho C chơi theo một biện pháp nếu thuộc dạng hình b cùng theo một phương pháp khác nếu như thuộc thứ hạng m. Tuy nhiên, nếu p có một giá chỉ trị nhỏ tuổi hơn 0,5, ví dụ như 0,1, sao để cho lời giải nổi lên là một trong cân bởi nửa tách; trường hợp C thuộc loại b thì lúc nào C cũng chơi F, với nếu thuộc hình dáng m thì đùa F với tỷ lệ 1/9 và nghịch A với tỷ lệ 8/9; nếu C chơi F, thì D chơi B tuyệt E theo đồng xu xấp ngửa và, trường hợp C nghịch A thì D lúc nào cũng chơi E.
Được trình diễn như trên, lí thuyết trò chơi chưa phù hợp tác, dựa vào giả thiết kép về tính duy lí và tính vị kỉ của những đấu thủ, tỏ ra quan trọng đặc biệt phong phú: lí thuyết được cho phép đổi mới không những “kinh tế học tập công nghiệp”, để đưa lại tựa một thắng lợi của Tirole, với của số đông những nhánh của khoa học kinh tế mà còn cả phần lớn khoa học tập xã hội khác, như giải pháp học (Baird, Gerner & Picker, 1994) cùng khoa học chủ yếu trị (Ordeshook, 1992). Tính đa dạng rõ rệt này đang không thải trừ những dự án công trình đặt lại vụ việc về phương diện lí thuyết. Dưới góc nhìn này, có thể nêu hai định nghĩa mới: cân bằng ổn định theo cách nhìn tiến hoá của Maynard Smith với Price (1973) và cân nặng bằng phù hợp với công lí của Rabin (1993). Vào trường hòa hợp sau mỗi đấu thủ được giả định chưa phải là vị kỉ nhưng sẵn sàng hi sinh một phần thu hoạch của bản thân để thưởng sự thong dong hay phạt sự ác hiểm cuả bạn khác, hai hộp động cơ này càng dũng mạnh khi sự hi sinh tài bao gồm để công bình ngự trị càng yếu. Trong trường phù hợp đầu, những đấu thủ được xem như là không bội phản ứng một phương pháp duy lí: họ sàng lọc không ý thức hành động của bản thân nhưng thừa kế hành vi của không ít người đi trước họ. Trò nghịch số 1 cho phép minh hoạ hai khái niệm mới này: nếu như C và D được đưa định là suy nghĩ công bởi và nếu gần như thu hoạch tiền tệ được thay thế cho những chi trả (không làm biến hóa cấu hình của trò chơi) thì (B, B) với (E, E) nổi lên tựa như những cân bằng Rabin; giả dụ C với D được coi như như hai phần tử bất kì của một tập đều sinh viên và nếu nghịch E (hay B) là tất cả một hành vi “diều hâu” (hay “bồ câu”) thì cân bằng Nash với kế hoạch hỗn thích hợp trở thành cân đối Maynard Smith với Price. Để xem thêm về biện pháp tiếp cận sau đây và biện pháp tiếp cận thêm với tập huấn thích hợp nghi, hoàn toàn có thể tham khảo Kreps và Wallis (1997).
▶ AUMANN R. J., “Subjectivity và correlation in randomized strategies”, Journal of Mathematical Economics, 1974, n0 1, p. 67-96; “Game Theory” vào EATWELL J. MILGATE M. & NEWMAN p chủ biên, The New Palgrave: A Dictionary of Economics, vol.2, London, Macmillan, 1987. – BAIRD E. G., GERTNER R. H. Và PICKER R. C., game Theory and the Law, Cambridge, Harvard University Press, 1994. – BINMORE K., Fun và Games: a Text on trò chơi Theory, Lexington (DC), Heath, 1992. – BRAMS S., Biblical Games: A Strategic Analysis of Stories in the Old Testament, Cambridge, MIT Press, 1980. – cho I. K. Và KREPS D. M., “Signaling games và stable equilibria”, Quarterly Journal of Economics, 1987, n0 2, phường 179-221. – DEMANGE G. & PONSARD, Théorie des jeux et analyse économique, Paris, PUF, 1994. – DIMAND M. A. Và DIMAND R. W., The History of trò chơi Theory, London, Routledge, vol. 1, 1996; The Foundations of trò chơi Theory, vol. I, II cùng III, Cheltenham, Edward Elgar, 1997. – DOS SANTOS FERREIRA R., “Introduction”, Revue économique, 1991, n0 6, phường 959-966. – FUDENBERG D. & TIROLE J., trò chơi Theory, Cambridge, MIT Press, 1991. – GIBBONS R., A Primer in game Theory, New York, Harvester Wheatsheaf, 1992. – GREMAQ A.-A., Dynamique, information incomplète, stratégies industrielles, Paris, Economica, 1988. – GUL F., “A Nobel prize for trò chơi theorists: the contribution of Harsanyi, Nash and Selten”, Journal of Economic Perspectives, 1997, n0 3, p 159-174. – HARSANYI J. C., “Games with incomplete information played by “bayesian“ players”, Management Science, 1967-1968, vol. 14, 3, phường 159-182, n0 5, phường 320-334, n0 7, phường 486-502; “Games with randomly disturbed payoffs a new rationale for mixed-strategy equilibrium points”, International Journal of game Theory, 1973 n0 1, p. 1-23. – KREPS D. M. Và WALLIS K. F., Advances in Economics & Econometrics: Theory & Applications, vol. I, Cambridge, University Press, 1997. – KREPS D. M. Và WILSON R., “Sequential equilibria”, Econometrica, 1982, n0 4, p 863-894. – MAYNARD SMITH J và PRICE G. R., “The logic of animal conflict”, Nature, 1973, vol. 246, p. 15-18. – NASH J. F., “The Bargaining Problem”, Econometrica, 1950, n0 2, 155-162m; “Non cooperative games”, Annals of Mathematics, 1951, n0 2, 286-295. – ORDESHOOK phường C., A Political Theory Primer, New York, Routledge, 1992.- RABIN M., “Incorporating fairness into trò chơi theory & economics”, American Economic Review, 1993, n0 5, phường 1281-1302. – RUBINSTEIN A., “Perfect equilibrium in a bargaining model”, Econometrica, 1982, n0 1, p 97-109; trò chơi Theory in Economics, Aldershot, Edward Elgar, 1990. – SCHMIDT C., “Game theory and economics: an historical survey”, Revue d’économie politique, n0 5, phường 589-618; “Présentation”, n0 4, p. 529-538. – SELTEN R., “Spieltheoretische Behandlung eines Oligopolmodells mit Nachfrageträgheit”, Zeitchrift für die gesamte Staatwissenschaft, 1965, vol. 121, p 301-324 cùng 667-689. – WALISER B., “A simplified taxonomy of 2 x 2 games”, Theory và Decision, 1988, n0 2, phường 163-191, – WEINTRAUB E. R. Công ty biên, Toward a History of game Theory, Durnham, Duke University Press, 1992.
Régis Deloche
Giáo sư đh Franche-Comté (BesanVon)
Nguyễn Đôn Phước dịch
® cân bằng Nash; kinh tế tài chính học thực nghiệm; kinh tế tài chính toán học; Lí thuyết mang cả; nỗ lực lưỡng nan của fan tù; tin tức không đối xứng.