Jeux à information complète mais imparfaite

Nous allons étudier des jeux à deux joueurs où les règles du jeu stipulent des coups simultanés. Les deux joueurs connaissent leurs gains respectifs pour chaque couple de coups (le coup du joueur A et celui du joueur B), mais le fait que les adversaires jouent de manière simultanée introduit un certain flou, d'où le terme de jeu à information complète mais imparfaite.
Lorsqu'il y a coups simultanés, la représentation qui apparaît comme la plus appropriée est la forme stratégique, ou normale, qui fait appel à un tableau de chiffres donnant les gains des joueurs pour chacune des issues possibles, les lignes et les colonnes correspondant aux diverses stratégies.
Dans l'exemple ci-dessous, chaque joueur a deux stratégies possibles: coopérer (C) ou trahir (T).

Jeu sous forme normale : Jeu sous forme extensive :
Jeu Joueur B
coopèretrahit
Joueur A coopère
(K,K)
(N,M)
trahit
(M,N)
(L,L)

On utilise ce tableau de la manière suivante:

  1. chaque case contient une paire de nombre. Le premier est le gain du premier joueur et le second celui du second joueur.
  2. les gains sont des nombre positifs ou nuls qui doivent respecter certaines règles:

Dilemme du prisonnier Dilemme de l'ascenseur
  • N < L < K < M
  • 2K > N + M
On utilise souvent N=0, L=1, K=3 et M=5

Prisonnier Joueur B
coopère trahit
Joueur A coopère
(3,3)
(0,5)
trahit
(5,0)
(1,1)
  • N < L < K < M
  • 2K < N + M
On utilise souvent N=0, L=1, K=3 et M=8

Ascenseur Joueur B
coopère trahit
Joueur A coopère
(3,3)
(0,8)
trahit
(8,0)
(1,1)

Dans le dilemme du prisonnier itéré, la condition 2K > N + M permet de s'assurer que la séquence (trahit, coopère), (coopère, trahit) donne pour chaque joueur des gains toujours inférieurs à la coopération (coopère, coopère), (coopère, coopère).
Pour le dilemme de l'ascenseur, c'est exactement l'inverse, d'où des stratégies optimales différentes.

Équilibre de Nash

On cherche si parmi les issues possibles, il y en a qui correspondent à des équilibres, c'est-à-dire qui résultent de choix individuels dont aucun joueur n'est incité à s'écarter de façon unilatérale (tout changement de stratégie d'un joueur, l'autre s'en tenant à la sienne, ne lui apportant pas de gain supplémentaire). Tout ensemble de stratégies, une par joueur, ayant cette propriété est appelée équilibre de Nash.
Ainsi, dans le dilemme du prisonnier (voir tableau ci-dessous), le seul équilibre de Nash est (trahit, trahit). Pourtant, on voit bien que la meilleure solution commune est (coopère, coopère).

t 1 t 2
s 1 , ,
s 2 , ,

Équilibre(s) de Nash :


Référence


Didier Müller, 29.3.03