Qu’est-ce que la Théorie des Jeux

Qu’est-ce que la Théorie des Jeux

Au sens mathématique, un jeu est un scénario dans lequel les joueurs font des choix rationnels selon des règles définies pour obtenir une sorte d’avantage. La théorie des jeux est la branche des mathématiques qui se concentre sur l’analyse de ces jeux vidéo. La théorie des jeux peut être divisée en deux sous-disciplines principales : la théorie des jeux classique et la théorie des jeux combinatoires.

La théorie des jeux classique étudie les jeux dans lesquels les joueurs se déplacent, parient ou planifient tous à la fois. En conséquence, les joueurs se retrouvent souvent inconscients des facettes spécifiques du jeu vidéo. Les joueurs de ces jeux vidéo sont plus susceptibles de se fier aux prévisions et aux possibilités en raison de ce manque de détails. Les exemples incluent le poker de casino ou la pierre, le papier, les ciseaux.

D’autre part, la théorie des jeux combinatoires est l’étude des jeux à deux joueurs dans lesquels chaque joueur a une connaissance complète de toutes les facettes du jeu vidéo tout au long du gameplay. Ces jeux sont généralement joués tour par tour et n’impliquent généralement pas de composants d’instances aléatoires constituées d’échecs ou de dames. De plus, les jeux vidéo combinatoires sont prétendus impartiaux si tous les joueurs ont le même ensemble d’actions possibles à partir de chaque placement. Sinon, le jeu vidéo est déclaré partisan.

Classement des jeux

En plus des deux catégories fournies ci-dessus, les jeux peuvent être identifiés dans une sélection de méthodes. L’une des plus évidentes est de catégoriser un jeu en fonction du nombre de joueurs. Il est courant de décrire un jeu vidéo comme un jeu vidéo à n personnes, où n est un entier supérieur ou égal à 1 représentant le nombre de joueurs appelés à rejoindre un jeu vidéo particulier.

L’ordre dans lequel les joueurs se déplacent (ou n’en ont pas) est un autre moyen simple de classer les jeux vidéo. Les joueurs effectuent tous leurs mouvements en même temps dans un jeu vidéo simultané. Au contraire, dans un jeu vidéo consécutif, un seul joueur peut se déplacer à n’importe quel moment proposé. Certains jeux ne relèvent pas toujours de l’une ou l’autre de ces classifications.

Les jeux peuvent également être classés en fonction des bénéfices possibles complets. Un jeu vidéo à somme constante ou un jeu à somme nulle est un jeu dans lequel le montant total des gains réalisables reste continu, peu importe ce que les joueurs prennent ; c’est-à-dire que la somme des gains obtenus par certains joueurs doit être égale au nombre de pertes des autres joueurs. Au Texas Hold’em, par exemple, les joueurs se disputent une somme infinie d’argent. Les choix de chaque joueur n’ont pas d’impact sur les gains offerts dans les jeux vidéo à somme variable, cependant, les gains globaux disponibles peuvent se transformer en fonction des actions des payeurs. La situation du détenu est un exemple de jeu vidéo à somme variable.

Les jeux à somme variable peuvent également être séparés en sous-groupes : jeux coopératifs et non coopératifs. Les joueurs de jeux participants peuvent conclure des accords contraignants, tels qu’un accord exécutoire, tandis que les joueurs de jeux vidéo non coopératifs peuvent ne produire aucune configuration contraignante. Par exemple, imaginez que deux personnes, un vendeur et un acheteur, souhaitent conclure une transaction commerciale. Alors qu’ils tentent de négocier un coût, les gens participent à un jeu non coopératif si l’acheteur signe un accord consentant à payer un prix détaillé, cela finit par être un jeu participatif.

Représentation des jeux

Il existe une gamme de méthodes par lesquelles nous pourrions expliquer les jeux vidéo. Le premier dont nous allons certainement discuter est connu sous le nom de type global. Dans cette technique, la série d’options réalisées dans un jeu vidéo est illustrée à l’aide d’un arbre de jeu. La récompense pour chaque séquence possible est notée à la fin de chacune des dernières branches. Considérons, à titre d’exemple, l’adhésion à l’arbre de jeu partiel pour une partie de Tic-Tac-Toe entre 2 joueurs :

Considérant que les rotations et les réflexions sont équivalentes, le joueur 1 à trois étapes possibles ; comme envisagé ci-dessus, les délocalisations possibles du joueur 2 changent, en fonction de l’option faite par le joueur 1. Si nous devions prolonger davantage l’arbre, nous verrions sans aucun doute quels mouvements le joueur 1 pourrait faire en se conformant à la décision du joueur 2. Nous pourrions dessiner un arbre total pour voir tous les résultats réalisables de toutes les séries de mouvements possibles. Notez qu’un type substantiel peut également être utilisé pour expliquer les jeux synchronisés en utilisant des lignes précipitées pour montrer qu’un joueur ne sait pas dans quel nœud il se trouve.

Bien que les jeux vidéo puissent être valablement décrits sous une forme étendue, ils peuvent être décrits plus clairement en utilisant une forme typique, également appelée forme critique. Par conséquent, le type typique est plus couramment utilisé pour expliquer les jeux vidéo synchronisés (généralement avec deux joueurs). Dans la catégorie normale, un jeu est représenté à l’aide d’une matrice qui décrit les résultats pour les deux joueurs pour n’importe quel mélange de mouvements. Par exemple, prenez en considération la matrice d’adhésion illustrant le jeu de dilemme du détenu.

Les joueurs et toutes leurs relocalisations possibles sont placés sur les côtés proches de la matrice. Les gains sont positionnés à l’intérieur de la matrice. Dans ce cas, toute la rentabilité des investissements sont défavorables, car ils correspondent au temps passé en prison. D’après la matrice visualisée ci-dessus, nous voyons que si les deux détenus avouent, ils investissent chacun 8 ans derrière les barreaux. Ainsi, un prisonnier avoue qu’il sort sans peine de prison, tandis que les autres joueurs doivent passer une décennie derrière les barreaux. Si les deux détenus existent, ils n’investissent chacun qu’un an derrière les barreaux.

Enfin, les jeux coopératifs peuvent être représentés dans des types de fonctions particuliers. Cette technique est plutôt que les deux autres dans la mesure où elle examine la rentabilité des investissements pour le groupe de joueurs dans son ensemble au lieu de penser aux décisions et aux avantages individuels.

L’équilibre de Nash

L’équilibre de Nash est une idée qui a été présentée à l’origine par un mathématicien américain, John Nash (1928-2015). Un jeu vidéo non coopératif est censé être en équilibre de Nash si aucun joueur n’a la récompense de modifier sa méthode de jeu privée après avoir examiné les méthodes de tous les autres joueurs. Le problème du prisonnier est un exemple intemporel de la stabilité de Nash. En guise de conseil, le dilemme du prisonnier est une circonstance dans laquelle 2 prisonniers sont reconnus coupables de complicité d’un crime.

Les prisonniers sont placés à l’isolement, ils n’ont donc aucune technique pour se connecter les uns aux autres. Ils sont alors chacun proposés avec le respect de la proposition :

  1. S’ils l’admettent tous les deux, ils passeront chacun huit ans derrière les barreaux.
  2. Alors l’un d’eux avoue, il sera libéré, tandis que l’autre passera dix ans en prison.
  3. Si ni l’un ni l’autre ne l’admet, ils investiront certainement chacun 1 an en prison.

Ce jeu vidéo est en équilibre de Nash lorsque les deux prisonniers avouent. Pourquoi ? Du fait que dans ces situations, aucun des détenus n’a intérêt à changer de méthode. Si le Détenu 1 changeait de stratégie et restait silencieux, après cela, il obtiendrait une peine de prison plus longue qu’il ne le ferait certainement s’il l’admettait et le Détenu 2 pourra s’en aller sans pénalité. Le Prisonnier 2 devrait garder sa stratégie aussi par la même logique. Bien que la meilleure approche pour le groupe dans son ensemble soit que les deux restent silencieux, individuellement, les prisonniers sont bien mieux placés pour avouer, car ils n’ont aucun autre moyen de comprendre à l’avance la méthode de l’autre détenu et de rester silencieux pendant que l’autre avoue conduirait à dix ans de prison.

La balance Nash peut être mise sur une sélection de situations de la vie réelle. Il décrit, par exemple, pourquoi nous sur pêchons dans les mers : bien que la surpêche soit négative pour la communauté dans son ensemble, il serait inapproprié pour une entreprise privée d’arrêter de pêcher, car cette entreprise cesserait alors de gagner de l’argent tandis que diverses autres entreprises restent pour pêcher et, par conséquent, reste à faire du profit. La balance Nash peut également être utilisée dans les domaines de l’économie, de la bataille, de la politique et de nombreux autres domaines.


Référence: Brams, Steven J., and Morton D. Davis. “Game Theory.” Encyclopædia Britannica, Encyclopædia Britannica, 2 Nov. 2017

Share this post