Dresseur, de pokébot

Théorie des jeux
le 18/08/2019 19:47
Je ne connaissais pas.

Du coup, quoi de mieux pour la comprendre qu'un jeu !

https://ayowel.github.io/trust/

J'ai trouvé ça plutôt bien expliqué.
haut de page - Les forums de MV >> Général >> Discussion : page 1 | 2 | 3
nicoG2
Géant
...
le 18/08/2019 23:38
Techniquement, faut plutôt compter sur +1/+1 en coopération ; +2/-1 si l'un trahit l'autre et 0/0 en cas de trahison mutuelle.
Madmox
I guess Warhol wasn't wrong, Fame fifteen minutes long

Légende
le 18/08/2019 23:49
Ça dépend du jeu (ou de ton environnement si tu préfères).

La théorie des jeux est un sujet vraiment passionnant, et cette animation interactive est très bien foutue : pas trop simpliste ou naïve, mais accessible.
nicoG2
Géant
...
le 18/08/2019 23:59
Euh -1/-1 si les 2 se font ça à l'envers.
Dresseur, de pokébot

le 19/08/2019 0:01
Du coup il n'y aurait plus d'enjeu (à part trahir tout le temps).
Pas d'enjeu, pas de jeu.
Et pas de jeu, pas de théorie du jeu.
nicoG2
Géant
...
le 19/08/2019 0:31
Non 0/0 . Il faut voir la machine comme une unité qui double la mise et la transfert à l'autre. Quand tu ne coopères tu fais semblant de mettre un jeton et tu récupères éventuellement la mise de l'autre.
C'est n'avoir que des non coopérants qui enlève tout possibilité de gain mais chacun à son attitude propre qui fait qu'à la génération n+1 , la population des trahisseurs n'a pas forcément augmentée d'autant plus qu'ils sont infructueux entre eux..
zombie33

Légende
le 19/08/2019 12:36
Tiens ça reparle de Math sur le gen cool :) Cette animation est bien faîte en plus et très pédagogique c'est cool.

Ce jeu est connu sous le nom de dilemme du prisonnier et date de 1950 c'est en grand classique en théorie des jeux, peut-être même le premier que l'on étudie. Généralement la matrice des gains utilisées dans les bouquins est :
Coopère/coopère : 3/3
Trahit/Coopère : 5/0
Trahit/Trahit : 1/1

Une sorte de tournoi fut organisé entre plusieurs participants un peu comme ceux présentés ici. Chaque participant devait soumettre une stratégie secrètement sous la forme de programmes informatiques et des stratégies complexes ont été proposés mais contre toute attente c'est copycat qui gagna le tournoi.
Il y a aussi une stratégie très forte notamment lorsqu'on introduit des "erreurs" comme dans l'animation, c'est la stratégie qui consiste à coopérer en premier puis à jouer le coût que l'adversaire a majoritairement joué jusqu'ici.

La théorie des jeux fut créé (co-créé) par John von Neumann dans les années 40 et de grands mathématiciens se sont penchés sur le sujet ensuite. Petite parenthèse mais si vous ne connaissez pas John von Neumann, je vous conseille de lire quelques anecdotes à son sujet. Ce gars est un des plus grand génie du XXème siècle à qui on doit notamment cette phrase magnifique : "Si les gens ne croient pas que les mathématiques sont simples, c'est uniquement parce qu'ils ne réalisent pas à quel point la vie est compliquée".

Si de nombreux mathématiciens ont développés ce domaine dans les années 50, c'est aussi parce que le budget alloué par les Etats Unis dans ce domaine a explosé à cette période. puisqu'il avait des applications militaires très concrètes dans un contexte de guerre froide. D'ailleurs un film a été fait sur l'histoire de l'un de ces mathématiciens John Nash : Un homme d'exception (l'équilibre de Nash y est très légèrement évoqué).

Outre ses applications en sociologie citées dans le lien de acwi, la théorie des jeux a aussi des applications en économie quand on étudie des interactions entre sociétés concurrentes par exemple, c'est pourquoi bon nombre de ces mathématiciens américains reçurent des prix nobel d'économies tels que John Nash justement.
Morosophe
Lille, France
Spectre
...
le 19/08/2019 13:25
Et je tiens à préciser :
1/ ce n'est qu'une des branches des théories des jeux (parmi beaucoup d'autres qui valent aussi le coup)

2/ qu'on attribue trop souvent aujourd'hui plein des résultats de la théorie des jeux (appliquée à la psychologie) à la "neuro-science" alors qu'ils étaient bien connus dès les années 60.

3/ que l'explication qu'on tire du "dilemme du prisonnier" sur l'intelligence collective et que c'est la coopération qui est gagnante et plus rationnelle (bla bla qu'on lit parfois, qu'on entend souvent) ne tient pas la route. Il faut voir les conditions du fameux tournoi et à quel point les conditions de réitérations du dilemme du prisonnier modifie le "métagame" (si on veut parler en langage Magic). Bref, réitérer, ça change la donne !
Azahir
Frappe, je te dirai quand arrêter

DRAGON
le 19/08/2019 16:19
Ah bon Morosophe, pourtant il me semble qu'en théorie des jeux, mais comme beaucoup avant eux (je pense notamment aux liberaux comme adam smith), chaque individu agit du mieux qu'il peut mais pour lui et selon lui. Les poids mis dans le dilemme du prisonnier peuvent dans certains cas rendre le "se tait;se tait" globalement meilleur ou "denonce;denonce" globalement meilleur au sens maximisation du "bien-etre" global DES individus, mais strictement personne ne reflechit comme cela, c'est inatteignable. Chacun va reflechir par rapport à lui et se rendre compte que quel que soit ce que repond l'autre, denonce/trahir est toujours meilleur POUR SOI. Le choix completement rationnel n'est certainement pas la collaboration mais bel et bien la denonciation/trahison systématique.

Ensuite la valeur des poids peuvent faire changer le resultat de la reflexion, mais la reflexion est toujours guidé par "qu'est ce qui est le mieux selon moi, et souvent, cela se traduit par qu'est ce qui est le mieux pour moi", jamais la collaboration. Chez les bisounours peut-etre, mais pas chez les animaux.
Morosophe
Lille, France
Spectre
...
le 19/08/2019 17:03
Azahir, c'est que tu n'es pas au courant de l'interprétation que je donne. ((et d'ailleurs, la théorie des jeux, ce n'est pas une idéologie, c'est un ensemble d'outils mathématiques. Donc comparer brutalement "en théorie des jeux" avec "dans la théorie libérale", c'est un peu une erreur de registre ...))

L'idée est que s'il existe une stratégie gagnante, et il existe une stratégie gagnante pour le dilemme itéré du prisonnier, c'est "COPY-CAT généreux"; bref s'il existe une stratégie gagnante, alors cette stratégie est plus rationnelle.

De là, certains ont conclu, à tort, en extrapolant à partir du dilemme du prisonnier et en résumant tout l'univers à une série de dilemmes de prisonnier itérés, que la rationalité, c'était "coopérer avec les coopératifs, punir les traîtres en les trahissant, et préférer commencer par la loyauté".

C'est une extrapolation très courante. Et fausse.
*************
La dénonciation systématique n'est pas rationnelle aussi. L'usage du dilemme du prisonnier itéré comme modèle de rationalité est juste mauvais.
Azahir
Frappe, je te dirai quand arrêter

DRAGON
le 19/08/2019 19:32
Disons que je passe peut etre un peu sous silence ta derniere phrase. Effectivement, je refléchissais en non itérée. Les regles sont differentes en itéré et dans l'exemple precis ici, avec les poids choisis, en fait le probleme est vraiment différent. Le copy-cat genereux, j'ai deja entendu le nom mais je me souvenais plus que c'etait la strategie qui maximise.... TES jetons, donc ta demarche n'est pas collaborative il me semble. Accessoirement, tu perds -1,3 contre... triche toujours qui lui doit rester vainqueur de condorcet je parierais, mais pas en nombre de jeton moyen final, il bat tout le meta oar contre il me semble. Mouais en fait, pas forcement si different du non itéré.

Sinon je n'ai pas forcement la force de partir en debat la dessus, mais le developpement principal, au moins dans les debuts, de la théorie des jeux n'était-il pas l'économie... t'es sur que non? Economie et theorie des jeux hors sujet? T'es sur? L'un des principes fondamentales de la theories des jeux n'est-il pas "chacun reagit aux actions des autres pour lui selon lui"? Bon ben l'équilibre de Nash, Smith l'a énoncé 200 ans avant en fait. Je partage son analyse (je contredis pas nash quoi ^^) au début, sur le constat factuel, sa conclusion très nettement moins.

/counter tatanka : penser seulement le mieux pour soi selon soi n'est pas exclusif de l'altruisme.

Maintenant je te rejoindrais completement sur le biais engendré par un modele bien trop simpliste et bien malin celui qui pourrait déterminer une stratégie ev max ,GENERIQUE qui plus est, au jeu de la vie (non mais le vrai). Au demeurant c'est relativement fair comme stratégie au jeu de la vie celle que tu propose : "coopérer avec les coopératifs, punir les traîtres en les trahissant, et préférer commencer par la loyauté".
nicoG2
Géant
...
le 19/08/2019 19:49
Ma stratégie est simple: je coopère par défaut et dès la deuxième trahison de l'autre, je trahie systématiquement jusqu'à la fin.
Madmox
I guess Warhol wasn't wrong, Fame fifteen minutes long

Légende
le 19/08/2019 20:01
J'ai vraiment du mal à voir où vous voulez en venir, nicoG2 et Azahir... On dirait que vous n'avez même pas regardé l'animation d'acwi et que vous lisez tous les messages de travers.

Erreurs de communication : 50%
Azahir
Frappe, je te dirai quand arrêter

DRAGON
le 19/08/2019 20:36
Ben je n'avais pas ete jusqua la fin (j'avais joue au jeu quoi).Elle est bien faite en montrant le principal:selon les parametres ca change tout! Apres je n'adhere pas à toutes les conclusions.

Ben moi je mettais en doute la lecture altruiste du jeu du prisonnier, tout comme moro en fait.
Madmox
I guess Warhol wasn't wrong, Fame fifteen minutes long

Légende
le 19/08/2019 22:10
A quelles conclusions est-ce que tu n'adhères pas ?
zombie33

Légende
le 19/08/2019 22:58
Citation :
Bon ben l'équilibre de Nash, Smith l'a énoncé 200 ans avant en fait.


Smith n'a jamais fait de math et Nash n'a jamais fait de philosophie.
Nash a démontré, sous certaines hypothèses, que tout jeu comportant un nombre fini de joueurs comportait un équilibre qui porte aujourd'hui son nom. Rien à voir avec une quelconque philosophie.
Morosophe
Lille, France
Spectre
...
le 19/08/2019 23:36
Citation :
Rien à voir avec une quelconque philosophie.


Et souvent, on fait de la mauvaise philosophie en utilisant et en abusant de cet outil-là, qui, s'il est sympa et cool, ne "capture" pas tout l'univers et toute la rationalité. Et c'est heureux :P !
Azahir
Frappe, je te dirai quand arrêter

DRAGON
le 20/08/2019 10:43
L'un est parti du postulat pour en batir un constat factuel du fonctionnement de l'économie afin d'en déduire une théorie, l'autre l'a démontré sous certaines conditions, dans un certain cadre, théorème immédiatement repris à son compte par le domaine d'application du premier, puisqu'il y avait déjà une théorie préexistante qui partait de ce postulat.... Effectivement rien à voir.

Sérieux c'est parfois un poil irritant de se frotter au rigorisme des matheux, surtout quand ce n'est qu'une petite remarque au passage dans mon premier post et SURTOUT quand j'y ai déjà répondu. Donc ne vous en déplaise cela n'a pas RIEN à voir, cela a strictement tout à voir. L'énoncé est genre presque le même quoi. Un postulat n'est pas une chose démontrée je suis d'accord, mais le qualificatif "rien à voir" me parait à cote de la plaque.


Mon probleme avec l'analyse qui est faite après le jeu est qu'elle est extremement biaisée. C'est d'autant plus bizarre qu'elle le dit à plusieurs reprises : selon les paramètres, le résultat est changé, donc pourquoi se permettent-ils de conclure quoi que ce soit de général, malgré cela? J'ai déjà pris un exemple : le critère de jugement est déjà biaisé, la facon dont est fait le classement l'est. Par exemple, si le classement est établi simplement par nombre de victoires sans tenir compte du nombre de jetons accumulés, sans itérer, on obtient triche toujours comme vainqueur et non copycat.
Birdish
Charlot de Feu

le 20/08/2019 10:53
Ca manque de concret tout ça. Les vraies questions c'est : faut revendre ses cartes de la Reserved List ou pas ? A qui ? A quel prix ?
Morosophe
Lille, France
Spectre
...
le 20/08/2019 11:05
Non, je confirme que les deux théories n'ont rien à voir et qu'on ne peut pas enjamber les environ 200 ans qui séparent Adam Smith et Nash comme si rien ne s'était passé entre temps et qu'ils faisaient la même chose.

Grosso modo, sur ces 200 ans, l'approche mathématique de l'économie, ça utilisait plutôt la probabilité, la statistique ou la recherche de "martingale" (les fameux cycles économiques = c'est rechercher une régularité qui serait à exploiter). Avec une approche disons assez aristotélicienne => le couple cause/conséquence traduit en demande/offre (encore que là, je peinturlure à gros traits et l'économie d'Aristote, ça avait une toute autre gueule !!!)
Azahir
Frappe, je te dirai quand arrêter

DRAGON
le 20/08/2019 14:02
Non je confirme, le postulat de depart d'adam smith et le theoreme de Nash ont bien, à la variation stylistique près, le même énoncé. A partir de là, dire que cela n'a rien à voir est pour ma part largement abusif. Ai-je dit que c'était la même chose? Non! J'ai dit que ce que Nash a démontré, d'autres très longtemps avant lui l'avait pressenti et factuellement, c'est vrai. Ce qu'en conclue Adam Smith par contre n'a effectivement que peu de chose à voir car le théorème de Nash n'est que le point de départ de la reflexion d'adam smith, mais Adam Smith dans sa reflexion prend bien comme hypothèse (entre autre) de depart le theoreme de Nash, qui ne sera démontré que 200 ans plus tard (sous certaines conditions en plus).

Bon on continue de pinailler/ergoter la dessus (heureusement que j'ai dit que je voulais pas spécialement débattre là dessus precisement) ou on continue sur la théorie des jeux?
haut de page - Les forums de MV >> Général >> Discussion : page 1 | 2 | 3
Vous devez être identifié pour pouvoir poster sur les forums.