Dresseur, de pokébot

Théorie des jeux
le 18/08/2019 19:47
Je ne connaissais pas.

Du coup, quoi de mieux pour la comprendre qu'un jeu !

https://ayowel.github.io/trust/

J'ai trouvé ça plutôt bien expliqué.
haut de page - Les forums de MV >> Général >> Discussion : page 1 | 2 | 3
zombie33

Légende
le 20/08/2019 14:18
Citation :
L'un est parti du postulat pour en batir un constat factuel du fonctionnement de l'économie afin d'en déduire une théorie, l'autre l'a démontré sous certaines conditions, dans un certain cadre, théorème immédiatement repris à son compte par le domaine d'application du premier, puisqu'il y avait déjà une théorie préexistante qui partait de ce postulat.... Effectivement rien à voir.


Il est assez fréquent que des mathématiques trouvent des applications concrètes dans différents domaines. Mais ce n'est pas pour autant que le mathématicien à l'origine du résultat peut être qualifié de physicien, chimiste, économiste etc... Nash ne fait pas de philosophie et en réalité il n'a que très peu de connaissances en économie. C'est en cela que je dis que ce qu'il fait n'a rien à voir avec une quelconque philosophie. Nash ne prône pas d'idéologies ou de modèles économiques à la différence de Smith.

Néanmoins il est vrai que les résultats de Nash peuvent être reliés aux idées de Smith mais ce n'est absolument pas ce qu'on pourrait appeler une redite. Il se trouve qu'on peut déduire des travaux de Nash qu'une partie du modèle de Smith concernant l'équilibre de marché (une des plus importantes en plus) est incorrecte.

Citation :
Mon probleme avec l'analyse qui est faite après le jeu est qu'elle est extrêmement biaisée.


C'est tout à fait vrai. Il est fait une interprétation extra-mathématiques de résultats mathématiques dans cette animation. Par définition une interprétation est biaisée et donc s'éloigne radicalement de la rigueur mathématiques qui précédait.
Toutefois ce genre d'interprétation est courante en vulgarisation car le grand public trouve qu'il est parfois un poil irritant voir indigeste de se frotter au rigorisme des matheux :{
Azahir
Frappe, je te dirai quand arrêter

DRAGON
le 20/08/2019 14:59
zombie, il ne faut pas confondre. Sur le cas précis, un philosophe a une intuition, il la prend vrai comme hypothese et construit une theorie en deduction (mais au passage se foire, mais ca s'est perso). Le theoreme de Nash n'a donc pas trouvé une application, il a montré un résultat qui en fait avait déjà trouvé une application avant que l'on en fasse la demonstration. Et c'est ce que je dis depuis le début, pourtant toi et morosophe martelé " c'est différent c'est différent", d'où la légère irritation. Est-ce que j'ai traité Nash d'économiste ou Smith de mathematicien?

bref, illusion de transparence 100%, Erreurs de communication : 50%.
zombie33

Légende
le 20/08/2019 15:16
Ok.

Quoi qu'il en soit pour revenir au sujet du topic, je trouve vraiment cette animation cool et pédagogique et je suis content qu'acwi l'ait posté.
Morosophe
Lille, France
Spectre
...
le 20/08/2019 15:37
De quel philosophe on parle ? Smith ? Smith n'a pas une "intuition", il a un problème, et un problème moral, à savoir : "pourquoi le travail ne paie pas ?", ce qui le pousse à reformuler des concepts pour résoudre son problème.
Avant d'être économiste ou philosophe de l'économie, Smith est moraliste. L'idée d'une économie scientifique dénuée de toute morale est "postérieure à Smith". ((là-dessus, ça se comprend quand on prend en considération le fait que la morale recouvrait un champs d'application bien plus large qu'aujourd'hui il y a 200 ans.)

Du coup,
Citation :
il a montré un résultat qui en fait avait déjà trouvé une application avant que l'on en fasse la demonstration.


De quel résultat parle-t-on ? De l'équilibre de Nash ? On est bien d'accord. De quelles applications on parle ? Utiliser les équilibres de Nash en économie ? Non, on ne les utilisait pas avant. Et Adam Smith ne les utilise pas, puisqu'il utilise la fameuse "main invisible du marché", qui n'est pas une allégorie de l'autorégulation des marchés, pour peu qu'on peut qu'on se soit donné la peine de lire Smith, de lire ses écrits moraux etc etc etc ...

Alors je vais sauter directement à la conclusion à laquelle on arriverait dans vingt heures de débat : une lecture néolibérale de Smith et de Nash raconte un récit où l'on passe "naturellement" de l'un en l'autre en cherrypickant les éléments concordants, mais ce récit est une reconstitution de surface, qui s'autojustifie en trouvant des éléments dans l'un et dans l'autre. Cette lecture de l'histoire n'est pas inintéressante en soi, mais n'est ni Smith, ni Nash.
tatanka
Apôtre de la justice

Minotaure
le 20/08/2019 21:51
Sympa l'animation.

Intuitivement j'ai collaboré en premier, puis quand je me suis fait enfler j'ai laissé une chance, puis je me suis refais enfler directement après, j'ai sanctionné en trichant. Puis j'ai été plus sévère après, j'ai sanctionné direct à la première triche.

Les tas de merde qui trichent plusieurs coups à la suite ou plusieurs fois dans la même série son responsable d'une baisse de confiance. Cependant j'ai du mal à concevoir un collabore toujours, pareil pour le triche toujours, c'est trop "idiot" dans les deux cas, l'un est vraiment la bonne poire absolue, et l'autre est "cramé", et risque de se manger la pression sociale, voir des sanctions réelles.

Il manque quelques facteurs, entre les erreurs et les humeurs humaines (personnalité, historique, etc).

Le truc que j'aime pas dans ce modèle, c'est que pour sanctionner le tricheur on incite l'autre sujet à tricher. Surement des contraintes mathématiques ou de données qui oblige à simplifier l'expérience. Par exemple la machine pourrait sanctionner en rendant les pièces dans certaines séquences (exemple, si triche 3 fois de suite, donne les gains à celui qui donne les pièces, comme ça la bonne poire qui collabore toujours ne se fait pas dévorer par triche toujours, on place un verrou systémique, ce qui manque d'ailleurs cruellement dans nos sociétés en ne plafonnant pas les gains personnels ou même la croissance des sociétés, oui oui pour moi on devient pas une baleine sans tricher, mais bon c'est mon opinion pour cet exemple de gains perso et croissance de société).
Anonyme1
Protection contre les phaseurs, Traversée des *counters*

Légende
le 20/08/2019 22:59
Pour sanctionner le tricheur sans tricher toi même, tu peux séduire puis baiser sa meuf.
Dresseur, de pokébot

tatanka
le 20/08/2019 23:36
Citation :
Intuitivement j'ai collaboré en premier, puis quand je me suis fait enfler j'ai laissé une chance, puis je me suis refais enfler directement après, j'ai sanctionné en trichant. Puis j'ai été plus sévère après, j'ai sanctionné direct à la première triche.


#Copycat

J'ai fait pareil.

pour le reste, oui tu peux complexifier le bousin pour tenter de te rapprocher des réactions humaines ; non seulement t'y arriveras pas, mais j'ai même envie de dire : c'est pas le but.
Birdish
Charlot de Feu

le 21/08/2019 8:54
Citation :
Le truc que j'aime pas dans ce modèle, c'est que pour sanctionner le tricheur on incite l'autre sujet à tricher.


Ouais tu peux pas rapidement commencer par un topo pour lui expliquer que ça serait bien dommage pour tout le monde que sa femme et ses gosses décident d'aller faire une balade sur la baie de Naples avec leurs nouvelles chaussures en ciment.
Azahir
Frappe, je te dirai quand arrêter

DRAGON
le 21/08/2019 11:09
Oui enfin c'est un modele où tu payes pour que l'autre gagne de l'argent et tu tables sur le fait que l'autre va faire pareil pour en gagner toi. Vous sentez pas comme un léger probleme de modelisation, de représentativité de la chose?

Le pire c'est que meme avec des regles semblant forcer la coopération, il faut tordre les paramètres et adapter son critère de jugement pour essayer de montrer que la coopération est meilleure. Désolé, mais en 1v1 le deck imbattable c'est triche toujours, meme s'il n'accumule pas le plus de biens, de jetons pardon, il bat TOUS les decks présentés. Ce n'est pas un critère meilleur ou moins bon que le nombre de jeton accumulés.

Et puis en admettant que la meilleure stratégie dans un certain cadre soit la """coopération""" beate (censée être copycat kitten), en fait il n'y a aucun altruisme dans la démarche. La personne qui le fait cherche juste à maximiser SES jetons. Et c'est en cela ou la reflexion de smith partait dans le bon sens. Il faut arreter d'esperer que l'humain soit capable spontanement de refléchir autrement et notablement attendre de lui qu'il fasse des choix maximisant le "bien" commun alors qu'ils ne maximisent pas SON bien. Par contre, à partir de là, en conclure qu'il faut laisser faire et que tout va aller très bien par auto-regulation, là, je suis moins d'accord. Rien que parce que maximiser le "bien" commun peut maximiser son "bien" par exemple. Or pour avoir ça, l'auto-regulation ne fonctionnera pas.

Enfin dire que copycat représente la collaboration, je suis pas non plus d'accord. Copycat ne collabore pas, c'est un rancunier plus évolué.

Ah, et sinon Tatanka, peux-tu nous expliquer en quoi ceux qui trichent plusieurs coups d'affilé sont des tas de merdes? Triche toujours est, sous un certain critère, la meilleure stratégie, je suis un tas de merde si j'agis en fait juste normalement comme n'importe quel être vivant et que j'utilise la meilleure stratégie pour moi, selon moi? Pas très rationnel tout ca.
Birdish
Charlot de Feu

le 21/08/2019 12:17
Citation :
Oui enfin c'est un modele où tu payes pour que l'autre gagne de l'argent et tu tables sur le fait que l'autre va faire pareil pour en gagner toi. Vous sentez pas comme un léger probleme de modelisation, de représentativité de la chose?


Euh, c'est pas le principe même du concept de "coopération" ?

Citation :
Triche toujours est, sous un certain critère, la meilleure stratégie, je suis un tas de merde si j'agis en fait juste normalement comme n'importe quel être vivant et que j'utilise la meilleure stratégie pour moi, selon moi? Pas très rationnel tout ca.


Alors déjà c'est pas comme n'importe quel être vivant. Ensuite paie ton appel à la nature. Est-ce que l'objectif du bousin n'est pas simplement de consolider un fait de civilisation a priori individuellement pas forcément rationnel, et encore moins intuitif, mais qui le devient complètement d'un point de vue plus global (moral, environnemental, etc...) qui serait basé sur la minimisation du préjudice total plutôt que sur la maximisation du bénéfice ?
tatanka
Apôtre de la justice

Minotaure
le 21/08/2019 12:28
Pourquoi copycat serait un rancunier et tricheur ne serait pas un tas de merde (même évolué si tu veux)?


Tricher ce n'est pas la meilleur stratégie, surtout si tu poses différent contexte ET que tu soulignes TOUT LES GAINS et pas juste ceux qui semblent évident y a un gain bien plus important qui est un peu la leçon de morale de ce jeu, c'est la confiance. En effet à long terme à force de tricher tu deviens "cramé", je l'ai bien souligné. Et ça implique sur le long terme la destruction d'un système fonctionnel ( ils ramassent comment des gains tes tricheurs si personne n'alimente la machine?).

Déjà qu'est ce que la triche?

C'est détourner le fonctionnement "normal" d'un système (ou les règles qui permettent le fonctionnement optimale) pour avoir un avantage en pensant que les autres vont les respecter. dans le modèle simpliste on te pose la "triche" comme une règle, c'est pour les besoins de l'expérience, en réalité y a pas de triche dans ce modèle, y a ceux qui mettent une pièce et ceux qui en mettent pas. Mais on comprend bien qu'en fait cette "règle" qui permet de ne pas mettre de pièce est la modélisation d'une "non règle", celle de tricher (c'est à dire ne pas mettre la pièce).

Si j'ose extrapoler dans un système plus complexe, pour moi c'est évident et intuitif, mais ça donne la politique du mensonge et la répression par la force pour forcer les bons moutons à alimenter la machine pendant que les tricheurs se gavent, donc ouais ce sont des tas de merde, car indirectement c'est une forme de mise en esclavage, voler les fruits du labeur des autres (symboliser par la pièce qu'on met dans la machine).

Si sans tricher tu obtiens suffisamment tout en permettant qu'un autre obtienne suffisamment à quel moment il est mieux pour toi de tricher pour avoir un petit peu plus et retirer TOUT (ou énormément) à l'autre? C'est le cas des abus de confiance entre bourse/banque et contribuable, client, petit investisseur.

Mais toi explique moi pourquoi le gain personnel est supérieure à un moindre gain (suffisant) et l'entretient de la confiance. Le tricheur croit à tord qu'il peut détruire la confiance des autres sans contre partie (au contraire il va croire que ça lui rapporte de détruire la confiance). C'est en ça que le système est simplifié, car il n'y a pas de sanction autre que dans le cadre du "jeu".

Déjà tu rajoutes la règle ceux qui trichent trois fois perdent tout leur gain au profit de ceux qui se sont fait arnaquer, tu vas voir si ta stratégie est la meilleur.

La défiance est-elle meilleur que la confiance pour toi? Les sociétés fonctionnent mieux via la défiance ou la confiance?
tatanka
Apôtre de la justice

Minotaure
le 21/08/2019 12:32
Citation :
Oui enfin c'est un modele où tu payes pour que l'autre gagne de l'argent et tu tables sur le fait que l'autre va faire pareil pour en gagner toi. Vous sentez pas comme un léger probleme de modelisation, de représentativité de la chose?


Euh, c'est pas le principe même du concept de "coopération" ?


Je dirais même que c'est le principe d'investissement, et que le tricheur symbolise le gars qui n'investi pas mais qui va en plus piquer ton investissement et tes gains (par l'abus de confiance). Ce qui va donc détruire un pan économique par un comportement parasitaire (et causer des grosses crises économiques, qu'on a connu et qu'on va surement encore connaitre).
zombie33

Légende
le 21/08/2019 12:45
Citation :
Déjà tu rajoutes la règle ceux qui trichent trois fois perdent tout leur gain au profit de ceux qui se sont fait arnaquer, tu vas voir si ta stratégie est la meilleur.


Elle me fait rêver cette phrase. L'argument du changement des règles pour discuter d'une stratégie j'avais jamais vu ça.

"Déjà tu rajoutes la règle ceux qui jouent trois sorts dans un même tour perdent la partie, tu vas voir si Storm est toujours le meilleur deck combo."



Genre ta stratégie elle vaut rien quand on change les règles du jeu.
tatanka
Apôtre de la justice

Minotaure
le 21/08/2019 12:56
Parce que tu considères la triche comme une règle dans Magic? La dans ce système je l'ai bien dis que c'est pas vraiment de la triche de ne pas mettre une pièce, puisque c'est la règle du jeu.
zombie33

Légende
le 21/08/2019 13:06
Sauf que non, triche est ici un mot très mal choisi. Tricher signifie enfreindre les règles.

Dans les règles du dilemme du prisonnier ou jeu du prisonnier, les joueurs ont deux coups possibles : Coopérer et Trahir. Personnes n'enfreint ces règles ici.
Madmox
I guess Warhol wasn't wrong, Fame fifteen minutes long

Légende
le 21/08/2019 13:06
Citation :
Le pire c'est que meme avec des regles semblant forcer la coopération, il faut tordre les paramètres et adapter son critère de jugement pour essayer de montrer que la coopération est meilleure. Désolé, mais en 1v1 le deck imbattable c'est triche toujours, meme s'il n'accumule pas le plus de biens, de jetons pardon, il bat TOUS les decks présentés. Ce n'est pas un critère meilleur ou moins bon que le nombre de jeton accumulés.
Je vois pas en quoi il y a des règles à tordre. Dans la plupart des champs d'application, le nombre de jetons accumulés définit le gagnant, pas le nombre de victoires individuelles. C'est évident en économie et en sociologie par exemple. Ou à MTG : même Burn, qui vise pourtant le max de dégâts pour chaque carte individuelle, a pour objectif d'arriver à 20 dégâts avant l'autre. Et dans la plupart des champs d'application la coopération produit plus de ressources que l'exploitation. Donc le barème classique du jeu, bien qu'ultra simpliste, n'est pas si aberrant.

En revanche je pense que la stratégie altruiste (maximiser les gains des autres joueurs sans tenir compte des siens) n'est pas équivalente à la stratégie collective (maximiser les gains de l'ensemble des joueurs). Je suis également en désaccord avec tatanka sur le fait que le coup "triche" (que je préfère appeler "exploite" justement), est une modélisation d'un contournement des règles. Je vais tâcher d'illustrer dans la suite.

Citation :
Ah, et sinon Tatanka, peux-tu nous expliquer en quoi ceux qui trichent plusieurs coups d'affilé sont des tas de merdes?
Mettons que la notion de "bien commun moyen" (notion que je trouve en pratique vague et indéfinissable, mais passons) soit représentée par le nombre total de jetons distribués à l'ensemble des joueurs. Dans ce cas la notion de "tas de merde" représente selon moi le joueur qui cherche, sur un match isolé, à maximiser son profit (en y arrivant ou pas) en jouant un coup qui ne permet pas l'issue maximisant le "bien commun moyen". Avec le barème classique :
Citation :
Exploite VS Exploite = +0/+0 (gain global 0)
Exploite VS Coopère = +3/-1 (gain global 2)
Coopère VS Exploite = -1/+3 (gain global 2)
Coopère VS Coopère = +2/+2 (gain global 4)
"Exploite" est systématiquement la stratégie "tas de merde", vu qu'elle conduit à un "bien commun" inférieur quel que soit le coup adverse.

Attention, avec certains barèmes dans lesquels la coopération rapporte moins de points à l'ensemble des joueurs qu'une exploitation VS coopération, il faut alors jouer au hasard "pondéré" pour maximiser l'espérance de gain global. Avec ce barème par exemple :
Citation :
Exploite VS Exploite = +0/+0 (gain global 0)
Exploite VS Coopère = +4/-1 (gain global 3)
Coopère VS Exploite = -1/+4 (gain global 3)
Coopère VS Coopère = +1/+1 (gain global 2)
le calcul des espérances de gain donne p(Coopère) = 0.75 afin de maximiser l'espérance de gain global (ici 2,25, mieux que 2 si tout le monde coopère tout le temps).

Sur un tournoi avec matchs répétés et élimination / reproduction, un joueur peut alors mettre en place une stratégie "justicier", qui vise à minimiser les gains d'un joueur (i.e. l'exploiter) tant qu'il se comporte comme un "tas de merde". On se rend alors compte que cette stratégie peut être excellente pour maximiser le "bien commun" sur le long terme, vu qu'elle conduit à l'élimination des joueurs ayant une stratégie ne permettant pas un rendement collectif maximal. Mais selon le barème, cette stratégie peut prendre une forme différente de "exploiter celui qui a exploité".
tatanka
Apôtre de la justice

Minotaure
le 21/08/2019 13:29
Oui du coup on est d'accord zombie33, et Madmox.

Je cherche pas à détruire l'expérience, mais je pense qu'il est intéressant pour l'expérience de rajouter des paramètres qui ne font pas qu'intervenir les "joueurs", un genre de cadre qui prend en compte certains aspects du réel: Conséquence d'un comportement répété, si y a pas de "prédateur" sur un modèle, ce modèle prolifère, sauf que c'est pas forcément un autre joueur qui fait office de "prédateur", mais parfois l’environnement (dans l'expérience la machine). Comme je l'ai dis au tout début, triche (ou trahit) toujours est aussi idiot et inconcevable que collabore toujours, car y a des contraintes réelles endogène et exogène aux comportement humain (religion, pression sociale, éducation, contexte, humeur).

Le choix des mots imposent une moralisation de l'expérience qui est perçu à raison ou à tord par les observateurs. Certes "tas de merde" c'est pas mieux, mais bon ça c'est entre nous :).
Azahir
Frappe, je te dirai quand arrêter

DRAGON
le 21/08/2019 15:46
Madmox moi je pensais plutot à "si on vire les 5 derniers, c'est copycat qui gagne au long terme, si on vire les 3 derniers seulement, c'est exploite toujours qui s'impose", "si on mets tant de % d'erreurs c'est un tel qui gagne" ou encore "je choisis tel critère de jugement parce que dans celui-là c'est ce que je veux montrer qui gagne, mais avec d'autres critères de jugement, d'autres stratégies s'imposent" etc... C'est en cela que je parlais de tordre les paramètres.

Sinon laisse tomber, tu n'arriveras jamais à faire admettre à Tatanka que dans certains cas, maximiser le bien commun ne maximise pas forcément systematiquement ton bien personnel et encore moins que dans ce cas le choix rationnel d'un être vivant n'est et ne pourra JAMAIS etre spontanément de se sacrifier et de privilégier le bien commun par rapport à son bien personnel. A partir de là le pointer du doigt en le traitant de tas de merde n'est pas très juste.

Citation :
Dans ce cas la notion de "tas de merde" représente selon moi le joueur qui cherche, sur un match isolé, à maximiser son profit (en y arrivant ou pas) en jouant un coup qui ne permet pas l'issue maximisant le "bien commun moyen".

Oui tout à fait je pense que c'est l'interpretation de Tatanka, mais cf ce que je dis, ce reproche est completement fallacieux. C'est parfaitement naturel de ne s'interesser qu'à son profit independamment de la maximisation du bien commun. En théorie des jeux, sous certaines conditions, c'est même un théorème.
tatanka
Apôtre de la justice

Minotaure
le 21/08/2019 16:12
Non ce n'est pas naturel, en tout cas pas pour un tas d'espèce vivante, principalement celle qui vivent en société, ce qui est le cas pour nous autre humain. Même en tant que mammifère tu as ta progéniture qui te "force" à choisir la stratégie de la collaboration entre individu. (Ce qui n'est pas le cas de pas mal d'ovipare, sauf les potes emplumer de birdish, bon il collabore beaucoup juste en couple, mais c'est déjà pas mal).

Je vois pas d'ou vient cette "nature" de chercher son profit personnel? C'est pour moi une forme de peur irrationnelle, celle du manque. Hors on croule sous l'abondance (au point ou le gaspillage devient une stratégie viable économique pour des distributeurs).

Mais pour être plus précis, et ce que j'ai pourtant souligner sans en faire la conclusion, c'est que collaboration ou trahison systématique ou à trop forte fréquence, sont des stratégies idiotes, l'humain est doté de discernement c'est pas fait pour décorer, donc on peut alterner. Trahir les malhonnêtes, et collaborer avec les honnêtes, ça pour le coup ça me semble "naturel", en tout cas à la nature humaine qui pose la confiance comme une valeur très importante.
Morosophe
Lille, France
Spectre
...
le 21/08/2019 16:22
Citation :
Trahir les malhonnêtes, et collaborer avec les honnêtes, ça pour le coup ça me semble "naturel", en tout cas à la nature humaine qui pose la confiance comme une valeur très importante.


C'est pour cela que je disais que les conclusions qu'on tirait de ce jeu sont trop hâtives et qu'on arrive très vite à n'importe quoi dans les extrapolations "philosophiques"... Et je ne dis pas cela pour Tatnka spécifiquement, qui vient mine de rien de nous glisser en douce une notion de morale naturelle, avec une définition "naturelle" de l'honnêté, de la trahison et de la collaboration ...
haut de page - Les forums de MV >> Général >> Discussion : page 1 | 2 | 3
Vous devez être identifié pour pouvoir poster sur les forums.