Citation :
Le biais des données wizard est connu. Ils donnent 5 listes a 5-0 ayant au moins 20 cartes de différences entre elles.
Et je viens d'expliquer en quoi ça n'avait pas nécessairement de conséquences.
C'est expliqué avec une citation de wizard dans ton article :
Citation :
"Since we have been presenting a random selection of top-performing decks, even if a deck doesn't have a particularly high win rate, it can appear to be extremely dominant if it's widely played. With only this information, it's not possible to disentangle win percentage and metagame percentage. This can lead, and at times has led, to feedback cycles where a deck appears more dominant than it would otherwise, which leads to an even greater percentage of play."
Mais comme certains idiots ne comprennent rien aux statistiques mais ne peuvent s'empêcher de se la raconter pour paraître intelligent, on peut lire des trucs du genre :
Citation :
This basically translates to, "The data we have been publishing is so bad it's messing with the metagame, so we're going to publish worse data to solve the problem."
Ses plaintes ne sont même pas toujours cohérente. Et plus il avance dans son article plus il part en mode "tinfoil hat". À la fin c'est juste n'importe quoi. Et sa conclusion est complètement à côté de la plaque. Je peux développer si tu le souhaites.
Le problème de la liste de wizard n'est pas que seuls 5 decks soient sélectionnés, le problème est qu'on ne sait pas si ces 5 decks sont représentatifs de ce qui est joué.
Or, considérant l'analyse statistique que je viens de faire, il semble que l'échantillon donné par wizard soit plutôt représentatif du méta -- pas de la popularité -- pourvu que l'on tienne compte des biais que j'ai décri, à savoir que le tiers 2 est un peu sous représenté et le tiers 3 un peu surreprésenté. Ce qui, finalement, popularise les rogues decks.
Un parallèle que plus de gens sont susceptible de comprendre, c'est l'échantillonnage en musique pour numériser le son : il faut avoir suffisamment d'information pour reproduire le son fidèlement, mais trop d'information demande de filtrer le bruit. On a aussi des traitements qui permettent d'augmenter l'importance d'une partie du signal et de diminuer l'importance d'une autre, ce qui permet de retransmettre un signal fidèle à l'original. Pourtant on a découpé et transformé le signal original de façon très importante.
Citation :
Vu que tu as l'air super motivé, ca voudrait peut etre le coup de référencer tous les decks à 5-0 et Top8 de Challenge à partir de la prochaine ban toutes les semaines ou 2 semaines pour voir l'évolution. Tu m'as peut-etre également motivé à faire ca lol...
Le problème après ça devient la taille de l'échantillon. D'après toi, quelle est la liste la plus cohérente ? La première avec uniquement les résultats d'août ou la seconde avec tous les résultats depuis juillet ?
J'ai l'impression que la première est plus pertinente en fait, parce que plus représentative du méta actuel. La seconde me semble noyer les détails intéressants dans les mouvements du méta et donne peut être trop d'importance aux états passés (le cas Baral typiquement).
Après pour faire ça par contre ça demande plus de travail. Là je me contente d'un fichier texte et ça marche bien. Pour l'évolution il faudrait une feuille de calcul avec une organisation et une présentation astucieuse des données. Faut être un peu malin pour ça.
Mais ça peut se faire. Je verrai ça à l'occasion.