Destiny Duel(men) Series (DDS) vol.9 am 17.5.2014 in Dülmen // Trainiert für die Nationals

  • In aller Kürze hier im Thread:


    - kleinstes bisheriges Turnier
    - sehr entspanntes Klima
    - nur freundliche und glückliche Gesichter
    - ALLE Spieler, die bis zum Ende mitgespielt haben, sind nach der letzten Runde noch mit einem Preis ausgezeichnet worden (Tin-Box-Promos oder Booster)! Als Spieler ist das doch einfach genial.



    Schlussfolgerung: Wir freuen uns nun alle schon riesig auf das Jubiläum.


    euer saske1306


    hier noch der Link zum ausführlichen Fazit in der CV:
    http://www.etcg.de/connect/blog/view.php?id=2701



    P.s.: Ich wünsche euch allen eine tolle, erfolgreiche und lustige DM in Bochum.

  • SO, nachdem ich wieder aus meinem Koma erwacht bin mache ich mich jetzt an die Nacharbeiten.


    Das Feature Match des Finales wird noch mit Fotos bestückt, sowie überarbeitet und danach folgen die Decklisten!

  • so. ich bin dann jetzt auch zu hause. ein fazit schreibe ich morgen in ruhe. heute möchte ich bloß noch auf mein schätzen, die untersuchung, eingehen.



    ich habe im einführungsartikel erwähnt, warum ich die untersuchung in runde 5 durchgeführt habe - damit nur gleich starke spieler gegeneinander spielen. wenn man sich olis alten artikel anschaut (den ich im übrigen schon im einführungsartikel verlinkt habe), dann sieht mann, dass die ergebnisse zwischen runde 1 und runde 6 sehr variieren, eben weil in den ersten runden auch schlechte spieler gegen profis ran müssen. um belastbare ergebnisse zu erhalten, hätte höchstens noch die 6. runde genommen werden können. du weißt aber selber, dass die letzte vorrunde immer etwas zu wuselig ist, um so etwas machen zu können. daher habe ich ja auch gesagt, dass ich mich freuen würde, wenn andere turniere einen ähnlichen versuch durchführen, um eine weitere referenzstudie zu haben. meine stichprobe war zwar nicht sehr groß gewesen, doch ich denke, dass die verteilung schon in eine tendenz geht, bei der man nicht mehr von einer empirischen standartabweichung sprechen kann und die ergebnisse trotzdem belastbar sind.


    Ich habe das gestern ehrlich gesagt nur kurz im Kopf überschlagen und war mir relativ sicher, dass der "kritische Wert" für eine statistische Relevanz bei circa 63% gelegen hätte. Ich wusste aus dem Kopf noch, dass bei n = 100 der Wert bei ca. 60% liegt.


    Wir hatten allerdings nur einen Stichprobenumfang von etwa n = 65 Spielen (nicht Matches; ich gebe zu, dass man sich über den Einfluss des Side-Decks streiten kann). Ich habe es gerade nochmal nachgerechnet und tatsächlich ist es bei den vermuteten 65 Spielen extrem knapp statistisch nicht signifikant ist (bei einem Alpha-Fehler von 0,05). Tatsächlich geht es um +/- 1 Partie. Das kommt davon, wenn man sowas im Kopf überschlägt. ^^


    Wenn Moritz die exakten Zahlen noch hat, rechne ich es aber nochmal genau nach.

  • Ich habe das gestern ehrlich gesagt nur kurz im Kopf überschlagen und war mir relativ sicher, dass der "kritische Wert" für eine statistische Relevanz bei circa 63% gelegen hätte. Ich wusste aus dem Kopf noch, dass bei n = 100 der Wert bei ca. 60% liegt.


    Ich habe das alles nur so aus meinem Bauchgefühl gesagt, ohne irgendetwas konkret nachzurechnen.... das größte Problem, was ich habe, ist die Darstellung. Für jemanden, der von Statistik keine Ahnung hat, sieht es so aus, als wäre es plausibel, jetzt zu glauben, dass in 2 von 3 Fällen der beginnende Spieler auch gewinnt.

    Wir hatten allerdings nur einen Stichprobenumfang von etwa n = 65 Spielen (nicht Matches; ich gebe zu, dass man sich über den Einfluss des Side-Decks streiten kann).


    Später, als ich schon offline war, hatte ich darüber auch noch mal nachgedacht und ich denke (ohne jetzt ganz exakt darüber nachzudenken), dass es eine bessere Modellierung wäre, nur Matches zu betrachten - denn Spiel 2 und Spiel 3 sind nicht mehr unabhängig von Spiel 1 (resp. Spiel 2). Außerdem könnten sich da noch andere Dinge einschleichen, wie z.B. dass ein Spiel 3 ganz anders abläuft als die anderen, weil das Timeout kurz bevorsteht. Deswegen würde ich es gefühlt für besser halten, Matches zu betrachten.

    Ich habe es gerade nochmal nachgerechnet und tatsächlich ist es bei den vermuteten 65 Spielen extrem knapp statistisch nicht signifikant ist (bei einem Alpha-Fehler von 0,05). Tatsächlich geht es um +/- 1 Partie. Das kommt davon, wenn man sowas im Kopf überschlägt. ^^


    Wenn man so etwas veröffentlicht, finde ich es aber schon entscheidend, dass man da genau ist. Ansonsten ist es zwar schön, dass so etwas durchgeführt wurde, der Wert davon aber relativ gering. Am allerbesten wäre es natürlich, wenn Konami eine solche Statistik auf einer oder gar mehreren YCS anfertigen würde (meinetwegen nur die Runden 4-10 oder so, aber halt schon mit möglichst großem Stichprobenumfang), aber ich weiß auch, dass das nicht wirklich realistisch ist.

  • Das Final FM ist nun augefhübscht und eines Finales würdig!


    http://www.etcg.de/connect/blog/view.php?id=2695


    Schaut gerne noch einmal herein, denn jetzt kann man alles haargenau verfolgen.


    Ich beginne nun die Top 8 Decklisten abzutippen und danach ist die CV auch vervollständigt!

  • Später, als ich schon offline war, hatte ich darüber auch noch mal nachgedacht und ich denke (ohne jetzt ganz exakt darüber nachzudenken), dass es eine bessere Modellierung wäre, nur Matches zu betrachten - denn Spiel 2 und Spiel 3 sind nicht mehr unabhängig von Spiel 1 (resp. Spiel 2). Außerdem könnten sich da noch andere Dinge einschleichen, wie z.B. dass ein Spiel 3 ganz anders abläuft als die anderen, weil das Timeout kurz bevorsteht. Deswegen würde ich es gefühlt für besser halten, Matches zu betrachten.


    Wir haben darüber auch kurz diskutiert. De fakto ist aber auch das Match bzw. die erste Partie bereits nicht wirklich "unabhängig", da die Spielstärke eines Decks immer abhängig vom gegnersichen Deck ist. Tatsächlicht denke ich sogar, dass die Spiele NACH dem benutzen des Side-Decks deutlich fairer und näher an der idealen Wahrscheinlichkeit von 0,5 liegen als davor. Genau das ist ja auch der Sinn des Side-Decks.

  • Wir haben darüber auch kurz diskutiert. De fakto ist aber auch das Match bzw. die erste Partie bereits nicht wirklich "unabhängig", da die Spielstärke eines Decks immer abhängig vom gegnersichen Deck ist.


    Es ist sogar vermutlich so, dass sich das je nach Metagame immer ändert. Überhaupt wird das ganze Phänomen nie wirklich 100%ig stabil bleiben, weil YGO eben ein sich veränderndes Spiel ist.

    Tatsächlicht denke ich sogar, dass die Spiele NACH dem benutzen des Side-Decks deutlich fairer und näher an der idealen Wahrscheinlichkeit von 0,5 liegen als davor. Genau das ist ja auch der Sinn des Side-Decks.


    Die Frage ist halt, was man will. Will man einfach nur ein Turnier analysieren oder einzelne Spiele? Für letzteres wäre es vermutlich am besten, wenn man zufällig "alle möglichen" Decks nur ein Duell und kein Match spielen lassen würde.

  • Ich denke, dass der beste Versuchsaufbau so etwas wie die Structure Deck Side Events einer YCS wären. Dort spielen alle das gleiche Deck ohne irgendwelche Side-Decks. Damit bleiben dann nur noch die "spielerische Fähigkeit" und das "Herz der Karten" als echte Störgrößen. Aber so eine Option hatten wir gestern halt nicht.

  • Deckliste sind oben und damit ist die Coverage fertig!


    http://www.etcg.de/connect/blog/view.php?id=2702


    Ich hoffe ihr habt Spaß daran sie durchzuschauen!

  • Wenn Moritz die exakten Zahlen noch hat, rechne ich es aber nochmal genau nach.


    eigentlich habe ich alle zahlen im artikel veröffentlicht. welche zahlen fehlen dir denn?


    Deswegen würde ich es gefühlt für besser halten, Matches zu betrachten.


    in dem artikel habe ich erklärt, warum ich nur einzelne duelle und nicht das ganze match betrachtet habe. der beginn des ersten duells kann keine auswirkungen auf den ausgang des matches haben, da duell 2 und 3 nicht betrachtet werden. deswegen habe ich olis untersuchung ja als methodisch fehlerhaft bezeichnet.


    Tatsächlicht denke ich sogar, dass die Spiele NACH dem benutzen des Side-Decks deutlich fairer und näher an der idealen Wahrscheinlichkeit von 0,5 liegen als davor.


    genau das denke ich nicht, da in so einem fall der beginner eindeutig einen vorteil gegenüber dem zweiten hat. stell dir mal vor, du spielst gegen bujin und beginnst das zweite duell. wenn du einen light-imprisoning mirror aktivieren kannst, bevor dein gegner auch nur sein erstes monster beschwört, hast du einen enormen vorteil durch das beginnen. weitere beispiele könnte ich hier aufzählen. ich habe allerdings nicht untersucht, ob das beginnen/gewinnen-verhältnis im schnitt in duell 2 und 3 (also nach dem siden) anders ausgefallen ist. die result slips mit den tabellen sind leider schon entsorgt und ich kann diese frage nicht mehr beantworten.


  • Die exakte Fallzahl bzw. die exakte Anzahl der gewonnen bzw. verlorenen Partien.


    was meinst du mir partie? duell oder match?


    gespielte matches: 24
    gespielte duelle: 61
    beginner gewinnt: 39
    beginner verliert: 22


    was ich nicht angeschaut habe war, ob der beginner des 1. duells in aller regel auch das match gewonnen hat. ich habe aber auch erklärt, warum ich das nicht gemacht habe. das wäre für eine wiederholungsstudie sicher ein punkt, den man dennoch anschauen könnte.


    oder reden wir gerade wieder aneinander vorbei? :P

  • Oh cool. Der "kritische Wert" liegt bei 61 * 0,5 + 1,96 * sqrt(61*0,25) = 38.15 gewonnene Spiele. Passt also ganz knapp doch, da 39,00 > 38,15 ist. :D


    Rein interessehalber: Schreib mal bitte alles Wichtige auf, Modellannahmen, Hypothese etc. Ich könnte mir das sicher schon anhand der Rechnung aus den Fingern saugen, dazu habe ich aber wenig Lust ;)

  • Das hier sollte in etwa dem entsprechen was ich gemacht habe: http://www.mathematik-wissen.de/hypothesentest.htm


    Fauler ****. ;)


    Na ja, ich will jetzt nicht völlig ausufern, möchte aber dennoch noch mal zwei Dinge betonen: Einerseits sind hier einige "technische" Probleme im Test; man kann halt nur schwer davon ausgehen, dass in Runde 5 tatsächlich nur gleich starke Spieler gegeneinander gepaart sind. Dazu kommt, dass ein TCG mit den Decks noch eine Komponente drin hat, die weitere Probleme macht, denn nicht alle Decks sind gleich stark. Schlimm ist das alles wirklich nicht, macht den Test aber ggf. etwas unscharf, weil unklar ist, ob sich diese Probleme weitestgehend aufheben oder ob sie das Ergebnis in eine Richtung verschärfen. (Das Problem kann man nie ganz lösen, aber das ist normal bei der Modellierung und es ist auch durchaus akzeptabel, hier annähernde Modellannahmen zu machen.)
    Andererseits gibt es dann aber ein mathematisches Problem, nämlich die fehlende Unabhängigkeit der Zufallsvariablen. Die sorgt nämlich dafür, dass der Test "kaputt geht" - die Unabhängigkeit ist nämlich ein wichtiges Kriterium dafür, dass die Teststatistik auch tatsächlich binomialverteilt ist mit den entsprechenden Parametern. Hier hätte eben zumindest aus dieser Sicht Abhilfe geschaffen, wenn man Matches und nicht einzelne Spiele betrachtet hätte - dann nämlich ist die Unabhängigkeitsannahme plausibel (wobei mir auch klar ist, dass dies weitere Annahmen nach sich zieht, nämlich dass man davon ausgehen muss, dass jeder Spieler immer beginnt, wenn er kann - vielleicht kann man hier sogar abschwächen.).


    Summa summarum: Ich glaube nicht, dass der Test/das Testergebnis sehr viel wert ist bzw. man von Signifikanz sprechen kann. Damit ich nicht falsch verstanden werde: Die Statistik selbst ist sehr wohl etwas wert und vermutlich reicht das auch vollkommen, ohne irgendeinen statistischen Test durchführen zu müssen.