Statistik Report 2018

  • Zelda-Forum Statistik Report 2018


    Einleitung

    Daten, Daten und noch mehr Daten.

    Das Zelda-Forum ist eine Datenschleuder vorm Herren. Das viel mir beim letzten Upgrade besonders auf.

    Insgesamt ist die Datenbank des Zelda-Forums 1,62 GB groß. Davon sind alleine 624 MB in der Tabelle zu Beiträgen. Insgesamt 195 Tabellen umfässt die Installation

    Auf dem Filserver ist das Forum 629 MB groß und enthält über 11.000 Dateien in 364 Ordnern



    Zeitpunkt der Datenerfassung: Anfang August 2018


    Part 1


    Beiträge

    Gesamtsumme zählende Beiträge: 274.809

    Gesamtzahl aller Beiträge laut Framework: 667.491

    Gesamtzahl Threads: 11.525

    Gesamtzahl der Einträge in der Datenbank Posts: 880.791


    User

    User gesamt: 4806

    Registrierungen: 6632

    Die Differenz ergibt sich als gelöschten Benutzern und fehlgeschlagenen Registrierungen.


    Likes

    Gesamtzahl der Likes: 20432

    Die meisten Likes bekommen hat Yuffie.



    Aus der Grafik zusammengefasst als "Andere" sind alle Benutzer die weniger als 500 Likes haben.


    Likes zu Beiträgen im Verhältnis

    Quote: Likes durch Beiträge

    Höchste Quoten haben: @Moscow GoronoVI   HeartHero

    Würde man die Qualität der Beiträge bewerten wollen, würden Vincent Delacroix und Lanayru durch Menge an Beiträgen und die Quote an Likes gewinnen.

    Diese User sind allerdings nicht sonderlich aktiv, also kürze ich sie für die Grafik raus




    Anmerkung zu den Likes:

    Frühere Systeme wie "Renomee" und "Thankomant" konnten nicht eingerechnet werden.

    Daher sind User die Beiträge vor dem Umstieg des Systems auf Likes geschrieben haben statistisch benachteiligt.

    Auffällig ist das durch die userIDs, die alle im mittleren vierstelligen Bereich liegen, also ist die "Alte Garde" dabei benachteiligt.


    Mail-Provider

    Was ich ganz interessant finde, ist die Verteilung der Mail-Provider. Schließlich ist zu jedem User eine Mailadresse bekannt, also warum nicht mal nachsehen wer der beliebteste Anbieter ist.

    Gewinner ist ganz klar der deutsche Anbieter Web.de mit immerhin 22,4% der User. Das ist fast ein Viertel der Benutzer.




    Beiträge

    Bei einer Spanne zwischen 0 und über 11.000 Beiträgen fällt es schwer eine anständige Darstellung zu finden, also habe ich mal alle Benutzer die weniger als 1500 Beiträge haben zusammengeafsst als "Andere". Trotzdem ist die Grafik nicht sehr übersichtlich. Funfact: Das Forum besteht zu 4,29% aus Megaolf s Beiträgen




    Geschlechter

    von den Usern die ihr Geschlecht angegeben haben, sind 68% Männlich (1968) und 32% (938) weiblich. Ausdrücklich "kein Geschlecht" haben 1225 User angegeben. Bei circa 400 Usern war der Datensatz leer.



    Lieblingsspiel

    Aus den Profilfeldern "Lieblingsteil der Serie" habe ich folgende werte ermittelt. Da oftmals verschiedene Schreibungen genutzt worden sind habe ich die gängisten zusammengekürzt und alles was unter 3 Nennungen hatte gestrichen.

    Spiel Anzahl
    Ocarina of Time 101
    A Link to the Past 53
    Twilight Princess 20
    Link's Awakening 17
    Phantom Hourglass 16
    Links Awakening 15
    The Legend of Zelda 8
    Wind Waker 8
    Skyward Sword 6
    Spirit Tracks 6
    Majoras Mask 3
    Oracle of Seasons 3
    The Minish Cap 3


    Durchscnittlicher User

    Ein durchschnittlicher User hat:

    57,18 Beiträge (Mittelwert aller Beiträge, Standardabweichung ist 344,98

    4,25 Likes

    wurde im Dezember 1990 geboren und ist 27,15 Jahre alt



    Das war erstmal Part 1.

    Für Part 2 werde ich mir noch weitere Profilfelder ansehen und wer wie viel Likes verteilt hat. Eventuell gibts auch einen Blick auf die zeitliche Entwicklung des Forums, mal sehen.


    Wenn ihr Vergleichen wollt wie es im Fallout-Forum aussieht, dann klickt hier: https://www.fallout-forum.com/…&postID=110610#post110610


    FAQ

    Wie schreibt man halbe Beiträge?

    Fragt mich nicht, ich hab keine Ahnung.


    Hast du langeweile?

    Scheinbar.


    Und was soll ich jetzt mit den informationen?

    Kein Plan. Steck sie in einen Rucksack und bring sie in ein Statistikmuseum. Ging mir nicht darum ob man das alles analysieren sollte, sondern vielmehr darum ob man es kann.


    Wie hast du solches Hexenwerk vollbracht?

    Hauptsächlich mit einem Programm das den wohlklingenden Namen R trägt. Ja richtig, nur ein verdammter Buchstabe. Lässt sich super googlen der Name. Für einiges musste ich allerdings unchristliche Methoden einsetzen: Microsoft Excel.


    Warum ist der Stuss in Parts geteilt?

    Weil ich nicht allmächtig bin und nur fünf Grafiken pro Beiträg hochladen kann.


    Warum machst du das alles?

    Erstmal aus Interesse, andererseits versuche ich Erfahrung mit deskriptiver Statistik zu sammeln. Dazu gehören Programme wie R/RStudio, SPSS und PSPP als auch SQL-Abfragen.

  • Vielen Dank für die aufschlussreiche Statistik. Dann muss ich mich wohl noch ein Bisschen mehr ins Zeug legen damit das Forum bald 5% Megaolf ist. Und wenn ich mich so richtig ins Zeug leg und 51% Forum werde, dann werden hier andere Seiten aufgezogen. Dann verkauf ich uns an einen chinesischen Investor und dann sind wir das zelda-folum.com

    Die Liga der außergewöhnlichen Gentlemen

    #51: Val Hallen

    valhallenxqcyi.png

    "Upsurge!"

  • Part 2


    Foren

    Gesamtzahl Threads: 11.525

    Ebene 1 sind die Bereiche (Nintendo, Sonstiges, Community, etc.) und Ebene 2 im Folgenden die Unterbereiche (Willkommensbereich, Archiv, etc.).

    (Ebene 1 und 2) mit mehr als einem Thema: 35


    Anteile der Foren an der Gesamtmenge der Themen:

    In der Grafik die Foren (Ebene 1)


    In der Grafik ist klar zu sehen das "Sonstiges" und "Community" ungefähr je ein Drittel der Themen ausmachen.

    Hier nochmal aufgelistet welche Foren (Ebene 2) welchen Anteil and den Themen haben.



    Anteile der Foren an der Gesamtmenge der Beiträge:

    Hier ist klar zu sehen, dass sich der Anteil stark zu Lasten des Community-Bereichs verändern.




    Bei den Beiträgen sieht man schon sehr stark, dass im Community deutlich mehr Beiträge in den Threads stecken. Hierbei sind allerdings auch die "nicht-zählenden" Beiträge eingerechnet.

    Threads

    Es gibt auch eine wunderbare Liste, die zeigt welcher Thread wie viele Antworten hat. Hier mal eine Auswahl



    Die größten Threadstarten auf einen Blick:

  • Vielen Dank für die schöne Statistik mit all den anschaulichen Grafiken. Einige Sachen überraschen mich doch tatsächlich – zum Beispiel, dass ich so weit oben bei den Thread-Erstellern bin und außerdem freue ich mich, dass ich bei „Verteilung von zählenden Beiträgen“ so eine schöne rosa Farbe abbekommen habe. War sicher Zufall, trotzdem Danke.


    Was mich sehr stark verwirrt ist, dass Majoras Mask so weit unten ist. Sind wir uns da sicher, dass das stimmt? Ich hatte das Gefühl, dass zumindest innerhalb von Threads oftmals die Aussage gefallen wäre, dass man den Underdog lieber mag als OoT. Hätte es wirklich höher eingeschätzt – Ocarina of Time auf dem ersten Platz, verwundert mich hingegen gar nicht.

  • Ein genauerer Blick in die Tabelle für "Lieblingszelda" schafft wohl klartheit.

    Tatsächlich sind es doch 10 Leute die Majoras Mask als Lieblingsteil angegeben habe.

    Ich hab einfach alle Einzelnennungen rausgestrichen, was aber dazu führt das durch verschiedene Schreibungen doch mehrmalige Nennungen sind. "Ocarina of Time" hat eben weniger Potential für Rechtschreibfehler wie "Braethe of the Wilde" oder "Major´'s Mask".

    Die Tabelle dazu:

  • Es schaut ein wenig komisch aus, in den obigen Statistiken, weil Breath of the Wild ja ein eigenes Unterforum erhalten hat. Interessant wäre noch eine Art Vergleich zu den Themenbereichen der Spiele untereinander, als wo man Breath of the Wild als Unterforum herauslöst und den restlichen Teilen gleichstellt.

    Ist es auch möglich, nur zählende Beiträge miteinzubeziehen (und den Chat und Smalltalk Bereich etc.) rauszunehmen, der "verfälscht" das natürlich auch etwas.

    Die Liga der außergewöhnlichen Gentlemen

    #51: Val Hallen

    valhallenxqcyi.png

    "Upsurge!"

  • Auch von meiner Seite aus dankeschön für die schöne Statistik. Wieviel Zeit hast du benötigt, um die ganzen Daten mit dem Programm zu beschaffen und die Grafiken zu erstellen?

    Ist es auch möglich, nur zählende Beiträge miteinzubeziehen (und den Chat und Smalltalk Bereich etc.) rauszunehmen, der "verfälscht" das natürlich auch etwas.

    zitres hat doch Angaben zu zählende und nicht zählende Beiträge vorgestellt, sodass es eigentlich deine gewünschte Werte gibt oder worauf beziehst du dich?


    Whity, Whity! Kuuluu-Limpah! Diese magischen Worte hat Whity für sich ersonnen! Stehlen Sie sie nicht!

  • Achso, der Communitybereich betrifft bereits zählende Foren, ich dachte, damit wäre der Chat und Smalltalk etc. gemeint

    Die Liga der außergewöhnlichen Gentlemen

    #51: Val Hallen

    valhallenxqcyi.png

    "Upsurge!"

  • Auch von mir ein Dankeschön für die Statistik. Ich hoffe, Du hast Spaß dabei gehabt.


    Schön zu sehen, wie das Forum in nackten Zahlen so aussieht. Schon beachtlich, wie viel mehr Beiträge im Community-Bereich als im Zelda-Bereich geschrieben worden sind. Allein 40 Prozent aller Beiträge befinden sich in Chat & Smalltalk.

  • Hach, ich liebe Statistiken. Ich wünsche ich könnte auch meine eigenen Statistiken des Lebens aufrufen können um endlich zu wissen wie oft ich schon in meinem Leben... ins Zelda-Forum geschrieben habe?


    Das ZF besteht also aus fast 2% Moody. Das wollte ich schon immer mal wissen!

    zitres Hut ab! Und vielen Dank für deine Arbeit! Wäre echt etwas für /r/dataisbeautiful xD

  • Die geringe Anzahl an Majoras Mask Favoriten hat mich ebenfalls gewundert, zumal ich dieser "Nischengruppe" zuzuordnen bin :D Ansonsten habe ich mich genau wie viele andere hier sehr über die Statistiken gefreut. Ich gehöre auch zur Kategorie, die das rundum interessant findet. Ich will nicht wissen, wie oft ich meine Spielstatistiken auf dem 3DS schon aufgerufen habe, aber da alle Programme und nicht nur Spiele mitgezählt werden, dürften die bald von der Anzahl der Software-Starts aufs Treppchen kommen :ugly2:

    Bereits 1,32% des Planeten habe ich erobert, bei den Lobpreisungen sind es sogar 4%. Macht Euch gefasst, jetzt attackiere ich - für die Zahlen!!! :woot2:

    Danke für die Arbeit, Zitrone!

  • Ist es auch möglich, nur zählende Beiträge miteinzubeziehen (und den Chat und Smalltalk Bereich etc.) rauszunehmen, der "verfälscht" das natürlich auch etwas.

    Nichts leichter als das. Also hier die Liste ohne Spam und Spieleecke


    Es schaut ein wenig komisch aus, in den obigen Statistiken, weil Breath of the Wild ja ein eigenes Unterforum erhalten hat. Interessant wäre noch eine Art Vergleich zu den Themenbereichen der Spiele untereinander, als wo man Breath of the Wild als Unterforum herauslöst und den restlichen Teilen gleichstellt.

    Naja, da brauchst du ja nur die Ebene 1 - Foren "Breath of Wild" mit "The Legend of Zelda" zu addieren, das mach ich jetzt nicht extra.


    Auch von meiner Seite aus dankeschön für die schöne Statistik. Wieviel Zeit hast du benötigt, um die ganzen Daten mit dem Programm zu beschaffen und die Grafiken zu erstellen?

    Bisher schätze ich mal circa 10h über vier Tage verteilt.

    Die Daten zu erhalten war dabei der geringere Aufwand, die Plots mit RStudio und dem CRAN-Paket ggplot2 zu erzeugen war dagegen sehr zeitfressend. Was in Excel drei Klicks sind, sind in R 15 Zeilen handgeschriebener Code, der relativ oft angepasst werden muss.

    Hut ab! Und vielen Dank für deine Arbeit! Wäre echt etwas für /r/dataisbeautiful x

    An sowas in der Richtung habe ich auch schon gedacht :D


    Ich habe mich bei dem Projekten wie Spiegelmining von D. Kriesel inspirieren lassen:

    vgl: https://www.youtube.com/watch?v=-YpwsdRKt8Q


    Ansonsten vielen Dank für das Feedback euch allen. Ich werde mal sehen wie es in den nächsten Tagen so weitergeht und zu was ich noch Lust habe.


    Ich wollte unter anderem auch die paar hunderttausend Beiträge mal durchlaufen lassen und mal sehen welche Wörter besonders oft verwendet worden sind, aber mal sehen wie sich das am effektivsten realisieren lässt.