Monday, February 1, 2010

Twopcharts veranderingen

Per 31 januari zijn enige wijzigingen doorgevoerd bij de wijze waarop de Twopcharts worden samengesteld. De wijzigingen zijn de volgende:
  • De rangorde voor de Twoplijst wordt nu bepaald door het aantal volgers en niet meer door het gekwalificeerde aantal volgers
  • De lijsten zullen verder worden uitgebreid, in eerste instantie richting 5000 twitteraars
  • De historie zal nu maandelijks worden vastgelegd en niet meer wekelijks, waarbij wel elke maand een aantal tussentijdse updates zullen worden samengesteld.
Als je in de historie van de Twopcharts bent opgenomen, kun je eenvoudig zien wat de consequentie is van de wijzigingen. Voor 31-12-2009 is een overzicht opgenomen volgens de "oude" methode, terwijl met exact dezelfde data een startpositie is vastgesteld met datum 1-1-2010.

Deze wijzigingen worden doorgevoerd, omdat enerzijds het makkelijker is geworden om, via een zelfontwikkelde taalscanner, Nederlandstalige twitteraars te vinden en anderzijds vanwege de wens om de interpretatie van de charts te vereenvoudigen. Dit betekent voor de Twoplijst dat deze nu samengesteld wordt op basis van het absolute aantal volgers en niet meer op basis van het gekwalificeerde aantal volgers.

Bij het gekwalificeerde aantal volgers wordt via een algoritme een correctie gemaakt op basis van het aantal twitteraars dat iemand zelf volgt. Deze correctie wordt gemaakt om zoveel mogelijk te voorkomen dat massfollow- en spamaccounts in de charts verschijnen. Het gekwalificeerde aantal volgers wordt nog wel gebruikt om vast te stellen wie in de charts verschijnen, maar vervolgens wordt voor de rangorde alleen nog naar het aantal volgers gekeken.

Voor de Tweetlijst verandert niets en deze wordt dus nog steeds samengesteld uit de twitteraars die zich ook voor de Twoplijst hebben gekwalificeerd.

Vanwege het gebruik van een automatische taalscanner is het veel eenvoudiger geworden om de taal te bepalen waarin tweets verzonden worden. Dit maakt het mogelijk om vrij eenvoudig het aantal twitteraars te verhogen die in de charts voorkomen. Dit is ook prettig vanwege de mogelijkheid die nu bestaat om op sleutelwoorden te zoeken in de bio's van twitteraars. De kans dat een zoekresultaat wordt gevonden wordt groter, alsmede het aantal resultaten dat een zoekopdracht op kan leveren.

De reden om naar een maandelijke frequentie te gaan, met tussentijdse updates, is ingegeven door de wens om zowel de omvang van de database enigszins hanteerbaar te houden, als ook om meer flexibiliteit te hanteren bij de momenten waarop tussentijds updates worden gemaakt.

Ik hoop dat deze wijzigingen positief ontvangen worden, daar deze het mogelijk maken om meer functionaliteit te blijven toevoegen, alsmede het aantal talen waarvoor de Twopcharts worden samengesteld verder uit te breiden.

No comments:

Post a Comment