Tuesday, February 2, 2010

Changes to Twopcharts

As of January 31st we have made some changes to the way Twopcharts are compiled. These changes are the following:
  • The ranking for the Twoplist is now determined by the total amount of followers and no longer by the qualified amount of followers.
  • The Twoplists will be gradually increased to about 5,000 tweeters
  • History data will no longer be tracked on a weekly basis. but on a monthly basis, while every month a number of updates will be made.
If your data is in the history file of twopcharts it is easy to see what the changes mean for you. For the end of December 2009 we have registered your data both in the old way and in the new way. The "old" way is dated 31-12-2009 for the German lists and 30-12-2009 for the French lists, while the new calculation method is shown on the following day with the same data.

We have made these changes for a couple of reasons. It is now easier to search and find tweeters in a certain language, because of a language scanner that we built and use, which will make it easier to expand the lists. We also wanted the charts to be easier to understand, and using qualified followers was a concept not always easily understood by everyone.

With the qualified followers, an algorithm is used that makes corrections to the number of followers based on the following behavior of a user. This is done in an attempt to avoid listing mass following accounts and spam accounts. The qualified followers are still used to determine if a certain tweeter should be listed at all, but no longer to determine the ranking position of someone.

For the Tweetlist nothing changes, and it is still built from the population of tweeters that has qualified for the Twoplist.

Because of the use of an automatic language scanner, it is now much easier to determine in which language tweets are sent, and expansion of the list makes the search functionality much more meaningful. If a certain keyword is used to search the bio's of tweeters, the chances of a result are higher as well as the potential amount of results that are found.

The reason to go to a monthly history, with intermediate updates, is the desire to both manage the size of the database and give more flexibility to the moments where intermediate updates are made.

I hope you will understand and appreciate these changes, which going forward will allow us to keep adding functionality and expand the amount of languages that will be represented in the Twopcharts.

Monday, February 1, 2010

Twopcharts veranderingen

Per 31 januari zijn enige wijzigingen doorgevoerd bij de wijze waarop de Twopcharts worden samengesteld. De wijzigingen zijn de volgende:
  • De rangorde voor de Twoplijst wordt nu bepaald door het aantal volgers en niet meer door het gekwalificeerde aantal volgers
  • De lijsten zullen verder worden uitgebreid, in eerste instantie richting 5000 twitteraars
  • De historie zal nu maandelijks worden vastgelegd en niet meer wekelijks, waarbij wel elke maand een aantal tussentijdse updates zullen worden samengesteld.
Als je in de historie van de Twopcharts bent opgenomen, kun je eenvoudig zien wat de consequentie is van de wijzigingen. Voor 31-12-2009 is een overzicht opgenomen volgens de "oude" methode, terwijl met exact dezelfde data een startpositie is vastgesteld met datum 1-1-2010.

Deze wijzigingen worden doorgevoerd, omdat enerzijds het makkelijker is geworden om, via een zelfontwikkelde taalscanner, Nederlandstalige twitteraars te vinden en anderzijds vanwege de wens om de interpretatie van de charts te vereenvoudigen. Dit betekent voor de Twoplijst dat deze nu samengesteld wordt op basis van het absolute aantal volgers en niet meer op basis van het gekwalificeerde aantal volgers.

Bij het gekwalificeerde aantal volgers wordt via een algoritme een correctie gemaakt op basis van het aantal twitteraars dat iemand zelf volgt. Deze correctie wordt gemaakt om zoveel mogelijk te voorkomen dat massfollow- en spamaccounts in de charts verschijnen. Het gekwalificeerde aantal volgers wordt nog wel gebruikt om vast te stellen wie in de charts verschijnen, maar vervolgens wordt voor de rangorde alleen nog naar het aantal volgers gekeken.

Voor de Tweetlijst verandert niets en deze wordt dus nog steeds samengesteld uit de twitteraars die zich ook voor de Twoplijst hebben gekwalificeerd.

Vanwege het gebruik van een automatische taalscanner is het veel eenvoudiger geworden om de taal te bepalen waarin tweets verzonden worden. Dit maakt het mogelijk om vrij eenvoudig het aantal twitteraars te verhogen die in de charts voorkomen. Dit is ook prettig vanwege de mogelijkheid die nu bestaat om op sleutelwoorden te zoeken in de bio's van twitteraars. De kans dat een zoekresultaat wordt gevonden wordt groter, alsmede het aantal resultaten dat een zoekopdracht op kan leveren.

De reden om naar een maandelijke frequentie te gaan, met tussentijdse updates, is ingegeven door de wens om zowel de omvang van de database enigszins hanteerbaar te houden, als ook om meer flexibiliteit te hanteren bij de momenten waarop tussentijds updates worden gemaakt.

Ik hoop dat deze wijzigingen positief ontvangen worden, daar deze het mogelijk maken om meer functionaliteit te blijven toevoegen, alsmede het aantal talen waarvoor de Twopcharts worden samengesteld verder uit te breiden.