.
Log in | Jump |

The Analytics Factor

Mesure sans analyse n'est que ruine de l'âme

En vente en librairie



Archives

This thing was constructed on August 25, 2008, and it was categorized as Web analytics.
You can follow comments through the RSS 2.0 feed. You can leave a comment, or trackback.

jamaica_flag.jpg Il y a quelques jours, cet article du Figaro a attiré mon attention sur la question du classement des pays aux Jeux Olympiques qui, semble-t-il, a toujours posé un certain casse-tête. Les États-Unis comptent le nombre total de médailles remportées (et donc sortent en tête des jeux de Beijing / Pékin) tandis que le reste du monde utilise un système tout aussi défaillant qui consiste à compter uniquement le nombre de médailles d’or (si ex aequo, le nombre de médailles d’argent est pris en compte puis bronze).

Ce dernier système a au moins le mérite d’être celui utilisé par le comité Olympique, même si le comité propose ce tableau purement à titre indicatif et ne revêt aucun caractère officiel. Jusqu’aux Jeux Olympiques de 1920 d’ailleurs, les sports d’équipe pouvaient comporter des sportifs de nationalités différentes (vous remarquerez, je l’espère, le travail de recherche que j’ai effectué pour pondre cet article) – c’est dire que les Jeux n’avaient aucune vocation à mettre les pays en concurrence.

Mais comme l’expose éminemment ce journaliste du Figaro, en dépit des intentions de départ, les jeux ont au fil des ans acquis un caractère concurrentiel entre pays des plus poussés. En l’absence d’un classement officiel, chacun n’en fait qu’à sa tête (voire à son avantage) et les États-Unis et la Chine sont tous deux convaincus de sortir grands vainqueurs de cette confrontation géopolitique.

En essayant tant bien que mal d’imaginer un classement plus juste, je me suis rendu compte des rapprochements qui pouvaient être fait entre le Web Analytics et le classement des médailles par pays.

1. Prendre en compte les micro-conversions

Il est toujours bon dans le Web Analytics de prendre en compte des indicateurs autres que le taux de conversion pour mesurer la notion de “engagement” (à prononcer en anglais) de vos visiteurs. Avinash a d’ailleurs écrit un très bon article sur cette question. Sur ce blog, je mesure comme micro-conversions un clic AdSense (plus pour le défi que pour les thunes), un commentaire laissé, une inscription au flux RSS et une inscription par email. En leur assignant une valeur monétaire incrémentale en fonction de la valeur que chaque action a pour moi (en l’occurrence, de manière complètement symbolique), je peux me faire une idée comparative entre plusieurs sources de trafic en comparant le “Per visit goal value” ou voir quelles pages ont la plus grande valeur en comparant leur “$ Index” (XiTi propose un indicateur de ce type, mystérieusement baptisé – à mon sens en tout cas – “Quotient Comportemental”).

micro-conversions.png

En appliquant ce principe au classement des pays, on peut imaginer un score de médailles qui prenne en compte toutes les médailles remportées (contrairement au classement du comité olympique), sans pour autant considérer qu’une médaille d’or a la même valeur qu’une médaille de bronze (contrairement au système américain).

La presse britannique avait développé un tel système pour les Jeux Olympiques de Londres en 1908 (non seulement je fais de la recherche, mais en plus je cite mes sources) en donnant une valeur de 5 points pour l’or, 3 pour l’argent et 1 pour le bronze. Voici le classement que l’on obtiendrait de la sorte:

medal-score-ranking.png

Rien de tel pour faire passer la France de la dixième à la huitième place !

2. Mesurer des ratios plutôt que des valeurs absolues

Nul besoin de m’attarder trop longtemps sur ce point. Je pense que l’on est tous d’accord que l’on aurait du mal à s’en remettre si on comparait la performance de plusieurs campagnes avec différents volumes respectifs, en se basant uniquement sur le nombre total de conversions générées (sans considérer le taux de conversion). De la même manière, est-il réellement juste de comparer des valeurs absolues de médailles remportées sans prendre en compte la population des pays concernés ? Est-il réellement justifié de déduire du précédent tableau que la Chine a une culture sportive beaucoup plus développée qu’un pays comme l’Australie par exemple ? Essayons donc de déterminer un “taux de conversion” de médailles par pays. Aucun classement dans l’immédiat, car il faut tout d’abord prendre en compte le point suivant.

3. Toujours soumettre son analyse à la rigueur statistique

J’ai parlé dans un précédent billet de l’intérêt évident qu’il pouvait y avoir à utiliser des tests pour déterminer si la différence de résultats entre deux campagnes marketing était statistiquement significative ou non. Dans le cas qui nous intéresse, si on divise tout simplement le nombre de médailles d’or obtenues, par la population (exprimée en millions dans mon tableau), on se retrouverait avec ce que des personnes moins politiquement correctes que votre serviteur appelleraient “des petits pays à la con” en tête de classement, tout simplement parce qu’ils ont remporté une seule et unique médaille et ont une population minuscule.

De manière à ne pas fausser un tel classement, j’ai décidé d’exclure quelques pays sur la base de deux critères (tous deux étant nécessaires à l’exclusion).
N’est pas pris en compte, tout pays qui, à la fois:

a. pourrait passer de la dernière à une des deux premières places en remportant une seule et unique médaille d’or, et

b. a remporté moins de 3 médailles au total

C’est ainsi que nous sommes obligés d’exclure l’Islande, le Bahreïn et les Bahamas de ce classement.

(Il y a plusieurs autres méthodes, probablement plus rigoureuses que celle-ci, qui pourraient être employées. En revanche, elles m’auraient prit quelques heures de plus à mettre en œuvre et mon dévouement à ce qui demeure un petit exercice académique commence à rencontrer ses limites. De plus, elles arriveraient au même résultat. Quelle que soit la méthode employée, le seuil de ce qui est statistiquement significatif demeure arbitraire et repose uniquement sur le bon sens).

Classement des pays par médailles d’or ramenées à la population:

gold-per-capita-ranking.png

Classement des pays par score ramené à la population:

medal-score-per-capita-ranking.png

On va dire que ce dernier tableau est à peu de choses près mon ultime tableau de classement olympique des pays, en faisant appel aux principes d’analyse inhérents au Web Analytics. Cela dit, on ne saurait trouver la solution parfaite à ce problème. Je vous soumets donc, en guise de conclusion, quelques pensées par rapport aux limitations de l’exercice auquel je me suis prêté ici:

a. En prenant en compte la population, j’introduis du coup un nouveau biais contre les pays à forte population étant donné que chaque pays est limité dans le nombre d’athlètes qu’ils peuvent envoyer aux jeux.

b. On pourrait pousser l’analogie plus loin et prendre en compte les médaillés uniques par pays et par population (si Michael Phelps était un pays à lui tout seul, avec ses 8 médailles d’or, il supplanterait la France à la 10ème place).

c. Le choix de scoring 5-3-1 est comlètement subjectif, même si je me plie au précédent historique. Une médaille d’or vaut-elle réellement 5 médailles de bronze ? Vous pouvez télécharger mon fichier Excel (ici en format 2007 et ici en format xls normal) pour déterminer votre propre classement en changeant par exemple les valeurs que j’ai attribuées aux différentes médailles dans le scoring.

Bon, au final, je vais quand même livrer un dernier classement, identique au dernier (classement des pays par score ramené à la population), mais en ne prenant en compte que les pays de plus de 20 millions d’habitants. Cela aura pour effet de ne présenter que des pays qui nous ressemblent un peu et de réduire considérablement le biais énoncé en a. plus haut:

large-country-ranking.png

This thing was constructed by .


You can follow comments through the RSS 2.0 feed. You can leave a comment, or trackback.

This thing has 21 Comments

  1. Posted August 26, 2008 at 0:57 | Permalink

    Tu as pris au final le meilleur classement pour la France, et celui où la Jamaïque n’apparaît pas. Chauvin franchouillard ! :-P

    mais je réponds “Merci” à “je cite mes sources”.

  2. Posted August 26, 2008 at 9:43 | Permalink

    Pas mal comme approche :)

    Il manque aussi le nombre de médailles par nombre de prisonniers politiques… :P

  3. Mehdi Laanaït
    Posted August 26, 2008 at 9:59 | Permalink

    Tu pourrais même rajouter un classement ou tu pondérerais non pas par la population du pays mais par le nombre de sportifs professionnels ou alors pondérer chaque discipline par le nombre d’affiliés dans les fédérations nationales :)

  4. Posted August 26, 2008 at 10:09 | Permalink

    Tom, tu fais erreur, Alan a choisi le dernier classement car en deuxième position on trouve la Grand Bretagne ! Et oui, Alan est un citoyen britannique (qui par conséquent n’a pas eu la lourde tâche de choisir entre Nico et Ségo il y a un an) ;)
    Chouette article, très ludique ! Merci.

  5. Posted August 26, 2008 at 10:56 | Permalink

    C’est vraiement génial, ça me parait parfait mais personnellement j’aurais ajouté l’IDH (indice de développement humain ) comme critère dans l’analyse. Plus fiable que le PIB/habitant il reflète un état de développement du pays. Par exemple un pays très peuplé mais avec un IDH faible (comme l’inde) aurait une valeur sportive relativement proche d’un pays peu peuplé avec un IDH plus élevé (comme la grèce)

  6. Posted August 26, 2008 at 13:27 | Permalink

    c’est sur que certains n’apprécieraient pas ce classement (en clair la chine). l’idée de Mehdi me paraît plus juste, et je pondérerai même avec le nombre de sportif engagé au JO par pays, le nombre de discipline au JO par pays, et je rajouterai même le classement à partir de la huitième place. ça serait plus représentatif de la diversité et de la culture sportif d’un pays. Je me demande ou se retrouverai la Jamaïque qui n’a que le sprint ?

  7. Posted August 26, 2008 at 13:29 | Permalink

    Superbe post, je me posais les mêmes questions, tu y réponds parfaitement !

    Merci

  8. Posted August 26, 2008 at 13:38 | Permalink

    Il y a un classement en athlétisme par finaliste (placing table) qui me semble plus pertinent que le classement par médaille. Une médaille d’or donne 8, argent 7, etc …
    Ce qui donne la France (athlétisme) juste derrière la chine.
    Les sports ne sont pas tous universels même s’ils sont aux Jeux Olympiques.
    Voici le nombre de pays ayant une fédération nationale : Athlétisme 213 pays, Cyclisme 170 pays, Tennis 145 pays, Escrime 127 pays.

  9. Posted August 26, 2008 at 17:59 | Permalink

    @Julien:
    Je reconnais bien là ton sens de l’humour et tu touches un point très important. Quel a été le prix à payer pour cette “victoire” Chinoise? Des enfants sortis de leur famille pour des centres d’entrainement depuis 4, 6 ou 8 ans. Ces dernières semaines, nous n’avons vu que les sourires de ceux qui ont été retenus jusqu’au bout. Quel a été le sort de ceux qui au bout de plusieurs années ont finalement été rejetés par ce système? Je pense que l’on découvrira des témoignages dérangeant dans les années à venir sur l’envers du décor des ces Jeux Olympiques.

    @Ciccio:
    Et pourtant, environ tous les deux jours, pendant 6 mois, on avait droit à l’échange surréel suivant:
    “Tu m’as dis que tu votais pour qui déjà ?”
    “Mais %**$#&, je suis pas Français mec !!!”
    “Aaaaaaaaaaaaah ouais, c’est vrai…”

    @Benjamin:
    Intéressant l’idée de l’indice du développement humain. J’avais intégré au départ le PIB par habitant, mais ça donnait vraiment n’importe quoi. De surcroît, il n’y pas forcément de corrélation directe entre le PIB et la culture sportive. La Jamaïque nous a bien prouvé cela.

    @Geneste:
    A posteriori, je pense que l’idée de pondérer par le nombre d’athlètes présentés est probablement une des meilleures (c’est juste que ça prend pas mal de temps d’intégrer des données provenant de sources différentes). Ce classement, en revanche, ne prendrait pas en compte la taille de l’échantillon (population du pays) parmi lequel un pays donnée peut choisir son élite.

    @Jean:
    Merci :)

    @David:
    T’aurais un lien pour ça ? Ça me parait assez intéressant.
    Ton point sur la non-universalité des sports est très juste. De plus, en ayant suivi à différents moments de ma vie des Jeux Olympiques du UK, des États-Unis, d’Allemagne, de France et du Cameroun (médaille d’or en foot à l’époque avec entre autres Eto’o et Mboma), je pense que le biais national n’est nulle part aussi présent dans la programmation audio-visuelle qu’en France (je compte pas trop le Cameroun en l’occurence). Un enfant français pourrait sérieusement croire que les sports phares des JO sont l’escrime, le judo et le handball ;)

  10. Mathias
    Posted August 27, 2008 at 10:21 | Permalink

    Si on voulait pousser l’exercice plus loin, un autre critère à prendre en compte :

    d. Valeur de la médaille. Remporter le 100m (potentiel : 5Milliards de concurrents) a-t-il la même valeur que remporter la voile (potentiel : X concurrents ayant les moyens de s’acheter un bateau et les infrastructures) ?
    A ce titre les 4 médailles britaniques en athlétisme ont infiniement plus de valeur que les médailles françaises en BMX et voile (ca n’engage que moi)

  11. Mathias
    Posted August 27, 2008 at 10:25 | Permalink

    Edit: en fait je rejoins les propos de david à ce sujet. Il suffit de prendre en compte le nombre de licenciés à un sport dans un pays

  12. Posted August 28, 2008 at 12:36 | Permalink

    super article!

    J’apporte ma contribution:

    Pour comparer la performance d’un même pays sur plusieurs Jeux Olympiques, il faudrait rapporter le nombre de medailles aux nombre d’épreuves ouvertes.
    La France a eu plus de médailles à Pékin qu’à Athènes, mais de nouvelles épreuves (BMX) sont apparues à Pékin, cela est plus facile.

    Benoit

  13. Posted August 29, 2008 at 15:09 | Permalink

    Tres tres fort ce classement, chapeau pour l’idée et le boulot effectué!

    Morgan

  14. Simon M.
    Posted September 14, 2008 at 18:27 | Permalink

    Je voulais simplement te féliciter pour ton travail sur ce cas là et ton blog en général. Je travaille dans le Web Analytics en agence Media et je subis en interne et avec mes clients tout un tas de question sur “les moyennes marché” (je les tuerai tous quand ils me posent ce genre de question)… Ce genre de sujet pourrait faire l’objet d’un billet.

  15. Lionel
    Posted November 10, 2008 at 3:36 | Permalink

    Interessant cet article. Bonne recherche dans l’ensemble. Mon voisin pensait que son pays avait “remporte” les JO mais faut croire que comme d’hab, les americains n’utilisent qu’une seule vision des choses et pensent avoir raison… LOL

  16. Posted November 11, 2008 at 1:20 | Permalink

    Mais t´as passé combien d’heures pour pondre un truc comme ca ?! Alan t’es vraiment un geek ! ;=)

  17. Posted November 27, 2008 at 16:14 | Permalink

    Il fallait y penser, et avoir le temps de faire tous ces calculs. Mais j’admire le raisonnement

  18. Posted June 9, 2009 at 14:52 | Permalink

    lol le raisonnement est sensé mais je me sens dépassé par le nombre de critère, ce qui est sur c’est qu’on pourras toujours prendre de plus en plus de critères en compte. Mais l’exemple que tu donnes est déjà bien fourni !

  19. Damien
    Posted August 11, 2009 at 11:55 | Permalink

    On peut imaginer aussi d’autres types de pondération. Par exemple, on peut se demander si une médaille d’or obtenue au cheval d’arçon a la même valeur, en terme de mérite sportif, qu’une médaille d’or obtenue (par exemple) en basket ?
    - la gymnastique distribue un grand nombre de médaille d’or (au pif, je dirais au moins 20) alors qu’il n’y en a que 2 au basket (homme et femme)
    - le nombre de pratiquants au basket dans le monde est incomparable par rapport au nombre de pratiquants au cheval d’arçon. Le basket est donc beaucoup plus “concurrentiel”. D’un certain point de vue, il est ainsi beaucoup plus difficile d’obtenir un médaille d’or au basket.

    Ca n’est qu’un exemple et vous pouvez remplacer le cheval d’arçon et le basket par les sports de votre choix.

  20. Posted August 21, 2009 at 11:13 | Permalink

    Effectivement on pourrais aller encore plus loin et plus précisément dans le raisonnement. Mais partant d’une idée toute simple par rapport aux jeux olympique tu nous démontres habilement qui nous est possible d’avoir des réponses concrètes à une question basé sur de bonnes statistique grâce à google analytique. Merci encore pour cette formation que j’espère pour adapté aux réponses que je peux me poser concernant mon site.

  21. Posted January 18, 2011 at 13:07 | Permalink

    très bien, je prend note ! à faire pour les prochains JO en 2012 !

Post a Comment

Your email is never published nor shared. Required fields are marked *

*
*