.
Log in | Jump |

The Analytics Factor

Mesure sans analyse n'est que ruine de l'âme

En vente en librairie



Archives

This thing was constructed on August 26, 2007, and it was categorized as Google Analytics, Techniques avancées, Web analytics.
You can follow comments through the RSS 2.0 feed. You can leave a comment, or trackback.

pensee.jpgDans le rapport “Sites Référents”, vous pouvez cliquer sur n’importe quel domaine pour voir le détail des pages du domaine qui – a priori – contiennent un lien vers votre site. Cependant, pour systématiquement pouvoir trouver la page en question, il manque les paramètres de l’URL (primordiaux pour les sites dynamiques).

En prenant l’exemple de ce blog, j’aperçois dans mon compte Google Analytics des visites provenant d’un site référent qui s’appelle webmaster-hub.com. Lorsque je clique dessus, je constate que l’ensemble des visites de ce site proviennent de la page /index.php.

Si j’entre l’URL http://www.webmaster-hub.com/index.php dans Firefox (car bien évidemment je HAIS Internet Explorer), je tombe sur une page qui ne contient pas la moindre trace d’un lien vers mon blog. Ce qui serait réellement utile pour trouver la page en question, serait d’avoir l’URL dans son intégralité (par ex: forums.webmaster-hub.com/index.php?topic=3498798634&article=aje98773), ce qui me permettrait de voir dans quel contexte mon blog a été cité. Vous verrez ci-dessous un filtre avancé (vous allez commencer à croire que c’est une obsession chez moi) qui va justement nous permettre de faire cela.

get-full-referral-path2.jpg


Les filtres avancés supportent le RegEx (regular expressions) et sont donc très puissants pour modifier les informations qui apparaissent dans les rapports. Un des champs qui n’apparaît pas dans les rapports, mais qui est accessible dans les filtres avancés, est le champ “referral” (très étrangement “lien externe” en français) qui contient l’URL complète du référent. Le filtre avancé va justement nous permettre de récupérer l’information qui nous intéresse dans ce champ-là (referral) et écraser le contenu existant d’un autre champ (”Campaign content”) avec l’URL complète.

full-referral-path-report-after.jpg


Dans le cas de ce filtre, il faut remplacer la partie “domain\.com” par votre propre domaine. Dans mon cas, ce serait ^https?://(?!.*\.analytics\.fr)[^/]*(/.*)
La première parenthèse représente une condition négative en RegEx. Ce filtre s’appliquera donc uniquement aux référents qui ne sont pas constitués d’une URL de votre propre site. C’est plus sûr d’opérer de la sorte car l’information du référent est une information au niveau du “hit” (ou de la page-vue). Dans cette logique, chaque visite a autant de référents que de pages-vues et cette condition négative assure que le filtre ne s’applique qu’en ce qui concerne le référent de la première page-vue, c’ést-à-dire le référent de la visite sur votre site.

[EDIT du 13/12/2007: J'ai changé légèrement le RegEx de manière à ce que le petit icône à gauche du lien continue à fonctionner. En cliquant sur cet icône, vous pouvez allez visiter la page en question pour retrouver le lien qui pointe vers votre site.]

This thing was constructed by .


You can follow comments through the RSS 2.0 feed. You can leave a comment, or trackback.

This thing has 18 Comments

  1. Posted August 26, 2007 at 23:05 | Permalink

    Bien vu, Alan ;)

    Une alternative consiste à utiliser la variable “user-defined” comme je l’explique sur
    http://webanalytics.wordpress.com/2007/06/25/google-analytics-de-limportance-des-referrers-complets/

    Dans ton explication comme dans la mienne, on doit sacrifier un champ (campagne ou user-defined)
    C’est donc un parti pris qu’il faut adopter ;)

    Amicalement,

    Julien

  2. Posted August 26, 2007 at 23:26 | Permalink

    Salut Julien,
    Merci pour tes commentaires.
    En l’occurence, on ne doit pas sacrifier de champ étant donné que le champ en question est celui utilisé de toutes les façons pour stocker l’URI pour les visites “referral” (l’URI qui apparaît ensuite comme “referral path”). Dans mon exemple, on écraserait donc l’information “/index.php” avec “http://forums.webmaster-hub.com/index.php?topic=3498798634&article=aje98773″
    De cette manière, le tout fonctionne exactement comme avant en cliquant simplement sur la source du trafic dans le rapport “sites référents”.

    Sinon, pour parler choses sérieuses, on se prend une bière quand tu seras à Paris pour le salon? :)

    Alan

  3. Posted August 27, 2007 at 9:39 | Permalink

    Fort volontiers pour la bière ;)
    Mais auras-tu le courage de monter à Bruxelles le lendemain?

  4. Mehdi Laanaït
    Posted August 27, 2007 at 10:53 | Permalink

    Bonjour Alan,

    Enchanté moi c’est Mehdi, apprenti de Julien :)
    Tout d’abord merci pour ce blog en français, c’est rafraichissant :)
    Je me pose une question de profane par rapport à ton filtre avancé. Dans le “Filter A -> extract A” tu as 2 blocs de paranthèses. Dans l’Output tu écris $A1. Je pensais qu’avec cette écriture tu ne prendrais en compte que le premier bloc de paranthèses, or, apparemment, l’URI (.*) est prise en compte aussi. Perso j’aurais mis “$A1 $A2″ dans l’Output. Peux tu m’expliquer ton raisonnement?

  5. Posted August 27, 2007 at 18:44 | Permalink

    Wow, ravi de découvrir ce blog, celui-là est définitivement bookmarké :}

  6. Posted August 27, 2007 at 22:38 | Permalink

    @Julien: on verra pour Bruxelles ;) C’est très tentant comme événement et le programme semble être d’un très haut niveau.

    @Mehdi: Salut Mehdi! Je dois avouer que ce n’est vraiment pas le genre de remarques auxquelles je m’attendais. Tu dois visiblement très bien maîtriser le RegEx :) À vrai dire, j’étais tout aussi interloqué que toi lorsque je me suis rendu compte que dans ce cas précis il fallait préciser $A1 pour obtenir le contenu de la 2ème parenthèse. Normalement, tu as tout à fait raison : une parenthèse constitue un « placeholder » (comprenez : mise en mémoire) et celles-ci sont numérotées. De prime abord, j’ai aussi eu le réflexe de spécifier $A2 pour obtenir le contenu de cette deuxième parenthèse. La différence ici, c’est que la première parenthèse ne correspond à aucun contenu potentiel dans l’URL à laquelle l’expression s’applique. Elle constitue une condition (à savoir « cette expression ne doit s’appliquer que si le contenu qui suit ne contient pas ‘.domain.com’ ») et dans ce sens, n’est pas pris en compte dans le RegEx comme un « placeholder ». Du coup le premier placeholder est le (.*). Pour plus de précisions sur cette histoire de conditions en RegEx, voir l’excellent post de Robbin : http://snipurl.com/1q0hh

    @Simon : Vraiment ravi que ça te soit utile. Merci pour les encouragements ;)

  7. Posted August 27, 2007 at 22:51 | Permalink

    Pour ceux qui se poseraient la question, le petit snipurl que j’ai inclu dans le commentaire ci-dessus opère une redirection sur la bonne URL de lunametrics, sans pour autant perdre le référent d’origine (en l’occurence analytics.fr). Je viens de tester, et voici le contenu de mon cookie utmz sur le site de lunametrics: utmccn=(referral)
    utmcsr=analytics.fr
    utmcct=/index.php/2007/08/26 /google-analytics-pour-blogueurs-ii-obtenir-lurl-integrale-des-pages-qui-vous-envoient-du-trafic/
    utmcmd=referral

    C’est donc avec joie et sans réserve que je donne mon onction à http://snipurl.com comme outil de raccourci d’URL résolument “anaytics-friendly”.

  8. Posted September 3, 2007 at 11:38 | Permalink

    Merci pour ces renseignements.

  9. Nico
    Posted September 24, 2007 at 11:09 | Permalink

    Bonjour,
    Je viens de créer ce filtre mais les urls referentes sont toujours tronquées.
    Il y a-t-il une autre action à faire apres la création du filtre ?
    Les Urls sont bien dans : sites refents/chemin du site referent ?

  10. Aurél
    Posted November 6, 2007 at 13:37 | Permalink

    Merci pour ces plus qu’astuces :) affiner les résultats permet de voir beaucoup plus d’informations :)
    Par contre je dois m’y prendre mal mais je trouver cela assez pénible (et peu d’intéret pour moi) d’avoir la distinction des visites provenant des webmail, surtout quand le fournisseur a plusieurs serveurs, du type webmail01.fai.net . Comment dans ce cas concatener tous les webmail([0-9] )\.fai\.net en webmail.fai.net ?
    Merci d’avance, je bute un peu c’est mon premier filtre avancé :(

  11. Posted November 6, 2007 at 18:00 | Permalink

    @Nico:
    J’imagine que les URL apparaissent seulement comme étant tronquées dans les rapports, faute de place. Essaie de faire un export .csv (bouton « export » en haut) pour voir les URL entières sous Excel.

    @Aurél :
    Le plus simple pour toi serait de « taguer » les URL contenues dans tes envois d’email. Plus d’information là-dessus ici : http://www.google.com/support/googleanalytics/bin/answer.py?hl=en&answer=55578

    Dans le corps des tes emails, au lieu de renvoyer vers http://www.domaine.fr/ tu pointerais alors vers http://www.domaine.fr/?utm_source=Email&utm_medium=Email.
    L’information contenue dans ces paramètres « écrase » l’information qui apparaîtrait normalement (en l’occurrence le referer webmailxyz.mail.com).

    De cette manière, TOUT le trafic provenant de tes campagnes de emailing apparaîtra sous le nom de source que tu détermines. Quand je dis « tout le trafic » cela signifie les visites provenant de boites webmail ainsi que le trafic provenant de clients mail (comme Outlook) qui apparaît par défaut comme étant du trafic « direct » (et cela fausse donc les stats du vrai trafic direct).

    C’est clairement le meilleur moyen. Sinon, si tu n’as pas la main sur les URL des campagnes emailing, tu peux faire un filtre avancé pour agréger tout le trafic webmail :
    Filter type: Custom Filter / Advanced
    Field A: Campaign medium
    Extract A: ^referral$
    Field B: Campaign source
    Extract B: mail
    Output to: Campaign source
    Constructor: Webmail
    Field A required: Yes
    Field B required: Yes
    Override output field: Yes

    Ce filtre signifie « Si le support est ‘referral’ et la source contient ‘mail’, alors réécrire la source avec ‘Webmail’ »

    En revanche, de cette manière, ceux qui cliquent sur un lien dans un mail à partir d’un client mail continueront à être catégorisés comme du « direct ».
    Bonne chance 

  12. Fred
    Posted December 1, 2007 at 13:52 | Permalink

    bonjour,

    Sincèrement merci pour toutes ces informations, je bute sur une chose:

    Où doivent apparaitre ces informations ?

    J’ai été dans Traffic Sources => Refering Sites => ???

    Je ne trouve pas le segment “Refferal Path” tel que sur la capture d’écran.

    Merci

  13. Posted December 1, 2007 at 23:48 | Permalink

    Bonsoir et merci pour l’astuce.

    Je vais essayer de l’appliquer tout de suite :)

    Excellent blog au passage !

  14. Fred
    Posted December 2, 2007 at 21:16 | Permalink

    ok j’ai résolu mon problème en mettant les référents dans le champ “user defined”

    merci pour toutes ces astuces !

  15. Agnes
    Posted December 10, 2008 at 10:39 | Permalink

    Bonjour

    J’ai appliqué la méthode à 2 sites dont je m’occupe: créé un nouveau profil et créé le filtre avec les paramétres ci-dessous.

    Je ne sais pas si je vais voir au bon endroit (traffic sources/referring sites), mais je ne vois pas la différence avec mon profil “sans bidouille”. J’ai toujours des satanés (ex):
    http://pagesjaunes.fr/trouverlesprofessionnels/rechercheClassique.do

    Pourtant, j’adorerais avoir les chemins complets. J’hésite a utiliser plutôt la méthode proposée sur http://webanalytics.ox2.eu/2007/06/25/google-analytics-de-limportance-des-referrers-complets/
    Mais je crains de “perdre un paramètre” comme dit ici plus haut….

    Quelque éclairage?
    Merci
    Agnes

  16. Posted January 11, 2009 at 19:49 | Permalink

    J’ai appliqué le filtre, mais où doit-on voir ces nouvelles informations dans analytics.
    Je n’ai aucune différence par rapport à avant.
    Merci pour votre aide.

  17. Posted October 3, 2009 at 14:01 | Permalink

    Bonjour,

    Vous avez l’air tous super pro et je me demandai si l’un d’entre vous aurais le temps de m’expliquer un peu Google Analytics.
    Je viens de créer une société, et donc un site mais je suis plutôt 2/20 en ordi et du coup, je pense passer à côté de pleins de chose.
    Voici mon adresse mail: pegoche@hotmail.com

    A bientôt!

  18. Posted March 24, 2010 at 18:51 | Permalink

    Bonjour ,

    Comment puis je faire pour obtenir l’URL de mon blog ?

    Merci

One Trackback

  1. Posted April 16, 2009 at 18:52 | Permalink

    [...] Donc si vous avez suivi les différents conseils dispensés sur AnalyseWeb.fr sur l’importance des referrer complets, vous aurez créé un profil secondaire dans Google Analytics dans lequel vous insérez le referrer complet dans la valeur personnalisée grâce

Post a Comment

Your email is never published nor shared. Required fields are marked *

*
*