.
Log in | Jump |

The Analytics Factor

Mesure sans analyse n'est que ruine de l'âme

En vente en librairie



Archives

This thing was constructed on December 18, 2008, and it was categorized as Google Analytics, Techniques avancées, Web analytics.
You can follow comments through the RSS 2.0 feed. You can leave a comment, or trackback.

thumb.pngAprès avoir atteint mon record absolu de silence radio sur ce blog, j’ai décidé aujourd’hui qu’il était grand temps que ce scandale cesse. J’ai décidé de ressortir, le temps de quelques articles, quelques trucs qui trainent dans mes fonds de tiroirs depuis des lustres et que pour une raison ou une autre je n’ai jamais postées (la flemme tient une place assez élevée sur ma liste de raisons possibles).

Notre bon Oliver de Segonzac (qui depuis peu a rejoint notre petit cercle de consultants agréés Google Analytics – une reconnaissance de son savoir-faire grandement méritée) avait montré il y a quelques temps comment voir de quelle page de résultat Google provenaient quelles visites. J’avais moi-même travaillé sur une technique analogue pour le compte d’un client avec des filtres et profils assez complexes et ensuite avais laissé tomber ça aux oubliettes.

Deux raisons motivent donc cette soudaine envie de publier un article sur ce même sujet. Premièrement la technique sur laquelle j’avais travaillé marche pour Google, Yahoo!, Live, MSN et Voila (juste au cas où ça existe encore), et donc, d’une certaine manière, justifiait un petit post. En deuxième lieu, cette formidable innovation dans Google Analytics que sont les Segments Avancés simplifie la mise en place et rend la technique beaucoup plus exploitable.

Pour mettre cela en place, il s’agit tout d’abord de créer un nouveau profil dans lequel nous allons, au moyen d’un filtre, copier le referer entier dans le rapport personnalisé:

referer-filter.png

Dans la case illisible sur la capture, entrez le RegEx suivant: ^https?://(?!.*\.votredomaine.com)(.*)
Il va sans dire qu’il serait préférable de remplacer “votredomaine.com” par le domaine du site en question pour que ça marche sans trop de souci. Donc sur le site de votre serviteur, cela ressemblerait à: ^https?://(?!.*\.analytics.fr)(.*)

C’est un profil que tout le monde devrait se créer et toujours avoir sous la main de toutes les façons. En temps normal, les referers complets ne sont visibles dans aucun rapport par défaut dans Google Analytics et il existe moultes situations dans lesquelles il peut être utile de les consulter.

Ensuite, c’est vraiment très, très simple. Il suffit de créer un segment avancé par page de résultat:

create-new-advanced-segment-1.png

Tout devrait être relativement clair dans mes captures. On sélectionne le champ personnalisé, on choisit le mode “Expressions régulières” et ensuite on entre la valeur qui correspond à la page en question ci-dessous:

Page 1: ((\?|&)(start|b|first|ap)=[0-1](&|$))|^.(?!.*(\?|&)(start|b|first|ap)=)
Page2: (\?|&)(start|b|first|ap)=(10|11|2)(&|$)
Page3: (\?|&)(start|b|first|ap)=(20|21|3)(&|$)
Page4+: (\?|&)(start|b|first|ap)=(?![0-3](&|$))(?![1-2][0-1](&|$))

create-page2-advanced-segment.png

Au delà de la quatrième page, je regroupe tout dans la même catégorie “4+”, mais pour les méticuleux, il est possible d’adapter les RegEx ci-dessus pour voir le détail des pages de résultat au-delà de la quatrième. Encore une fois, pour les méticuleux, sur chaque segment avancé, il serait encore mieux d’ajouter une autre condition “AND” pour que “Campaign medium” corresponde à “organic”, mais ça n’est pas absolument nécessaire.

Après cela, on sélectionne les segments ainsi créés dans ce nouveau profil:

select-advanced-segments.png

Et voici à quoi ressemble le rapport “moteurs de recherche” dans le compte de mon blog:

report.png

(Vous remarquerez que je splitte tous les moteurs en fonction de leur TLD. Ça n’a rien à voir avec la technique décrite ici, donc ignorez ce détail)

Après, ça peut également être assez utile de sélectionner un seul de ces segments et de regarder un rapport de mots-clés. Dans le rapport ci-dessous par exemple, j’obtiens directement la liste de mots-clés sur lesquels je figure en troisième page sur google.fr :

keywords-page-3.png

Et voilou ! Comme d’habitude, j’ai hâte de lire vos commentaires !


PS: Joyeux anniversaire Serge !
Joyeux anniversaire Sophie !
And a very special happy birthday Dad!

This thing was constructed by .


You can follow comments through the RSS 2.0 feed. You can leave a comment, or trackback.

This thing has 38 Comments

  1. Posted December 18, 2008 at 19:33 | Permalink

    Merci Alan et bravo Olivier et Résoneo pour l’admission dans les GAAC! :)

  2. Posted December 18, 2008 at 20:53 | Permalink

    Hello,
    clair qu’avec les segments personnalisés ça dépote :) Sur voila.fr les résultats sont appelés en ajax maintenant, mais ca marchera nickel pour le portail orange !

    PS : merci julien ;)

  3. John
    Posted December 18, 2008 at 22:31 | Permalink

    Could you create the advanced segment on Dimensions -> Traffic Sources -> Referral Path without creating the profile/filter at the start?

    Maybe I missed the point of the profile since I don’t know any French.

    Anyway, Great Post. I like the idea, I hadn’t done that before.

  4. Posted December 18, 2008 at 22:45 | Permalink

    Hey John,

    Unfortunately the Referral Path strips out all parameters, so it’s not going to fly that way. Good thinking though ;)

    @Olivier: Bien vu pour voila! Je dois dire que j’ai développé ces RegEx il y a un an et demi, donc tout changement depuis ne sera pas prit en compte. IL faudra songer à mettre ça à jour. À bon entendeur… ;)

  5. Posted December 18, 2008 at 23:15 | Permalink

    Pourquoi mets tu https ?

  6. Posted December 18, 2008 at 23:17 | Permalink

    Je viens d’ouvrir les yeux navré j’avais zappé le ? ;)

  7. Posted December 19, 2008 at 10:50 | Permalink

    Franchement, t’aurais pu mettre l’info principale (mon anniversaire) en haut de pge. Le reste n’est que bavardage…
    Merci !
    PS: la bise à Papa Boydell.

  8. Posted December 19, 2008 at 10:58 | Permalink

    Un grand merci, j’ai hâte de voir les premiers résultats :-)

  9. Mehdi
    Posted December 19, 2008 at 14:49 | Permalink

    Excellent Alan , merci!

  10. Posted December 20, 2008 at 10:36 | Permalink

    Merci beaucoup pour cette astuce, que je vais m’empresser de mettre en place !

    Bruno

  11. Posted December 29, 2008 at 14:42 | Permalink

    ahhhh tu nous avait manqué Alan et je doit dire que je commençais à me lasser de compter les médailles d’or aux JO :)
    Merci pour cette astuce fort pratique.
    question: Peut-on appliquer le même genre de filtre aux campagnes SEM ?
    je rejoins également la question de billyboylindien sur le https
    à bientôt

    Ben

  12. Posted December 29, 2008 at 16:35 | Permalink

    Salut Benjamin !

    Les segments avancés créés en suivant cette méthode s’appliquent tout aussi bien aux rapports SEM qu’aux rapports de ref nat. Aucun souci puisque les referers sont inchangés que l’on clique sur un résultat naturel ou sur du lien sponso.

    Sinon en RegEx, le ‘?’ suivant le https rend le ’s’ optionnel. Du coup, les referers sont récupérés que ce soit du http ou du https. Ça doit arriver une fois sur 10000 d’avoir un referer en https, et JAMAIS en provenance d’un moteur, mais c’est mon côté perfectionniste et un poil obsessionel qui ressort du coup ;)

    En tout état de cause, ça ne gène pas.

    PS: comment va l’ambiance chez XiTi ?

  13. mehdi
    Posted December 30, 2008 at 13:28 | Permalink

    Salut Alan,

    j’ai une question pour toi:

    Lorsqu’on applique le filtre pour récupérer le full referral, on a série d’entrées qui ressemblent à “http://www.google.com/?search&hl=en…”. Jusque là, tout est normal.

    Mais il reste une entrée qui ne contient que “google”. Celle-ci ne semble pas être impactée par le filtre, pourquoi?

    Je précise que je n’utilise pas le user-defined comme réceptacle mais bien les sources de campagnes “moteurs de recherches”.

    Merci d’avance :)

  14. Posted December 30, 2008 at 18:18 | Permalink

    Salut Mehdi !

    C’est une bonne question. En fait, toutes les visites “directe” (qui n’ont pas de referer donc) “héritent” de la source de la visite précédente.

    Donc imaginons que quelqu’un visite par Google (sa visite est donc marquée en tant que tel) et ensuite revient 2 jours plus tard en tapant l’URL directement. Cette deuxième visite n’aura pas de referer (et donc notre filtre ne fera rien du tout) et c’est la valeur de la visite précédente qui restera donc visible dans le rapport, soit Google / organic -> keywordX

    En utilisant le champ “user defined”, ces visites apparaissent comme du “not set”.

    Par ailleurs, je ne réécris jamais les champs de “campagne” (comme Campaign Source) – d’ou mon utilisation systématique du champ “user-defined”. J’ai eu des experiences très étranges qui tendent à suggérer que les champ de campagne servent d’une certaine manière de clé primaire pour les visites et que les réécrire peuvent disloquer les sessions. J’ai pas réésayé depuis 2006 je pense, mais en tout cas c’était vrai à l’époque.

  15. Posted January 5, 2009 at 14:28 | Permalink

    Salut Alan,

    Merci pour tes précisions effectivement ça s’avère très utile et je vais tester ça rapidement.
    Concernant XiTi oui l’ambiance est super, le produit merveilleux, bref je m’éclate :)
    cependant je garde toujours un oeil sur analytics ;)
    Tiens moi au courant on ira descendre quelques taliskers dès que tu descends.
    à bientôt
    Ben

  16. Posted January 5, 2009 at 14:44 | Permalink

    Ah la la… J’avais oublié la soirée Talisker à Bayonne :)

    Il faudra grave se refaire ça !

  17. cashmer
    Posted January 8, 2009 at 18:32 | Permalink

    Bonjour,
    C’est vraiment nickel !
    Juste une petite question : quelle est la formule pour afficher les résultats en provenance des pages 3 et ???
    J’ai essayé de bidouiller en vain.
    Merci d’avance.

  18. cashmer
    Posted January 8, 2009 at 18:33 | Permalink

    Je voulais dire : ls pages 3 et

  19. cashmer
    Posted January 8, 2009 at 18:33 | Permalink

    3 et plus

  20. Posted January 15, 2009 at 10:51 | Permalink

    Bonjour,

    merci pour cette astuce ! Cependant je veux être sur de bien faire la manipulation de départ doit on ajouter un nouveau profil à un domaine existant ou Ajouter un profil pour un nouveau domaine ?

    Merci

  21. Posted January 30, 2009 at 15:14 | Permalink

    Salut cashmer,
    Si j’ai bien compris ta question tu veux le trafic de la page 3 et plus
    j’imagine que c’est ça m’est c’est à valider par alan

    Page3 et : (\?|&)(start|b|first|ap)=(?![0-2](&|$))(?![0-1][1-2](&|$))

    si au contraire tu veux le trafic spécifique d’une page non indiqué plus haut, la page 5 par exemple tu ne dois pas mettre le dernier filtre (4 et plus) et
    essaye ça.
    Page5: (\?|&)(start|b|first|ap)=(40|41|5)(&|$)

    mais encore une fois je laisse Alan Valider

  22. Posted March 23, 2009 at 17:14 | Permalink

    Ok c’est tout frais et je viens de l’installer… on va voir demain ce que cela donne !
    Alan, un petit billet sur un rapport avancé Ecommerce ?

    A

  23. Spouiik
    Posted April 1, 2009 at 9:45 | Permalink

    Bonjour,
    j’ai mis en place ce système qui marchait très bien jusqu’à présent mais depuis quelques jours j’ai “Une erreur est survenue lors de la récupération des données pour cette vue.”
    D’après vous d’où ça peut venir ?

  24. Daniel
    Posted April 1, 2009 at 21:18 | Permalink

    Même problème que Spouiik…

  25. JJacques
    Posted April 8, 2009 at 12:06 | Permalink

    idem, ne fonctionne plus chez moi.

  26. Posted April 8, 2009 at 13:02 | Permalink

    Je vois que c’est pareil pour tous le monde ! Dommage, ce segment était bien pratique. Y a plus qu’a chercher une alternative.

  27. Posted April 9, 2009 at 19:02 | Permalink

    ouf… je ne suis pas le seul !!!
    ca ne marche pas uniquement pour les resultats de position SEO 1

  28. Posted April 10, 2009 at 15:50 | Permalink

    Je vais essayer de voir à quoi ces soucis sont dus et revenir vers vous.

  29. Posted April 10, 2009 at 16:55 | Permalink

    OK, j’ai trouvé le souci:

    Google Analytics ne supporte plus les condition négatives dans le RegEx. Ce sont les parties qui commencent par (?!

    Apparemment cela n’était pas voulu et étant conscient du prblème l’équipe GA devrait rétablir cela bientôt (ça prendra probablement un peu de temps car ils sont un peu occupés à complètement péter le tracking AdWords en ce moment).

    En attendant, pour le segment SEO page 1, il suffit d’éviter d’utiliser une condition négative. Du coup, il faut mettre trois conditions:
    Matches regular expression: (\?|&)(start|b|first|ap)=[0-1](&|$)
    OR
    Does not match regular expression: (\?|&)(start|b|first|ap)=
    AND
    Matches regular expression: ^http://[^/]*(google|yahoo|live|msn|voila)

    SEO pages 2 et 3 marchent très bien sans modification.

  30. Spouiik
    Posted April 17, 2009 at 14:44 | Permalink

    Il y a encore plus intéressant pour ressortir de bonnes données comme on les aimes ;)
    http://juliencoquet.wordpress.com/2009/04/15/changements-dans-les-urls-de-sites-referents-via-recherche-google/
    Merci Julien c’est juste génial de nous partager des infos comme ça !!!

  31. Posted April 21, 2009 at 14:17 | Permalink

    @Spouiik non c’est un juste retour des choses après le billet d’Alan ;-)

  32. myriacl
    Posted April 25, 2009 at 0:46 | Permalink

    un peu d’expression reguliere correcte, d’accord, elles semblent noob, mais elles font le boulot correctement :

    1er resultat sur google :
    match regular : google. cd=1(\D|$)
    signifie : cd=1 suivi de tout sauf un chiffre ou suivi de la fin de la chaine de caracteres, pour eviter de choper 10 et 100 :)

    1ere page sur google :
    match regular : google. cd=(10|9|8|7|6|5|4|3|2|1)(\D|$)

    2eme page sur google
    match regular : cd=(20|19|18|17|16|15|14|13|12|11)(\D|$)

    etc…

  33. myriacl
    Posted April 25, 2009 at 0:48 | Permalink

    en fait, le (\D|$) evite aussi de choper 11 12 13 14 15 16 etc…
    juste cd=1 !!!!

  34. Posted June 9, 2009 at 14:41 | Permalink

    Merci pour cette info en tout cas toujours aussi bien expliqué.
    Je vais essayer de mettre sa en pratique, j’espère que cette astuce fonctionne toujours.

  35. Posted June 11, 2009 at 15:12 | Permalink

    Je viens de tomber sur cet article qui m’a beaucoup aidé, je comprend maintenant pourquoi mes valeurs personnalisées étaient quasiment toutes à ‘not set’, et donc mes segments renvoyaient tous 0 !!

    j’attends qq jours pour enfin voir les résultats !

  36. Posted July 22, 2009 at 11:36 | Permalink

    Bizarre, je suis bien avec le cd=1 mais sur des mots clés sur lesquels je suis sur d’être en première position, j’ai une différence de plusieurs milliers de visites. La forme du referer dépend elle ?

  37. Nekikool
    Posted August 28, 2009 at 15:39 | Permalink

    Hello, j’ai enfin réussi à mettre en place les segments sans avoir d’erreur mais je suis tout dépité sur toutes les pages le graph m’affiche 0 visites :(
    J’ai pourtant entre 5 et 10 000 visites naturelles selon ce même graph, je veux bien qu’il y ait des liens commerciaux mal filtrés mais pas au point d’avoir 0 visites naturelles. Faut-il attendre un petit peu? J’ai aussi raccourci la période d’observation sur quelques jours pour éviter d’avoir des stats basées sur un échantillonnage qui me paraît très aléatoire.
    Si vous avez d’autres idées pour regonfler le graph et le moral je suis preneur !!

  38. Posted September 23, 2009 at 15:02 | Permalink

    le fonctionnement est un peu complexe de mon côté

This thing has 3 Trackbacks

  1. Posted December 21, 2008 at 17:18 | Permalink

    [...] Google Analytics & SEO: de quelles pages de résultats proviennent vos visites ? par The Analytics Factor [...]

  2. Posted April 21, 2009 at 14:02 | Permalink

    [...] Il existe sur internet de très bon articles sur le sujet. j’ai choisi de combiner deux articles que je résume dans ce billet. je parle en l’occurrence de celui de Julien Coquet et celui de Alan Boydell. [...]

  3. Posted August 18, 2009 at 20:11 | Permalink

    [...] Il existe sur internet de très bon articles sur le sujet. j’ai choisi de combiner deux articles que je résume dans ce billet. je parle en l’occurrence de celui de Julien Coquet et celui de Alan Boydell. [...]

Post a Comment

Your email is never published nor shared. Required fields are marked *

*
*