Après avoir atteint mon record absolu de silence radio sur ce blog, j’ai décidé aujourd’hui qu’il était grand temps que ce scandale cesse. J’ai décidé de ressortir, le temps de quelques articles, quelques trucs qui trainent dans mes fonds de tiroirs depuis des lustres et que pour une raison ou une autre je n’ai jamais postées (la flemme tient une place assez élevée sur ma liste de raisons possibles).
Notre bon Oliver de Segonzac (qui depuis peu a rejoint notre petit cercle de consultants agréés Google Analytics – une reconnaissance de son savoir-faire grandement méritée) avait montré il y a quelques temps comment voir de quelle page de résultat Google provenaient quelles visites. J’avais moi-même travaillé sur une technique analogue pour le compte d’un client avec des filtres et profils assez complexes et ensuite avais laissé tomber ça aux oubliettes.
Deux raisons motivent donc cette soudaine envie de publier un article sur ce même sujet. Premièrement la technique sur laquelle j’avais travaillé marche pour Google, Yahoo!, Live, MSN et Voila (juste au cas où ça existe encore), et donc, d’une certaine manière, justifiait un petit post. En deuxième lieu, cette formidable innovation dans Google Analytics que sont les Segments Avancés simplifie la mise en place et rend la technique beaucoup plus exploitable.
Pour mettre cela en place, il s’agit tout d’abord de créer un nouveau profil dans lequel nous allons, au moyen d’un filtre, copier le referer entier dans le rapport personnalisé:
Dans la case illisible sur la capture, entrez le RegEx suivant: ^https?://(?!.*\.votredomaine.com)(.*)
Il va sans dire qu’il serait préférable de remplacer “votredomaine.com” par le domaine du site en question pour que ça marche sans trop de souci. Donc sur le site de votre serviteur, cela ressemblerait à: ^https?://(?!.*\.analytics.fr)(.*)
C’est un profil que tout le monde devrait se créer et toujours avoir sous la main de toutes les façons. En temps normal, les referers complets ne sont visibles dans aucun rapport par défaut dans Google Analytics et il existe moultes situations dans lesquelles il peut être utile de les consulter.
Ensuite, c’est vraiment très, très simple. Il suffit de créer un segment avancé par page de résultat:
Tout devrait être relativement clair dans mes captures. On sélectionne le champ personnalisé, on choisit le mode “Expressions régulières” et ensuite on entre la valeur qui correspond à la page en question ci-dessous:
Page 1: ((\?|&)(start|b|first|ap)=[0-1](&|$))|^.(?!.*(\?|&)(start|b|first|ap)=)
Page2: (\?|&)(start|b|first|ap)=(10|11|2)(&|$)
Page3: (\?|&)(start|b|first|ap)=(20|21|3)(&|$)
Page4+: (\?|&)(start|b|first|ap)=(?)(?![1-2][0-1](&|$))
Au delà de la quatrième page, je regroupe tout dans la même catégorie “4+”, mais pour les méticuleux, il est possible d’adapter les RegEx ci-dessus pour voir le détail des pages de résultat au-delà de la quatrième. Encore une fois, pour les méticuleux, sur chaque segment avancé, il serait encore mieux d’ajouter une autre condition “AND” pour que “Campaign medium” corresponde à “organic”, mais ça n’est pas absolument nécessaire.
Après cela, on sélectionne les segments ainsi créés dans ce nouveau profil:
Et voici à quoi ressemble le rapport “moteurs de recherche” dans le compte de mon blog:
![]()
(Vous remarquerez que je splitte tous les moteurs en fonction de leur TLD. Ça n’a rien à voir avec la technique décrite ici, donc ignorez ce détail)
Après, ça peut également être assez utile de sélectionner un seul de ces segments et de regarder un rapport de mots-clés. Dans le rapport ci-dessous par exemple, j’obtiens directement la liste de mots-clés sur lesquels je figure en troisième page sur google.fr :
Et voilou ! Comme d’habitude, j’ai hâte de lire vos commentaires !
PS: Joyeux anniversaire Serge !
Joyeux anniversaire Sophie !
And a very special happy birthday Dad!



This thing has 38 Comments
Merci Alan et bravo Olivier et Résoneo pour l’admission dans les GAAC!
Hello,
Sur voila.fr les résultats sont appelés en ajax maintenant, mais ca marchera nickel pour le portail orange !
clair qu’avec les segments personnalisés ça dépote
PS : merci julien
Could you create the advanced segment on Dimensions -> Traffic Sources -> Referral Path without creating the profile/filter at the start?
Maybe I missed the point of the profile since I don’t know any French.
Anyway, Great Post. I like the idea, I hadn’t done that before.
Hey John,
Unfortunately the Referral Path strips out all parameters, so it’s not going to fly that way. Good thinking though
@Olivier: Bien vu pour voila! Je dois dire que j’ai développé ces RegEx il y a un an et demi, donc tout changement depuis ne sera pas prit en compte. IL faudra songer à mettre ça à jour. À bon entendeur…
Pourquoi mets tu https ?
Je viens d’ouvrir les yeux navré j’avais zappé le ?
Franchement, t’aurais pu mettre l’info principale (mon anniversaire) en haut de pge. Le reste n’est que bavardage…
Merci !
PS: la bise à Papa Boydell.
Un grand merci, j’ai hâte de voir les premiers résultats
Excellent Alan , merci!
Merci beaucoup pour cette astuce, que je vais m’empresser de mettre en place !
Bruno
ahhhh tu nous avait manqué Alan et je doit dire que je commençais à me lasser de compter les médailles d’or aux JO
Merci pour cette astuce fort pratique.
question: Peut-on appliquer le même genre de filtre aux campagnes SEM ?
je rejoins également la question de billyboylindien sur le https
à bientôt
Ben
Salut Benjamin !
Les segments avancés créés en suivant cette méthode s’appliquent tout aussi bien aux rapports SEM qu’aux rapports de ref nat. Aucun souci puisque les referers sont inchangés que l’on clique sur un résultat naturel ou sur du lien sponso.
Sinon en RegEx, le ‘?’ suivant le https rend le ’s’ optionnel. Du coup, les referers sont récupérés que ce soit du http ou du https. Ça doit arriver une fois sur 10000 d’avoir un referer en https, et JAMAIS en provenance d’un moteur, mais c’est mon côté perfectionniste et un poil obsessionel qui ressort du coup
En tout état de cause, ça ne gène pas.
PS: comment va l’ambiance chez XiTi ?
Salut Alan,
j’ai une question pour toi:
Lorsqu’on applique le filtre pour récupérer le full referral, on a série d’entrées qui ressemblent à “http://www.google.com/?search&hl=en…”. Jusque là, tout est normal.
Mais il reste une entrée qui ne contient que “google”. Celle-ci ne semble pas être impactée par le filtre, pourquoi?
Je précise que je n’utilise pas le user-defined comme réceptacle mais bien les sources de campagnes “moteurs de recherches”.
Merci d’avance
Salut Mehdi !
C’est une bonne question. En fait, toutes les visites “directe” (qui n’ont pas de referer donc) “héritent” de la source de la visite précédente.
Donc imaginons que quelqu’un visite par Google (sa visite est donc marquée en tant que tel) et ensuite revient 2 jours plus tard en tapant l’URL directement. Cette deuxième visite n’aura pas de referer (et donc notre filtre ne fera rien du tout) et c’est la valeur de la visite précédente qui restera donc visible dans le rapport, soit Google / organic -> keywordX
En utilisant le champ “user defined”, ces visites apparaissent comme du “not set”.
Par ailleurs, je ne réécris jamais les champs de “campagne” (comme Campaign Source) – d’ou mon utilisation systématique du champ “user-defined”. J’ai eu des experiences très étranges qui tendent à suggérer que les champ de campagne servent d’une certaine manière de clé primaire pour les visites et que les réécrire peuvent disloquer les sessions. J’ai pas réésayé depuis 2006 je pense, mais en tout cas c’était vrai à l’époque.
Salut Alan,
Merci pour tes précisions effectivement ça s’avère très utile et je vais tester ça rapidement.

Concernant XiTi oui l’ambiance est super, le produit merveilleux, bref je m’éclate
cependant je garde toujours un oeil sur analytics
Tiens moi au courant on ira descendre quelques taliskers dès que tu descends.
à bientôt
Ben
Ah la la… J’avais oublié la soirée Talisker à Bayonne
Il faudra grave se refaire ça !
Bonjour,
C’est vraiment nickel !
Juste une petite question : quelle est la formule pour afficher les résultats en provenance des pages 3 et ???
J’ai essayé de bidouiller en vain.
Merci d’avance.
Je voulais dire : ls pages 3 et
3 et plus
Bonjour,
merci pour cette astuce ! Cependant je veux être sur de bien faire la manipulation de départ doit on ajouter un nouveau profil à un domaine existant ou Ajouter un profil pour un nouveau domaine ?
Merci
Salut cashmer,
Si j’ai bien compris ta question tu veux le trafic de la page 3 et plus
j’imagine que c’est ça m’est c’est à valider par alan
Page3 et : (\?|&)(start|b|first|ap)=(?)(?![0-1][1-2](&|$))
si au contraire tu veux le trafic spécifique d’une page non indiqué plus haut, la page 5 par exemple tu ne dois pas mettre le dernier filtre (4 et plus) et
essaye ça.
Page5: (\?|&)(start|b|first|ap)=(40|41|5)(&|$)
mais encore une fois je laisse Alan Valider
Ok c’est tout frais et je viens de l’installer… on va voir demain ce que cela donne !
Alan, un petit billet sur un rapport avancé Ecommerce ?
A
Bonjour,
j’ai mis en place ce système qui marchait très bien jusqu’à présent mais depuis quelques jours j’ai “Une erreur est survenue lors de la récupération des données pour cette vue.”
D’après vous d’où ça peut venir ?
Même problème que Spouiik…
idem, ne fonctionne plus chez moi.
Je vois que c’est pareil pour tous le monde ! Dommage, ce segment était bien pratique. Y a plus qu’a chercher une alternative.
ouf… je ne suis pas le seul !!!
ca ne marche pas uniquement pour les resultats de position SEO 1
Je vais essayer de voir à quoi ces soucis sont dus et revenir vers vous.
OK, j’ai trouvé le souci:
Google Analytics ne supporte plus les condition négatives dans le RegEx. Ce sont les parties qui commencent par (?!
Apparemment cela n’était pas voulu et étant conscient du prblème l’équipe GA devrait rétablir cela bientôt (ça prendra probablement un peu de temps car ils sont un peu occupés à complètement péter le tracking AdWords en ce moment).
En attendant, pour le segment SEO page 1, il suffit d’éviter d’utiliser une condition négative. Du coup, il faut mettre trois conditions:
Matches regular expression: (\?|&)(start|b|first|ap)=[0-1](&|$)
OR
Does not match regular expression: (\?|&)(start|b|first|ap)=
AND
Matches regular expression: ^http://[^/]*(google|yahoo|live|msn|voila)
SEO pages 2 et 3 marchent très bien sans modification.
Il y a encore plus intéressant pour ressortir de bonnes données comme on les aimes
http://juliencoquet.wordpress.com/2009/04/15/changements-dans-les-urls-de-sites-referents-via-recherche-google/
Merci Julien c’est juste génial de nous partager des infos comme ça !!!
@Spouiik non c’est un juste retour des choses après le billet d’Alan
un peu d’expression reguliere correcte, d’accord, elles semblent noob, mais elles font le boulot correctement :
1er resultat sur google :
match regular : google. cd=1(\D|$)
signifie : cd=1 suivi de tout sauf un chiffre ou suivi de la fin de la chaine de caracteres, pour eviter de choper 10 et 100
1ere page sur google :
match regular : google. cd=(10|9|8|7|6|5|4|3|2|1)(\D|$)
2eme page sur google
match regular : cd=(20|19|18|17|16|15|14|13|12|11)(\D|$)
etc…
en fait, le (\D|$) evite aussi de choper 11 12 13 14 15 16 etc…
juste cd=1 !!!!
Merci pour cette info en tout cas toujours aussi bien expliqué.
Je vais essayer de mettre sa en pratique, j’espère que cette astuce fonctionne toujours.
Je viens de tomber sur cet article qui m’a beaucoup aidé, je comprend maintenant pourquoi mes valeurs personnalisées étaient quasiment toutes à ‘not set’, et donc mes segments renvoyaient tous 0 !!
j’attends qq jours pour enfin voir les résultats !
Bizarre, je suis bien avec le cd=1 mais sur des mots clés sur lesquels je suis sur d’être en première position, j’ai une différence de plusieurs milliers de visites. La forme du referer dépend elle ?
Hello, j’ai enfin réussi à mettre en place les segments sans avoir d’erreur mais je suis tout dépité sur toutes les pages le graph m’affiche 0 visites
J’ai pourtant entre 5 et 10 000 visites naturelles selon ce même graph, je veux bien qu’il y ait des liens commerciaux mal filtrés mais pas au point d’avoir 0 visites naturelles. Faut-il attendre un petit peu? J’ai aussi raccourci la période d’observation sur quelques jours pour éviter d’avoir des stats basées sur un échantillonnage qui me paraît très aléatoire.
Si vous avez d’autres idées pour regonfler le graph et le moral je suis preneur !!
le fonctionnement est un peu complexe de mon côté
This thing has 3 Trackbacks
[...] Google Analytics & SEO: de quelles pages de résultats proviennent vos visites ? par The Analytics Factor [...]
[...] Il existe sur internet de très bon articles sur le sujet. j’ai choisi de combiner deux articles que je résume dans ce billet. je parle en l’occurrence de celui de Julien Coquet et celui de Alan Boydell. [...]
[...] Il existe sur internet de très bon articles sur le sujet. j’ai choisi de combiner deux articles que je résume dans ce billet. je parle en l’occurrence de celui de Julien Coquet et celui de Alan Boydell. [...]