Dans le rapport “Sites Référents”, vous pouvez cliquer sur n’importe quel domaine pour voir le détail des pages du domaine qui – a priori – contiennent un lien vers votre site. Cependant, pour systématiquement pouvoir trouver la page en question, il manque les paramètres de l’URL (primordiaux pour les sites dynamiques).
En prenant l’exemple de ce blog, j’aperçois dans mon compte Google Analytics des visites provenant d’un site référent qui s’appelle webmaster-hub.com. Lorsque je clique dessus, je constate que l’ensemble des visites de ce site proviennent de la page /index.php.
Si j’entre l’URL http://www.webmaster-hub.com/index.php dans Firefox (car bien évidemment je HAIS Internet Explorer), je tombe sur une page qui ne contient pas la moindre trace d’un lien vers mon blog. Ce qui serait réellement utile pour trouver la page en question, serait d’avoir l’URL dans son intégralité (par ex: forums.webmaster-hub.com/index.php?topic=3498798634&article=aje98773), ce qui me permettrait de voir dans quel contexte mon blog a été cité. Vous verrez ci-dessous un filtre avancé (vous allez commencer à croire que c’est une obsession chez moi) qui va justement nous permettre de faire cela.
![]()
Les filtres avancés supportent le RegEx (regular expressions) et sont donc très puissants pour modifier les informations qui apparaissent dans les rapports. Un des champs qui n’apparaît pas dans les rapports, mais qui est accessible dans les filtres avancés, est le champ “referral” (très étrangement “lien externe” en français) qui contient l’URL complète du référent. Le filtre avancé va justement nous permettre de récupérer l’information qui nous intéresse dans ce champ-là (referral) et écraser le contenu existant d’un autre champ (”Campaign content”) avec l’URL complète.

Dans le cas de ce filtre, il faut remplacer la partie “domain\.com” par votre propre domaine. Dans mon cas, ce serait ^https?://(?!.*\.analytics\.fr)[^/]*(/.*)
La première parenthèse représente une condition négative en RegEx. Ce filtre s’appliquera donc uniquement aux référents qui ne sont pas constitués d’une URL de votre propre site. C’est plus sûr d’opérer de la sorte car l’information du référent est une information au niveau du “hit” (ou de la page-vue). Dans cette logique, chaque visite a autant de référents que de pages-vues et cette condition négative assure que le filtre ne s’applique qu’en ce qui concerne le référent de la première page-vue, c’ést-à-dire le référent de la visite sur votre site.
[EDIT du 13/12/2007: J'ai changé légèrement le RegEx de manière à ce que le petit icône à gauche du lien continue à fonctionner. En cliquant sur cet icône, vous pouvez allez visiter la page en question pour retrouver le lien qui pointe vers votre site.]


This thing has 18 Comments
Bien vu, Alan
Une alternative consiste à utiliser la variable “user-defined” comme je l’explique sur
http://webanalytics.wordpress.com/2007/06/25/google-analytics-de-limportance-des-referrers-complets/
Dans ton explication comme dans la mienne, on doit sacrifier un champ (campagne ou user-defined)
C’est donc un parti pris qu’il faut adopter
Amicalement,
Julien
Salut Julien,
Merci pour tes commentaires.
En l’occurence, on ne doit pas sacrifier de champ étant donné que le champ en question est celui utilisé de toutes les façons pour stocker l’URI pour les visites “referral” (l’URI qui apparaît ensuite comme “referral path”). Dans mon exemple, on écraserait donc l’information “/index.php” avec “http://forums.webmaster-hub.com/index.php?topic=3498798634&article=aje98773″
De cette manière, le tout fonctionne exactement comme avant en cliquant simplement sur la source du trafic dans le rapport “sites référents”.
Sinon, pour parler choses sérieuses, on se prend une bière quand tu seras à Paris pour le salon?
Alan
Fort volontiers pour la bière
Mais auras-tu le courage de monter à Bruxelles le lendemain?
Bonjour Alan,
Enchanté moi c’est Mehdi, apprenti de Julien

Tout d’abord merci pour ce blog en français, c’est rafraichissant
Je me pose une question de profane par rapport à ton filtre avancé. Dans le “Filter A -> extract A” tu as 2 blocs de paranthèses. Dans l’Output tu écris $A1. Je pensais qu’avec cette écriture tu ne prendrais en compte que le premier bloc de paranthèses, or, apparemment, l’URI (.*) est prise en compte aussi. Perso j’aurais mis “$A1 $A2″ dans l’Output. Peux tu m’expliquer ton raisonnement?
Wow, ravi de découvrir ce blog, celui-là est définitivement bookmarké :}
@Julien: on verra pour Bruxelles
C’est très tentant comme événement et le programme semble être d’un très haut niveau.
@Mehdi: Salut Mehdi! Je dois avouer que ce n’est vraiment pas le genre de remarques auxquelles je m’attendais. Tu dois visiblement très bien maîtriser le RegEx
À vrai dire, j’étais tout aussi interloqué que toi lorsque je me suis rendu compte que dans ce cas précis il fallait préciser $A1 pour obtenir le contenu de la 2ème parenthèse. Normalement, tu as tout à fait raison : une parenthèse constitue un « placeholder » (comprenez : mise en mémoire) et celles-ci sont numérotées. De prime abord, j’ai aussi eu le réflexe de spécifier $A2 pour obtenir le contenu de cette deuxième parenthèse. La différence ici, c’est que la première parenthèse ne correspond à aucun contenu potentiel dans l’URL à laquelle l’expression s’applique. Elle constitue une condition (à savoir « cette expression ne doit s’appliquer que si le contenu qui suit ne contient pas ‘.domain.com’ ») et dans ce sens, n’est pas pris en compte dans le RegEx comme un « placeholder ». Du coup le premier placeholder est le (.*). Pour plus de précisions sur cette histoire de conditions en RegEx, voir l’excellent post de Robbin : http://snipurl.com/1q0hh
@Simon : Vraiment ravi que ça te soit utile. Merci pour les encouragements
Pour ceux qui se poseraient la question, le petit snipurl que j’ai inclu dans le commentaire ci-dessus opère une redirection sur la bonne URL de lunametrics, sans pour autant perdre le référent d’origine (en l’occurence analytics.fr). Je viens de tester, et voici le contenu de mon cookie utmz sur le site de lunametrics: utmccn=(referral)
utmcsr=analytics.fr
utmcct=/index.php/2007/08/26 /google-analytics-pour-blogueurs-ii-obtenir-lurl-integrale-des-pages-qui-vous-envoient-du-trafic/
utmcmd=referral
C’est donc avec joie et sans réserve que je donne mon onction à http://snipurl.com comme outil de raccourci d’URL résolument “anaytics-friendly”.
Merci pour ces renseignements.
Bonjour,
Je viens de créer ce filtre mais les urls referentes sont toujours tronquées.
Il y a-t-il une autre action à faire apres la création du filtre ?
Les Urls sont bien dans : sites refents/chemin du site referent ?
Merci pour ces plus qu’astuces
affiner les résultats permet de voir beaucoup plus d’informations 
Par contre je dois m’y prendre mal mais je trouver cela assez pénible (et peu d’intéret pour moi) d’avoir la distinction des visites provenant des webmail, surtout quand le fournisseur a plusieurs serveurs, du type webmail01.fai.net . Comment dans ce cas concatener tous les webmail([0-9] )\.fai\.net en webmail.fai.net ?
Merci d’avance, je bute un peu c’est mon premier filtre avancé
@Nico:
J’imagine que les URL apparaissent seulement comme étant tronquées dans les rapports, faute de place. Essaie de faire un export .csv (bouton « export » en haut) pour voir les URL entières sous Excel.
@Aurél :
Le plus simple pour toi serait de « taguer » les URL contenues dans tes envois d’email. Plus d’information là-dessus ici : http://www.google.com/support/googleanalytics/bin/answer.py?hl=en&answer=55578
Dans le corps des tes emails, au lieu de renvoyer vers http://www.domaine.fr/ tu pointerais alors vers http://www.domaine.fr/?utm_source=Email&utm_medium=Email.
L’information contenue dans ces paramètres « écrase » l’information qui apparaîtrait normalement (en l’occurrence le referer webmailxyz.mail.com).
De cette manière, TOUT le trafic provenant de tes campagnes de emailing apparaîtra sous le nom de source que tu détermines. Quand je dis « tout le trafic » cela signifie les visites provenant de boites webmail ainsi que le trafic provenant de clients mail (comme Outlook) qui apparaît par défaut comme étant du trafic « direct » (et cela fausse donc les stats du vrai trafic direct).
C’est clairement le meilleur moyen. Sinon, si tu n’as pas la main sur les URL des campagnes emailing, tu peux faire un filtre avancé pour agréger tout le trafic webmail :
Filter type: Custom Filter / Advanced
Field A: Campaign medium
Extract A: ^referral$
Field B: Campaign source
Extract B: mail
Output to: Campaign source
Constructor: Webmail
Field A required: Yes
Field B required: Yes
Override output field: Yes
Ce filtre signifie « Si le support est ‘referral’ et la source contient ‘mail’, alors réécrire la source avec ‘Webmail’ »
En revanche, de cette manière, ceux qui cliquent sur un lien dans un mail à partir d’un client mail continueront à être catégorisés comme du « direct ».
Bonne chance
bonjour,
Sincèrement merci pour toutes ces informations, je bute sur une chose:
Où doivent apparaitre ces informations ?
J’ai été dans Traffic Sources => Refering Sites => ???
Je ne trouve pas le segment “Refferal Path” tel que sur la capture d’écran.
Merci
Bonsoir et merci pour l’astuce.
Je vais essayer de l’appliquer tout de suite
Excellent blog au passage !
ok j’ai résolu mon problème en mettant les référents dans le champ “user defined”
merci pour toutes ces astuces !
Bonjour
J’ai appliqué la méthode à 2 sites dont je m’occupe: créé un nouveau profil et créé le filtre avec les paramétres ci-dessous.
Je ne sais pas si je vais voir au bon endroit (traffic sources/referring sites), mais je ne vois pas la différence avec mon profil “sans bidouille”. J’ai toujours des satanés (ex):
http://pagesjaunes.fr/trouverlesprofessionnels/rechercheClassique.do
Pourtant, j’adorerais avoir les chemins complets. J’hésite a utiliser plutôt la méthode proposée sur http://webanalytics.ox2.eu/2007/06/25/google-analytics-de-limportance-des-referrers-complets/
Mais je crains de “perdre un paramètre” comme dit ici plus haut….
Quelque éclairage?
Merci
Agnes
J’ai appliqué le filtre, mais où doit-on voir ces nouvelles informations dans analytics.
Je n’ai aucune différence par rapport à avant.
Merci pour votre aide.
Bonjour,
Vous avez l’air tous super pro et je me demandai si l’un d’entre vous aurais le temps de m’expliquer un peu Google Analytics.
Je viens de créer une société, et donc un site mais je suis plutôt 2/20 en ordi et du coup, je pense passer à côté de pleins de chose.
Voici mon adresse mail: pegoche@hotmail.com
A bientôt!
Bonjour ,
Comment puis je faire pour obtenir l’URL de mon blog ?
Merci
One Trackback
[...] Donc si vous avez suivi les différents conseils dispensés sur AnalyseWeb.fr sur l’importance des referrer complets, vous aurez créé un profil secondaire dans Google Analytics dans lequel vous insérez le referrer complet dans la valeur personnalisée grâce