Les compteurs de fréquentations sont de petits programmes qui enregistrent le nombre de visiteurs d'un site (ou d'une page) -- la manière dont ils opèrent varie grandement et chacun donne des résultats très différents.
Un visiteur est une personne qui va sur un site. Une page est dite «visitée» chaque fois que le visiteur charge la page en entier. Mais techniquement, une «visite» (telle que définie dans le serveur Web) est enregistrée pour chaque fichier envoyé à partir du serveur (le serveur Web) vers le client (le navigateur).
En tant que Webmestre, je me soucie du nombre de visites par page (le nombre de visiteurs ayant chargé une page), cependant le serveur Web me donne le nombre de visites selon sa définition (le nombre de fichiers qu'un client a reçu) -- ce sont deux résultats de calcul complètement différents.
Une «page» Web vue par un utilisateur peut être composée de plusieurs fichiers différents -- chaque fichier enregistre une visite sur le serveur. Cela signifie qu'un véritable «compteur de visites» peut enregistrer un nombre de 5, 10 ou 20 fois supérieur au nombre réel de visiteurs d'une page. Laissez-moi vous expliquer comment une page peut enregistrer plusieurs visites:
Mais le nombre de «visites» n'est pas toujours aussi gonflé, dans certains cas l'architecture peut diminuer artificiellement ce nombre. Supposons que vous visitez ma page, votre navigateur la «cache» sur votre disque dur, une copie locale de la page et des graphiques (et des cadres séparés si j'en utilisais). La prochaine fois que vous visitez mon site, le navigateur essaiera de tirer le maximum d'informations de la cache située sur votre disque dur. Ainsi lors de votre première visite, 5 ou 10 visites peuvent être enregistrées, la fois suivante, la moitié de ces visites pourraient être enregistrées ou aucune (toute l'information est retirée de la cache). Cela signifie que vous pouvez visiter mon site sans qu'aucune visite ne soit enregistrée, si l'information est tirée de la cache, puisque rien ne vous parvient du serveur (le site). Normalement les graphiques sont tirés de la cache alors que la page provient du serveur -- donc une seule visite enregistrée.
Bien entendu la cache est entièrement dépendante du client (navigateur) -- si cache il y a (la plupart l'utilise). Mais un tas de facteurs sont déterminants -- la taille de votre cache et le temps que vous passez à naviguer. Si vous naviguez beaucoup (et que votre cache est petite), alors le navigateur aura à vider la cache pour l'utiliser sur d'autres sites (alors elle n'est plus disponible pour accélérer mon site). Ainsi un tas de paramètres, que je ne contrôle pas, peuvent changer.
Encore plus de caches et de Proxies : Au cas où la technique de cache du client ne serait pas à la hauteur, il existe une autre méthode de cache. Entre la plupart des ordinateurs et le serveur destination, il y a d'autres ordinateurs (routeurs, serveurs proxy, caches et coupe-feux); ceux-là, la plupart du temps des serveurs proxy, peuvent mettre de l'information en cache pour tout un groupe d'ordinateurs. Ainsi, dans le bureau de votre organisation, si vous chargez une page en passant par un serveur proxy, il se rappellera de cette page. La prochaine fois que quelqu'un d'autre de la compagnie essaie de charger la même page, elle peut être lue dans la cache local ITS (pour réduire l'engorgement extérieur). Bien sûr cela veut dire qu'il n'y a pas de «visite» enregistrée sur le serveur. À la maison, vous n'êtes pas à l'abri des serveurs proxy puisque votre fournisseur d'accès Internet peut avoir un serveur proxy entre vous et un hôte.
Pour compliquer les choses davantage, certains compteurs de fréquentations enregistrent le nombre de visiteurs par page, alors que d'autres comptent le nombre total de visiteurs dans le site entier (toutes les pages).
Vous voyez maintenant qu'une visite est difficile à définir, elle peut être un fichier envoyé, un fichier partiel ou autre chose -- et cela varie d'un serveur à l'autre (d'un site à l'autre) -- la définition d'une visite peut même changer selon les préférences fixées dans un serveur ou par une fonctionnalité ajoutée dans le serveur par on ne sait trop qui. Et elle change selon le client, les paramètres de sa cache et leur comportement en navigation. Et cela varie encore selon le fournisseur d'accès Internet et selon la méthode que vous utilisez pour vous connecter à Internet (et si oui ou non il y a des serveurs proxy).
La plupart des webmestres disent que la bonne façon d'afficher avec précision le nombre de «visiteurs» est de ne pas utiliser les visites comptées par le serveur. Certains utilisent les visites calculées par le serveur car cela donne une impression de popularité à leur site, ou utilisent de faux compteurs pour vendre de l'espace publicitaire. Certains webmestres mentent et inventent ou gonflent le nombre de visites. Vous ne pouvez pas faire confiance aux compteurs Web, à moins de faire confiance au webmestre.
La majorité des compteurs sont meilleurs que les compteurs de visites des serveurs (notez bien, la plupart des sites Web n'utilisent PAS le compteur de visites du serveur pour faire leur calcul). Les compteurs les plus communs sont les compteurs basés sur des CGI. Les CGI sont de petits programmes qui sont chargés et qui tournent sur le serveur. Ces programmes sont exécutés une fois par page et tout ce qu'ils font c'est d'incrémenter le compteur et afficher le total sous forme d'image -- il y a donc un compteur CGI par page.
Rappelez-vous que le navigateur (ou un serveur proxy) pourra mettre l'image en cache pour ne pas avoir à la recharger, alors le compteur CGI peut ne pas être exécuté (à moins que le navigateur soit forcé de recharger l'image). La page peut également être mis en cache et ne pas être chargée du tout lorsque vous visitez un site -- les CGI sont cependant assez bons pour éviter tous ces problèmes de cache (mais ils ne sont pas parfaits).
Certains compteurs CGI mettent en cache l'adresse IP du visiteur, ainsi ils n'incrémentent le compteur qu'une seule fois par visiteur, chaque jour. Ainsi, si vous visitez un site et y revenez plus tard la même journée, vous n'aurez été compté qu'une seule fois (1 visiteur).
Pire encore, vous vous branchez sur Internet par l'entremise de votre fournisseur Internet, vous naviguez puis vous vous déconnectez. Un autre membre appel ce même fournisseur Internet et obtient la même adresse IP que celle que vous aviez obtenue (puisque les adresses IP sont une ressource partagée), il visite le même site que vous, et le compteur n'en tient pas compte car il a déjà comptabilisé aujourd'hui cette adresse IP.
Ces quelques exemples montrent que le nombre de visites calculé par un compteur n'est qu'une approximation grossière. Ces calculs peuvent être faits de plusieurs façons et les résultats obtenus diffèrent autant, en plus d'être altéré par la manière dont les pages Web sont conçues, les configurations des utilisateurs et la méthode de branchement sur Internet.
La meilleure façon de calculer le nombre de visites, c'est d'analyser le fichier de journalisation (log) du serveur lui-même; ce journal renferme chacune des transactions et visite. Il faut alors filtrer les visites en ignorant les images et en ne comptant que les fichiers HTML uniques. C'est la meilleure manière de calculer les visites (enfin celles qui n'ont pas été mis en cache). En utilisant cette méthode sur différents mois (et en les comparant avec le calcul du compteur), je me suis rendu compte que mon compteur donnait un résultat presque 3 fois moindre (2.68 pour être exact). J'obtiens donc 3 fois plus de visiteurs que ce que je croyais obtenir!
J'ai également été en mesure de déterminer la provenance des utilisateurs, les navigateurs utilisés, et plus encore; un tas de statistiques intéressantes. Par exemple, j'ai appris qu'un pauvre type de l'Estonie s'est essayé par trois fois en un mois de se connecter à mon site sans que mon serveur puisse lui répondre. Cela a également changé certains de mes calculs, par exemple, je croyais que j'obtenais un message de courrier électronique pour chaque 1000 visiteurs -- c'était plutôt 1 pour 3000 visiteurs. Toutes sortes de petites choses intéressantes qui apparaissent sans importance, mais bonnes à savoir (peut-être aurais-je besoin d'un site miroir local pour les Estoniens). Enfin, j'ai été si heureux d'apprendre que j'obtenais 3 fois plus de visiteurs que ce que j'avais toujours cru, que j'ai décidé d'écrire cet article sur les compteurs de fréquentations. J'espère que vous y avez trouvé votre compte!