sabato 9 marzo 2013

AWStats e Google Analytics: la differenza nelle misurazioni

Recentemente mi è stato chiesto come mai i dati di accesso registrati da Google Analytics siano ben diversi rispetto alle visite tracciate da AWStats.

Confrontando i dati presentati dai due sistemi si può osservare come i valori di Google Analytics siano spesso inferiori rispetto ad AWStats, e più in generale siano inferiori a quelli estrapolati dai software che analizzano i log.

Come mai questa discrepanza numerica?

Il timore di chi mi ha fatto questa domanda era sulla possibilità che Google Analytics alteri le statistiche a "proprio vantaggio".

A parte il fatto che la teoria della cospirazione è piuttosto esagerata e non vedo motivi validi per cui il servizio Google Analytics abbia dei vantaggi sottostimando i dati di accesso ad un sito, esistono delle motivazioni concrete molto semplici basate sul fatto che gli analizzatori di log e Google Analytics hanno dei metodi di funzionamento decisamente diversi, primo su tutti il fatto che Google Analytics utilizza del codice JavaScript inserito nelle pagine, mentre AWStats analizza i log del web server.

Quindi le rilevazioni effettuate da Google Analytics seguono delle regole non confrontabili con l'analisi diretta dei log del web server.

In particolare si possono evidenziare alcuni aspetti decisamente significativi.

Per prima cosa il web server potrebbe avere un fuso orario diverso dalle impostazioni di Google Analytics, ciò comporta una ovvia differenza ma non spiega come mai solitamente i dati di Google Analytics sono inferiori ad AWStats.

Abbiamo poi altri dettagli tecnici che influenzano il tracciamento effettuato da Google Analytics e le sue differenze con AWStats:
  • Google Analytics si basa su dei cookie per identificare gli utenti che ritornano nel sito. Se un utente elimina i cookie allora Google Analytics non funzionerà come previsto.
  • Il conteggio delle nuove visite è diverso tra i due sistemi. Mentre Google Analytics ha un tempo minimo di mezz'ora, e quindi se un utente entra nel sito più volte nell'arco di 30 minuti sarà conteggiato come una visita unica ed al 31esimo minuto verrà aggiunta una seconda visita, AWStats utilizza un periodo di 60 minuti per ogni singolo IP.
  • Google Analytics inoltre non registra i bot ed i crawler che visitano il sito, mentre AWStats li conteggia e, fortunatamente, è in grado di distinguere i visitatori reali dai bot e dai crawler.
  • AWStats conteggia ogni richiesta effettuata, compresi gli indirizzi non esistenti (pagine 404).

Infine abbiamo anche altri fattori che possono influenzare il campionamento da parte di Google Analytics.

Ad esempio in alcune pagine potrebbe mancare per errore il codice JavaScript di controllo. Oppure se il sito è molto lento e lo script è stato inserito nel piè pagina del codice HTML, questo potrebbe non essere eseguito. Un altro motivo è il blocco dell'esecuzione degli script da parte dei browser.

Niente cospirazione, almeno per questa volta: Google Analytics svolge il suo dovere come ci si aspetta e lo stesso vale per AWStats.

Chiaramente è importante essere a conoscenza di tali meccanismi nel momento in cui si svolgono delle analisi del traffico degli utenti di un sito web in modo da poter interpretare correttamente i numeri a nostra disposizione.