Acabando con el tráfico fantasma de Google Analitycs

Acabando con el tráfico fantasma de Google Analitycs
trafico fantasma
Publicado el: 11 de enero de 2016

Google Analitycs es el sistema de conteo de visitas más usado. Es gratuito y muy potente, pero este último año aumentaron los problemas generados por ingenierías sociales diseñadas con la intención de conseguir algo de tráfico extra a costa de ‘hackear’ nuestras métricas de Analitycs.

Los dos principales ataques que están sufriendo nuestras cuentas vienen originados por el denominado Tráfico fantasma y también por el Tráfico de rastreadores. Las dos variedades se pueden reconocer fácilmente porque hinchan significativamente nuestras visitas de tráfico referido.

El tráfico fantasma procedente de dominios como floating-share-buttons.com, siempre de nuevo usuario y con un porcentaje de rebote del 100%. No son visitas reales, ya que los datos no son enviados desde el servidor donde está alojada tu web.

El tráfico de referencia proveniente de rastreadores tipo semalt.com, en el que un bot rastrea tu web, insertando datos de referencia falsa como si hubiera originado una visita.

Trafico referral

Si en nuestro Analitycs vamos a Informes, Adquisición, Todo el tráfico, Canales y seleccionamos Referral podemos ver todo este tráfico malo. Para la gráfica de este año que estamos viendo más de un 10% de las visitas totales han sido de esta procedencia.

Este es uno de los principales motivos por los que siempre es recomendable contrastar las analíticas con las estadísticas de servidor o utilizar alguna alternativa a Google Analitycs.

Estas estadísticas alteradas no modifican nuestro posicionamiento orgánico, pero resultan muy molestas a la hora de sacar conclusiones reales respecto a nuestros datos, además de afectar al Porcentaje de rebote y al Tiempo medio de sesión.

Como las visitas provenientes de Trafico fantasma no son reales y no pasan por tu propio servidor, las reglas en el htaccess no servirán. La solución pasa por establecer una serie de filtros en nuestro Analitycs.

Lista de exclusión de referencia

Comenzaremos creando una Lista de exclusión de referencia para decirle a Google Analitycs que deje de contabilizar visitas provenientes de los dominios que nos estén insertando tráfico falso.

En primer lugar iremos al informe de tráfico referido que hemos visto y tomaremos nota de todos los sitios que nos estén afectando. Reconoceremos a vista todo el Tráfico fantasma porque tiene un porcentaje cercano al 100% y siempre serán nuevos usuarios. El Tráfico de rastreadores es un poco más difícil de detectar pero el tiempo en página también suele ser muy bajo.

Debemos tener cuidado no excluir dominios de boletines de noticias, ya que frecuentemente tienen estructuras tipo dominio.us8.list-manage.com y pueden resultar sospechosas.

El principal problema que tiene este método es la posibilidad de excluir de nuestras métricas (de ninguna manera altera la indexación de google) alguna pagina que nos esté enviando tráfico válido. Otro problema es que tenemos que revisar nuestras estadísticas para aumentar nuestra lista con las nuevas referencias que vayan apareciendo.

Cuando tengamos nuestra lista completa, iremos a la sección Administrador de nuestro Google Analitycs, Propiedad, Información de seguimiento pulsando en Lista de exclusión de referencia.

Lista de exclusión de referencia

Es el momento de introducir cada dominio de nuestra lista (uno a uno). En un año es fácil acumular 50 o 60 dominios de tráfico fantasma, por lo que introducir la lista suele ser una lata. Además está la revisión constante en busca de nuevos dominios. Como veis este método no es definitivo ni muy práctico; más adelante veremos un método mejor.

Creando un Segmento de datos limpios

Acabamos de ver un método para proteger el conteo de nuevas visitas provenientes de tráfico fantasma o tráfico de rastreadores, pero las visitas ya contabilizadas siguen estando alteradas. Para limpiar estos datos podemos crear un segmento.

Iremos a Informes en nuestro Google Analitycs seleccionando el cuadro Añadir segmento en la parte superior de la pantalla. Pulsamos Agregar segmento.

Agregar segmento

Ponemos el nombre Tráfico sin Spam y seleccionamos la opción Condiciones, dentro de Opciones Avanzadas. En el primer combo seleccionamos Medio, dentro de la categoría Adquisición. En el segundo Coincide exactamente con y en el tercero escogemos Referral.

Crearndo la vista

A continuación pulsamos el botón Y y accedemos a una nueva línea en la que escogemos Fuente, Contiene y en la caja introducimos el dominio que queremos excluir. Pulsamos el boton O bien para seguir introduciendo dominios. Por cada nuevo dominio insertado, modificaremos el cálculo lateral que nos indica el porcentaje de visitas excluidas por el filtro. Cuando tengamos nuestra lista metida pulsaremos el botón Agregar filtro.

Exclusiones tráfico

Una vez creado el Filtro, cuando volveremos a pulsar Agregar segmento seleccionando en esta ocasión nuestro filtro Visitas sin Spam. La buena noticia es que este filtro se podrá usar con cualquier cuenta de Analitycs registrada para ese usuario. La mala es que no se puede exportar, por lo que tendremos que volver a introducir manualmente toda la lista si trabajamos con varias cuentas.

Comparativa tráfico referral

Esta comparativa muestra todo el tráfico anual de referencia; en azul tenemos el tráfico sin filtrar mientras que el naranja son las visitas sin spam. Para una web que reciba muchas visitas puede que no resulte muy significativo, pero para esta que tiene una media de 2500 al mes representa más de un 10% del tráfico total.

Mes a mes sin Spam

Esta gráfica muestra el total de las visitas sin filtrar en azul y con el filtro de spam en naranja mes a mes; algo más del 10% de las visitas totales.

Una opción mejor: Filtro de nombre de host

Hemos visto que el método de Lista de exclusión de referencia es laborioso, implica introducir las excepciones una a una, además de que excluye totalmente ese tráfico y no nos permite contrastar los datos. Una opción más recomendable es la de crear una nueva vista con el tráfico de los dominios de nuestra confianza.

Sabemos que el Tráfico fantasma no viene desde nuestro dominio. Si vamos a Audiencia, Red de nuestro panel de Analitycs y pulsamos Nombre del host veremos los dominios de procedencia de nuestras visitas. La mayor parte de ellas serán de nuestros dominios, así como otros legítimos como el traductor de google (translate.googleusercontent.com) pero también veremos muchas visitas que no nos corresponden.
Nombre del host
Como vemos en la imágen, además de las visitas provenientes de dominios conocidos, un alto porcentaje se esconden detrás de (not set). Estas son visitas fantasma que podemos excluir con un filtro.

En la imágen también vemos visitas de otros dominios como co.lumb.co o dktr.ru. Estos también son conocidos host que envían visitas falsas a nuestro Analitycs. Las visitas de google.com o google o google.fr también son falsas como luego veremos.

Con estos datos se nos presentan dos opciones para crear una nueva vista filtrada:

  • Establecer un filtro de inclusión de nuestros dominios conocidos (nuestro propio dominio, listas de correo, dominios de google y hosts contrastados)
  • Establecer un filtro de exclusión de los dominios fantasma (incluyendo los not set)

En este ejemplo vamos a ver como crear una nueva vista estableciendo para ella un filtro de inclusión de dominios conocidos. De esta manera no tenemos que comprobar los nuevos dominios que vayan apareciendo. Comenzamos yendo a nuestro panel de Analitycs, Administrador, Ver, Todos los datos de sitios web y pulsando Crear nueva vista.

Es conveniente crear una nueva vista a la que aplicar los filtros, ya que de esta manera dispondremos siempre de una vista sin filtrar para contrastar nuestros datos. Creamos una lista de Sitio Web, con el nombre de Visitas de dominios conocidos, seleccionando nuestra zona regional y activando los informes User-ID.

Una vez tenemos la lista creada, estableceremos un filtro para esa nueva vista.

Filtro de inclusión de dominios conocidos

En primer lugar volveremos al informe Audiencia, Red de nuestro panel de Analitycs pulsando Nombre del host. Tenemos que extraer la lista de dominios válidos.

El problema es que los spammers se ocultan bajo nombres como google.com, google.fr o www.amazon.com para despistar y esto complica un poco las cosas. Si tienes dudas sobre algún dominio en concreto, te recomiendo que busques en Google para confirmar si hay algún problema con el. Dependiendo de la instalación que tengas, si utilizas lista de correo, marketplaces tipo Shopify, seguimiento de youtube etc, los dominios pueden variar, pero básicamente suelen ser estos:

Tus dominios (con y sin www): tudominio.com y www.tudominio.com
Dominios de traducción y de contenido enlazado de Google: googleusercontent.com y translate.googleusercontent.com
Listas de correo: tudominio.us9.list-manage.com

Cuando determinemos nuestros dominios de confianza debemos crear una expresión regular de este tipo:

tudominio\.com|translate\.googleusercontent\.com|tudominio\.us9\.list\-manage\.com

Es el momento de crear el filtro. Desde la pantalla de Administrador, Ver, Filtros, pulsaremos en la opción Crear Filtro, dándole como nombre Dominios conocidos.

patron del filtro

Escogeremos Tipo de Filtro Personalizado seleccionando la opción Incluir. En Campo del filtro escogeremos Nombre del host y en Patrón del filtro copiaremos nuestra expresión regular. A partir de aquí la nueva Vista Visitas de dominios conocidos recogerá solo las visitas que pasen el filtro.

Otras prácticas de interés

Una práctica recomendable para esta nueva vista filtrada que acabamos de crear es la de marcar la opción Excluir todas las visitas de robots y de arañas conocidos que encontraremos en Administrador, Ver, Ver configuración con nuestra vista Visitas de dominios conocidos seleccionada. De esta manera evitaremos el rastro de los bots y rastreadores que aunque no sean nocivos no nos aportan información relevante.

excluir-robots

También podemos bloquear el acceso del los robots de rastreo con una regla en el .htacess de este tipo:

## STOP REFERRER SPAM
RewriteCond %{HTTP_REFERER} semalt\.com [NC,OR]
RewriteCond %{HTTP_REFERER} buttons-for-website\.com [NC]
RewriteRule .* – [F]

Incluir esta regla en el htaccess es recomendable, ya que impide el acceso de los robots a nuestra web, pero debemos tener cuidado en no bloquear ningún robot que no sea nocivo, ya que aquí sí que le estaremos bloqueando el acceso a la web.

También se puede evitar cierto tipo de Trafico fantasma creando una Nueva Propiedad para nuestra cuenta. Muchos de los dominios fantasma como darodar funcionan generando número aleatorios con los que componen claves que envían a Analitycs con el formato UA-XXXXXXXX-1. Si vamos a Administrador, Propiedad de nuestro panel de Analitycs y creamos una nueva propiedad la creará con el formato UA-XXXXXXXX-2 quedando a salvo del algoritmo aleatorio de muchos de estos host.

De una forma u otra, el principio del año es un momento perfecto para ajustar tus métricas de Analitycs si no lo has hecho antes y tienes la intención de emplear la herramienta esta temporada. Al menos hasta que Google decida solucionarlo, y parece que de momento no tiene mucha prisa.

Director Técnico at PlanB-Ecommerce S.C.
Me han apasionado los ordenadores desde que mi padre me compró mi primer CPC. Ahora me dedico a ayudar a empresas a conseguir sus objetivos en internet.