Por: Alejandro Zahler

Desde hace algún tiempo hemos visto cómo los sitios web, en especial los sitios nuevos, se ven afectados por un sinnúmero de spam referals como el típico “simple-share-buttons.com / referral”, entre otros. Este tipo de spam genera ruido en algunas de nuestras métricas principales, como tasa de rebote de 100% y duración media de sesión de 0 segundos.

¿En qué consiste el tráfico spam?

Es una técnica utilizada por sitios que generan visitas falsas a través de bots en otros sitios, para así retornar visitas a su propia página. Con ese volumen de visitas, su negocio es la venta de publicidad.

trafico_spam

¿Por qué debes eliminar el Spam?

Principalmente por dos razones:

  • Si tienes un sitio grande con muchas visitas de diferentes fuentes, seguramente este tipo de tráfico no te generará mucho ruido como sí lo haría en un sitio nuevo con pocas visitas, en donde la mayoría de las visitas provienen de tráfico spam generando métricas falsas de sesiones y páginas en Google Analytics.
  • Éstas son visitas indeseadas que pueden sobrecargar el servidor haciendo más lento el sitio, entre otros efectos.

¿Cómo identificar el tráfico spam?

Son referidos que presentan las siguientes características:

  1. Tienen tasas de rebote de 100%
  2. Tienen tiempo medio de sesión 0 .00 seg
  3. Las URL no existen y redirigen a otro lugar
  4. Tienen un índice de páginas por sesión 1,00
  5. Si los buscas en Google, aparecen como spam

identificar_spam

¿Qué hacer para eliminar tráfico spam?

1. Bloquear el tráfico mediante htaccess

La mejor forma de impedir el tráfico spam es bloquear su acceso a tu sitio mediante el archivo .htaccess. Te recomendamos que hables con tu webmaster para que te ayude a hacer la configuración.

htaccess

2. Filtro en Google Analytics

Para poder excluir todo el tráfico spam de Google Analytics, debemos identificar los hostnames distintos de la URL de nuestro sitio o hosts que no reconozcamos.

Es importante tener en cuenta que los siguientes hostnames:

translate.googleusercontent.com (traductor de Google) webcache.googleusercontent.com (caché de Google)

No se deben excluir.

Acá puedes encontrar una lista actualizada de todos los sitios spam.

lista_spam

Se debe hacer una expresión regular que sólo incluya tráfico de hostname reconocido. En este caso, haremos un filtro que incluya el hostname de nuestro sitio además del traductor y caché de Google, de la siguiente manera:

Expresión Regular

"tusitio\.com|translate\.googleusercontent\.com|webcache\.googleusercontent\.com"

expresion_regular

Por último, no se debe olvidar que al manejar filtros en Google Analytics, debemos tener siempre una vista con todos los datos sin filtros para no afectar la data.Acá te dejamos algunos links útiles sobre este tema:

  1. http://www.optimizesmart.com/geek-guide-removing-referrer-spam-google-analytics/
  2. https://moz.com/blog/how-to-stop-spam-bots-from-ruining-your-analytics-referral-data
  3. https://megalytic.com/blog/how-to-filter-out-fake-referrals-and-other-google-analytics-spam
  4. http://blog.raventools.com/stop-referrer-spam/
  5. http://www.analyticsedge.com/2014/12/removing-referral-spam-google-analytics/



Tags: