Viendo estadísticas en un ordenador portátil

Tener datos estadísticos de las visitas que tiene tu web es sin duda un factor clave para conocer mejor a tu público.

Los valiosos datos ayudan a tomar decisiones estratégicas de posicionamiento SEO, marketing y publicidad, así como a entender el impacto de tus publicaciones en las redes sociales, o ver el funcionamiento de una campaña de publicidad determinada.

La mayoría de blogueros y empresas utilizan Google Analytics porque ofrece una interfaz de usuario con prácticas gráficas y reportes, ¿pero sabías que a cambio compartes los datos con Google? Para que te ofrezca información sobre cómo los usuarios interactúan con el contenido de tu sitio tienes que instalar unos programas JavaScript en todas tus páginas, más concretamente en la etiqueta <head>.

Con esa configuración los visitantes recibirán cookies de Google en sus navegadores para varios fines.

Si eres de los que se preocupa por la privacidad de los usuarios tengo una buena noticia para ti: existen alternativas a Google Analytics gratis y sin cookies. Una de ellas consiste en analizar el log de acceso de tu servidor web.

¿Qué es el log de acceso de un servidor web?

Un log o registro de acceso web es un archivo de texto que genera un servidor web (por ejemplo, Apache, Nginx o IIS de Microsoft) a medida que va recibiendo peticiones de los así llamados agentes de usuario.

Los agentes de usuario son los programas informáticos que hacen las peticiones; pueden ser personas utilizando su navegador web de escritorio, o bots de rastreo como Qwantify o SEMrushBot, por poner solo dos ejemplos. ¿Sabías que además de usuarios hay miles de bots automáticos en Internet visitando páginas web? Qwantify es el rastreador web del motor de búsqueda Qwant y SEMrushBot es el bot de SEMrush, una conocida empresa de marketing digital.

Este repositorio disponible en GitHub contiene un archivo JSON con robots rastreadores conocidos.

El funcionamiento del log de acceso es sencillo. El servidor web escribe una línea de texto en el log cuando recibe una petición nueva tal y como se muestra en el siguiente ejemplo de log de Nginx.

Así pues, esta consulta al log de acceso muestra las visitas realizadas por SEMrushBot:

$ cat access.log | grep SEMrushBot
85.208.98.0 - - [18/Jan/2021:01:09:48 +0000] "GET / HTTP/1.1" 200 4604 "-" "SEMrushBot"
85.208.98.0 - - [01/Feb/2021:01:34:24 +0000] "GET / HTTP/1.1" 200 4586 "-" "SEMrushBot"
85.208.98.0 - - [02/Feb/2021:17:38:27 +0000] "GET / HTTP/1.1" 200 4589 "-" "SEMrushBot"
85.208.98.0 - - [15/Feb/2021:09:49:03 +0000] "GET / HTTP/1.1" 200 4548 "-" "SEMrushBot"

El 18 de enero de 2021 SEMrushBot rastreó la página principal "GET / HTTP/1.1" con éxito obteniendo un código de estado HTTP 200. Lo mismo para el 1, 2 y 15 de febrero.

Fíjate que las direcciones IP del log de acceso acaban en 0 porque están anonimizadas, tal y como hace Google Analytics para ayudar a los propietarios de sitios web a cumplir sus políticas de privacidad. Para más información sobre cómo aplicar esto último se recomienda consultar a un profesional técnico y legal.

Los proveedores de hosting web suelen ofrecer una serie de servicios que incluyen gestión de registros DNS, gestor de archivos, FTP, bases de datos, configuración de hosting, y también pueden incluir un servicio de estadísticas que permite descargar archivos de registro para su posterior análisis. Es habitual que te den acceso a un panel con estadísticas AWStats o Webalizer, siendo estas dos herramientas visuales de análisis de archivos de log.

Así pues, antes de instalar Google Analytics en tu página web o blog, recuerda revisar los servicios que ofrece tu proveedor de hosting y mira si tienen AWStats o Webalizer.

Genera informes y gráficos de visitas con GoAccess

Si lo tuyo es un servidor dedicado, GoAccess es una aplicación de código abierto con la que puedes analizar fácilmente los registros de acceso de tus páginas web. Permite crear gráficos de visitas y estadísticas sin necesidad de instalar códigos JavaScript ni cookies en los navegadores de los usuarios de modo que los datos no se comparten con terceros.

El siguiente comando crea un informe en formato HTML que no tiene en cuenta las visitas automáticas realizadas por los rastreadores web mencionados antes.

$ goaccess access.log > report.html --ignore-crawlers

Para filtrar las peticiones HTTP por fecha puedes escribir algo parecido a lo siguiente dependiendo del formato específico de tu log:

$ sed -n '/06\/Jan\/2021/,/22\/Feb\/2021/p' access.log > 2021_01_06_02_22.log
$ goaccess 2021_01_06_02_22.log > report.html --ignore-crawlers

El archivo report.html es muy completo y contiene gráficas con esta información:

  • Visitantes únicos por día (las visitas con la misma IP, fecha y agente cuentan como visita única)
  • Archivos solicitados
  • Contenido estático servido
  • URLs no encontradas
  • Nombre del servidor e IP del visitante
  • Sistemas operativos utilizados
  • Navegadores web
  • Distribución de las visitas durante el día
  • Sitios de referencia
  • Códigos de estado HTTP
  • Geolocalización

A continuación se muestran tres de las gráficas anteriores.

Figura 1

Figura 1. Visitantes únicos por día

Figura 2

Figura 2. Navegadores web que acceden al sitio

Figura 3

Figura 3. Reparto de las visitas por horas durante el día

Conclusión

Como ves no hace falta instalar Google Analytics para analizar las visitas de tu página web o blog. Tu proveedor de hosting te dirá si puedes ver las valiosas estadísticas con alguna herramienta basada en la lectura de archivos access.log del servidor web, por ejemplo AWStats o Webalizer.

Por otra parte, si eres una empresa o autónomo y dispones de un servidor web dedicado en lugar de uno compartido, instala GoAccess en tu ordenador. GoAccess es un conocido software de código abierto distribuido con una licencia MIT que te ayudará a entender la dinámica de visitas de tu sitio web con sus reportes.

Crea informes impresionantes en formato HTML pero recuerda, eso sí, estar a la última en materia de protección de datos y GDPR. Para más información consulta a un profesional, pregúntale cómo puede ayudarte a cumplir con la legalidad en tu sitio web.

¡Espero que el post de hoy os haya gustado y os animéis a compartirlo en vuestras redes sociales!

También te puede interesar leer esto...

Previous Post Next Post